Apache Hive to projekt oprogramowania typu Data Warehouse zbudowany na platformie Apache Hadoop, który zapewnia możliwość wykonywania zapytań i analizy danych. Hive udostępnia interfejs SQL-podobny do zapytywania danych przechowywanych w różnych bazach danych i systemach plików, które integrują się z Hadoopem. Tradycyjne zapytania SQL muszą być implementowane w MapReduce Java API, aby wykonywać aplikacje i zapytania SQL na danych rozproszonych. Hive zapewnia niezbędną abstrakcję SQL, aby zintegrować zapytania SQL-podobne (HiveQL) z podstawową warstwą Java bez konieczności implementacji zapytań w niskopoziomowym Java API.