Apache Hadoop to zbiór narzędzi typu open-source, które ułatwiają rozwiązywanie problemów związanych z ogromnymi ilościami danych i obliczeniami poprzez wykorzystanie sieci wielu komputerów. Zapewnia on framework oprogramowania do rozproszonego przechowywania i przetwarzania dużych danych, używając modelu programowania MapReduce.