Hadoop là một framework mã nguồn mở cho phép để lưu trữ và xử lý dữ liệu lớn trong một môi trường phân phối trên các cụm máy tính sử dụng mô hình lập trình đơn giản. Nó được thiết kế để mở rộng quy mô từ các máy chủ duy nhất để hàng ngàn máy móc, từng cung cấp tính toán và lưu trữ địa phương.