ข้อมูลขนาดใหญ่ทำให้การพัฒนาเครื่องมือค้นหาออนไลน์ที่มีความสามารถสูงมีความเป็นไปได้ เครื่องมือค้นหาที่ค้นหาหน้าเว็บตามข้อความค้นหาต้องใช้อัลกอริทึมที่ซับซ้อนและความสามารถในการประมวลผลจำนวนคำขอที่ส่าย ต่อไปนี้เป็นสี่เครื่องมือค้นหาที่ใช้กันอย่างแพร่หลาย:
-
Google
-
Microsoft Bing
-
Yahoo!
-
ถาม
การใช้ Google แคระคู่แข่งของ บริษัท ตั้งแต่เดือนกุมภาพันธ์ปี 2015 Google คาดว่าจะได้รับ 1. 1 พันล้านผู้เข้าชมที่ไม่ซ้ำในแต่ละเดือน Bing เป็นระยะทางไกลกับ 350 ล้าน; Yahoo! ได้รับ 300 ล้านบาทและถาม 245 ล้าน แม้ว่า Google ไม่ใช่เครื่องมือค้นหาที่เก่าแก่ที่สุด แต่ก็เป็นที่นิยมมากที่สุด จำนวนข้อมูลที่ Google จัดการในแต่ละวันมีประมาณประมาณ 20 petabytes (2. 0 x 10 16 bytes) การเข้าชมทั้งหมดนี้ทำกำไรได้สำหรับ Google ซึ่งรายได้ส่วนใหญ่มาจากการโฆษณา
Google ยังให้บริการคอมพิวเตอร์แก่องค์กรที่ไม่มีขีดความสามารถในการประมวลผลข้อมูลขนาดใหญ่ Google เพิ่งเปิดตัว Google Cloud Dataflow ซึ่งช่วยให้องค์กรสามารถจัดเก็บวิเคราะห์และประมวลผลข้อมูลจำนวนมากได้