การเรียนรู้ที่จะนับวัตถุในสตรีมจะช่วยให้คุณสามารถค้นหารายการที่พบบ่อยที่สุดหรือจัดลำดับเหตุการณ์ปกติและผิดปกติได้ อัลกอริทึมนี้ยกระดับฟังก์ชันแฮชและภาพร่างโดยประมาณ หลังจากคัดกรองวัตถุที่ซ้ำซ้อนแล้วนับองค์ประกอบที่ต่างกันที่ปรากฏในสตรีมข้อมูล
คุณใช้เทคนิคนี้ในการแก้ปัญหาเช่นการค้นหาข้อความค้นหาบ่อยๆในเครื่องมือค้นหารายการที่ขายดีที่สุดจากผู้ค้าปลีกออนไลน์หน้าเว็บยอดนิยมในเว็บไซต์หรือหุ้นที่มีความผันผวนมากที่สุด (โดยการนับครั้งหุ้นเป็น ขายและซื้อ)
คุณใช้แนวทางแก้ไขปัญหานี้ Count-Min Sketch ไปยังสตรีมข้อมูล ต้องใช้ข้อมูลเพียงอย่างเดียวและจัดเก็บข้อมูลให้น้อยที่สุดเท่าที่จะเป็นไปได้ อัลกอริทึมนี้ใช้กับสถานการณ์ในโลกแห่งความเป็นจริง (เช่นการวิเคราะห์การรับส่งข้อมูลเครือข่ายหรือการจัดการการกระจายข้อมูล) สูตรต้องใช้พวงของฟังก์ชันแฮชแต่ละอันที่เกี่ยวข้องกับเวกเตอร์บิตในลักษณะที่คล้ายกับตัวกรอง Bloom ตามที่แสดงในรูป:
- เริ่มต้นเวคเตอร์บิตทั้งหมดให้เป็น zero ในทุกตำแหน่ง
- ใช้ฟังก์ชันแฮชสำหรับแต่ละบิตเวกเตอร์เมื่อรับวัตถุจากสตรีม ใช้ที่อยู่ที่เป็นตัวเลขเพื่อเพิ่มมูลค่าในตำแหน่งนั้น
- ใช้ฟังก์ชันแฮชกับวัตถุและเรียกค่าในตำแหน่งที่เกี่ยวข้องเมื่อขอให้ประเมินความถี่ของวัตถุ จากค่าทั้งหมดที่ได้รับจากพาหะบิตคุณใช้เวลาน้อยที่สุดเท่าที่ความถี่ของสตรีม
เนื่องจากการชนเป็นไปได้เสมอเมื่อใช้ฟังก์ชันแฮชโดยเฉพาะอย่างยิ่งหากเวกเตอร์บิตที่เกี่ยวข้องมีช่องเล็ก ๆ มีเวกเตอร์บิตหลายตัวอยู่ในมือรับประกันได้ว่าอย่างน้อยหนึ่งรายการมีค่าที่ถูกต้อง ค่าที่เลือกควรมีขนาดเล็กที่สุดเนื่องจากไม่ได้มีการผสมกับจำนวนบวกเท็จเนื่องจากการชนกัน