ในระดับทองเหลืองการวิเคราะห์ข้อมูลเชิงวิเคราะห์ประกอบด้วยสองขั้นตอนคือขั้นตอนการเรียนรู้และขั้นตอนการทำนาย. ขั้นตอนการเรียนรู้จะสร้างแบบจำลองการจัดหมวดหมู่โดยเรียกใช้ชุดข้อมูลที่ผ่านมาผ่านตัวจำแนกประเภท เป้าหมายคือการสอนโมเดลของคุณในการดึงและค้นพบความสัมพันธ์และกฎที่ซ่อนอยู่ - กฎการจัดหมวดหมู่ จากข้อมูลที่ผ่านมา (การฝึกอบรม) แบบจำลองดังกล่าวทำได้ด้วยการใช้อัลกอริธึมการจำแนก เพื่อเป็นการแสดงให้เห็นถึงขั้นตอนเหล่านี้สมมติว่าคุณเป็นเจ้าของร้านค้าออนไลน์ที่ขายนาฬิกา คุณเป็นเจ้าของร้านค้าออนไลน์มาระยะหนึ่งแล้วและได้รวบรวมข้อมูลการทำธุรกรรมและข้อมูลส่วนบุคคลเกี่ยวกับลูกค้าที่ซื้อนาฬิกาจากร้านค้าของคุณเป็นจำนวนมาก สมมติว่าคุณได้รับข้อมูลดังกล่าวผ่านทางไซต์ของคุณโดยการจัดเตรียมเว็บฟอร์มนอกเหนือจากข้อมูลการทำธุรกรรมที่คุณได้รวบรวมผ่านการดำเนินการ
นอกจากนี้คุณยังสามารถซื้อข้อมูลจากบุคคลที่สามที่ให้ข้อมูลเกี่ยวกับลูกค้าของคุณนอกเวลาที่พวกเขาสนใจในนาฬิกา ไม่ยากเท่าที่จะเป็นไปได้ มี บริษัท ที่มีรูปแบบธุรกิจคือการติดตามลูกค้าออนไลน์และรวบรวมและขายข้อมูลที่มีค่าเกี่ยวกับพวกเขา
บริษัท เหล่านี้ส่วนใหญ่รวบรวมข้อมูลจากไซต์โซเชียลมีเดียและใช้วิธีการทำเหมืองข้อมูลเพื่อค้นหาความสัมพันธ์ระหว่างผู้ใช้แต่ละรายกับผลิตภัณฑ์ ในกรณีนี้ในฐานะเจ้าของร้านนาฬิกาคุณจะสนใจในความสัมพันธ์ระหว่างลูกค้าและความสนใจในการซื้อนาฬิกา
คุณสามารถสรุปข้อมูลประเภทนี้ได้จากการวิเคราะห์ตัวอย่างเช่นโปรไฟล์เครือข่ายสังคมของลูกค้าหรือความคิดเห็นของไมโครบล็อกในแบบที่คุณพบใน Twitter
ในการวัดระดับความสนใจในนาฬิกาของแต่ละบุคคลคุณสามารถใช้เครื่องมือวิเคราะห์ข้อความหลายอย่างเพื่อค้นหาความสัมพันธ์ดังกล่าวในข้อความที่เขียนขึ้นโดยบุคคล (สถานะเครือข่ายทางสังคมทวีตการโพสต์บล็อกและอื่น ๆ) หรือกิจกรรมออนไลน์ เช่นการโต้ตอบทางสังคมออนไลน์การอัปโหลดรูปภาพและการค้นหา)หลังจากที่คุณรวบรวมข้อมูลทั้งหมดเกี่ยวกับธุรกรรมที่ผ่านมาของลูกค้าและความสนใจในปัจจุบันแล้วข้อมูลการฝึกอบรม
ที่แสดงโมเดลของคุณสิ่งที่ควรค้นหาคุณจะต้องจัดโครงสร้างดังกล่าวให้เป็นโครงสร้างที่ทำให้ ง่ายต่อการเข้าถึงและใช้งาน (เช่นฐานข้อมูล)
ณ จุดนี้คุณถึงขั้นที่สองของการจัดหมวดหมู่ข้อมูล: ขั้นตอนการคาดการณ์ ซึ่งเป็นข้อมูลเกี่ยวกับการทดสอบโมเดลของคุณและความถูกต้องของกฎการจัดหมวดหมู่ที่สร้างขึ้น ด้วยเหตุนี้คุณจะต้องมีข้อมูลลูกค้าเพิ่มเติมในอดีตซึ่งเรียกว่า
ข้อมูลทดสอบ (ซึ่งแตกต่างจากข้อมูลการฝึกอบรม) คุณป้อนข้อมูลทดสอบนี้ลงในแบบจำลองของคุณและวัดความถูกต้องของการคาดคะเนที่เกิดขึ้น คุณนับว่าแบบจำลองทำนายพฤติกรรมในอนาคตของลูกค้าที่แสดงในข้อมูลทดสอบของคุณอย่างถูกต้อง นอกจากนี้คุณยังนับครั้งที่โมเดลทำการคาดการณ์ที่ไม่ถูกต้อง ณ จุดนี้คุณมีผลลัพธ์ที่เป็นไปได้เพียงสองอย่างเท่านั้น: คุณพอใจกับความถูกต้องของโมเดลหรือไม่: ถ้าคุณพอใจแล้วคุณสามารถเริ่มต้นสร้างแบบจำลองของคุณได้ การคาดการณ์เป็นส่วนหนึ่งของระบบการผลิต
หากคุณไม่พอใจกับการคาดการณ์คุณจะต้องฝึกอบรมแบบจำลองใหม่ด้วยชุดข้อมูลการฝึกอบรมใหม่
หากข้อมูลการฝึกอบรมเดิมของคุณไม่เพียงพอสำหรับกลุ่มลูกค้าของคุณหรือมีข้อมูลที่มีเสียงดังซึ่งทำให้ผลการค้นหาของโมเดลปิดลงโดยการแนะนำสัญญาณปลอมคุณจำเป็นต้องดำเนินการเพิ่มเติมเพื่อให้โมเดลของคุณทำงาน ทั้งสองผลลัพธ์จะเป็นประโยชน์ในทางของมัน