วีดีโอ: สรุปพื้นฐานการเขียนโปรแกรมใน 10 นาที 2024
ข้อมูลในการวิเคราะห์เชิงคาดการณ์สามารถระบุได้ว่าเป็นแบบสตรีมแบบคงที่หรือแบบผสมผสานกันของทั้งสอง ข้อมูลที่สตรีม เปลี่ยนแปลงอย่างต่อเนื่อง; ตัวอย่างรวมถึงกระแสคงที่ของการปรับปรุง Facebook, tweets บน Twitter และราคาหุ้นที่เปลี่ยนแปลงตลอดเวลาในขณะที่ตลาดยังคงเปิดอยู่
สตรีมข้อมูลมีการเปลี่ยนแปลงอย่างต่อเนื่อง ข้อมูลแบบสถิต มีอยู่ในตัวและล้อมรอบ ปัญหาที่เกี่ยวข้องกับข้อมูลแบบสถิต ได้แก่ ช่องว่างค่าผิดปกติหรือข้อมูลที่ไม่ถูกต้องซึ่งทั้งหมดนี้อาจต้องใช้การทำความสะอาดการจัดเตรียมและการเตรียมการก่อนที่คุณจะสามารถใช้ข้อมูลแบบสถิตเพื่อการวิเคราะห์ได้
เช่นเดียวกับข้อมูลแบบสตรีมปัญหาอื่น ๆ อาจเกิดขึ้น ปริมาณอาจเป็นปัญหา จำนวนข้อมูลที่แท้จริงของข้อมูลที่ไม่หยุดนิ่งที่กำลังมาถึงอย่างต่อเนื่องอาจล้นหลาม และยิ่งมีข้อมูลสตรีมมิ่งที่เร็วขึ้นเท่าใดก็ยิ่งยากสำหรับการวิเคราะห์เพื่อให้ทัน
สองโมเดลหลักสำหรับการวิเคราะห์ข้อมูลแบบสตรีมมีดังนี้
-
ตรวจสอบเฉพาะจุดข้อมูลล่าสุดและตัดสินใจเกี่ยวกับสถานะของโมเดลและการย้ายครั้งต่อไป วิธีนี้จะเพิ่มขึ้น - โดยทั่วไปจะสร้างภาพของข้อมูลเมื่อมาถึง
-
ประเมินชุดข้อมูลทั้งหมดหรือเซ็ตย่อยของข้อมูลเพื่อตัดสินใจทุกครั้งที่มีข้อมูลใหม่มาถึง วิธีนี้รวมถึงจุดข้อมูลมากขึ้นในการวิเคราะห์ - สิ่งที่ถือว่าชุดข้อมูล "ทั้งหมด" เปลี่ยนแปลงทุกครั้งที่มีการเพิ่มข้อมูลใหม่
ขึ้นอยู่กับลักษณะธุรกิจและผลกระทบที่คาดว่าจะได้จากการตัดสินใจ
บางโดเมนทางธุรกิจเช่นการวิเคราะห์ข้อมูลด้านสิ่งแวดล้อมตลาดหรือข่าวกรองจะให้ข้อมูลใหม่ ๆ ที่มาถึงในเวลาจริง ข้อมูลทั้งหมดนี้ต้องได้รับการวิเคราะห์ขณะที่กำลังสตรีมและตีความไม่เพียง แต่อย่างถูกต้อง แต่ในทันที
จากข้อมูลที่มีอยู่ใหม่แบบจำลองจะวาดภาพการแสดงออกภายในของโลกภายนอกทั้งหมด การทำเช่นนี้จะทำให้คุณมีพื้นฐานที่ทันสมัยที่สุดสำหรับการตัดสินใจที่คุณอาจต้องทำและดำเนินการได้อย่างรวดเร็ว
ตัวอย่างเช่นรูปแบบการวิเคราะห์เชิงคาดการณ์อาจประมวลผลราคาหุ้นเป็นฟีดข้อมูลแม้ในขณะที่ข้อมูลมีการเปลี่ยนแปลงอย่างรวดเร็ววิเคราะห์ข้อมูลในบริบทของสภาวะตลาดที่มีอยู่ในเวลาจริงและตัดสินใจว่าจะทำการค้าหรือไม่ หุ้นที่เฉพาะเจาะจง
เห็นได้ชัดว่าการวิเคราะห์ข้อมูลแบบสตรีมแตกต่างจากการวิเคราะห์ข้อมูลแบบคงที่ การวิเคราะห์ทั้งสองประเภทข้อมูลอาจเป็นเรื่องที่ท้าทายมากยิ่งขึ้น