วีดีโอ: Predictive Modelling based on Small Data - Code Mania 101 2024
ส่วนหนึ่งของ Analytics ที่คาดการณ์ล่วงหน้าสำหรับ Dummies Cheat Sheet
โครงการวิเคราะห์ข้อมูลที่ประสบความสำเร็จจากการทำนายสำเร็จจะดำเนินการทีละขั้นตอน ดูรายละเอียดโครงการที่สำคัญ:
-
การกำหนดวัตถุประสงค์ทางธุรกิจ
โครงการเริ่มต้นด้วยการใช้วัตถุประสงค์ทางธุรกิจที่กำหนดไว้อย่างชัดเจน แบบจำลองควรจะตอบคำถามทางธุรกิจ ชัดเจนระบุว่าวัตถุประสงค์จะช่วยให้คุณสามารถกำหนดขอบเขตของโครงการของคุณและจะให้คุณทดสอบที่แน่นอนในการวัดความสำเร็จของ
-
การจัดเตรียมข้อมูล
คุณจะใช้ข้อมูลที่ผ่านมาในการฝึกอบรมโมเดลของคุณ ข้อมูลมักกระจายอยู่ในหลายแหล่งและอาจต้องใช้การทำความสะอาดและการเตรียมการ ข้อมูลอาจมีสำเนาและข้อมูลที่ซ้ำกัน ขึ้นอยู่กับการวิเคราะห์และวัตถุประสงค์ทางธุรกิจคุณตัดสินใจว่าจะเก็บหรือลบออก นอกจากนี้ข้อมูลอาจมีค่าที่ขาดหายไปอาจต้องได้รับการเปลี่ยนแปลงบางอย่างและอาจใช้ในการสร้างแอตทริบิวต์ที่ได้รับซึ่งมีอำนาจในการคาดการณ์มากขึ้นสำหรับวัตถุประสงค์ของคุณ โดยรวมแล้วคุณภาพของข้อมูลบ่งบอกถึงคุณภาพของรูปแบบ
-
การสุ่มตัวอย่างข้อมูลของคุณ
คุณจะต้องแบ่งข้อมูลออกเป็น 2 ชุด ได้แก่ ชุดฝึกอบรมและชุดทดสอบ คุณสร้างโมเดลโดยใช้ชุดข้อมูลการฝึกอบรม คุณใช้ชุดข้อมูลทดสอบเพื่อตรวจสอบความถูกต้องของเอาต์พุตของโมเดล การทำเช่นนั้นเป็นสิ่งสำคัญอย่างยิ่ง มิฉะนั้นคุณจะเสี่ยงต่อการ overfitting โมเดลของคุณ - ฝึกแบบจำลองด้วยชุดข้อมูลที่ จำกัด ไปยังจุดที่เลือกลักษณะเฉพาะทั้งหมด (ทั้งสัญญาณและเสียง) ที่เป็นจริงสำหรับชุดข้อมูลนั้น ๆ โมเดลที่ใส่ไว้สำหรับชุดข้อมูลเฉพาะจะทำงานอย่างน่าสังเวชเมื่อคุณเรียกใช้ชุดข้อมูลอื่น ๆ ชุดข้อมูลทดสอบช่วยให้มั่นใจได้ถึงวิธีที่ถูกต้องในการวัดประสิทธิภาพของโมเดลของคุณอย่างถูกต้อง
-
การสร้างโมเดล
บางครั้งข้อมูลหรือวัตถุประสงค์ทางธุรกิจยืมตัวเองไปเป็นอัลกอริทึมหรือแบบจำลองเฉพาะ บางครั้งวิธีที่ดีที่สุดไม่ชัดเจนนัก ขณะที่คุณสำรวจข้อมูลให้เรียกใช้อัลกอริทึมมากเท่าที่คุณสามารถทำได้ เปรียบเทียบผลลัพธ์ของพวกเขา เลือกรูปแบบสุดท้ายในผลการทดสอบโดยรวม บางครั้งคุณก็สามารถเรียกใช้ชุดข้อมูลรูปแบบต่างๆพร้อมกันในข้อมูลและเลือกรูปแบบสุดท้ายโดยการเปรียบเทียบผลงานของพวกเขา
-
การใช้โมเดล
หลังจากสร้างโมเดลแล้วคุณต้องปรับใช้โมเดลเพื่อเก็บเกี่ยวผลประโยชน์ กระบวนการดังกล่าวอาจต้องมีการประสานงานกับหน่วยงานอื่น ๆ มุ่งสร้างโมเดล deployable นอกจากนี้ให้แน่ใจว่าคุณรู้วิธีนำเสนอผลงานของคุณต่อผู้มีส่วนได้เสียทางธุรกิจด้วยวิธีการที่เข้าใจได้และน่าเชื่อเพื่อให้พวกเขานำมาใช้กับโมเดลของคุณหลังจากติดตั้งโมเดลแล้วคุณจะต้องตรวจสอบประสิทธิภาพและปรับปรุงอย่างต่อเนื่อง โมเดลส่วนใหญ่สลายตัวหลังจากผ่านช่วงระยะเวลาหนึ่ง อัปเดตโมเดลของคุณให้ทันสมัยโดยรีเฟรชข้อมูลที่มีอยู่ใหม่