วีดีโอ: หลักการเขียนโปรแกรมเบื้องต้น - PART 3 อัลกอริทึมคืออะไร ? 2024
การเรียนรู้ที่ไม่ได้รับการยกเว้นมีความท้าทายมากมายสำหรับการวิเคราะห์เชิงคาดการณ์ - รวมถึงไม่ทราบว่าจะคาดหวังอะไรเมื่อคุณเรียกใช้อัลกอริทึม แต่ละขั้นตอนจะให้ผลลัพธ์ที่แตกต่างกัน คุณจะไม่แน่ใจว่าผลลัพธ์หนึ่งดีกว่าอีกหรือแม้กระทั่งว่าผลลัพธ์มีค่าใดก็ตาม
เมื่อคุณทราบผลลัพธ์ที่ควรจะเป็นคุณสามารถปรับแต่งอัลกอริทึมเพื่อสร้างผลลัพธ์ที่ต้องการได้ ในชุดข้อมูลในโลกแห่งความจริงคุณจะไม่มีความหรูหรานี้ คุณต้องพึ่งพาความรู้ก่อนหน้าของข้อมูลหรือปรีชาญาณเพื่อตัดสินใจว่าจะใช้พารามิเตอร์และอัลกอริทึมการเริ่มต้นใดในการสร้างโมเดลของคุณ
คิดว่าข้อมูลที่สามารถแยกได้เป็น Linear
เป็นพวงของจุดในกราฟที่สามารถแยกออกได้โดยใช้เส้นตรง ถ้าข้อมูลไม่สามารถแยกได้เป็นเชิงเส้นจะต้องใช้ K-means รุ่นที่สูงขึ้นซึ่งจะมีราคาแพงกว่าและอาจไม่เหมาะสำหรับชุดข้อมูลที่มีขนาดใหญ่มาก ในการใช้งานมาตรฐานความซับซ้อนในการคำนวณศูนย์และระยะทางคลัสเตอร์อยู่ในระดับต่ำ
DBSCAN เหมาะสำหรับชุดข้อมูลที่มีขนาดคลัสเตอร์ที่ไม่สมมาตรและสามารถแยกข้อมูลออกเป็นแบบไม่เป็นเชิงเส้นได้เช่นเดียวกับ K-means DBSCAN สามารถปรับขนาดได้ แต่การใช้ข้อมูลบนชุดข้อมูลขนาดใหญ่ต้องการหน่วยความจำและพลังการประมวลผลมากขึ้น