ส่วนของ Machine Learning For Dummies โกงแผ่น < การเรียนรู้เกี่ยวกับเครื่องจักรเกี่ยวข้องกับการใช้อัลกอริทึมต่างๆ ตารางนี้จะให้ข้อมูลสรุปอย่างรวดเร็วของจุดแข็งและจุดอ่อนของอัลกอริทึมต่างๆ
ป่าแบบสุ่ม | มีปัญหาในการเรียนรู้เกี่ยวกับเครื่องจักรเกือบทั้งหมด
ชีวสารสนเทศศาสตร์ |
สามารถทำงานแบบขนานได้
> ไม่สามารถใช้งานได้กับทุกคนที่มีผลลัพธ์ที่ยอดเยี่ยม ยากที่จะตีความ ลดลงเมื่อถดถอยเมื่อประมาณค่าที่ ไม่ต้องเปลี่ยนค่าใด ๆ ความรุนแรงของการกระจายของค่าการตอบสนอง |
ลำเอียงในปัญหาหลายประเภทต่อการเรียนบ่อย ๆ
การไล่โทนสี Apt ที่เกือบทุกปัญหาเกี่ยวกับการเรียนรู้ด้วยเครื่อง |
เครื่องมือค้นหา (การแก้ปัญหาในการเรียนรู้ที่จะจัดอันดับ) > ดีที่สุดในการทำนายคลาส | จัดการค่าที่ขาดหายไปโดยอัตโนมัติ
ไม่จำเป็นต้องเปลี่ยนตัวแปรใด ๆ |
สามารถสวมใส่ได้หากใช้งานซ้ำหลายครั้ง
มีความไวต่อข้อมูลที่มีเสียงดังและ ค่าดีเอ็นเอ ไม่ทำงานได้ดีถ้าไม่มีการปรับค่าพารามิเตอร์ การถดถอยเชิงเส้น |
ค่าเริ่มต้นพื้นฐาน
การใช้ L1 & L2 regularization มีประสิทธิภาพในการเลือกคุณลักษณะ Fast to train |
ง่ายต่อการใช้งาน | การคาดการณ์ทางเศรษฐมิติ
ฝึกอบรมเกี่ยวกับข้อมูลขนาดใหญ่ด้วยรุ่นสุ่ม คุณต้องทำงานหนักเพื่อทำให้มันพอดีกับฟังก์ชั่นที่ไม่เป็นเชิงเส้น |
สามารถทนต่อความผิดปกติ
การสนับสนุนเครื่องเวกเตอร์ การจดจำตัวอักษร การรับรู้ภาพ ข้อความ |
ไม่สามารถแปลความหมายได้เมื่อนำไปใช้กับเมล็ดที่ไม่เป็นเชิงเส้น
ต้องทนทุกข์ทรมานจากตัวอย่างมากเกินไปหลังจาก 10 000 ตัวอย่างเริ่มต้นใช้เวลานานในการฝึกอบรม |
K- ใกล้เคียงเพื่อนบ้าน | วิสัยทัศน์คอมพิวเตอร์
การติดแท็กแบบหลายชั้น ระบบคำแนะนำ |
ปัญหาในการตรวจสอบตัวสะกด
การฝึกอบรมอย่างรวดเร็วและขี้เกียจ |
สามารถจัดการกับปัญหาแบบมัลติเชลล์ได้อย่างมาก (เช่นการติดแท็กข้อความ)
และยุ่งยากในระยะทำนาย |
ไม่สามารถคาดการณ์ corr ได้ (999) Adaboost | การตรวจหาใบหน้า
จัดการค่าที่ขาดหายไปโดยอัตโนมัติ ไม่จำเป็นต้องเปลี่ยนตัวแปรใด ๆ ไม่ง่ายเลย |
ไม่กี่พารามิเตอร์ที่จะปรับแต่ง > การวิเคราะห์ความคิดเห็น
การตรวจหาจดหมายขยะ |
การตรวจหาจดหมายขยะ
การตรวจหาจดหมายขยะ |
เข้าใจง่าย | คำนึงถึงความรู้ก่อน
สมมุติฐานด้านความเป็นไปได้ของคุณลักษณะที่แข็งแกร่งและไม่สมจริง การจำแนกประเภทข้อความ ใช้งานง่ายและรวดเร็วไม่ต้องใช้หน่วยความจำมากเกินไป > การรู้จำเสียงพูด การรู้จำเสียงวิสัยทัศน์ |
การประมาณค่าของเหตุการณ์ที่ไม่เป็นไปได้
ต้องทนทุกข์ทรมานจากคุณสมบัติที่ไม่เกี่ยวข้อง |
|
เครือข่ายประสาทเทียม | ทนทานต่อความผิดพลาด
ใช้ได้เฉพาะกับตัวอย่างบางส่วนเท่านั้น (เวกเตอร์สนับสนุน s) ยากที่จะตั้งค่า ยากที่จะปรับแต่งเนื่องจากมีพารามิเตอร์มากเกินไปและคุณต้องตัดสินใจเกี่ยวกับสถาปัตยกรรมของเครือข่าย |
ยากที่จะตีความ
ง่ายต่อการสวมใส่ การถดถอยโลจิสติก < การใช้การกำหนดกฎเกณฑ์แบบ L1 & L2 มีผลในการเลือกคุณลักษณะ |
ขั้นตอนวิธีที่ดีที่สุดในการทำนายความน่าจะเป็นของ เหตุการณ์
รวดเร็วในการฝึกอบรม ง่ายต่อการฝึกอบรมเกี่ยวกับข้อมูลขนาดใหญ่ด้วยรุ่นสุ่มของ |
คุณต้องทำงานอย่างหนักเพื่อทำให้มันพอดีกับฟังก์ชั่นที่ไม่เป็นเชิงเส้น | สามารถทนต่อความผิดพลาดได้
SVD Recommender การลดขนาดของชุดข้อมูล |
สามารถลดมิติข้อมูลลงได้
สามารถปรับโครงสร้างข้อมูลได้อย่างมีนัยสำคัญ สามารถปรับโครงสร้างข้อมูลได้อย่างมีนัยสำคัญ |
ยากที่จะเข้าใจว่าเหตุใดข้อมูลจึงถูกปรับโครงสร้างใหม่ในลักษณะที่กำหนด
PCA สมมติฐานเชิงเส้นที่แข็งแกร่ง (ส่วนประกอบคือการรวมคุณลักษณะที่มีน้ำหนัก) <99 สามารถตรวจจับค่าผิดปกติได้ในหลายมิติ |
ทนทุกข์ทรมานจาก multicollinearity | กลุ่มมีทรงกลมไม่สามารถตรวจจับกลุ่มของรูปทรงอื่น ๆ
ไม่เสถียร โซลูชันขึ้นอยู่กับการเริ่มต้น |
|