เมื่อคุณมีเครื่องมือและข้อมูลทั้งหมดที่จำเป็นในการเริ่มสร้างรูปแบบการคาดการณ์แล้วความสนุกสนานจะเริ่มขึ้น โดยทั่วไปการสร้างแบบจำลองการเรียนรู้สำหรับงานจัดหมวดหมู่จะเป็นไปตามขั้นตอนต่อไปนี้:
-
โหลดข้อมูล
-
เลือกตัวจำแนกประเภท
-
ฝึกแบบจำลอง
-
เห็นภาพโมเดล
-
ทดสอบโมเดล
-
ประเมินโมเดล
ทั้งสองแบบการถดถอยโลจิสติกและรูปแบบการจำแนกแบบเวคเตอร์รองรับ (SVM) ทำได้ค่อนข้างดีโดยใช้ชุดข้อมูล Iris
Sepal ความยาว | Sepal Width | ความยาวของ Petal | ความกว้างของกลีบ | Target Class / Label |
---|---|---|---|---|
5. 1 | 3 5 | 1 4 | 0 2 | Setosa (0) |
7 0 | 3 2 | 4 7 | 1 4 | Versicolor (1) |
6. 3 | 3 3 | 6 0 | 2 5 | Virginica (2) |
สำหรับชุดข้อมูลขนาดใหญ่ที่มีข้อมูลที่ไม่สามารถแยกได้เป็นแบบ linearly คุณคาดว่าผลลัพธ์จะเบี่ยงเบนไปมากยิ่งขึ้น นอกจากนี้การเลือกรูปแบบที่เหมาะสมจะกลายเป็นเรื่องยากมากขึ้นเนื่องจากความซับซ้อนและขนาดของข้อมูล เตรียมพร้อมที่จะใช้เวลาในการปรับพารามิเตอร์ให้พอดี
เมื่อสร้างโมเดลที่คาดการณ์ไว้ให้ลองใช้อัลกอริทึมเพียงไม่กี่ขั้นตอนและปรับแต่งพารามิเตอร์ของตนอย่างละเอียดจนกว่าคุณจะพบสิ่งที่ดีที่สุดสำหรับข้อมูลของคุณ จากนั้นเปรียบเทียบผลลัพธ์ของพวกเขากับแต่ละอื่น ๆ