สารบัญ:
- การเข้าใจถึงความต้องการในการสร้างคุณลักษณะ
- ในการขยายพหุนามคุณจะสร้างการโต้ตอบระหว่างคุณลักษณะต่างๆและสร้างอำนาจโดยอัตโนมัติ (เช่นการคำนวณสเปรดชีตของคุณลักษณะ) การโต้ตอบอาศัยการคูณคุณลักษณะต่างๆ การสร้างคุณลักษณะใหม่โดยใช้การคูณช่วยในการติดตามว่าคุณลักษณะมีแนวโน้มที่จะทำงานอย่างไรโดยรวม ดังนั้นจึงช่วยในการจับคู่ความสัมพันธ์ที่ซับซ้อนระหว่างคุณลักษณะของคุณซึ่งอาจเป็นนัยในสถานการณ์พิเศษ
วีดีโอ: การเรียนรู้ของเครื่องคืออะไร | What is Machine Learning? 2024
บางครั้งข้อมูลดิบที่คุณได้รับจากแหล่งต่างๆจะไม่มีคุณสมบัติที่จำเป็นในการดำเนินการเรียนรู้ด้วยเครื่อง เมื่อเกิดเหตุการณ์นี้ขึ้นคุณต้องสร้างคุณลักษณะของตนเองเพื่อให้ได้ผลลัพธ์ที่ต้องการ การสร้างคุณลักษณะไม่ได้หมายความว่าการสร้างข้อมูลจากอากาศบาง คุณสร้างคุณสมบัติใหม่จากข้อมูลที่มีอยู่
การเข้าใจถึงความต้องการในการสร้างคุณลักษณะ
ข้อ จำกัด ที่ยิ่งใหญ่ประการหนึ่งของอัลกอริทึมการเรียนรู้ด้วยเครื่องคือการคาดเดาสูตรที่สามารถเชื่อมโยงการตอบสนองกับคุณลักษณะที่คุณใช้ได้ บางครั้งความสามารถในการคาดเดานี้เกิดขึ้นเนื่องจากคุณไม่สามารถจับคู่การตอบสนองโดยใช้ข้อมูลที่คุณมี (ซึ่งหมายความว่าคุณไม่มีข้อมูลที่ถูกต้อง) ในกรณีอื่น ๆ ข้อมูลที่คุณให้มาไม่ได้ช่วยให้อัลกอริทึมสามารถเรียนรู้ได้อย่างถูกต้อง
รู้ปัญหาได้ดีและหาวิธีที่มนุษย์จะแก้ปัญหานี้ได้เป็นส่วนหนึ่งของการสร้างคุณลักษณะ ดังนั้นการเชื่อมต่อกับตัวอย่างก่อนหน้านี้ความจริงที่พื้นผิวดินเชื่อมต่อกับราคาทรัพย์สินเป็นความรู้ทั่วไป หากพื้นผิวขาดหายไปจากคุณลักษณะของคุณเมื่อพยายามคาดเดาค่าของพร็อพเพอร์ตี้คุณสามารถกู้คืนข้อมูลดังกล่าวจากข้อมูลที่มีอยู่ได้และการทำเช่นนี้จะเพิ่มประสิทธิภาพของการคาดการณ์
การสร้างคุณลักษณะโดยอัตโนมัติ
คุณสามารถสร้างคุณลักษณะใหม่ ๆ ได้โดยอัตโนมัติวิธีหนึ่งในการสร้างการสร้างคุณลักษณะอัตโนมัติคือการใช้การขยายพหุนาม มีวิธีเฉพาะเพื่อให้บรรลุการขยายพหุนามเพื่อที่คุณจะสร้างคุณลักษณะต่างๆโดยอัตโนมัติทั้งใน R และ Python ในขณะนี้คุณต้องเข้าใจแนวคิดเบื้องหลังการขยายตัวของพหุนาม
ในการขยายพหุนามคุณจะสร้างการโต้ตอบระหว่างคุณลักษณะต่างๆและสร้างอำนาจโดยอัตโนมัติ (เช่นการคำนวณสเปรดชีตของคุณลักษณะ) การโต้ตอบอาศัยการคูณคุณลักษณะต่างๆ การสร้างคุณลักษณะใหม่โดยใช้การคูณช่วยในการติดตามว่าคุณลักษณะมีแนวโน้มที่จะทำงานอย่างไรโดยรวม ดังนั้นจึงช่วยในการจับคู่ความสัมพันธ์ที่ซับซ้อนระหว่างคุณลักษณะของคุณซึ่งอาจเป็นนัยในสถานการณ์พิเศษ
ตัวอย่างที่ยอดเยี่ยมของการปฏิสัมพันธ์คือเสียงที่ปล่อยออกมาจากรถและราคาของรถ ผู้บริโภคไม่ได้ชื่นชมรถยนต์ที่มีเสียงดังแม้ว่าพวกเขาจะซื้อรถสปอร์ตซึ่งในกรณีนี้เสียงเครื่องยนต์จะเป็นบวกที่เตือนเจ้าของรถยนต์ นอกจากนี้ยังทำให้ผู้คนรอบข้างสังเกตเห็นรถเย็น ๆ เสียงจึงมีบทบาทอย่างมากในการแสดงออกเพราะเสียงจะดึงดูดความสนใจของผู้อื่น ในทางกลับกันเสียงรบกวนเมื่อขับขี่รถของครอบครัวไม่ได้ทั้งหมดที่เย็น
ในแอ็พพลิเคชันการเรียนรู้ด้วยเครื่องเครื่องในการคาดการณ์อัตราการตั้งค่าสำหรับรถยนต์บางคันคุณลักษณะต่างๆเช่นเสียงรบกวนและราคาของรถยนต์สามารถคาดการณ์ได้ด้วยตัวเอง อย่างไรก็ตามการคูณค่าสองค่าและเพิ่มให้กับชุดคุณลักษณะสามารถระบุได้อย่างชัดเจนถึงขั้นตอนการเรียนรู้ที่เป้าหมายคือรถสปอร์ต (เมื่อคุณคูณระดับเสียงสูงด้วยราคาที่สูง)
อำนาจช่วยโดยการสร้างความสัมพันธ์ที่ไม่เชิงเส้นระหว่างการตอบสนองกับคุณลักษณะต่างๆโดยนัยในสถานการณ์เฉพาะ
อีกเช่นสมมติว่าคุณต้องคาดเดาค่าใช้จ่ายรายปีของบุคคล อายุเป็นตัวทำนายที่ดีเนื่องจากในขณะที่คนแก่และโตเต็มที่ชีวิตและสถานการณ์ในครอบครัวก็เปลี่ยนไปเช่นกัน นักเรียนเริ่มต้นที่น่าสงสาร แต่หางานทำและสามารถสร้างครอบครัวได้ จากมุมมองทั่วไปค่าใช้จ่ายมีแนวโน้มเพิ่มขึ้นเช่นเดียวกับอายุจนถึงจุดหนึ่ง การเกษียณอายุมักเป็นจุดที่ค่าใช้จ่ายมีแนวโน้มลดลง อายุมีข้อมูลดังกล่าว แต่เป็นคุณลักษณะที่มีแนวโน้มที่จะเติบโตขึ้นและค่าใช้จ่ายที่เกี่ยวข้องกับการเติบโตจะไม่ช่วยอธิบายถึงการผกผันที่เกิดขึ้นในบางช่วงอายุ
การเพิ่มคุณลักษณะสี่เหลี่ยมจะช่วยให้สามารถสร้างผลกระทบต่อตัวอายุซึ่งจะเล็กเมื่อเริ่มต้น แต่เติบโตขึ้นอย่างรวดเร็วตามอายุ ผลสุดท้ายคือพาราโบลาที่มีการเติบโตเริ่มแรกโดยมีค่าใช้จ่ายสูงสุดในช่วงอายุที่กำหนดและลดลง
ตามที่กล่าวมาในตอนต้นการรู้ล่วงหน้าเกี่ยวกับการเปลี่ยนแปลงดังกล่าวล่วงหน้า (เสียงและกีฬารถการบริโภคและอายุที่มากขึ้น) สามารถช่วยให้คุณสร้างคุณสมบัติที่เหมาะสมได้ แต่ถ้าคุณไม่รู้จักการเปลี่ยนแปลงเหล่านี้ล่วงหน้าการขยายพหุนามจะสร้างขึ้นโดยอัตโนมัติสำหรับคุณเนื่องจากได้รับคำสั่งบางอย่างแล้วจะเป็นการสร้างปฏิสัมพันธ์และอำนาจของคำสั่งดังกล่าว คำสั่งจะชี้จำนวนคูณและพลังสูงสุดที่จะนำไปใช้กับคุณลักษณะที่มีอยู่
ดังนั้นการขยายพหุนามของลำดับที่ 2 จะเพิ่มคุณลักษณะทั้งหมดให้กับพลังที่สองและเพิ่มทวีคูณให้กับคุณลักษณะอื่น ๆ ทั้งหมดของทุกคน (คุณได้รับการผสมผสานของชุดค่าผสมทั้งหมดของสองคุณสมบัติ) อย่างชัดเจนยิ่งจำนวนที่มากขึ้นจะมีการสร้างคุณลักษณะใหม่ ๆ ขึ้น แต่ส่วนมากจะซ้ำซ้อนและมีส่วนช่วยในการทำให้อัลกอริทึมการเรียนรู้ของเครื่องของคุณมีข้อมูลที่มากขึ้น
เมื่อใช้การขยายพหุนามคุณต้องใส่ใจกับการระเบิดของคุณลักษณะที่คุณสร้าง พลังเพิ่มขึ้นเป็นเส้นตรงดังนั้นหากคุณมีห้าคุณสมบัติและต้องการการขยายคำสั่งซื้อ 2 คุณลักษณะแต่ละตัวจะถูกยกขึ้นโดยใช้กำลังไฟที่สอง การเพิ่มลำดับการสั่งงานเพียงเพิ่มคุณสมบัติด้านพลังงานใหม่สำหรับคุณลักษณะดั้งเดิมแต่ละรายการ การโต้ตอบจะเพิ่มขึ้นตามการรวมกันของคุณลักษณะตามลำดับดังกล่าว
ในความเป็นจริงมีห้าคุณสมบัติและการขยายตัวของคำสั่ง 2 จะมีการสร้างการผสมผสานคุณลักษณะเฉพาะทั้งหมด 10 ชุด การเพิ่มคำสั่งซื้อเป็น 3 จะต้องมีการสร้างชุดค่าผสมที่ไม่ซ้ำกันทั้งหมดของตัวแปรสองตัวแปรรวมทั้งชุดค่าผสมที่ไม่ซ้ำกันของตัวแปรสามตัวนั่นคือคุณลักษณะ 20 อย่าง