บ้าน การเงินส่วนบุคคล Machine การเรียนรู้: การสร้างคุณลักษณะของคุณเองในข้อมูล - dummies

Machine การเรียนรู้: การสร้างคุณลักษณะของคุณเองในข้อมูล - dummies

สารบัญ:

วีดีโอ: การเรียนรู้ของเครื่องคืออะไร | What is Machine Learning? 2024

วีดีโอ: การเรียนรู้ของเครื่องคืออะไร | What is Machine Learning? 2024
Anonim

บางครั้งข้อมูลดิบที่คุณได้รับจากแหล่งต่างๆจะไม่มีคุณสมบัติที่จำเป็นในการดำเนินการเรียนรู้ด้วยเครื่อง เมื่อเกิดเหตุการณ์นี้ขึ้นคุณต้องสร้างคุณลักษณะของตนเองเพื่อให้ได้ผลลัพธ์ที่ต้องการ การสร้างคุณลักษณะไม่ได้หมายความว่าการสร้างข้อมูลจากอากาศบาง คุณสร้างคุณสมบัติใหม่จากข้อมูลที่มีอยู่

การเข้าใจถึงความต้องการในการสร้างคุณลักษณะ

ข้อ จำกัด ที่ยิ่งใหญ่ประการหนึ่งของอัลกอริทึมการเรียนรู้ด้วยเครื่องคือการคาดเดาสูตรที่สามารถเชื่อมโยงการตอบสนองกับคุณลักษณะที่คุณใช้ได้ บางครั้งความสามารถในการคาดเดานี้เกิดขึ้นเนื่องจากคุณไม่สามารถจับคู่การตอบสนองโดยใช้ข้อมูลที่คุณมี (ซึ่งหมายความว่าคุณไม่มีข้อมูลที่ถูกต้อง) ในกรณีอื่น ๆ ข้อมูลที่คุณให้มาไม่ได้ช่วยให้อัลกอริทึมสามารถเรียนรู้ได้อย่างถูกต้อง

ตัวอย่างเช่นถ้าคุณกำลังสร้างโมเดลราคาอสังหาริมทรัพย์คุณสมบัติพื้นผิวของที่ดินค่อนข้างจะทำนายได้เนื่องจากคุณสมบัติขนาดใหญ่มีแนวโน้มที่จะเสียค่าใช้จ่ายมากขึ้น แต่ถ้าแทนพื้นผิวคุณจะมีขั้นตอนวิธีการเรียนรู้ด้วยเครื่องของคุณด้วยความยาวของด้านข้างของที่ดิน (พิกัดละติจูดและลองจิจูดของมุม) อัลกอริทึมของคุณอาจไม่ทราบว่าจะทำอย่างไรกับข้อมูลที่คุณให้ไว้ อัลกอริธึมบางตัวจะจัดการความสัมพันธ์ระหว่างคุณสมบัติต่างๆ แต่อัลกอริทึมส่วนใหญ่จะไม่สามารถทำได้

คำตอบสำหรับปัญหานี้คือการสร้างคุณลักษณะ การสร้างคุณลักษณะเป็นส่วนหนึ่งของการเรียนรู้ด้วยเครื่องซึ่งถือเป็นศิลปะมากกว่าวิทยาศาสตร์เพราะเป็นการแทรกแซงของมนุษย์ในการผสมผสานคุณลักษณะที่มีอยู่อย่างสร้างสรรค์ คุณสามารถทำงานนี้ได้ด้วยการบวกการลบการคูณและอัตราส่วนเพื่อสร้างคุณลักษณะที่ได้รับมาใหม่พร้อมด้วยพลังการคาดการณ์มากกว่าต้นฉบับ

รู้ปัญหาได้ดีและหาวิธีที่มนุษย์จะแก้ปัญหานี้ได้เป็นส่วนหนึ่งของการสร้างคุณลักษณะ ดังนั้นการเชื่อมต่อกับตัวอย่างก่อนหน้านี้ความจริงที่พื้นผิวดินเชื่อมต่อกับราคาทรัพย์สินเป็นความรู้ทั่วไป หากพื้นผิวขาดหายไปจากคุณลักษณะของคุณเมื่อพยายามคาดเดาค่าของพร็อพเพอร์ตี้คุณสามารถกู้คืนข้อมูลดังกล่าวจากข้อมูลที่มีอยู่ได้และการทำเช่นนี้จะเพิ่มประสิทธิภาพของการคาดการณ์

การสร้างคุณลักษณะโดยอัตโนมัติ

คุณสามารถสร้างคุณลักษณะใหม่ ๆ ได้โดยอัตโนมัติวิธีหนึ่งในการสร้างการสร้างคุณลักษณะอัตโนมัติคือการใช้การขยายพหุนาม มีวิธีเฉพาะเพื่อให้บรรลุการขยายพหุนามเพื่อที่คุณจะสร้างคุณลักษณะต่างๆโดยอัตโนมัติทั้งใน R และ Python ในขณะนี้คุณต้องเข้าใจแนวคิดเบื้องหลังการขยายตัวของพหุนาม

ในการขยายพหุนามคุณจะสร้างการโต้ตอบระหว่างคุณลักษณะต่างๆและสร้างอำนาจโดยอัตโนมัติ (เช่นการคำนวณสเปรดชีตของคุณลักษณะ) การโต้ตอบอาศัยการคูณคุณลักษณะต่างๆ การสร้างคุณลักษณะใหม่โดยใช้การคูณช่วยในการติดตามว่าคุณลักษณะมีแนวโน้มที่จะทำงานอย่างไรโดยรวม ดังนั้นจึงช่วยในการจับคู่ความสัมพันธ์ที่ซับซ้อนระหว่างคุณลักษณะของคุณซึ่งอาจเป็นนัยในสถานการณ์พิเศษ

ตัวอย่างที่ยอดเยี่ยมของการปฏิสัมพันธ์คือเสียงที่ปล่อยออกมาจากรถและราคาของรถ ผู้บริโภคไม่ได้ชื่นชมรถยนต์ที่มีเสียงดังแม้ว่าพวกเขาจะซื้อรถสปอร์ตซึ่งในกรณีนี้เสียงเครื่องยนต์จะเป็นบวกที่เตือนเจ้าของรถยนต์ นอกจากนี้ยังทำให้ผู้คนรอบข้างสังเกตเห็นรถเย็น ๆ เสียงจึงมีบทบาทอย่างมากในการแสดงออกเพราะเสียงจะดึงดูดความสนใจของผู้อื่น ในทางกลับกันเสียงรบกวนเมื่อขับขี่รถของครอบครัวไม่ได้ทั้งหมดที่เย็น

ในแอ็พพลิเคชันการเรียนรู้ด้วยเครื่องเครื่องในการคาดการณ์อัตราการตั้งค่าสำหรับรถยนต์บางคันคุณลักษณะต่างๆเช่นเสียงรบกวนและราคาของรถยนต์สามารถคาดการณ์ได้ด้วยตัวเอง อย่างไรก็ตามการคูณค่าสองค่าและเพิ่มให้กับชุดคุณลักษณะสามารถระบุได้อย่างชัดเจนถึงขั้นตอนการเรียนรู้ที่เป้าหมายคือรถสปอร์ต (เมื่อคุณคูณระดับเสียงสูงด้วยราคาที่สูง)

อำนาจช่วยโดยการสร้างความสัมพันธ์ที่ไม่เชิงเส้นระหว่างการตอบสนองกับคุณลักษณะต่างๆโดยนัยในสถานการณ์เฉพาะ

อีกเช่นสมมติว่าคุณต้องคาดเดาค่าใช้จ่ายรายปีของบุคคล อายุเป็นตัวทำนายที่ดีเนื่องจากในขณะที่คนแก่และโตเต็มที่ชีวิตและสถานการณ์ในครอบครัวก็เปลี่ยนไปเช่นกัน นักเรียนเริ่มต้นที่น่าสงสาร แต่หางานทำและสามารถสร้างครอบครัวได้ จากมุมมองทั่วไปค่าใช้จ่ายมีแนวโน้มเพิ่มขึ้นเช่นเดียวกับอายุจนถึงจุดหนึ่ง การเกษียณอายุมักเป็นจุดที่ค่าใช้จ่ายมีแนวโน้มลดลง อายุมีข้อมูลดังกล่าว แต่เป็นคุณลักษณะที่มีแนวโน้มที่จะเติบโตขึ้นและค่าใช้จ่ายที่เกี่ยวข้องกับการเติบโตจะไม่ช่วยอธิบายถึงการผกผันที่เกิดขึ้นในบางช่วงอายุ

การเพิ่มคุณลักษณะสี่เหลี่ยมจะช่วยให้สามารถสร้างผลกระทบต่อตัวอายุซึ่งจะเล็กเมื่อเริ่มต้น แต่เติบโตขึ้นอย่างรวดเร็วตามอายุ ผลสุดท้ายคือพาราโบลาที่มีการเติบโตเริ่มแรกโดยมีค่าใช้จ่ายสูงสุดในช่วงอายุที่กำหนดและลดลง

ตามที่กล่าวมาในตอนต้นการรู้ล่วงหน้าเกี่ยวกับการเปลี่ยนแปลงดังกล่าวล่วงหน้า (เสียงและกีฬารถการบริโภคและอายุที่มากขึ้น) สามารถช่วยให้คุณสร้างคุณสมบัติที่เหมาะสมได้ แต่ถ้าคุณไม่รู้จักการเปลี่ยนแปลงเหล่านี้ล่วงหน้าการขยายพหุนามจะสร้างขึ้นโดยอัตโนมัติสำหรับคุณเนื่องจากได้รับคำสั่งบางอย่างแล้วจะเป็นการสร้างปฏิสัมพันธ์และอำนาจของคำสั่งดังกล่าว คำสั่งจะชี้จำนวนคูณและพลังสูงสุดที่จะนำไปใช้กับคุณลักษณะที่มีอยู่

ดังนั้นการขยายพหุนามของลำดับที่ 2 จะเพิ่มคุณลักษณะทั้งหมดให้กับพลังที่สองและเพิ่มทวีคูณให้กับคุณลักษณะอื่น ๆ ทั้งหมดของทุกคน (คุณได้รับการผสมผสานของชุดค่าผสมทั้งหมดของสองคุณสมบัติ) อย่างชัดเจนยิ่งจำนวนที่มากขึ้นจะมีการสร้างคุณลักษณะใหม่ ๆ ขึ้น แต่ส่วนมากจะซ้ำซ้อนและมีส่วนช่วยในการทำให้อัลกอริทึมการเรียนรู้ของเครื่องของคุณมีข้อมูลที่มากขึ้น

เมื่อใช้การขยายพหุนามคุณต้องใส่ใจกับการระเบิดของคุณลักษณะที่คุณสร้าง พลังเพิ่มขึ้นเป็นเส้นตรงดังนั้นหากคุณมีห้าคุณสมบัติและต้องการการขยายคำสั่งซื้อ 2 คุณลักษณะแต่ละตัวจะถูกยกขึ้นโดยใช้กำลังไฟที่สอง การเพิ่มลำดับการสั่งงานเพียงเพิ่มคุณสมบัติด้านพลังงานใหม่สำหรับคุณลักษณะดั้งเดิมแต่ละรายการ การโต้ตอบจะเพิ่มขึ้นตามการรวมกันของคุณลักษณะตามลำดับดังกล่าว

ในความเป็นจริงมีห้าคุณสมบัติและการขยายตัวของคำสั่ง 2 จะมีการสร้างการผสมผสานคุณลักษณะเฉพาะทั้งหมด 10 ชุด การเพิ่มคำสั่งซื้อเป็น 3 จะต้องมีการสร้างชุดค่าผสมที่ไม่ซ้ำกันทั้งหมดของตัวแปรสองตัวแปรรวมทั้งชุดค่าผสมที่ไม่ซ้ำกันของตัวแปรสามตัวนั่นคือคุณลักษณะ 20 อย่าง

Machine การเรียนรู้: การสร้างคุณลักษณะของคุณเองในข้อมูล - dummies

ตัวเลือกของบรรณาธิการ

ใช้สำเนียงกระดาษในการจัดเตรียมอาหารและการถ่ายภาพอาหาร - มัดหนังสือ

ใช้สำเนียงกระดาษในการจัดเตรียมอาหารและการถ่ายภาพอาหาร - มัดหนังสือ

สำเนียงกระดาษเช่นอุปกรณ์และของตกแต่งอื่น ๆ สามารถนำเสนออาหารได้อย่างดีสำหรับกล้องในรูปแบบอาหารและภาพถ่ายอาหารของคุณ เอกสารที่ละเอียดอ่อนเหล่านี้อาจเป็นสำเนียงเล็ก ๆ น้อย ๆ ที่สมบูรณ์แบบสำหรับการตั้งค่าการถ่ายภาพธรรมดาและบางครั้งก็น่าเบื่อ ถ้าใช้แบบดั้งเดิมตุ๊กตาหมุดก็ไม่ใช่ของคุณหรือถ้าคุณกำลังมองหาบางสิ่งบางอย่าง ...

ใช้ขาตั้งกล้องเพื่อลดการสั่นของกล้อง - มัมมี่

ใช้ขาตั้งกล้องเพื่อลดการสั่นของกล้อง - มัมมี่

ในการถ่ายภาพระยะใกล้และระยะใกล้มากที่สุด อุปสรรคยากที่จะเอาชนะ คุณอาจพบวัตถุที่เคลื่อนที่ (เช่นผึ้งยุ่ง) กล้องของคุณอาจสั่นสะเทือนในระหว่างการรับแสงเนื่องจากสาเหตุต่างๆและลมอาจทำให้ทุกสิ่งในฉากของคุณเคลื่อนที่ได้ การจัดการกับท่าทางของคุณขึ้นอยู่กับเรื่องของคุณ ...

การใช้ภาพถ่ายและผ้าลินินเพื่อจัดเตรียมอาหารและการถ่ายภาพอาหาร - มัมมี่

การใช้ภาพถ่ายและผ้าลินินเพื่อจัดเตรียมอาหารและการถ่ายภาพอาหาร - มัมมี่

ห้องสมุดสำหรับตกแต่งบ้านที่มีสินค้า เช่นจานและผ้าสำหรับธุรกิจถ่ายภาพอาหารช่วยให้คุณสามารถจัดรูปถ่ายของคุณได้ ขณะที่คุณรวบรวมอาหารผ้าเช็ดปากและสิ่งอื่น ๆ เก็บไว้ในบ้านหรือในสตูดิโอเพื่อจัดระเบียบและจัดเก็บวัสดุของคุณ การเก็บเข้าลิ้นชักโลหะอุตสาหกรรมทำได้ดีและช่วยให้คุณเห็นทุกอย่าง ...

ตัวเลือกของบรรณาธิการ

การเพิ่มข้อมูลลงในภาพเดียวบน Canon EOS 6D ของคุณ - หุ่น

การเพิ่มข้อมูลลงในภาพเดียวบน Canon EOS 6D ของคุณ - หุ่น

ข้อมูลเมตามีประสิทธิภาพมาก เมื่อคุณเพิ่มข้อมูลเมตาลงในรูปภาพใน EOS 6D จะหาได้ง่ายขึ้น ข้อมูลนี้สามารถใช้งานได้หากคุณตัดสินใจแยกสาขาออกและพยายามขายรูปภาพบางส่วนในหน่วยงานภาพสต็อก ข้อมูลเมตายิ่งมีมากเท่าไหร่ก็ยิ่งหาได้ง่ายกว่า ...

การปรับช่องมองภาพบนกล้อง Canon EOS 70D - Dummies

การปรับช่องมองภาพบนกล้อง Canon EOS 70D - Dummies

ใน Canon EOS 70D, ใกล้ด้านขวาบนของสายยางที่ล้อมรอบช่องมองภาพเป็นปุ่มหมุน (ดูรูปต่อไปนี้) ที่ช่วยให้คุณปรับโฟกัสของช่องมองภาพให้ตรงกับสายตาของคุณ ปุ่มหมุนนี้เป็นที่รู้จักอย่างเป็นทางการว่าเป็นตัวควบคุมการปรับสายตา หากไม่ใช้ขั้นตอนนี้ฉากที่ปรากฏ ...

ตัวเลือกของบรรณาธิการ

สิ่งที่ควรค้นหาในซอฟต์แวร์การถ่ายภาพ HDR - ดัมมี่

สิ่งที่ควรค้นหาในซอฟต์แวร์การถ่ายภาพ HDR - ดัมมี่

องค์ประกอบที่สำคัญที่สุดของการถ่ายภาพแบบไดนามิกสูงคือ ไม่แปลกใจที่แอพพลิเคชันซอฟต์แวร์ HDR นี่คือสิ่งที่คุณใช้ในการเปลี่ยนภาพถ่ายที่ถ่ายคร่อมของคุณ (และการเปิดรับแสงดิบแบบดิบเพียงครั้งเดียวสำหรับ pseudo-HDR) ในภาพช่วงไดนามิคสูงและแผนที่โทนเพื่อสร้างภาพที่มีความอิ่มตัวและดึงดูดความสนใจดังที่แสดงในภาพนี้ ใช้เวลาลอง ...

เมื่อต้องการแปลง HDR เป็นขาวดำ - ม้วน

เมื่อต้องการแปลง HDR เป็นขาวดำ - ม้วน

หนึ่งตัวเลือกเพื่อสร้างสีดำและสีขาวสูง ภาพช่วงไดนามิก (HDR) คือการแปลงภาพถ่ายสีของคุณให้เป็นขาวดำก่อนใช้ภาพเหล่านี้เพื่อสร้างภาพ HDR คุณมีสองตัวเลือกเพื่อเลือกว่านี่คือทิศทางที่คุณต้องการหรือไม่: แปลงระหว่าง Conversion ดิบ แปลงระหว่างการทำแผนที่โทน หากเลือก ...

สิ่งที่ควรนำมาสู่การถ่ายภาพอาหารนอกสถานที่ - มัมมี่

สิ่งที่ควรนำมาสู่การถ่ายภาพอาหารนอกสถานที่ - มัมมี่

รายการตรวจสอบคือ เพียงวิธีเดียวในการจดจำทุกอย่างที่คุณต้องการสำหรับการถ่ายภาพอาหารนอกสถานที่ขนาดใหญ่ เมื่อเขียนรายการตรวจสอบลองพิจารณาด้านต่างๆของการถ่ายทำที่กำลังจะเกิดขึ้น รายการที่ครอบคลุมมากขึ้นดีกว่า จดจำพื้นฐานสำหรับการจัดเตรียมอาหารและการถ่ายภาพอย่าลืมข้อมูลเบื้องต้นเกี่ยวกับชุดของคุณ ...