บ้าน การเงินส่วนบุคคล วิธีสร้างโมเดล Predictive Analytics ด้วยการถดถอย R - Dummies

วิธีสร้างโมเดล Predictive Analytics ด้วยการถดถอย R - Dummies

วีดีโอ: [5-2] การสร้าง Schema และ data model และการสร้าง Index 2024

วีดีโอ: [5-2] การสร้าง Schema และ data model และการสร้าง Index 2024
Anonim

คุณต้องการสร้างรูปแบบการวิเคราะห์เชิงคาดการณ์ที่คุณสามารถประเมินได้โดยใช้ผลลัพธ์ที่ทราบ ในการทำเช่นนี้เราจะแบ่งข้อมูลของเราออกเป็นสองชุด: หนึ่งสำหรับการฝึกอบรมรูปแบบและหนึ่งสำหรับการทดสอบรูปแบบ การแยกการฝึกอบรมและชุดทดสอบออกเป็น 70/30 ก็เพียงพอแล้ว สองบรรทัดถัดไปของรหัสคำนวณและเก็บขนาดของแต่ละชุด: >> trainSize testSize <- nrow (autos) - trainSize

เมื่อต้องการส่งออกค่าให้พิมพ์ชื่อของตัวแปรที่ใช้เก็บค่าและ กดปุ่มตกลง. นี่คือผลลัพธ์:

trainSize [1] 279> testSize [1] 119
รหัสนี้กำหนดขนาดของชุดข้อมูลที่คุณตั้งใจจะทำการฝึกอบรมและชุดข้อมูลทดสอบของเรา คุณยังไม่ได้สร้างชุดเหล่านี้เลย นอกจากนี้คุณไม่ต้องการเพียงแค่เรียก 279 ข้อสังเกตแรกชุดฝึกและเรียก 119 ข้อสังเกตชุดทดสอบ ซึ่งจะสร้างโมเดลที่ไม่ดีเนื่องจากชุดข้อมูลปรากฏขึ้นตามคำสั่ง โดยเฉพาะคอลัมน์ modelyer ได้รับคำสั่งจากเล็กที่สุดไปจนถึงใหญ่ที่สุด

หนักกว่า

มีแปดสูบ

  • มี การเคลื่อนย้ายที่ใหญ่กว่า

  • มีแรงม้ามากขึ้น

    โอเคเห็นได้ชัดว่าหลายคนรู้อะไรเกี่ยวกับรถยนต์ดังนั้นการคาดเดาเกี่ยวกับความสัมพันธ์จะไม่ถูกเบี่ยงเบนไปมากเกินไปหลังจากที่คุณเห็นข้อมูล คนที่มีความรู้เกี่ยวกับรถยนต์เป็นจำนวนมากอาจรู้จักข้อมูลนี้แล้วโดยไม่ได้ดูข้อมูล
  • นี่เป็นเพียงตัวอย่างง่ายๆของโดเมน (รถยนต์) ที่หลาย ๆ คนสามารถใช้ได้ หากเป็นข้อมูลเกี่ยวกับโรคมะเร็ง แต่คนส่วนใหญ่จะไม่เข้าใจในสิ่งที่แต่ละแอตทริบิวต์หมายถึงทันที

นี่คือที่ซึ่งผู้เชี่ยวชาญด้านโดเมนและผู้สร้างแบบจำลองข้อมูลมีความสำคัญต่อกระบวนการสร้างโมเดล ผู้เชี่ยวชาญด้านโดเมนอาจมีความรู้ดีที่สุดว่าแอตทริบิวต์ใดที่มีความสำคัญมากที่สุด (หรือน้อยที่สุด) และคุณลักษณะที่สัมพันธ์กันอย่างไร

พวกเขาสามารถแนะนำให้ผู้สร้างแบบจำลองข้อมูลซึ่งตัวแปรที่จะทดลองด้วย พวกเขาสามารถให้น้ำหนักที่ใหญ่กว่าถึงคุณลักษณะที่สำคัญมากขึ้นและ / หรือน้ำหนักที่น้อยกว่าสำหรับคุณลักษณะที่มีความสำคัญน้อยที่สุด (หรือลบออกทั้งหมด)

ดังนั้นคุณต้องสร้างชุดข้อมูลการฝึกอบรมและชุดข้อมูลทดสอบที่เป็นตัวแทนของชุดทั้งหมดอย่างแท้จริง วิธีหนึ่งในการทำเช่นนี้คือการสร้างชุดฝึกอบรมจากการสุ่มเลือกข้อมูลทั้งหมดนอกจากนี้คุณต้องการให้การทดสอบนี้สามารถทำซ้ำได้เพื่อให้คุณสามารถเรียนรู้จากตัวอย่างเดียวกันได้

ตั้งค่าเมล็ดพันธุ์สำหรับเครื่องกำเนิดไฟฟ้าแบบสุ่มดังนั้นเราจะมีชุดฝึกอบรม "แบบสุ่ม" แบบเดียวกัน รหัสต่อไปนี้จะทำงาน: >> set (123)> training_indices <- ตัวอย่าง (seq_len (nrow (autos)), size = trainSize) trainSet testSet <- autos [-training_indices,]

ชุดการฝึกอบรมประกอบด้วย 279 ข้อสังเกตพร้อมกับผลลัพธ์ (mpg) ของการสังเกตแต่ละครั้ง อัลกอริทึมการถดถอยใช้ผลลัพธ์ในการฝึกแบบจำลองโดยดูที่ความสัมพันธ์ระหว่างตัวแปรพยากรณ์ (คุณลักษณะใด ๆ ในเจ็ด) และตัวแปรตอบสนอง (mpg)

ชุดทดสอบประกอบด้วยส่วนที่เหลือของข้อมูล (นั่นคือส่วนที่ไม่รวมอยู่ในชุดฝึกอบรม) คุณควรสังเกตด้วยว่าชุดทดสอบยังประกอบด้วยตัวแปรตอบกลับ (mpg) ด้วย 

เมื่อคุณใช้ฟังก์ชันทำนาย (จากแบบจำลอง) กับชุดทดสอบจะไม่สนใจตัวแปรการตอบสนองและจะใช้เฉพาะตัวแปรพยากรณ์เท่านั้นหากชื่อคอลัมน์เหมือนกันกับชุดการฝึกอบรม

เมื่อต้องการสร้างแบบจำลองการถดถอยเชิงเส้นที่ใช้แอตทริบิวต์ mpg เป็นตัวแปรตอบกลับและตัวแปรอื่น ๆ ทั้งหมดเป็นตัวแปร predictor ให้พิมพ์ในบรรทัดต่อไปนี้: >> model

วิธีสร้างโมเดล Predictive Analytics ด้วยการถดถอย R - Dummies

ตัวเลือกของบรรณาธิการ

ใช้สำเนียงกระดาษในการจัดเตรียมอาหารและการถ่ายภาพอาหาร - มัดหนังสือ

ใช้สำเนียงกระดาษในการจัดเตรียมอาหารและการถ่ายภาพอาหาร - มัดหนังสือ

สำเนียงกระดาษเช่นอุปกรณ์และของตกแต่งอื่น ๆ สามารถนำเสนออาหารได้อย่างดีสำหรับกล้องในรูปแบบอาหารและภาพถ่ายอาหารของคุณ เอกสารที่ละเอียดอ่อนเหล่านี้อาจเป็นสำเนียงเล็ก ๆ น้อย ๆ ที่สมบูรณ์แบบสำหรับการตั้งค่าการถ่ายภาพธรรมดาและบางครั้งก็น่าเบื่อ ถ้าใช้แบบดั้งเดิมตุ๊กตาหมุดก็ไม่ใช่ของคุณหรือถ้าคุณกำลังมองหาบางสิ่งบางอย่าง ...

ใช้ขาตั้งกล้องเพื่อลดการสั่นของกล้อง - มัมมี่

ใช้ขาตั้งกล้องเพื่อลดการสั่นของกล้อง - มัมมี่

ในการถ่ายภาพระยะใกล้และระยะใกล้มากที่สุด อุปสรรคยากที่จะเอาชนะ คุณอาจพบวัตถุที่เคลื่อนที่ (เช่นผึ้งยุ่ง) กล้องของคุณอาจสั่นสะเทือนในระหว่างการรับแสงเนื่องจากสาเหตุต่างๆและลมอาจทำให้ทุกสิ่งในฉากของคุณเคลื่อนที่ได้ การจัดการกับท่าทางของคุณขึ้นอยู่กับเรื่องของคุณ ...

การใช้ภาพถ่ายและผ้าลินินเพื่อจัดเตรียมอาหารและการถ่ายภาพอาหาร - มัมมี่

การใช้ภาพถ่ายและผ้าลินินเพื่อจัดเตรียมอาหารและการถ่ายภาพอาหาร - มัมมี่

ห้องสมุดสำหรับตกแต่งบ้านที่มีสินค้า เช่นจานและผ้าสำหรับธุรกิจถ่ายภาพอาหารช่วยให้คุณสามารถจัดรูปถ่ายของคุณได้ ขณะที่คุณรวบรวมอาหารผ้าเช็ดปากและสิ่งอื่น ๆ เก็บไว้ในบ้านหรือในสตูดิโอเพื่อจัดระเบียบและจัดเก็บวัสดุของคุณ การเก็บเข้าลิ้นชักโลหะอุตสาหกรรมทำได้ดีและช่วยให้คุณเห็นทุกอย่าง ...

ตัวเลือกของบรรณาธิการ

การเพิ่มข้อมูลลงในภาพเดียวบน Canon EOS 6D ของคุณ - หุ่น

การเพิ่มข้อมูลลงในภาพเดียวบน Canon EOS 6D ของคุณ - หุ่น

ข้อมูลเมตามีประสิทธิภาพมาก เมื่อคุณเพิ่มข้อมูลเมตาลงในรูปภาพใน EOS 6D จะหาได้ง่ายขึ้น ข้อมูลนี้สามารถใช้งานได้หากคุณตัดสินใจแยกสาขาออกและพยายามขายรูปภาพบางส่วนในหน่วยงานภาพสต็อก ข้อมูลเมตายิ่งมีมากเท่าไหร่ก็ยิ่งหาได้ง่ายกว่า ...

การปรับช่องมองภาพบนกล้อง Canon EOS 70D - Dummies

การปรับช่องมองภาพบนกล้อง Canon EOS 70D - Dummies

ใน Canon EOS 70D, ใกล้ด้านขวาบนของสายยางที่ล้อมรอบช่องมองภาพเป็นปุ่มหมุน (ดูรูปต่อไปนี้) ที่ช่วยให้คุณปรับโฟกัสของช่องมองภาพให้ตรงกับสายตาของคุณ ปุ่มหมุนนี้เป็นที่รู้จักอย่างเป็นทางการว่าเป็นตัวควบคุมการปรับสายตา หากไม่ใช้ขั้นตอนนี้ฉากที่ปรากฏ ...

ตัวเลือกของบรรณาธิการ

สิ่งที่ควรค้นหาในซอฟต์แวร์การถ่ายภาพ HDR - ดัมมี่

สิ่งที่ควรค้นหาในซอฟต์แวร์การถ่ายภาพ HDR - ดัมมี่

องค์ประกอบที่สำคัญที่สุดของการถ่ายภาพแบบไดนามิกสูงคือ ไม่แปลกใจที่แอพพลิเคชันซอฟต์แวร์ HDR นี่คือสิ่งที่คุณใช้ในการเปลี่ยนภาพถ่ายที่ถ่ายคร่อมของคุณ (และการเปิดรับแสงดิบแบบดิบเพียงครั้งเดียวสำหรับ pseudo-HDR) ในภาพช่วงไดนามิคสูงและแผนที่โทนเพื่อสร้างภาพที่มีความอิ่มตัวและดึงดูดความสนใจดังที่แสดงในภาพนี้ ใช้เวลาลอง ...

เมื่อต้องการแปลง HDR เป็นขาวดำ - ม้วน

เมื่อต้องการแปลง HDR เป็นขาวดำ - ม้วน

หนึ่งตัวเลือกเพื่อสร้างสีดำและสีขาวสูง ภาพช่วงไดนามิก (HDR) คือการแปลงภาพถ่ายสีของคุณให้เป็นขาวดำก่อนใช้ภาพเหล่านี้เพื่อสร้างภาพ HDR คุณมีสองตัวเลือกเพื่อเลือกว่านี่คือทิศทางที่คุณต้องการหรือไม่: แปลงระหว่าง Conversion ดิบ แปลงระหว่างการทำแผนที่โทน หากเลือก ...

สิ่งที่ควรนำมาสู่การถ่ายภาพอาหารนอกสถานที่ - มัมมี่

สิ่งที่ควรนำมาสู่การถ่ายภาพอาหารนอกสถานที่ - มัมมี่

รายการตรวจสอบคือ เพียงวิธีเดียวในการจดจำทุกอย่างที่คุณต้องการสำหรับการถ่ายภาพอาหารนอกสถานที่ขนาดใหญ่ เมื่อเขียนรายการตรวจสอบลองพิจารณาด้านต่างๆของการถ่ายทำที่กำลังจะเกิดขึ้น รายการที่ครอบคลุมมากขึ้นดีกว่า จดจำพื้นฐานสำหรับการจัดเตรียมอาหารและการถ่ายภาพอย่าลืมข้อมูลเบื้องต้นเกี่ยวกับชุดของคุณ ...