บ้าน การเงินส่วนบุคคล การจัดเตรียมข้อมูลของคุณสำหรับ Predictive Analytics - Dummies

การจัดเตรียมข้อมูลของคุณสำหรับ Predictive Analytics - Dummies

สารบัญ:

Anonim

เมื่อคุณกำหนดวัตถุประสงค์ของโมเดลแล้วขั้นตอนต่อไปในการวิเคราะห์เชิงคาดการณ์คือการระบุและเตรียมข้อมูลที่คุณจะใช้ในการสร้างโมเดลของคุณ ข้อมูลต่อไปนี้จะกล่าวถึงกิจกรรมที่สำคัญที่สุด ลำดับขั้นตอนทั่วไปมีลักษณะดังนี้:

  1. ระบุแหล่งข้อมูลของคุณ

    ข้อมูลอาจอยู่ในรูปแบบต่างๆหรืออาศัยอยู่ในสถานที่ต่างๆ

  2. ระบุว่าคุณจะเข้าถึงข้อมูลนั้นได้อย่างไร

    บางครั้งคุณจำเป็นต้องได้รับข้อมูลจากบุคคลที่สามหรือข้อมูลที่เป็นของแผนกต่างๆในองค์กรของคุณ ฯลฯ

  3. พิจารณาตัวแปรที่จะรวมไว้ในการวิเคราะห์ของคุณ

    วิธีการหนึ่งมาตรฐานคือการเริ่มต้นด้วยตัวแปรที่หลากหลายและกำจัดสิ่งที่ไม่สามารถคาดการณ์ได้สำหรับแบบจำลอง

  4. ตรวจสอบว่าจะใช้ตัวแปรที่ได้มาหรือไม่

    ในหลาย ๆ กรณีตัวแปรที่ได้รับ (เช่นอัตราส่วนราคาต่อรายได้ที่ใช้ในการวิเคราะห์ราคาหุ้น) จะมีผลโดยตรงต่อรูปแบบมากกว่าตัวแปรดิบ

  5. สำรวจคุณภาพข้อมูลของคุณพยายามทำความเข้าใจกับทั้งรัฐและข้อ จำกัด

    ความถูกต้องของการคาดคะเนของรูปแบบจะเกี่ยวข้องโดยตรงกับตัวแปรที่คุณเลือกและคุณภาพข้อมูลของคุณ คุณต้องการตอบคำถามเฉพาะข้อมูลบางส่วน ณ จุดนี้:

    • ข้อมูลมีข้อมูลครบถ้วนหรือไม่?
    • มีข้อผิดพลาดหรือไม่?
    • ข้อมูลต้องทำความสะอาดหรือไม่?
    • คุณจำเป็นต้องเติมค่าที่ขาดหายไปเก็บไว้ตามที่เป็นอยู่หรือลบออกทั้งหมดหรือไม่?

การทำความเข้าใจข้อมูลและคุณสมบัติของข้อมูลจะช่วยให้คุณเลือกอัลกอริทึมที่จะเป็นประโยชน์มากที่สุดในการสร้างโมเดลของคุณ ตัวอย่างเช่น:

  • อัลกอริทึมการถดถอยสามารถใช้ในการวิเคราะห์ข้อมูลแบบอนุกรมได้
  • อัลกอริทึ่มการจำแนกประเภทสามารถใช้ในการวิเคราะห์ข้อมูลแบบไม่ต่อเนื่อง
  • สามารถใช้อัลกอริทึมของสมาคมสำหรับข้อมูลที่มีคุณลักษณะที่เกี่ยวโยงกันได้

อัลกอริทึมแต่ละตัวและเทคนิคการทำนายมีจุดอ่อนและจุดแข็งที่แตกต่างกัน ที่สำคัญที่สุดความถูกต้องของแบบจำลองนั้นขึ้นอยู่กับการมีทั้งปริมาณและคุณภาพของข้อมูล ข้อมูลของคุณควรมีจำนวนระเบียนที่เพียงพอเพื่อให้ได้ผลที่มีนัยสำคัญทางสถิติ

การรวบรวมข้อมูลที่เกี่ยวข้อง (โดยเฉพาะบันทึกจำนวนมากในช่วงระยะเวลาที่ยาวนาน) การประมวลผลล่วงหน้าและการแยกแยะคุณลักษณะที่มีค่าคาดการณ์มากที่สุดจะเป็นที่ที่คุณใช้เวลาส่วนใหญ่ แต่คุณยังต้องเลือกอัลกอริทึมอย่างชาญฉลาดซึ่งเป็นอัลกอริทึมที่เหมาะสมกับปัญหาทางธุรกิจ

การเตรียมข้อมูลมีความเฉพาะเจาะจงกับโครงการที่คุณกำลังทำงานและขั้นตอนวิธีที่คุณเลือกใช้ขึ้นอยู่กับความต้องการของโครงการคุณจะเตรียมข้อมูลให้เหมาะสมและป้อนข้อมูลให้กับอัลกอริทึมขณะที่คุณสร้างแบบจำลองเพื่อตอบสนองความต้องการทางธุรกิจ

ชุดข้อมูลที่ใช้ในการฝึกอบรมและทดสอบโมเดลต้องมีข้อมูลทางธุรกิจที่เกี่ยวข้องเพื่อตอบปัญหาที่คุณกำลังพยายามแก้ไข หากเป้าหมายของคุณคือ (ตัวอย่าง) เพื่อพิจารณาว่าลูกค้ารายใดมีแนวโน้มที่จะปั่นป่วนจากนั้นชุดข้อมูลที่คุณเลือกจะต้องมีข้อมูลเกี่ยวกับลูกค้าที่ปั่นป่วนในอดีตนอกเหนือจากลูกค้าที่ไม่ได้ใช้บริการ

บางโมเดลที่สร้างขึ้นเพื่อการทำเหมืองข้อมูลและทำความเข้าใจเกี่ยวกับความสัมพันธ์ที่เป็นรากฐานของตัวเองตัวอย่างเช่นโครงสร้างที่สร้างขึ้นด้วยอัลกอริทึ่มการจัดกลุ่มไม่จำเป็นต้องมีผลในใจ

Underfitting

Underfitting คือเมื่อโมเดลของคุณไม่สามารถตรวจพบความสัมพันธ์ใด ๆ ในข้อมูลของคุณได้ นี่เป็นข้อบ่งชี้ว่าตัวแปรที่สำคัญซึ่ง ได้แก่ ผู้ที่มีอำนาจในการคาดการณ์ไม่ได้รวมอยู่ในการวิเคราะห์ของคุณ

หากตัวแปรที่ใช้ในโมเดลของคุณไม่มีอำนาจการคาดการณ์ที่สูงให้ลองเพิ่มตัวแปรเฉพาะของโดเมนใหม่และเรียกใช้โมเดลของคุณอีกครั้ง เป้าหมายสุดท้ายคือการปรับปรุงประสิทธิภาพของโมเดลในข้อมูลการฝึกอบรม

ปัญหาที่ควรระวังก็คือ ฤดูกาล (เมื่อคุณมีรูปแบบตามฤดูกาลหากคุณไม่สามารถวิเคราะห์หลาย ๆ ฤดูกาลได้อาจมีปัญหา) ตัวอย่างเช่นการวิเคราะห์หุ้นที่มีเฉพาะข้อมูลจากวัว (ซึ่งราคาหุ้นโดยรวมเพิ่มขึ้น) ไม่ได้เป็นสาเหตุของวิกฤตการณ์หรือฟองสบู่ที่อาจนำมาซึ่งการแก้ไขที่สำคัญต่อประสิทธิภาพโดยรวมของหุ้น การไม่รวมข้อมูลที่ครอบคลุมทั้งตลาดหมี และ แบกหมี (เมื่อราคาหุ้นโดยรวมลดลง) ทำให้โมเดลไม่สามารถเลือกพอร์ตโฟลิโอที่ดีที่สุด

การสวมใส่ที่น้อยเกินไป

การโอเวอร์มาก คือเมื่อโมเดลของคุณมีข้อมูลที่ไม่มีอำนาจคาดการณ์ แต่เฉพาะข้อมูลที่คุณกำลังวิเคราะห์เท่านั้น เสียงรบกวน - รูปแบบสุ่มในชุดข้อมูล - สามารถหาทางเข้าสู่รูปแบบได้เช่นการเรียกใช้โมเดลบนชุดข้อมูลอื่นทำให้เกิดการลดลงอย่างมากในประสิทธิภาพและความแม่นยำในการคาดการณ์ของโมเดล

การจัดเตรียมข้อมูลของคุณสำหรับ Predictive Analytics - Dummies

ตัวเลือกของบรรณาธิการ

วิธีการลดทับภาพใน Photoshop Elements 11 - Dummies

วิธีการลดทับภาพใน Photoshop Elements 11 - Dummies

คุณสามารถเปลี่ยนขนาดและความละเอียดของภาพใน สองวิธีที่แตกต่างกันภายใน Photoshop Elements 11. วิธีการหนึ่งที่เกี่ยวข้องกับไดอะล็อกบ็อกซ์ Image Size ซึ่งคุณใช้ในการแก้ไขใน Elements หลาย ๆ เมื่อคุณใช้กล่องโต้ตอบขนาดภาพเพื่อลดขนาดภาพลงคุณจะสุ่มตัวอย่างภาพ ทำตาม ...

วิธีการวาดด้วย Photoshop Elements 11 Pencil Tool - Dummies

วิธีการวาดด้วย Photoshop Elements 11 Pencil Tool - Dummies

เครื่องมือดินสอและแปรงใน Photoshop Elements 11 คล้ายคลึงกันยกเว้นว่าเครื่องมือดินสอมีขอบแข็งในขณะที่เครื่องมือแปรงสามารถมีขอบขนนุ่ม ในความเป็นจริงขอบของจังหวะดินสอไม่สามารถแม้แต่จะต่อต้าน aliased -

การแก้ไขข้อความใน Photoshop Elements 11 - dummies

การแก้ไขข้อความใน Photoshop Elements 11 - dummies

คุณอาจต้องจัดเรียงคำใหม่หรือแก้ไขความผิดพลาดและ ข้อผิดพลาดอื่น ๆ ภายในข้อความที่คุณวางไว้ใน Photoshop Elements 11 ของคุณ หากต้องการเปลี่ยนแปลงข้อความเองเพียงทำตามขั้นตอนต่อไปนี้: เปิดภาพของคุณใน Photo Editor ในโหมด Expert เลือกเครื่องมือ Type จากแผง Tools ในเลเยอร์ ...

ตัวเลือกของบรรณาธิการ

การแนบและการถอดเลนส์สำหรับกล้อง Nikon D5200 ของคุณ - ความหนา

การแนบและการถอดเลนส์สำหรับกล้อง Nikon D5200 ของคุณ - ความหนา

ความแตกต่างระหว่าง กล้องดิจิตอลแบบจุดและจุดดิจิตอลและกล้อง DSLR (Digital Single-lens Reflex) (เช่น Nikon D5200) เป็นเลนส์ ด้วยกล้อง DSLR คุณสามารถเปลี่ยนเลนส์เพื่อให้เหมาะกับความต้องการด้านการถ่ายภาพที่แตกต่างกันไปได้เช่นเลนส์ซูมมากสุดไปจนถึงเลนส์ซูเปอร์ยาว ไม่ว่าเลนส์ที่คุณซื้อจะทำตามขั้นตอนต่อไปนี้ ...

วิธีการใช้เอฟเฟ็กต์พิเศษผ่านเมนูรีเมนูปรับแต่ง Nikon D7200 - หุ่น

วิธีการใช้เอฟเฟ็กต์พิเศษผ่านเมนูรีเมนูปรับแต่ง Nikon D7200 - หุ่น

เครื่องมือแก้ไขภาพเมนูรีทัชของ Nikon D7200 มีเครื่องมือพิเศษบางอย่าง ในการสร้างเอฟเฟ็กต์แบบหลังยิงให้ลองใช้ตัวเลือกเมนูรีทัชดังต่อไปนี้: หน้าจอครอสซิ่ง: เครื่องมือนี้จะเพิ่มเอฟเฟ็กต์การกระเจิงแสงให้กับส่วนที่สว่างที่สุดของภาพ เพื่อไปที่เครื่องมือนี้เลือกรีทัช> ผลการกรอง> ข้ามหน้าจอ คุณเห็น ...

การปรับการตั้งค่าวิดีโอใน Nikon D5500 ของคุณ - Dummies

การปรับการตั้งค่าวิดีโอใน Nikon D5500 ของคุณ - Dummies

เมื่อคุณพร้อมที่จะใช้งานมากขึ้น ควบคุมภาพยนตร์ของคุณได้โดยเริ่มจากการสำรวจการตั้งค่าวิดีโอ Nikon D5500 ของคุณช่วยให้คุณสามารถปรับการตั้งค่าเหล่านี้เพื่อจับภาพวิดีโอโดยไม่จำเป็นต้องสลับกล้องออก การเลือกโหมดวิดีโอ (NTSC หรือ PAL) ตัวเลือกแรกที่ต้องพิจารณาคือโหมดวิดีโอที่พบใน Setup men การตั้งค่านี้ ...

ตัวเลือกของบรรณาธิการ

การถ่ายภาพการตั้งค่าสำหรับกล้อง Canon EOS Rebel T3 Series - หน้าม้วน

การถ่ายภาพการตั้งค่าสำหรับกล้อง Canon EOS Rebel T3 Series - หน้าม้วน

หน้าจอการตั้งค่าการถ่ายภาพใน Canon กล้อง EOS Rebel T3 และกล้อง Canon EOS Rebel T3i จะแสดงการตั้งค่าถ่ายภาพที่สำคัญที่สุด ได้แก่ รูรับแสงความเร็วชัตเตอร์ ISO และอื่น ๆ โปรดทราบว่าจอแสดงผลมีความเกี่ยวข้องกับการถ่ายภาพนิ่งปกติเท่านั้น เมื่อคุณเปลี่ยนไปใช้โหมดดูภาพหรือโหมดภาพยนตร์ใน Rebel T3 ของคุณ

ถ่ายภาพบุคคลกับ Canon EOS Rebel T1i / 500D - ภาพขนาดใหญ่

ถ่ายภาพบุคคลกับ Canon EOS Rebel T1i / 500D - ภาพขนาดใหญ่

เรื่องที่เน้นอย่างรวดเร็วและพื้นหลังนุ่มเบลอ ปฏิบัติตามขั้นตอนต่อไปนี้เพื่อถ่ายรูปกับ Canon Digital Rebel ของคุณ