บ้าน การเงินส่วนบุคคล การเลือกอัลกอริธึมสำหรับ Predictive Analytics

การเลือกอัลกอริธึมสำหรับ Predictive Analytics

Anonim

อัลกอริทึมทางสถิติข้อมูลการทำเหมืองข้อมูลและเครื่องอัลกอริทึมต่างๆมีให้ใช้ในรูปแบบการวิเคราะห์เชิงคาดการณ์ คุณสามารถเลือกอัลกอริทึมได้ดีขึ้นหลังจากที่คุณกำหนดเป้าหมายของโมเดลและเลือกข้อมูลที่คุณต้องการ อัลกอริทึมเหล่านี้บางส่วนได้รับการพัฒนาขึ้นเพื่อแก้ไขปัญหาทางธุรกิจที่เฉพาะเจาะจงเพิ่มอัลกอริทึมที่มีอยู่หรือให้ความสามารถใหม่ซึ่งอาจทำให้บางส่วนของพวกเขาเหมาะสมกับวัตถุประสงค์ของคุณมากกว่าที่อื่น ๆ คุณสามารถเลือกจากอัลกอริทึมต่างๆเพื่อแก้ไขปัญหาทางธุรกิจเช่น

  • สำหรับการแบ่งกลุ่มลูกค้าและ / หรือการตรวจพบชุมชนในรูปทรงกลมทางสังคมเช่นคุณต้องใช้อัลกอริทึมการจัดกลุ่ม
  • สำหรับการรักษาลูกค้าหรือเพื่อพัฒนาระบบ recommender คุณควรใช้อัลกอริทึมการจัดหมวดหมู่
  • สำหรับการให้คะแนนเครดิตหรือการคาดการณ์ผลลัพธ์ถัดไปของเหตุการณ์ที่ขับเคลื่อนด้วยเวลาคุณควรใช้อัลกอริทึมการถดถอย

ตามเวลาและทรัพยากรที่อนุญาตคุณควรใช้อัลกอริทึมหลายรูปแบบตามความเหมาะสม การเปรียบเทียบการทำงานที่แตกต่างกันของอัลกอริทึมต่างๆสามารถนำข้อมูลที่น่าประหลาดใจเกี่ยวกับข้อมูลหรือข้อมูลทางธุรกิจที่ฝังอยู่ในข้อมูล การทำเช่นนี้จะช่วยให้คุณมีรายละเอียดมากขึ้นเกี่ยวกับปัญหาทางธุรกิจและช่วยคุณระบุว่าตัวแปรใดในข้อมูลของคุณมีอำนาจในการคาดการณ์

บางโครงการการวิเคราะห์เชิงคาดการณ์จะประสบความสำเร็จได้ดีที่สุดโดยสร้างโมเดลกลุ่ม กลุ่มของโมเดลที่ใช้ข้อมูลเดียวกัน โมเดลวงดนตรีใช้กลไกที่กำหนดไว้ล่วงหน้าเพื่อรวบรวมผลลัพธ์จากโมเดลส่วนประกอบทั้งหมดและเป็นผลลัพธ์สุดท้ายสำหรับผู้ใช้

โมเดลสามารถใช้รูปแบบต่างๆได้ ได้แก่ แบบสอบถามชุดของสถานการณ์แผนภูมิการตัดสินใจหรือการวิเคราะห์ทางคณิตศาสตร์ขั้นสูง นอกจากนี้บางรุ่นยังทำงานได้ดีที่สุดสำหรับข้อมูลและการวิเคราะห์บางอย่าง คุณสามารถ (เช่น) ใช้อัลกอริทึมการจำแนกที่ใช้กฎการตัดสินเพื่อตัดสินผลของภาพจำลองหรือธุรกรรมที่กำหนดโดยให้ตอบคำถามดังนี้:

  • ลูกค้าคนนี้น่าจะตอบสนองต่อแคมเปญการตลาดของเราหรือไม่?
  • การโอนเงินอาจเป็นส่วนหนึ่งของโครงการฟอกเงินหรือไม่?
  • ผู้ขอสินเชื่อนี้อาจผิดนัดชำระหนี้หรือไม่?

คุณสามารถใช้อัลกอริทึมการจัดกลุ่มที่ไม่ได้รับการยกเว้นเพื่อค้นหาความสัมพันธ์ที่มีอยู่ภายในชุดข้อมูลของคุณ คุณสามารถใช้อัลกอริทึมเหล่านี้เพื่อหาการจัดกลุ่มที่แตกต่างกันในหมู่ลูกค้าของคุณกำหนดบริการที่สามารถจัดกลุ่มเข้าด้วยกันหรือเลือกผลิตภัณฑ์ที่สามารถเพิ่มยอดขายได้

อัลกอริทึมการถดถอยสามารถใช้เพื่อคาดการณ์ข้อมูลอย่างต่อเนื่องเช่นคาดการณ์แนวโน้มการเคลื่อนไหวของสต๊อกด้วยราคาที่ผ่านมา

ต้นไม้การตัดสินใจเครื่องเวกเตอร์สนับสนุนเครือข่ายประสาทโลจิสติกและการถดถอยเชิงเส้นคืออัลกอริทึมที่พบได้บ่อยๆ แม้ว่าการใช้งานทางคณิตศาสตร์ของพวกเขาต่างกันโมเดลที่คาดการณ์เหล่านี้จะสร้างผลลัพธ์ที่เทียบเท่ากัน ต้นไม้การตัดสินใจเป็นที่นิยมมากเพราะพวกเขาเข้าใจได้ง่าย คุณสามารถปฏิบัติตามเส้นทางไปสู่การตัดสินใจที่กำหนด

อัลกอริทึมการจัดประเภทเหมาะสำหรับประเภทของการวิเคราะห์เมื่อเป้าหมายรู้จัก (เช่นระบุอีเมลขยะ) ในทางกลับกันเมื่อทราบตัวแปรเป้าหมายแล้วขั้นตอนวิธีการจัดกลุ่มเป็นทางออกที่ดีที่สุดของคุณ พวกเขาช่วยให้คุณสามารถจัดกลุ่มหรือจัดกลุ่มข้อมูลของคุณลงในกลุ่มที่มีความหมายตามความคล้ายคลึงกันระหว่างสมาชิกในกลุ่ม

อัลกอริทึมเหล่านี้ได้รับความนิยมอย่างกว้างขวาง มีเครื่องมือมากมายทั้งเชิงพาณิชย์และโอเพนซอร์สที่ใช้งานได้ การสะสมข้อมูลที่เจริญรุ่งเรืองและเร่งขึ้น (นั่นคือข้อมูลขนาดใหญ่) และฮาร์ดแวร์และแพลตฟอร์มที่คุ้มค่าใช้จ่าย (เช่น Cloud Computing และ Hadoop) เครื่องมือวิเคราะห์ข้อมูลคาดการณ์กำลังประสบกับความเจริญ

วัตถุประสงค์ข้อมูลและธุรกิจไม่ใช่ปัจจัยเดียวที่จะต้องพิจารณาเมื่อคุณเลือกอัลกอริทึม ความเชี่ยวชาญของนักวิทยาศาสตร์ข้อมูลของคุณมีมูลค่ามหาศาล ณ จุดนี้ การเลือกอัลกอริธึมที่จะทำให้งานนี้ทำได้ดีมักเป็นการรวมกันของวิทยาศาสตร์และศิลปะ ส่วนศิลปะมาจากประสบการณ์และความชำนาญด้านธุรกิจซึ่งมีบทบาทสำคัญในการระบุรูปแบบที่สามารถตอบสนองวัตถุประสงค์ทางธุรกิจได้อย่างถูกต้อง

การเลือกอัลกอริธึมสำหรับ Predictive Analytics

ตัวเลือกของบรรณาธิการ

ลักษณะของการวิเคราะห์ข้อมูลขนาดใหญ่ - มัมมี่

ลักษณะของการวิเคราะห์ข้อมูลขนาดใหญ่ - มัมมี่

การวิเคราะห์ข้อมูลขนาดใหญ่ได้รับการตอบรับอย่างรวดเร็วเมื่อเร็ว ๆ นี้และด้วยเหตุผลที่ดี คุณจำเป็นต้องทราบลักษณะของการวิเคราะห์ข้อมูลขนาดใหญ่หากคุณต้องการเป็นส่วนหนึ่งของการเคลื่อนไหวนี้ บริษัท รู้ว่ามีบางอย่างที่นั่น แต่จนกระทั่งเมื่อไม่นานมานี้ยังไม่สามารถทำเหมืองได้ นี้ผลักดัน ...

การเลือกการแจกจ่าย R กับ Machine Learning in Mind - มัมมี่

การเลือกการแจกจ่าย R กับ Machine Learning in Mind - มัมมี่

คุณต้องทำให้เป้าหมายการเรียนรู้ของเครื่อง ในใจเมื่อเลือกการกระจาย R R คือการรวมกันของสภาพแวดล้อมและภาษา เป็นรูปแบบของภาษาการเขียนโปรแกรม S ซึ่ง John Chambers สร้างขึ้นที่ Bell Laboratories เพื่อให้สามารถทำงานกับสถิติได้ง่ายขึ้น Rick Becker และ Allan Wilks เพิ่มในท้ายที่สุดแล้ว ...

ตัวเลือกของบรรณาธิการ

ปรับ ISO ใน Digital Macro Photography - Dummies

ปรับ ISO ใน Digital Macro Photography - Dummies

ในการถ่ายภาพระยะใกล้และระยะใกล้ ISO อาจมีความสำคัญเท่ากับ รูรับแสงและความเร็วชัตเตอร์ในการกำหนดรูปลักษณ์ของภาพ องค์ประกอบที่ต้องใช้รูรับแสงขนาดใหญ่และความเร็วชัตเตอร์ต่ำช่วยให้แสงสว่างมากขึ้นกว่าที่ต้องการรูรับแสงขนาดเล็กและความเร็วชัตเตอร์ที่รวดเร็ว ISO ของกล้องของคุณ

ตัวเลือกของบรรณาธิการ

รูปถ่ายแนวนอน - Sunset in Paradise - รูปปั้น

รูปถ่ายแนวนอน - Sunset in Paradise - รูปปั้น

ภาพภูมิทัศน์นี้ถ่ายในหาด Caspersen ในเมือง Venice, Florida ภาพนี้ถ่ายภาพในช่วงฤดูหนาว ฤดูหนาวในฟลอริด้าเป็นงานที่ยากลำบาก แต่บางคนต้องทำ การตั้งค่ากล้อง 100: มีแสงมากดังนั้นช่างภาพจึงตั้งค่า ISO ต่ำ ชดเชยแสง -1/3 EV: ถ่ายภาพพระอาทิตย์ตกไม่ได้

ภาพภูมิทัศน์ - ใช้เส้นทางสูง - หุ่น

ภาพภูมิทัศน์ - ใช้เส้นทางสูง - หุ่น

ภาพนี้ถ่ายภาพใน Myakka River State Park ใกล้ Sarasota, ฟลอริด้า สวนสวยด้วยหลายไมล์ของเส้นทาง เส้นทางนี้คดเคี้ยวผ่านทุ่งหญ้าเขียวขจีที่เต็มไปด้วยต้นไม้ที่น่ารัก ดวงอาทิตย์กำลังจมเมฆต่ำและน่ารักอยู่ในท้องฟ้า เพิ่มเลนส์โพลาไรซ์ลงในเลนส์ลูบบลูส์ ...

รูปถ่ายภูมิทัศน์ - นกเหยี่ยวพูด - หุ่น

รูปถ่ายภูมิทัศน์ - นกเหยี่ยวพูด - หุ่น

เหยี่ยวแดงมีไฝที่แตกต่างกันซึ่งสามารถทำให้ช่างภาพเสียขวัญได้ ไม่สิ้นสุด คุณได้ยินเสียงนกเหยี่ยว แต่คุณไม่สามารถคิดได้ว่าสัตว์ตัวนี้อยู่ที่ไหน เมื่อคุณพบภาพคุณจะได้รับโอกาสในการถ่ายภาพที่ยอดเยี่ยม สัตว์ประหลาดตัวนี้แหลมพายุและช่างภาพซูมเข้ามาอย่างแน่นหนาเท่าที่ทำได้ ...