อัลกอริทึมทางสถิติข้อมูลการทำเหมืองข้อมูลและเครื่องอัลกอริทึมต่างๆมีให้ใช้ในรูปแบบการวิเคราะห์เชิงคาดการณ์ คุณสามารถเลือกอัลกอริทึมได้ดีขึ้นหลังจากที่คุณกำหนดเป้าหมายของโมเดลและเลือกข้อมูลที่คุณต้องการ อัลกอริทึมเหล่านี้บางส่วนได้รับการพัฒนาขึ้นเพื่อแก้ไขปัญหาทางธุรกิจที่เฉพาะเจาะจงเพิ่มอัลกอริทึมที่มีอยู่หรือให้ความสามารถใหม่ซึ่งอาจทำให้บางส่วนของพวกเขาเหมาะสมกับวัตถุประสงค์ของคุณมากกว่าที่อื่น ๆ คุณสามารถเลือกจากอัลกอริทึมต่างๆเพื่อแก้ไขปัญหาทางธุรกิจเช่น
- สำหรับการแบ่งกลุ่มลูกค้าและ / หรือการตรวจพบชุมชนในรูปทรงกลมทางสังคมเช่นคุณต้องใช้อัลกอริทึมการจัดกลุ่ม
- สำหรับการรักษาลูกค้าหรือเพื่อพัฒนาระบบ recommender คุณควรใช้อัลกอริทึมการจัดหมวดหมู่
- สำหรับการให้คะแนนเครดิตหรือการคาดการณ์ผลลัพธ์ถัดไปของเหตุการณ์ที่ขับเคลื่อนด้วยเวลาคุณควรใช้อัลกอริทึมการถดถอย
ตามเวลาและทรัพยากรที่อนุญาตคุณควรใช้อัลกอริทึมหลายรูปแบบตามความเหมาะสม การเปรียบเทียบการทำงานที่แตกต่างกันของอัลกอริทึมต่างๆสามารถนำข้อมูลที่น่าประหลาดใจเกี่ยวกับข้อมูลหรือข้อมูลทางธุรกิจที่ฝังอยู่ในข้อมูล การทำเช่นนี้จะช่วยให้คุณมีรายละเอียดมากขึ้นเกี่ยวกับปัญหาทางธุรกิจและช่วยคุณระบุว่าตัวแปรใดในข้อมูลของคุณมีอำนาจในการคาดการณ์
บางโครงการการวิเคราะห์เชิงคาดการณ์จะประสบความสำเร็จได้ดีที่สุดโดยสร้างโมเดลกลุ่ม กลุ่มของโมเดลที่ใช้ข้อมูลเดียวกัน โมเดลวงดนตรีใช้กลไกที่กำหนดไว้ล่วงหน้าเพื่อรวบรวมผลลัพธ์จากโมเดลส่วนประกอบทั้งหมดและเป็นผลลัพธ์สุดท้ายสำหรับผู้ใช้
โมเดลสามารถใช้รูปแบบต่างๆได้ ได้แก่ แบบสอบถามชุดของสถานการณ์แผนภูมิการตัดสินใจหรือการวิเคราะห์ทางคณิตศาสตร์ขั้นสูง นอกจากนี้บางรุ่นยังทำงานได้ดีที่สุดสำหรับข้อมูลและการวิเคราะห์บางอย่าง คุณสามารถ (เช่น) ใช้อัลกอริทึมการจำแนกที่ใช้กฎการตัดสินเพื่อตัดสินผลของภาพจำลองหรือธุรกรรมที่กำหนดโดยให้ตอบคำถามดังนี้:
- ลูกค้าคนนี้น่าจะตอบสนองต่อแคมเปญการตลาดของเราหรือไม่?
- การโอนเงินอาจเป็นส่วนหนึ่งของโครงการฟอกเงินหรือไม่?
- ผู้ขอสินเชื่อนี้อาจผิดนัดชำระหนี้หรือไม่?
คุณสามารถใช้อัลกอริทึมการจัดกลุ่มที่ไม่ได้รับการยกเว้นเพื่อค้นหาความสัมพันธ์ที่มีอยู่ภายในชุดข้อมูลของคุณ คุณสามารถใช้อัลกอริทึมเหล่านี้เพื่อหาการจัดกลุ่มที่แตกต่างกันในหมู่ลูกค้าของคุณกำหนดบริการที่สามารถจัดกลุ่มเข้าด้วยกันหรือเลือกผลิตภัณฑ์ที่สามารถเพิ่มยอดขายได้
อัลกอริทึมการถดถอยสามารถใช้เพื่อคาดการณ์ข้อมูลอย่างต่อเนื่องเช่นคาดการณ์แนวโน้มการเคลื่อนไหวของสต๊อกด้วยราคาที่ผ่านมา
ต้นไม้การตัดสินใจเครื่องเวกเตอร์สนับสนุนเครือข่ายประสาทโลจิสติกและการถดถอยเชิงเส้นคืออัลกอริทึมที่พบได้บ่อยๆ แม้ว่าการใช้งานทางคณิตศาสตร์ของพวกเขาต่างกันโมเดลที่คาดการณ์เหล่านี้จะสร้างผลลัพธ์ที่เทียบเท่ากัน ต้นไม้การตัดสินใจเป็นที่นิยมมากเพราะพวกเขาเข้าใจได้ง่าย คุณสามารถปฏิบัติตามเส้นทางไปสู่การตัดสินใจที่กำหนด
อัลกอริทึมการจัดประเภทเหมาะสำหรับประเภทของการวิเคราะห์เมื่อเป้าหมายรู้จัก (เช่นระบุอีเมลขยะ) ในทางกลับกันเมื่อทราบตัวแปรเป้าหมายแล้วขั้นตอนวิธีการจัดกลุ่มเป็นทางออกที่ดีที่สุดของคุณ พวกเขาช่วยให้คุณสามารถจัดกลุ่มหรือจัดกลุ่มข้อมูลของคุณลงในกลุ่มที่มีความหมายตามความคล้ายคลึงกันระหว่างสมาชิกในกลุ่ม
อัลกอริทึมเหล่านี้ได้รับความนิยมอย่างกว้างขวาง มีเครื่องมือมากมายทั้งเชิงพาณิชย์และโอเพนซอร์สที่ใช้งานได้ การสะสมข้อมูลที่เจริญรุ่งเรืองและเร่งขึ้น (นั่นคือข้อมูลขนาดใหญ่) และฮาร์ดแวร์และแพลตฟอร์มที่คุ้มค่าใช้จ่าย (เช่น Cloud Computing และ Hadoop) เครื่องมือวิเคราะห์ข้อมูลคาดการณ์กำลังประสบกับความเจริญ
วัตถุประสงค์ข้อมูลและธุรกิจไม่ใช่ปัจจัยเดียวที่จะต้องพิจารณาเมื่อคุณเลือกอัลกอริทึม ความเชี่ยวชาญของนักวิทยาศาสตร์ข้อมูลของคุณมีมูลค่ามหาศาล ณ จุดนี้ การเลือกอัลกอริธึมที่จะทำให้งานนี้ทำได้ดีมักเป็นการรวมกันของวิทยาศาสตร์และศิลปะ ส่วนศิลปะมาจากประสบการณ์และความชำนาญด้านธุรกิจซึ่งมีบทบาทสำคัญในการระบุรูปแบบที่สามารถตอบสนองวัตถุประสงค์ทางธุรกิจได้อย่างถูกต้อง