วิธีการใช้อัลกอริธึมคลัสเตอร์ K-means ในการวิเคราะห์แบบคาดการณ์ - มัมมี่
K เป็นอินพุต > วิธีการใช้อัลกอริธึมคลัสเตอร์ K-means ในการวิเคราะห์ Predictive กับอัลกอริทึมสำหรับการวิเคราะห์เชิงพยากรณ์; หมายถึงจำนวนกลุ่มที่อัลกอริทึมต้องแยกออกจากชุดข้อมูลโดยแสดงพีชคณิตเป็น k อัลกอริธึม K-means จะแบ่งข้อมูลที่กำหนดให้เป็น k clusters อัลกอริทึมจะทำการดำเนินการดังต่อไปนี้: เลือก k รายการแบบสุ่มจากชุดข้อมูลและตั้งชื่อว่า
การใช้โมเดลมาร์คอฟใน Analytics ที่ทำนายได้ - หุ่น
โมเดล Markov เป็นแบบจำลองทางสถิติที่ สามารถนำมาใช้ในการวิเคราะห์เชิงคาดการณ์ที่อาศัยหลักทฤษฎีความน่าจะเป็นอย่างมาก นี่เป็นสถานการณ์จริงที่อธิบายถึงวิธีการทำงาน: ลองนึกภาพคุณต้องการคาดการณ์ว่าทีม X จะชนะเกมในวันพรุ่งนี้หรือไม่ The
วิธีการใช้งูหลามเพื่อเลือกตัวแปรด้านขวาสำหรับข้อมูลวิทยาศาสตร์ - Dummies
การเลือก ตัวแปรที่ถูกต้องใน Python สามารถปรับปรุงกระบวนการเรียนรู้ในข้อมูลวิทยาศาสตร์โดยการลดปริมาณของเสียงรบกวน (ข้อมูลไร้ประโยชน์) ที่อาจมีผลต่อการประมาณการของผู้เรียน การเลือกตัวแปรสามารถลดความแปรปรวนของการคาดคะเนได้อย่างมีประสิทธิภาพ เพื่อที่จะเกี่ยวข้องกับตัวแปรที่มีประโยชน์เพียงอย่างเดียวในการฝึกอบรมและละเว้นสิ่งที่ซ้ำซ้อนคุณ ...
วิธีการเห็นภาพผลการวิเคราะห์ของโมเดล: การจัดกลุ่มที่ซ่อนไว้การจัดประเภทข้อมูลและการใช้ค่าผิดพลาด - Dummies > วิธีการแสดงผลการวิเคราะห์แบบจำลองของคุณ: ซ่อนการรวมกลุ่มการจัดประเภทข้อมูล
การสร้างภาพของผลการวิเคราะห์เชิงคาดการณ์ของคุณช่วยให้ผู้มีส่วนได้เสียเข้าใจขั้นตอนต่อไป ต่อไปนี้เป็นวิธีการใช้เทคนิคการสร้างภาพเพื่อรายงานผลของโมเดลของคุณต่อผู้มีส่วนได้ส่วนเสีย การจัดกลุ่มข้อมูลเป็นกระบวนการของการค้นพบกลุ่มที่ซ่อนอยู่ของรายการที่เกี่ยวข้องภายใน ...
วิธีการเห็นภาพการวิเคราะห์เชิงคาดการณ์' ข้อมูลดิบ - หุ่น
ภาพมีค่าพันคำ - โดยเฉพาะอย่างยิ่งเมื่อ คุณพยายามที่จะจัดการกับข้อมูลการวิเคราะห์คาดการณ์ของคุณได้ดี ในขั้นตอนก่อนการประมวลผลในขณะที่คุณกำลังเตรียมข้อมูลของคุณการปฏิบัติทั่วไปเพื่อให้เห็นภาพสิ่งที่คุณมีอยู่ในมือก่อนดำเนินการต่อในขั้นตอนต่อไป คุณเริ่มต้นโดยใช้สเปรดชีตเช่น ...
เครื่องการเรียนรู้ใน Academia with Weka - Dummies
Weka (ซึ่งมีให้ที่ Sourceforge .net) คือชุดของเครื่อง learning ใน Java และพัฒนาขึ้นที่มหาวิทยาลัย Waikato ประเทศนิวซีแลนด์ จุดประสงค์หลักของ Weka คือการทำเหมืองข้อมูลและในขั้นแรกโรงเรียนใช้เป็นเครื่องมือการเรียนรู้
การระบุข้อมูลที่ขาดหายไปสำหรับการเรียนรู้ด้วยเครื่อง - มัมมี่
แม้ว่าคุณจะมีตัวอย่างเพียงพอสำหรับการฝึกอบรมทั้งแบบเรียบง่ายและซับซ้อน อัลกอริทึมการเรียนรู้ด้วยเครื่องจะต้องแสดงค่าที่สมบูรณ์ในคุณสมบัติโดยไม่มีข้อมูลที่หายไป มีตัวอย่างที่ไม่สมบูรณ์ทำให้การเชื่อมต่อสัญญาณทั้งหมดภายในและระหว่างคุณสมบัติเป็นไปไม่ได้ ค่าที่ขาดหายไปทำให้ยากสำหรับอัลกอริธึมในการเรียนรู้ในช่วง
การดูข้อมูลพื้นฐานเกี่ยวกับสถิติการเรียนรู้ด้วยเครื่องและวิธีการทางคณิตศาสตร์ในข้อมูลวิทยาศาสตร์ - Dummies
ถ้าสถิติได้รับการอธิบายว่าเป็นวิทยาศาสตร์ของการได้มาซึ่งข้อมูลเชิงลึกจากข้อมูลแล้วความแตกต่างระหว่างนักสถิติกับนักวิทยาศาสตร์ข้อมูลคืออะไร คำถามที่ดี! ในขณะที่งานด้านข้อมูลจำนวนมากจำเป็นต้องมีความรู้ทางสถิติเท่าไรขอบเขตและความกว้างของความรู้และฐานความรู้ของนักวิทยาศาสตร์ข้อมูลแตกต่างจาก ...
ทำให้ความรู้สึกของข้อมูลสำหรับการเติบโตของอีคอมเมิร์ซ - หุ่น
ข้อมูลวิทยาศาสตร์ในอีคอมเมิร์ซทำหน้าที่ วัตถุประสงค์เดียวกันกับที่อยู่ในระเบียบวินัยอื่น ๆ เพื่อหาข้อมูลเชิงลึกอันมีค่าจากข้อมูลดิบ ในอีคอมเมิร์ซคุณกำลังมองหาข้อมูลเชิงลึกที่คุณสามารถใช้เพื่อเพิ่มผลตอบแทนจากการลงทุนด้านการตลาด (ROI) ของแบรนด์และกระตุ้นการเติบโตในทุกขั้นตอนของช่องทางการขาย วิธี ...
Machine การเรียนรู้: การสร้างคุณลักษณะของคุณเองในข้อมูล - dummies
บางครั้งข้อมูลดิบที่คุณได้รับจากหลาย ๆ แหล่งที่มาจะไม่มีคุณสมบัติที่จำเป็นในการดำเนินการเรียนรู้ด้วยเครื่อง เมื่อเกิดเหตุการณ์นี้ขึ้นคุณต้องสร้างคุณลักษณะของตนเองเพื่อให้ได้ผลลัพธ์ที่ต้องการ การสร้างคุณลักษณะไม่ได้หมายความว่าการสร้างข้อมูลจากอากาศบาง คุณสร้างคุณสมบัติใหม่จากข้อมูลที่มีอยู่ เข้าใจถึงความต้องการ ...
การสร้างผลกระทบเชิงบวกกับ Environmental Intelligence - Dummies
Elva เป็นตัวอย่างที่สุกใสว่าเทคโนโลยีด้านสิ่งแวดล้อมสามารถใช้งานได้อย่างไร สร้างผลกระทบเชิงบวก แพลตฟอร์มโอเพนซอร์สฟรีนี้ช่วยให้เกิดการทำแผนที่และรายงานข้อมูลภาพสำหรับการตรวจสอบการเลือกตั้งการละเมิดสิทธิมนุษยชนการเสื่อมสภาพของสิ่งแวดล้อมและความเสี่ยงจากภัยพิบัติในประเทศกำลังพัฒนา ในโครงการล่าสุด Elva ได้ทำงานร่วมกับ ...
การสร้างแบบจำลองความต้องการท่องเที่ยวในกิจกรรมทางอาญา
การสร้างแบบจำลองความต้องการการเดินทางของกิจกรรมทางอาญาช่วยให้คุณสามารถอธิบายและทำนายความต้องการด้านการท่องเที่ยวได้[SET:h1th]การสร้างแบบจำลองความต้องการท่องเที่ยวในกิจกรรมทางอาญา
การทำเหมืองข้อมูลของคุณโดยใช้ข้อมูลวิทยาศาสตร์ - หุ่น
ในยุคของข้อมูลขนาดใหญ่ดูเหมือนองค์กรที่มีรูปร่างทั้งหมด และขนาดอยู่ในเควสจ้างงาน พวกเขาต้องการจ้างนักวิทยาศาสตร์ข้อมูลเพื่อให้พวกเขาสามารถใช้ข้อมูลและการตัดสินใจข้อมูลที่มีข้อมูลเพื่อเพิ่มมูลค่าให้กับองค์กรของตนและสามารถแข่งขันได้ แต่น่าเสียดายที่องค์กรส่วนใหญ่และผู้จัดการการจ้างงานของพวกเขาไม่เข้าใจอย่างแท้จริง ...
ค่าที่หายไปในข้อมูลของคุณ - มัมมี่
ปัญหาข้อมูลที่เกิดขึ้นบ่อยครั้งและไม่เป็นระเบียบเพื่อจัดการกับข้อมูลขาดหายไป ไฟล์อาจไม่สมบูรณ์เนื่องจากระเบียนถูกทิ้งหรืออุปกรณ์จัดเก็บข้อมูลเต็มไป หรือบางฟิลด์ข้อมูลอาจไม่มีข้อมูลสำหรับระเบียนบางรายการ แรกของปัญหาเหล่านี้สามารถวินิจฉัยโดยเพียงแค่การตรวจสอบการนับระเบียนสำหรับไฟล์ ...
โอกาสในการทำงานใหม่ ๆ กับการเรียนรู้ด้วยเครื่อง - มัมมี่
คุณสามารถค้นพบบทความได้มากกว่าสองสามบทความที่กล่าวถึงการสูญเสียงาน การเรียนรู้ด้วยเครื่องและเทคโนโลยีที่เกี่ยวข้องจะทำให้เกิด หุ่นยนต์ได้ปฏิบัติงานเป็นจำนวนมากซึ่งใช้ในการจ้างมนุษย์และการใช้งานนี้จะเพิ่มขึ้นเมื่อเวลาผ่านไป คุณต้องมีการพิจารณาว่าการใช้งานใหม่เหล่านี้อาจทำให้คุณเสียค่าใช้จ่ายได้อย่างไร
ขั้นตอนของกระบวนการทำเหมืองข้อมูล - มัมมี่
กระบวนการมาตรฐานข้ามอุตสาหกรรมสำหรับการทำเหมืองข้อมูล (CRISP-DM) เป็นกรอบการทำเหมืองข้อมูลที่สำคัญ เป็นมาตรฐานแบบเปิด ทุกคนอาจใช้มัน รายการต่อไปนี้อธิบายถึงขั้นตอนต่างๆของกระบวนการ ความเข้าใจในธุรกิจ: ทำความเข้าใจปัญหาที่คุณจะแก้ไขได้ผลกระทบต่อองค์กรของคุณและเป้าหมายของคุณในการแก้ไขปัญหา ...
การเพิ่มประสิทธิภาพของตัวเลือก Cross Validation ในการเรียนรู้ด้วยเครื่อง - มัมมี่
การตรวจสอบความถูกต้องของสมมติฐานการเรียนรู้ของเครื่องสามารถช่วยให้ได้อย่างมีประสิทธิภาพ การเพิ่มประสิทธิภาพของอัลกอริทึมที่คุณเลือก อัลกอริทึมจะให้ประสิทธิภาพในการคาดการณ์ข้อมูลของคุณมากที่สุดโดยให้ความสามารถในการตรวจจับสัญญาณจากข้อมูลและเหมาะสมกับรูปแบบการทำงานที่แท้จริงของฟังก์ชันการทำนายโดยไม่ทำให้เกิดการแปรปรวนและสร้างความแปรปรวนมากขึ้นของค่าประมาณ ไม่สามารถ
การนวนิยายการสร้างภาพใน Predictive Analytics - Dummies
การสร้างภาพสามารถจำลอง (จำลองภาพของสถานการณ์ What-If) ) ในการวิเคราะห์เชิงคาดการณ์ คุณสามารถติดตามการทำนายด้วยการจำลองที่ทับซ้อนกันและสนับสนุนการคาดการณ์ได้ ตัวอย่างเช่นจะเกิดอะไรขึ้นหาก บริษัท หยุดผลิตผลิตภัณฑ์ D? จะเกิดอะไรขึ้นถ้าภัยพิบัติทางธรรมชาติกระทบที่โฮมออฟฟิศ? ...
Analytics เชิงคาดการณ์: การรู้ว่าเมื่ออัปเดตโมเดลของคุณ - มหัศวร
เท่าที่คุณอาจไม่ชอบก็ได้ งานวิเคราะห์ข้อมูลคาดการณ์ของคุณยังไม่สิ้นสุดเมื่อโมเดลของคุณใช้งานได้ การใช้งานแบบจำลองที่ประสบความสำเร็จในการผลิตไม่ใช่เวลาที่จะผ่อนคลาย คุณจะต้องตรวจสอบความถูกต้องและประสิทธิภาพตามเวลาอย่างใกล้ชิด แบบจำลองมีแนวโน้มที่จะลดลงเมื่อเวลาผ่านไป (บางครั้งเร็วกว่าคนอื่น) และ ...
โมเดลเชิงพื้นที่คาดการณ์สำหรับการวิเคราะห์อาชญากรรม - หุ่น
คุณสามารถรวมโมเดลทางสถิติเชิงพยากรณ์เข้าไปในวิธีการวิเคราะห์อาชญากรรมเพื่อสร้างการวิเคราะห์ที่ อธิบายและคาดการณ์ว่ากิจกรรมอาชญากรรมประเภทใดและแนวโน้มที่จะเกิดขึ้น โมเดลเชิงพื้นที่ที่คาดการณ์ล่วงหน้าสามารถช่วยคุณคาดเดาพฤติกรรมสถานที่หรือกิจกรรมทางอาญาของผู้กระทำผิดซ้ำได้ นอกจากนี้คุณยังสามารถใช้วิธีการทางสถิติกับข้อมูล Spatio-temporal เพื่อยืนยัน ...
การจัดเตรียมข้อมูลของคุณสำหรับ Predictive Analytics - Dummies
เมื่อคุณกำหนดวัตถุประสงค์ของโมเดลแล้วขั้นตอนถัดไป ในการวิเคราะห์เชิงคาดการณ์คือการระบุและเตรียมข้อมูลที่คุณจะใช้เพื่อสร้างโมเดลของคุณ ข้อมูลต่อไปนี้จะกล่าวถึงกิจกรรมที่สำคัญที่สุด ลำดับขั้นตอนทั่วไปมีลักษณะดังนี้: ระบุแหล่งข้อมูลของคุณ ข้อมูลอาจอยู่ในรูปแบบอื่นหรือ
การแจกแจงความน่าจะเป็นในการวิเคราะห์ทางสถิติของข้อมูลขนาดใหญ่ - มัด
การกระจายความน่าจะเป็นหนึ่งในหลายเทคนิคทางสถิติที่สามารถทำได้ ใช้เพื่อวิเคราะห์ข้อมูลเพื่อหารูปแบบที่เป็นประโยชน์ คุณใช้การแจกแจงความน่าจะเป็นเพื่อคำนวณความน่าจะเป็นที่เกี่ยวข้องกับองค์ประกอบของชุดข้อมูล: การแจกแจงแบบคู่: คุณจะใช้การแจกแจงสองทางเพื่อวิเคราะห์ตัวแปรที่สามารถสันนิษฐานได้เพียงหนึ่งในสองค่าเท่านั้น สำหรับ <...
Quandl Open Data - dummies
Quandl เป็นเว็บไซต์ที่ใช้ชื่อว่า Toronto ซึ่งมีจุดมุ่งหมายเพื่อเป็นเครื่องมือค้นหาสำหรับข้อมูลตัวเลข แต่แตกต่างจากเครื่องมือค้นหาส่วนใหญ่ แต่ฐานข้อมูลไม่ได้สร้างโดยอัตโนมัติโดยแมงมุมที่รวบรวมข้อมูลบนเว็บ ค่อนข้างจะมุ่งเน้นไปที่ข้อมูลที่เชื่อมโยงที่ได้รับการอัปเดตผ่านทาง crowdsourcing - อัปเดตด้วยตนเองผ่านภัณฑารักษ์ของมนุษย์หรือกล่าวอีกนัยหนึ่ง เนื่องจากข้อมูลทางการเงินส่วนใหญ่เป็น ...
การป้องกันภัยข้อมูลความเป็นส่วนตัว - ดัมมี่
ข้อมูลส่วนบุคคลเป็นปัญหาใหญ่สำหรับผู้ปฏิบัติเหมืองข้อมูล รายงานข่าวที่ระบุถึงระดับข้อมูลส่วนบุคคลในมือของหน่วยงานความมั่นคงแห่งชาติของรัฐบาลสหรัฐฯและการละเมิดแหล่งข้อมูลเชิงพาณิชย์ทำให้ความตระหนักและความห่วงใยของสาธารณชนเพิ่มมากขึ้น แนวคิดหลักเกี่ยวกับความเป็นส่วนตัวของข้อมูลคือข้อมูลส่วนบุคคล (PII) หรือข้อมูลใด ๆ ที่สามารถทำได้
การวิเคราะห์ถดถอยในการวิเคราะห์ข้อมูลสถิติขนาดใหญ่ - หุ่น
การวิเคราะห์ถดถอยถูกใช้เพื่อประเมินความแข็งแรงและทิศทาง ของความสัมพันธ์ระหว่างตัวแปรที่เกี่ยวข้องกับเส้นตรงกัน สองตัวแปร X และ Y ถูกกล่าวว่าเป็น linearly related ถ้าความสัมพันธ์ระหว่างพวกเขาสามารถเขียนได้ในรูปแบบ Y = mX + b โดย m คือความชันหรือ ...
การเพิ่มขึ้นของข้อมูลที่เปิดและบทบาทในการคาดการณ์ Analytics - มัมมี่
เปิดข้อมูลอาจกลายเป็น > การเพิ่มขึ้นของข้อมูลที่เปิดและบทบาทในการวิเคราะห์ข้อมูลที่คาดเดา เป็นเครื่องมือที่มีประโยชน์มากสำหรับการวิเคราะห์เชิงคาดการณ์ Bob Lytle ซีอีโอของ rel8ed และล่าสุดเป็นที่รู้จักในฐานะ CIO เดิมของ TransUnion Canada กำลังพยายามนำข้อมูลสาธารณะมาใช้เป็นแหล่งข้อมูลทางเลือกและเชิงกลยุทธ์สำหรับการทำแบบจำลองทำนายในภาคบริการทางการเงินและภาคประกันภัย เปิด ...
เทคนิคการวิเคราะห์ข้อมูลเชิงปริมาณ (EDA) - หุ่น
แม้ว่า EDA จะขึ้นอยู่กับเทคนิคกราฟิก ยังประกอบด้วยเทคนิคเชิงปริมาณไม่กี่ บทความนี้กล่าวถึงสองข้อนี้คือการประมาณช่วงเวลาและการทดสอบสมมุติฐาน การประเมินช่วงเวลาการประมาณช่วงคือเทคนิคที่ใช้ในการสร้างช่วงของค่าภายในที่ตัวแปรมีแนวโน้มลดลง ตัวอย่างหนึ่งที่สำคัญของเรื่องนี้ ...
สถิติที่แข็งแกร่งและข้อมูลขนาดใหญ่ - มัมมี่
สถิติกล่าวว่ามีประสิทธิภาพหากไม่ได้รับอิทธิพลอย่างมากจาก การแสดงตนของ Outliers ตัวอย่างเช่นค่าเฉลี่ยไม่แข็งแรงเนื่องจากอาจได้รับผลกระทบอย่างมากจากการปรากฏตัวของค่าผิดปกติ ในทางกลับกันค่ามัธยฐานมีเสถียรภาพ - ไม่ได้รับผลกระทบจากค่าผิดปกติ ตัวอย่างเช่นสมมติว่าข้อมูลต่อไปนี้ ...
บทบาทของสถิติในการเรียนรู้เครื่องจักร - มัมมี่
บางเว็บไซต์ทางออนไลน์น่าจะทำให้คุณเชื่อว่าสถิติและการเรียนรู้ด้วยเครื่อง เป็นเทคโนโลยีที่แตกต่างกันอย่างสิ้นเชิงสองประการ ตัวอย่างเช่นเมื่อคุณอ่าน Statistics vs. Machine Learning ให้ต่อสู้! คุณจะได้รับความคิดที่ว่าทั้งสองเทคโนโลยีต่างกันไม่เพียง แต่เป็นปฏิปักษ์ต่อกันและกัน ความจริงก็คือสถิติและการเรียนรู้เกี่ยวกับเครื่องมี ...
การใช้ Cross Validation ในการเรียนรู้ด้วยเครื่อง - Dummies
บางครั้งการเรียนรู้ด้วยเครื่องต้องการให้คุณต้อง รีสอร์ทเพื่อตรวจสอบข้าม ปัญหาที่เห็นได้ชัดเกี่ยวกับการแยกชุดรถไฟ / ชุดทดสอบคือความจริงที่คุณนำเสนอในการทดสอบเนื่องจากคุณลดขนาดข้อมูลการฝึกอบรมในตัวอย่างของคุณ เมื่อคุณแยกข้อมูลของคุณคุณอาจจะรักษาตัวอย่างที่เป็นประโยชน์บางส่วนออกมาจากการฝึกอบรม ...
ค้นหาข้อมูลด้วย Federal Data Portal - Dummies
ก่อนที่คุณจะเริ่มค้นหาข้อมูลที่จะทิ้งข้อมูล . Gov, พอร์ทัลข้อมูลของรัฐบาลกลางคุณต้องเข้าใจสิ่งหนึ่งอย่าง: ไม่มีข้อมูลในไซต์ ข้อมูล. gov เป็นที่เก็บแคตตาล็อกข้อมูลซึ่งเป็นรายการชื่อชุดข้อมูลที่มีรายละเอียดเช่นคำอธิบายรูปแบบและ URL สำหรับการได้รับข้อมูลและข้อมูลเพิ่มเติม ข้อมูลเอง ...
ความคล้ายคลึงกันเมตริกที่ใช้ในข้อมูลศาสตร์ - มัด
การจัดกลุ่มและการจำแนกประเภทขึ้นอยู่กับการคำนวณความเหมือนหรือความแตกต่างระหว่างสอง จุดข้อมูล. หากชุดข้อมูลของคุณเป็นตัวเลขซึ่งประกอบด้วยฟิลด์และค่าจำนวนเพียงอย่างเดียวและสามารถแสดงให้เห็นได้ในพล็อต N มิติแล้วจะมีเมตริกทางเรขาคณิตต่างๆที่คุณสามารถใช้เพื่อปรับขนาดข้อมูลแบบหลายมิติได้ พล็อต n มิติ ...
การดูสิ่งที่คุณต้องรู้เมื่อเริ่มต้นใช้งานข้อมูลวิทยาศาสตร์ - มัมมี่
ตามธรรมเนียม, ข้อมูลขนาดใหญ่เป็นคำที่ใช้สำหรับข้อมูลที่มีปริมาณความเร็วและความหลากหลายอย่างเหลือเชื่อ เทคโนโลยีฐานข้อมูลแบบเดิมไม่สามารถจัดการกับข้อมูลขนาดใหญ่ได้จำเป็นต้องใช้โซลูชั่นด้านข้อมูลที่เป็นนวัตกรรมใหม่กว่า เมื่อต้องการประเมินโครงการของคุณว่ามีคุณสมบัติเป็นโครงการข้อมูลขนาดใหญ่หรือไม่โปรดพิจารณาเกณฑ์ต่อไปนี้ Volume: ระหว่าง 1 เทราไบต์ต่อปีและ 10 petabytes / year ความเร็ว: ...
การวิเคราะห์ชั่วคราวเพื่อการป้องกันอาชญากรรมและการตรวจสอบ - หุ่น
การวิเคราะห์ชั่วคราวของข้อมูลอาชญากรรมเป็นการวิเคราะห์ที่อธิบายถึงรูปแบบ กิจกรรมทางอาญาตามเวลา คุณสามารถวิเคราะห์ข้อมูลอาชญากรรมชั่วขณะเพื่อพัฒนาการวิเคราะห์ที่กำหนดได้โดยการวิเคราะห์อาชญากรรมแบบดั้งเดิมหรือผ่านวิธีการทางวิทยาศาสตร์ข้อมูล
9 คำแถลงในการทำเหมืองข้อมูล: คู่มืออ้างอิง - มัมมี่
ผู้บุกเบิกข้อมูล Thomas Thomas Khabaza "เก้าข้อกฎหมายในการทำเหมืองข้อมูล" เพื่อเป็นแนวทางให้กับคนงานเหมืองข้อมูลใหม่ ๆ ในขณะที่พวกเขาลงมาทำงาน คู่มืออ้างอิงฉบับนี้แสดงให้คุณเห็นว่ากฎหมายแต่ละข้อเหล่านี้หมายถึงอะไรในชีวิตประจำวันของคุณ กฎหมายที่ใช้ในการทำเหมืองข้อมูลที่ 1 หรือ "กฎหมายเป้าหมายทางธุรกิจ": วัตถุประสงค์ทางธุรกิจเป็นที่มาของข้อมูลทุกอย่าง
Scatter Plots: เทคนิคแบบกราฟิกสำหรับข้อมูลทางสถิติ - Dummies
แตกต่างจากแผนภาพ Stem-and-leaf a พล็อตกระจายมีวัตถุประสงค์เพื่อแสดงความสัมพันธ์ระหว่างสองตัวแปร อาจเป็นเรื่องยากที่จะดูว่ามีความสัมพันธ์ระหว่างสองตัวแปรเพียงแค่ดูข้อมูลดิบ แต่ด้วยการกระจายข้อมูลรูปแบบใด ๆ ที่มีอยู่ในข้อมูลจะกลายเป็นเรื่องง่ายที่จะเห็นได้มากขึ้น กระจาย
The Big Data Paradox - Dummies
คุณจะพบความแตกต่างในการวิเคราะห์ข้อมูลขนาดใหญ่ จริงๆแล้วข้อมูลเล็ก ๆ แม้ว่าข้อมูลนี้อาจทำให้เกิดความสับสนและขัดต่อหลักฐานทั้งหมดข้อมูลขนาดเล็กเป็นผลมาจากการวิเคราะห์ข้อมูลขนาดใหญ่ นี่ไม่ใช่แนวความคิดใหม่หรือไม่คุ้นเคยกับผู้ที่เคยทำการวิเคราะห์ข้อมูลมานานเท่าใด
การทำงานใน Python แบบขนานสำหรับวิทยาศาสตร์ข้อมูล - Dummies
คอมพิวเตอร์ส่วนใหญ่เป็น Multicore แพคเกจเดียว) บางส่วนที่มี CPU หลายตัว หนึ่งในข้อ จำกัด ที่สำคัญที่สุดของ Python คือใช้ single core ตามค่าดีฟอลต์ ข้อมูลโครงการวิทยาศาสตร์ต้องใช้คอมพิวเตอร์เป็นจำนวนมาก ...
D3 js ห้องสมุดสำหรับการแสดงข้อมูล - Dummies
D3 js เป็นไลบรารี JavaScript แบบโอเพนซอร์สที่นำภาพข้อมูลโลกโดยพายุมาใช้นับตั้งแต่เปิดตัวครั้งแรกในปีพ. ศ. 2554 โดย Mike Bostock ผู้สร้างภาพข้อมูลที่มีชื่อเสียงและบรรณาธิการกราฟิกสำหรับ New York Times สร้างขึ้น (และยังคงรักษา) คุณสามารถใช้ไลบรารีนี้เพื่อสร้างเอกสารที่ขับเคลื่อนด้วยข้อมูลที่มีคุณภาพสูง (D3) ใน <...