เมื่อคุณอาศัยเทคโนโลยีหรือเครื่องมือเพื่อทำหน้าที่วิเคราะห์ข้อมูลคาดการณ์ผิดพลาดที่นี่หรือที่นั่นอาจทำให้เครื่องมือเหล่านี้สามารถลงทะเบียนค่าที่มากหรือผิดปกติได้ หากเซ็นเซอร์บันทึกค่าสังเกตการณ์ที่ไม่ผ่านมาตรฐานการควบคุมคุณภาพขั้นพื้นฐานจะทำให้เกิดปัญหาการหยุดชะงักที่เกิดขึ้นจริงในข้อมูล
คนที่ทำการป้อนข้อมูลเช่นสามารถเพิ่มความผิดพลาดได้อย่างน้อย 0 ในตอนท้ายของค่าโดยใช้รายการที่อยู่นอกขอบเขตและสร้างค่าผิดปกติ
หากคุณกำลังดูข้อมูลการสังเกตการณ์ที่เก็บรวบรวมโดยเซ็นเซอร์น้ำที่ติดตั้งในท่าเรือบัลติมอร์ - และรายงานความลึกของน้ำ 20 ฟุตเหนือระดับน้ำทะเลปานกลาง - คุณมีข้อผิดพลาดมากกว่า เซ็นเซอร์จะเห็นได้ชัดว่าผิดพลาดเว้นแต่เมืองบัลติมอร์จะถูกปกคลุมด้วยน้ำอย่างสมบูรณ์
ข้อมูลอาจมีข้อผิดพลาดเนื่องจากเหตุการณ์ภายนอกหรือข้อผิดพลาดของบุคคลหรือเครื่องมือ
หากเหตุการณ์จริงเช่นเหตุการณ์แฟลชเกิดขึ้นจากข้อผิดพลาดในระบบผลที่ตามมายังเป็นจริง แต่ถ้าคุณทราบแหล่งที่มาของปัญหาคุณอาจสรุปได้ว่าข้อบกพร่องในข้อมูลไม่ใช่โมเดลของคุณ ถูกตำหนิหากโมเดลของคุณไม่ได้คาดการณ์เหตุการณ์
การรู้แหล่งที่มาของข้อผิดพลาดภายนอกจะเป็นแนวทางในการตัดสินใจของคุณเกี่ยวกับวิธีจัดการกับมัน ข้อผิดพลาดที่เกิดจากข้อผิดพลาดเกี่ยวกับการป้อนข้อมูลสามารถแก้ไขได้โดยง่ายหลังจากปรึกษาแหล่งข้อมูล ข้อผิดพลาดที่สะท้อนถึงความเป็นจริงในการเปลี่ยนแปลงอาจทำให้คุณเปลี่ยนรูปแบบของคุณได้
ไม่มีคำตอบใดเหมาะสำหรับทุกคำตอบเมื่อคุณตัดสินใจว่าจะใส่หรือลบล้างข้อมูลที่มากเกินไปซึ่งไม่ใช่ข้อผิดพลาดหรือเกิดความผิดพลาด การตอบสนองของคุณขึ้นอยู่กับลักษณะของการวิเคราะห์ที่คุณกำลังทำและประเภทของรูปแบบที่คุณกำลังสร้างขึ้น ในบางกรณีวิธีจัดการกับข้อผิดพลาดเหล่านี้ตรงไปตรงมา:
ถ้าหากเซ็นเซอร์น้ำใน Baltimore Harbour รายงานน้ำที่ระดับความลึก 20 ฟุตเหนือระดับน้ำทะเลปานกลางและคุณอยู่ที่บัลติมอร์ให้มองออกไปนอกหน้าต่างของคุณ:
ถ้า Baltimore ไม่ได้รับน้ำทั้งหมด เห็นได้ชัดว่าผิด
-
ถ้าคุณเห็นปลากำลังมองไปที่คุณความเป็นจริงเปลี่ยนไป คุณอาจต้องแก้ไขโมเดลของคุณ
-
ความผิดพลาดใน Flash อาจเป็นเหตุการณ์เพียงครั้งเดียว (ในระยะสั้น ๆ) อย่างไรก็ตามผลกระทบที่เกิดขึ้นจริง - และหากคุณศึกษาตลาดในระยะยาวคุณก็รู้ว่าสิ่งที่คล้ายกันอาจเกิดขึ้นอีกครั้ง.หากธุรกิจของคุณอยู่ในด้านการเงินและคุณจัดการกับตลาดหุ้นตลอดเวลาคุณต้องการให้โมเดลของคุณพิจารณาความผิดปรกติดังกล่าว
โดยทั่วไปแล้วหากผลของการจัดงานปกติที่ถือว่าเป็น outlier อาจมีผลกระทบอย่างสำคัญต่อธุรกิจของคุณให้พิจารณาวิธีจัดการกับเหตุการณ์เหล่านั้นในการวิเคราะห์ของคุณ จงเก็บจุดทั่วไปเหล่านี้ไว้ในใจเกี่ยวกับความผิดปกติ:
ชุดข้อมูลที่มีขนาดเล็กกว่าคือค่าความผิดพลาดที่มีนัยสำคัญยิ่งขึ้นในการวิเคราะห์
-
ในขณะที่คุณพัฒนาแบบจำลองของคุณให้แน่ใจว่าคุณได้พัฒนาเทคนิคในการหาค่าผิดปกติและเพื่อให้เข้าใจถึงผลกระทบที่มีต่อธุรกิจของคุณอย่างเป็นระบบ
-
การตรวจจับค่าผิดปกติอาจเป็นกระบวนการที่ซับซ้อน ไม่มีวิธีง่ายๆในการระบุตัวตน
-
ผู้เชี่ยวชาญด้านโดเมน
-
(คนที่รู้จักสาขาที่คุณกำลังสร้างโมเดล) คือบุคคลที่ดีที่สุดของคุณเพื่อตรวจสอบว่าจุดข้อมูลถูกต้องหรือไม่ตรงตามที่คุณสามารถปฏิเสธได้ ที่จะนำมาพิจารณา ผู้เชี่ยวชาญด้านโดเมนควรจะสามารถอธิบายได้ว่าปัจจัยใดที่ทำให้เกิดความผิดปกติขึ้นช่วงของความแปรปรวนและผลกระทบต่อธุรกิจ เครื่องมือแสดงภาพสามารถช่วยคุณตรวจหาข้อมูลผิดปกติในข้อมูลได้ นอกจากนี้หากคุณทราบช่วงค่าที่คาดไว้คุณสามารถสอบถามข้อมูลที่อยู่ในช่วงดังกล่าวได้อย่างง่ายดาย