วีดีโอ: สถิติ 17.1.1 ตารางแจกแจงความถี่ 2024
เช่นเดียวกับในหลาย ๆ ด้านของระบบธุรกิจใด ๆ ข้อมูลคือการสร้างของมนุษย์ดังนั้นจึงควรมีข้อ จำกัด ในการใช้งานเมื่อแรก ได้รับมัน ต่อไปนี้คือภาพรวมของข้อ จำกัด บางอย่างที่คุณอาจประสบ:
-
ข้อมูลอาจไม่สมบูรณ์ ค่าที่ขาดหายไปแม้ไม่มีส่วนหรือส่วนสำคัญของข้อมูลอาจ จำกัด การใช้งาน
ตัวอย่างเช่นข้อมูลของคุณอาจครอบคลุมเพียงหนึ่งหรือสองเงื่อนไขของชุดที่ใหญ่กว่าที่คุณกำลังพยายามสร้างโมเดลเช่นเดียวกับเมื่อโมเดลที่สร้างขึ้นเพื่อวิเคราะห์ประสิทธิภาพของตลาดหุ้นมีเพียงข้อมูลที่มีอยู่ในช่วง 5 ปีที่ผ่านมาเท่านั้นซึ่งสะเทือนทั้งสองอย่าง ข้อมูลและรูปแบบที่มีต่อสมมติฐานของตลาดวัว
ตรวจสอบว่าคุณกำลังมองหาช่วงเวลาที่ให้ภาพที่สมบูรณ์ของความผันผวนตามธรรมชาติของข้อมูลของคุณ ข้อมูลของคุณไม่ควรถูก จำกัด ด้วยตามฤดูกาล หากคุณกำลังใช้ข้อมูลจากแบบสำรวจโปรดจำไว้ว่าผู้คนไม่ได้ให้ข้อมูลที่ถูกต้องเสมอไป
-
ทุกคนจะไม่ตอบคำถามเกี่ยวกับจำนวนครั้งที่ออกกำลังกายหรือดื่มเครื่องดื่มแอลกอฮอล์เท่าไร - ต่อสัปดาห์ คนอาจจะไม่สุจริตมากเช่นเดียวกับตัวเอง แต่ข้อมูลยังคงเบ้
-
ข้อมูลที่รวบรวมได้จากแหล่งข้อมูลที่หลากหลายเช่นแบบสำรวจแบบฟอร์มอีเมลแบบฟอร์มการป้อนข้อมูลและเว็บไซต์ของ บริษัท จะมีคุณลักษณะและโครงสร้างที่แตกต่างกัน ข้อมูลจากแหล่งต่างๆอาจไม่สามารถทำงานร่วมกันระหว่างเขตข้อมูลได้มากนัก ข้อมูลดังกล่าวต้องการการประมวลผลล่วงหน้าที่สำคัญก่อนที่จะมีการวิเคราะห์พร้อม แถบด้านข้างประกอบเป็นตัวอย่าง
เพื่อตรวจสอบข้อ จำกัด ของข้อมูลให้แน่ใจว่า:
ยืนยันตัวแปรทั้งหมดที่คุณจะใช้ในโมเดลของคุณ
-
ประเมินขอบเขตของข้อมูลโดยเฉพาะช่วงเวลาดังนั้นโมเดลของคุณจึงสามารถหลีกเลี่ยงกับดักฤดูกาลได้
-
ตรวจสอบหาค่าที่หายไประบุและประเมินผลกระทบต่อการวิเคราะห์โดยรวม
-
ระวังค่าที่มากสุด (outliers) และตัดสินใจว่าควรรวมไว้ในการวิเคราะห์หรือไม่
-
ยืนยันว่าข้อมูลการฝึกอบรมและการทดสอบมีขนาดใหญ่พอสมควร
-
ตรวจสอบให้แน่ใจว่า
-
ประเภทข้อมูล (จำนวนเต็มค่าทศนิยมหรืออักขระ ฯลฯ) ถูกต้องและตั้งค่าขอบเขตบนและล่างของค่าที่เป็นไปได้ ให้ความสำคัญกับการรวมข้อมูลเมื่อข้อมูลของคุณมาจากหลายแหล่ง
-
ตรวจสอบว่าคุณเข้าใจแหล่งข้อมูลและผลกระทบต่อคุณภาพโดยรวมของข้อมูล
เลือกชุดข้อมูลที่เกี่ยวข้องซึ่งเป็นตัวแทนของประชากรทั้งหมด
-
เลือกพารามิเตอร์ที่เหมาะสมสำหรับการวิเคราะห์ของคุณ
-
แม้จะได้รับความใส่ใจและใส่ใจทุกรายอย่ารู้สึกแปลกใจหากข้อมูลของคุณยังคงต้องมีการประมวลผลล่วงหน้าก่อนที่คุณจะสามารถวิเคราะห์ได้อย่างถูกต้อง การประมวลผลล่วงหน้ามักใช้เวลานานและมีความพยายามอย่างมากเนื่องจากต้องแก้ไขปัญหาต่างๆที่เกี่ยวข้องกับข้อมูลเดิมซึ่ง ได้แก่ ปัญหา: 999 ค่าใด ๆ ที่ขาดหายไปจากข้อมูล
ความไม่สอดคล้องใด ๆ และ / หรือข้อผิดพลาดที่มีอยู่ในข้อมูล
-
ข้อมูลที่ซ้ำกันหรือข้อมูลผิดปกติ
-
การทำให้เป็นบรรทัดฐานหรือการแปลงข้อมูลอื่น ๆ
-
ข้อมูลที่จำเป็นทั้งหมดที่จำเป็นสำหรับการวิเคราะห์