ก่อนที่จะมีการวิเคราะห์ทางสถิติประเภทใด ๆ การทำความเข้าใจลักษณะของข้อมูลที่ได้รับการวิเคราะห์เป็นสิ่งจำเป็น คุณสามารถใช้ EDA เพื่อระบุคุณสมบัติของชุดข้อมูลเพื่อกำหนดวิธีการทางสถิติที่เหมาะสมที่สุดเพื่อนำไปใช้กับข้อมูล คุณสามารถตรวจสอบคุณสมบัติหลายประเภทด้วยเทคนิค EDA ซึ่ง ได้แก่ ข้อมูลต่อไปนี้
-
ศูนย์กลางของข้อมูล
-
การแพร่กระจายระหว่างสมาชิกของข้อมูล
-
ความสัมพันธ์ระหว่างองค์ประกอบในชุดข้อมูล
-
ค่าพารามิเตอร์ของข้อมูลมีค่าคงที่ตลอดเวลาหรือไม่
-
การมีข้อมูลผิดปกติในข้อมูล
-
คำตอบที่สำคัญอีกอย่างของ EDA คือ "ข้อมูลมีความสอดคล้องกับสมมติฐานของเราหรือไม่? "การระบุคุณสมบัติของชุดข้อมูลมีความสำคัญมากเนื่องจากขั้นตอนทางสถิติจำนวนมากมีความอ่อนไหวต่อสมมติฐานที่คุณทำเกี่ยวกับข้อมูล
-