ในการวิเคราะห์ข้อมูลสำหรับ infographics ของคุณคุณควรทราบว่าบางจุดข้อมูล - เรียกว่า outliers - อยู่นอกบรรทัดฐานที่ เรียกร้องความสนใจให้กับตัวเอง ในกรณีที่รุนแรงที่สุดพวกเขาสามารถแม้แต่เอียงข้อมูลและสร้างภาพที่ทำให้เข้าใจผิดของวัตถุ คุณต้องรู้จักเมื่อคุณมีข้อผิดพลาดและตัดสินใจว่าจะทำอย่างไร
ตารางนี้มีตัวอย่างง่ายๆในการแสดงให้เห็นถึงแนวคิดนี้ ชุดข้อมูลสองชุดเป็นตัวแทนของคะแนนของนักเรียนเป็นเวลาแปดสัปดาห์ในการสอบรายสัปดาห์สองครั้ง ตัวเลขเป็นเปอร์เซ็นต์ที่ถูกต้องในการสอบ ชุดข้อมูลทางด้านซ้าย (การสอบครั้งแรก) ไม่มีค่าผิดปกติ แต่ชุดข้อมูลทางด้านขวา (การสอบที่สอง) ทำ ข้อผิดพลาดหนึ่งจะแสดงเป็นตัวหนา
1 เกรด สัปดาห์ระดับ (เหนือกว่าหนึ่ง) | 1 | 90% |
---|---|---|
90% | 2 | 88% |
88% | 3 | 90% |
90% | 4 | 85% |
50% | 5 | 86% |
86% | 6 | 87% |
87% | 7 | 85% |
85% | 8 | 84% |
84% | เฉลี่ย > 87% | 83% |
|
ค่าเฉลี่ยในคอลัมน์กลางจะวาดภาพได้อย่างแม่นยำว่านักเรียนมีผลสัมฤทธิ์ทางการเรียนในการทดสอบปกติ ค่าดีเอ็นเอ (ตัวหนา) ตัวเดียว (ตัวหนา) (50%) ในชุดข้อมูลทางด้านขวาจะพัตต์ประแจลงในงานแม้ว่าค่าเฉลี่ยของนักเรียนจะลดลง 4 เปอร์เซ็นต์และบิดเบือนข้อมูล | ผู้สื่อข่าวทำอะไรในกรณีนี้? ต่อไปนี้เป็นตัวเลือกน้อยกว่า: |
หากคุณใช้ค่าเฉลี่ยในกราฟิกของคุณเท่านั้นและกังวลว่าข้อมูลนี้ทำให้เข้าใจผิดให้กำจัดค่าผิดปกติเป็นค่าเบี่ยงเบนแล้วคำนวณค่าเฉลี่ยโดยไม่ใช้สัปดาห์ดังกล่าวดังแสดงในรูป
-
ในตัวอย่างนี้การโยนออกค่าทดแทนจะหมายถึงคะแนนการทดสอบเฉลี่ยของนักเรียนคนนี้จะสูงขึ้นถึง 87% ซึ่งเป็นคอลัมน์ที่แสดงถึงความสำเร็จได้ดีกว่าคำนี้ ถ้าคุณเลือกตัวเลือกนี้โปรดเพิ่มเชิงอรรถอธิบายทุกอย่าง: ในกรณีนี้การลบจุดข้อมูล ควรโปร่งใสที่สุดเท่าที่จะเป็นไปได้
แสดงข้อมูลตามที่เป็นอยู่ไม่ว่าคุณจะใช้ค่าเฉลี่ยในกราฟิกหรือวางแผนข้อมูลทั้งหมดในแผนภูมิคุณสามารถนำเสนอข้อมูลทั้งหมดตามที่แสดงในรูปต่อไปนี้
ในกรณีนี้คุณควรเพิ่มเชิงอรรถเพื่อแจ้งให้ผู้อ่านเข้าใจอย่างเต็มที่
-
สร้าง "เส้นที่พอดีที่สุด " ตัวเลือกนี้ใช้เฉพาะเมื่อคุณต้องการสร้างแผนภูมิที่แสดงข้อมูลทั้งหมด เส้นที่พอดีที่สุด - เรียกอีกอย่างหนึ่งว่า
การถดถอยเชิงเส้น
-
- เป็นค่าเฉลี่ยของข้อมูลของคุณ: บรรทัดแท้จริงที่แสดงถึงข้อมูลที่กระจัดกระจายของคุณดีที่สุด