วีดีโอ: Making more pizzas to spread cost per pizza | Functions and their graphs | Algebra II | Khan Academy 2024
เมื่อทำงานร่วมกับข้อมูลสถิติขนาดใหญ่คุณสามารถระบุการแพร่กระจายของชุดข้อมูลจากศูนย์ด้วยมาตรการสรุปที่แตกต่างกันหลายแบบ ได้แก่ ความแปรปรวนมาตรฐาน ส่วนเบี่ยงเบน quartiles ช่วงควอไทล์ (IQR)
ความแปรปรวนคือค่าเบี่ยงเบนกำลังสองเฉลี่ยระหว่างองค์ประกอบของชุดข้อมูลและค่าเฉลี่ย สำหรับตัวอย่างของข้อมูลความแปรปรวนจะคำนวณดังนี้:
โดยที่
-
x i คือค่าขององค์ประกอบเดี่ยวในตัวอย่าง
-
หมายถึงตัวอย่าง
-
n คือขนาดตัวอย่าง
ค่าเบี่ยงเบนมาตรฐานคือรากที่สองของความแปรปรวน สำหรับการใช้งานส่วนใหญ่ค่าเบี่ยงเบนมาตรฐานจะสะดวกกว่าการใช้ความแปรปรวนมากกว่าการแพร่กระจาย นั่นเป็นเพราะความแปรปรวนวัดได้ในหน่วย ที่มีกำลังสอง ขณะที่ส่วนเบี่ยงเบนมาตรฐานวัดได้ในหน่วยเดียวกับข้อมูล ตัวอย่างเช่นความแปรปรวนของชุดข้อมูลประกอบด้วยราคาจะวัดเป็นดอลลาร์ ยกกำลังสอง, และส่วนเบี่ยงเบนมาตรฐานจะวัดเป็นดอลลาร์ ส่วนเบี่ยงเบนมาตรฐานคือการวัดที่แพร่หลายมากที่สุดในการแพร่กระจายในชุดข้อมูล
ควอร์ไทล์แบ่งชุดข้อมูลออกเป็นสี่ส่วนเท่า ๆ กัน ควอไทล์แรก (Q 1 ) แบ่งข้อมูลออกเป็น 25 เปอร์เซ็นต์ต่ำสุดของการสังเกตและสูงสุด 75 เปอร์เซ็นต์ (25 เปอร์เซ็นต์ของข้อสังเกต น้อยกว่า Q 1 < และ 75 เปอร์เซ็นต์ มากกว่า Q 1 ) ควอร์ไทล์ที่สอง (Q 2 ) แบ่งข้อมูลออกเป็น 50 เปอร์เซ็นต์ต่ำสุดของการสังเกตและสูงสุด 50 เปอร์เซ็นต์ ควอร์ไทล์ที่สาม (Q 3 ) แบ่งข้อมูลออกเป็น 75 เปอร์เซ็นต์ต่ำสุดของการสังเกตและสูงสุด 25 เปอร์เซ็นต์ ช่วงคั่นระหว่างกัน (IQR) เท่ากับความแตกต่างระหว่างควอไทล์ที่สามและสี่:
quartiles ของชุดข้อมูลแสดงได้ดีที่สุดด้วยพล็อตกล่อง
ต่อไปนี้เป็นแผนผังกล่องคืนผลตอบแทนรายวันของ ExxonMobil ในปี 2556 กล่องแปลงผลตอบแทนรายวันของหุ้น ExxonMobil ในปี 2556
กล่องแปลงแสดงสถิติสำคัญหลายประการสำหรับผลตอบแทนของเอ็กซอนโมบิล: > ผลตอบแทนต่ำสุดจะแสดงบนกราฟเป็นจุดเดียวที่ด้านล่างของพล็อต (พล็อตกล่องแสดงค่าผิดปกติ
เป็นแต่ละจุด) Q 1 แสดงด้านล่างของกล่อง Q 2 เป็นเส้นสีดำทึบตรงกลางของกล่องและ Q 3 เป็นด้านบนของ กล่อง. ผลตอบแทนสูงสุดจะแสดงเป็นจุดเดียวที่ด้านบนสุดของพล็อต