บ้าน การเงินส่วนบุคคล เทคนิคการวิเคราะห์ข้อมูลเชิงสำรวจแบบกราฟิก (EDA) - มัมมี่

เทคนิคการวิเคราะห์ข้อมูลเชิงสำรวจแบบกราฟิก (EDA) - มัมมี่

สารบัญ:

Anonim

EDA มีพื้นฐานอยู่บน เทคนิคแบบกราฟิก คุณสามารถใช้เทคนิคแบบกราฟิกเพื่อระบุคุณสมบัติที่สำคัญที่สุดของชุดข้อมูล นี่คือบางส่วนของเทคนิคการใช้งานที่แพร่หลายมากขึ้น:

  • กล่องแปลง

  • ฮิสโตแกรม

  • แผนการแปลงความน่าจะเป็นปกติ

  • แปลงกระจาย

กล่องแปลง

คุณใช้กล่องแปลงเพื่อแสดงบางส่วนที่สำคัญที่สุด คุณลักษณะของชุดข้อมูลเช่นข้อมูลต่อไปนี้:

  • ค่าต่ำสุด

  • ค่าสูงสุด

  • ควอร์ไทล์

ควอร์ไทล์แยกชุดข้อมูลออกเป็นสี่ส่วนเท่า ๆ กัน ควอร์ไทล์ที่หนึ่ง (Q 1 ) มีค่าดังต่อไปนี้:

25 เปอร์เซ็นต์ของข้อสังเกตในชุดข้อมูลมีค่าน้อยกว่าควอร์ไทล์ที่หนึ่ง

75 เปอร์เซ็นต์ของข้อสังเกตมากกว่าควอร์ไทล์แรก

ควอไทล์ที่สอง (Q 2 ) เป็นค่าที่ทำให้

50 เปอร์เซ็นต์ของข้อสังเกตในชุดข้อมูลมีค่าน้อยกว่าควอร์ไทล์ที่สอง

50 เปอร์เซ็นต์ของข้อสังเกตมากกว่าควอร์ไทล์ที่สอง

ควอร์ไทล์ที่สองเรียกว่าค่ามัธยฐาน

ควอไทล์ที่สาม (Q 3 ) เป็นค่าที่

75 เปอร์เซ็นต์ของข้อสังเกตในชุดข้อมูลมีค่าน้อยกว่าไตรมาสที่สาม

25 เปอร์เซ็นต์ของข้อสังเกตมากกว่าควอร์ไทล์ที่สาม

นอกจากนี้คุณยังสามารถใช้กล่องแปลงเพื่อระบุความแตกต่าง ค่าเหล่านี้เป็นค่าที่แตกต่างจากส่วนที่เหลือของชุดข้อมูล ค่าผิดปกติอาจทำให้เกิดปัญหาในการทดสอบทางสถิติแบบเดิมดังนั้นคุณจึงต้องระบุข้อมูลก่อนที่จะทำการวิเคราะห์ทางสถิติประเภทใด ๆ

ฮิสโตแกรม

คุณใช้ฮิสโตแกรมเพื่อทำความเข้าใจเกี่ยวกับการกระจายความน่าจะเป็นที่ชุดข้อมูลต่อไปนี้ ด้วยฮิสโตแกรมชุดข้อมูลจะจัดเป็นชุดของค่าแต่ละค่าหรือช่วงของค่าแต่ละค่าจะแสดงโดยแถบแนวตั้ง ความสูงของแถบแสดงค่าหรือช่วงของค่าที่บ่อยครั้ง ด้วยฮิสโตแกรมคุณจะเห็นได้ง่ายว่าข้อมูลมีการกระจายอย่างไร

แปลงกระจาย

พล็อตกระจายคือชุดของจุดที่แสดงให้เห็นว่าสองตัวแปรมีความสัมพันธ์กันอย่างไร การกระจายจุดที่สุ่มชี้ให้เห็นว่าทั้งสองตัวแปรไม่สัมพันธ์กันหรือความสัมพันธ์ระหว่างพวกเขาอ่อนแอมาก ถ้าจุดใกล้เคียงกับเส้นตรงนี้แสดงให้เห็นว่าความสัมพันธ์ระหว่างสองตัวแปรมีค่าประมาณ เป็นเส้นตรง

สองตัวแปรมีความเกี่ยวเนื่องเชิงเส้นถ้าสามารถอธิบายได้ด้วยสมการ Y = mX + b X

เป็นตัวแปรอิสระและ Y เป็นตัวแปรตาม m คือความลาดชัน ซึ่งหมายถึงการเปลี่ยนแปลง Y เนื่องจากการเปลี่ยนแปลงที่กำหนดใน X คือ ตัด ซึ่งแสดงค่า Y เมื่อ X เท่ากับศูนย์ ภาพแสดงพล็อตกระจายระหว่างสองตัวแปรที่ความสัมพันธ์ปรากฏเป็นเส้นตรง

พล็อตกระจายของความสัมพันธ์เชิงเส้น

จุดบนจุดกระจายเกือบจะเป็นเส้นตรง เลี้ยวไปทางซ้ายเล็กน้อยและโค้งไปทางขวาเล็กน้อย แต่ตรงไปเรื่อย ๆ นี่แสดงให้เห็นว่าความสัมพันธ์เป็นเส้นตรงมีความชันบวก

รูปต่อไปนี้แสดงพล็อตกระจายระหว่างสองตัวแปรซึ่ง

Y ดูเหมือนจะเพิ่มขึ้นอย่างรวดเร็วกว่า X พล็อตกระจายของความสัมพันธ์ที่ไม่ใช่เชิงเส้น

ดูเส้นโค้งหรือไม่? ความสัมพันธ์นี้ไม่ได้เป็นเส้นตรง ในความเป็นจริงเป็นความสัมพันธ์แบบสองขั้น ความสัมพันธ์แบบสองกำลังใช้รูปแบบ

Y = aX 2 + b X + c รูปต่อไปนี้แสดงแผนภาพการกระจายที่ไม่มีความสัมพันธ์ระหว่าง

X และ Y X

และ Y " และ Y ตัวแปรในพล็อตกระจายที่แสดง ไม่เกี่ยวข้อง < หรือ

เป็นอิสระ คุณสามารถดูได้โดยไม่มีรูปแบบใด ๆ ในข้อมูล นอกเหนือจากการแสดงความสัมพันธ์ระหว่างตัวแปรสองตัวแปรพล็อตที่กระจายยังสามารถแสดงถึงความผิดปกติได้ด้วย รูปดังต่อไปนี้แสดงชุดข้อมูลที่มีข้อสังเกตเดียวซึ่งแตกต่างจากข้อสังเกตอื่น ๆ อย่างมาก พล็อตการกระจายด้วยค่าผิดปรกติ ต้องมีการตรวจสอบจุดเริ่มต้นอีกครั้งเพื่อพิจารณาว่าเป็นผลมาจากข้อผิดพลาดหรือปัญหาอื่น ๆ อาจเป็นไปได้ว่าผู้เอาประกันภัยจะต้องถูกนำออกจากข้อมูล

แผนการแปลงความน่าจะเป็นปกติ

แผนการแปลงความน่าจะเป็นปกติ

ถูกใช้เพื่อดูว่าองค์ประกอบของชุดข้อมูลมีความสอดคล้องกันมากน้อยเพียงใดตามสมมติฐานปกติคือ ทั่วไปในหลายสาขาวิชาตัวอย่างเช่นมักจะสันนิษฐานว่าในด้านการเงินและเศรษฐศาสตร์ที่ r eturns ไปยังหุ้นมีการกระจายตามปกติ สมมติฐานของภาวะปกติจะสะดวกมากและมีการทดสอบทางสถิติหลายอย่างบนสมมติฐานนี้

การใช้การทดสอบทางสถิติที่ถือว่าเป็นปกติกับ

ชุดข้อมูลที่ไม่ปกติ จะให้ผลลัพธ์ที่น่าสงสัยมาก ดังนั้นจึงเป็นเรื่องสำคัญที่จะต้องพิจารณาว่าข้อมูลมีการแจกแจงตามปกติหรือไม่ก่อนที่จะทำการทดสอบทางสถิติเหล่านี้

เทคนิคการวิเคราะห์ข้อมูลเชิงสำรวจแบบกราฟิก (EDA) - มัมมี่

ตัวเลือกของบรรณาธิการ

การเข้าถึงเมนูกล้อง Canon EOS 6D ของคุณ - หุ่น

การเข้าถึงเมนูกล้อง Canon EOS 6D ของคุณ - หุ่น

ถึงแม้ว่าปุ่มทั้งหมดและลูกบิด ในกล้องของคุณบางส่วนของงานถ่ายภาพของคุณเกี่ยวข้องกับการใช้เมนูกล้อง Canon ของคุณ ตัวอย่างเช่นเมื่อคุณจัดรูปแบบการ์ด SD คุณใช้เมนู นอกจากนี้คุณยังใช้เมนูเพื่อกำหนดขนาดและคุณภาพของภาพเช่นเดียวกับการตั้งค่าพารามิเตอร์สำหรับงานต่างๆเช่น

การเพิ่มชื่อผู้เขียนลงใน Canon EOS 6D ของคุณ - มัมมี่

การเพิ่มชื่อผู้เขียนลงใน Canon EOS 6D ของคุณ - มัมมี่

คุณสามารถเพิ่มชื่อของคุณเป็น ผู้เขียนภาพแต่ละภาพที่คุณจับภาพด้วย Canon ของคุณ ข้อมูลจะถูกเพิ่มเป็นข้อมูล EXIF ​​ในแต่ละภาพที่คุณถ่าย หากต้องการลงทะเบียนข้อมูลผู้แต่งด้วยกล้อง: กดปุ่มเมนู เมนูที่ใช้ก่อนหน้านี้จะปรากฏขึ้น ใช้ตัวควบคุมมัลติเพื่อควบคุมการตั้งค่ากล้อง 4 ...

วิธีเพิ่มลิขสิทธิ์ในข้อมูลเมตาที่มี Canon 60D - Dummies

วิธีเพิ่มลิขสิทธิ์ในข้อมูลเมตาที่มี Canon 60D - Dummies

รวมถึงประกาศเกี่ยวกับลิขสิทธิ์ เป็นขั้นตอนแรกที่เหมาะสมในการดำเนินการหากคุณต้องการป้องกันไม่ให้บุคคลอื่นใช้ภาพที่คุณถ่ายด้วย Canon EOS 60D โดยไม่ได้รับอนุญาตจากคุณ ทุกคนที่ดูภาพของคุณในโปรแกรมที่สามารถแสดงข้อมูลเมตาจะเห็นการแจ้งเตือนเกี่ยวกับลิขสิทธิ์ของคุณและรู้ว่าใครมีสิทธิ์ที่จะ

ตัวเลือกของบรรณาธิการ

วิธีการระบุแนวโน้มในข้อมูล Infographics ของคุณ - Dummies

วิธีการระบุแนวโน้มในข้อมูล Infographics ของคุณ - Dummies

วิธีหนึ่งในการทำให้ข้อเท็จจริงมีความหมายกับคุณมากขึ้น ผู้อ่าน Infographics คือการวางไว้ในบริบท ตัวอย่างเช่นการบอกให้ผู้อ่านทราบว่าอัตราการว่างงานในเดือนพฤษภาคมของสหรัฐฯอยู่ที่ 9.4 เปอร์เซ็นต์ไม่ได้ให้การศึกษาหรือภาพประกอบเท่าที่ปรากฏในภาพนี้ เป็นอัตราที่ดีหรือไม่ดี? คือ

วิธีใช้ตัวกรองแบบรวดเร็วของ Tableau เพื่อยกเว้นข้อมูล - dummies

วิธีใช้ตัวกรองแบบรวดเร็วของ Tableau เพื่อยกเว้นข้อมูล - dummies

บ่อยครั้งที่คุณอาจต้องการกรองข้อมูล ที่แสดงในมุมมองของคุณใน Tableau นอกจากนี้คุณอาจต้องการให้ผู้ชมมีตัวเลือกในการกรองแบบเดียวกันกับสิ่งที่พวกเขาต้องการดู ตัวกรองแบบรวดเร็วช่วยให้คุณสามารถเปลี่ยนมุมมองของตัวเองได้อย่างง่ายดายขณะเดียวกันก็อนุญาตให้

การใช้ Social Media เพื่อกระจาย Infographic - Dummies

การใช้ Social Media เพื่อกระจาย Infographic - Dummies

การเข้าถึงผู้มีอิทธิพลและการพูดคุยของคุณ งาน Infographic เป็นความพยายามภายนอกทั้งหมด คุณจะต้องวางแผนขั้นตอนภายในของสิ่งตีพิมพ์ด้วย นี้เกี่ยวข้องกับการวาง Infographic ในทุกช่องสังคมของคุณ ขนาดงานของคุณสำหรับ Facebook เริ่มจาก Facebook จากมุมมอง infographics หน้าที่ที่สำคัญที่สุดของคุณคือการปรับขนาด Infographic ของคุณให้สูงขึ้น ...

ตัวเลือกของบรรณาธิการ

การถ่ายภาพอาคารโดยใช้กล้องดิจิตอล SLR - หุ่น

การถ่ายภาพอาคารโดยใช้กล้องดิจิตอล SLR - หุ่น

ไม่ว่าจะเป็นสถานที่สำคัญโบสถ์โบสถ์มหัศจรรย์ทางสถาปัตยกรรมหรือ ที่น่าสนใจสำหรับคุณ - เป็นเรื่องที่ดีสำหรับคุณและกล้องดิจิตอล SLR ของคุณ อาคารไม่ลืมที่จะยิ้มไม่อิดโรยและพร้อมเสมอสำหรับการถ่ายภาพ

การถ่ายภาพเด็กที่ใช้กล้องดิจิตอล SLR ของคุณ - รูปหุ่น

การถ่ายภาพเด็กที่ใช้กล้องดิจิตอล SLR ของคุณ - รูปหุ่น

รูปถ่ายของเด็กที่เป็นตัวของตัวเองเป็นของที่มีค่า คุณและกล้องดิจิตอล SLR ของคุณสามารถรักษาความล้ำค่าได้อย่างง่ายดายและประณีต ถ่ายรูปลูกบ่อยๆ วันเกิดมีความสำคัญ แต่รูปถ่ายของเด็กที่เล่นในสวนสาธารณะที่โรงเรียนในบ้านและที่บ้านสามารถจดจำได้อย่างเท่าเทียมกัน การจับเด็กเล่นเมื่อคุณถ่ายภาพ ...

การถ่ายภาพกับแสงธรรมชาติในพื้นที่ใช้สอย - หุ่น

การถ่ายภาพกับแสงธรรมชาติในพื้นที่ใช้สอย - หุ่น

การถ่ายภาพภายในด้วยแสงธรรมชาติเป็นสิ่งที่คุ้มค่า แต่ต้องใช้ พื้นที่สาธารณะส่วนใหญ่มีหน้าต่างอยู่ใกล้มือ เปิดผ้าม่านและให้แสงธรรมชาติมากที่สุดเท่าที่จะเป็นไปได้ ยกเว้นกรณีที่คุณใช้แฟลชคุณมักต้องเพิ่ม ISO ถ้าเลนส์ของคุณเร็วเพียงพอให้เปิด