วีดีโอ: การสร้างกราฟด้วย Excel: สร้างกราฟ Dynamic XY (Scatter Plot) 2024
คนงานเหมืองข้อมูลมักจะใช้ประโยชน์จากคุณลักษณะพิเศษเพื่อรวบรวมข้อมูลเพิ่มเติมลงในแผนภูมิง่ายๆ ป้ายกำกับการวางซ้อนและการเลือกแบบโต้ตอบเป็นจุดเด่นของแอ็ปพลิเคชันการทำเหมืองข้อมูลคุณสมบัติพิเศษที่ช่วยให้คุณสามารถผลิตได้มากขึ้น
ระยะทางลดลงเมื่อเพิ่มแรงม้าตามที่เห็นในรูปต่อไปนี้
ระยะเวลาเพิ่มขึ้นตามระยะเวลาตามที่เห็นได้จากระยะเวลาในการคำนวณเทียบกับปีของรุ่น การคิดสองแนวคิดนี้เป็นกราฟเดียวน่าจะเป็นประโยชน์
วิธีการทำเหมืองข้อมูลทั่วไปสำหรับการผสานรวมมากกว่าสองตัวแปรในกราฟ ได้แก่
-
ป้ายกำกับ: ป้ายกำกับคือค่าของสตริงหรือตัวแปรประเภทที่ถูกซ้อนทับบน scatterplot รูปต่อไปนี้แสดง scatterplot ที่มีข้อความว่าปีรุ่นของรถ
ชุดข้อมูลที่มีหลายจุดหรือป้ายกำกับยาวสามารถทำให้แผนภูมิเหล่านี้ไม่สามารถอ่านได้! การแก้ปัญหาคือการใช้ตัวอย่างข้อมูลเท่านั้น การตั้งค่าสำหรับการสุ่มตัวอย่างแบบนี้จะแสดงในรูปต่อไปนี้
-
การวางซ้อน: เมื่อใช้การซ้อนทับค่าของตัวแปรประเภทจะกำหนดรูปร่างหรือสีของจุด รูปต่อไปนี้แสดงการตั้งค่าสำหรับ scatterplot เพื่อซ้อนทับโมเดลปีบนเครื่อง scatterplot ระยะทางเทียบกับแรงม้า
ชุดภาพซ้อนทับการส่งออกจะปรากฏในภาพต่อไปนี้ การอ่านภาพซ้อนทับสีอาจอ่านได้ง่ายกว่าการวางซ้อนรูปจุด การตั้งค่ามักจะมากเหมือนกัน
สิ่งอื่นที่ควรทราบด้วย scatterplots: คุณอาจมีหลายจุดตกลงไปในจุดเดียวกัน! ถ้าเป็นเช่นนั้นคุณอาจไม่สามารถบอกจุดสำหรับกรณีหนึ่งได้จากจุดสำหรับ 100 กรณี การแก้ไขคือการตรวจสอบตัวเลือกเพื่อให้หลายอินสแตนซ์สามารถมองเห็นได้ มองหาขนาดจุดหรือ กระวนกระวายใจ (เลื่อนตำแหน่งเล็กน้อยออกจากตำแหน่งที่แท้จริงเพื่อทำให้ทุกคนมองเห็น) ตัวเลือก
Scatterplots แบบอินเทอร์แอ็กทีฟช่วยประหยัดเวลาสำหรับผู้ปฏิบัติงานด้านข้อมูล
สมมติว่าคุณเห็นกลุ่มกรณีที่น่าสนใจในกราฟและต้องการตรวจสอบเฉพาะกรณีเหล่านี้ หากคุณกำลังมองหาเพียงอย่างใดอย่างหนึ่งหรือสองจุดคุณอาจได้รับข้อมูลที่ต้องการโดยเลื่อนเมาส์อยู่ แต่ไม่น่าพอใจเมื่อคุณสนใจมากกว่าสองจุด
เครื่องมือการเลือกข้อมูลในระบบกระจายข้อมูลเชิงโต้ตอบช่วยให้คุณสามารถเลือกข้อมูลได้มากขึ้น รูปต่อไปนี้แสดงการตั้งค่ากราฟเดียวกัน แต่มีกลุ่มของจุดที่เลือกโดยคลิกและลากเมาส์ไปรอบ ๆ นี่ไม่ใช่แค่ภาพเท่านั้น
คุณสามารถส่งออกจุดที่เลือกเป็นชุดข้อมูลใหม่ได้ นี้มีประโยชน์มากและรวดเร็ว!
หากจุดที่คุณต้องการไม่พอดีกับการเลือกสี่เหลี่ยมผืนผ้าคุณมีทางเลือกอื่น ๆ ดูบริเวณซูม / เลือก คุณสามารถเห็นปุ่มที่มีสี่เหลี่ยมผืนผ้าสำหรับการเลือกสี่เหลี่ยมผืนผ้าและอีกปุ่มหนึ่งมีรูปร่างกลมสำหรับการเลือกรูปแบบอิสระ
นี่คือตัวอย่างการเลือกรูปแบบฟรีโดยใช้ข้อมูลเกี่ยวกับปริมาณนิโคตินของบุหรี่ที่จำหน่ายในหลายส่วนของโลก แผ่กระจายนี้แสดงให้เห็นถึงนิโคตินต่อบุหรี่สำหรับตัวอย่างจากหกภูมิภาคของสหประชาชาติ (นี่คือการใช้งานแบบไม่เป็นทางการของการกระจายเนื่องจากภูมิภาคไม่ใช่ตัวแปรต่อเนื่อง แต่เป็นเรื่องที่เป็นแบบแผนคนงานเหมืองข้อมูลมักใช้เครื่องมือแบบดั้งเดิมในแบบที่ไม่ได้รับการอบรม)
จุดภายในภูมิภาคไม่ตกอยู่ในแนวตั้งที่สมบูรณ์แบบ การเลื่อนขนาดเล็ก (กระวนกระวายใจ) ไปทางซ้ายและขวาจะทำให้สามารถอ่านได้และมีลักษณะเฉพาะเท่านั้น บุหรี่บางชนิดมีระดับนิโคตินสูงเป็นพิเศษและคุณต้องการเลือกกรณีเหล่านี้
เมนูแบบเลื่อนลงมีตัวเลือกการเลือก การเลือกรูปหลายเหลี่ยมช่วยให้คุณทำเครื่องหมายพื้นที่ว่างใน scatterplot
เมื่อต้องการทำเครื่องหมายคลิกที่กราฟเพื่อสร้างจุดเริ่มต้นจากนั้นคลิกอีกครั้งรอบ ๆ กลุ่มของจุดที่คุณต้องการจนกว่าคุณจะสร้างรูปร่างที่ต้องการ
คลิกขวาจะบ่งบอกว่าคุณได้ทำการเลือกเสร็จสิ้นแล้ว ซึ่งจะมองเห็นได้จากไฮไลต์บนกราฟ