สารบัญ:
- ประเภทข้อมูล
- R จะต้องมีที่เก็บกลุ่มข้อมูลประเภทต่างๆเพื่อให้สามารถทำงานได้อย่างมีประสิทธิภาพ เหล่านี้เรียกว่า
ในการเขียนโปรแกรม R สำหรับการวิเคราะห์เชิงคาดการณ์ข้อมูล ประเภท บางครั้งสับสนกับโครงสร้างข้อมูล แต่ละตัวแปรในหน่วยความจำของโปรแกรมมีชนิดข้อมูล แน่นอนคุณสามารถหลีกเลี่ยงการมีตัวแปรหลายอย่างในโปรแกรมของคุณและยังสามารถจัดการได้ แต่ที่อาจจะไม่ทำงานได้ดีถ้าคุณมีหลายร้อย (หรือหลายพัน) ของตัวแปร; คุณต้องให้ทุกตัวแปรชื่อเพื่อให้คุณสามารถเข้าถึงได้
การเก็บตัวแปรเหล่านี้ทั้งหมดในคอลเล็กชันตรรกะมีประสิทธิภาพมากขึ้น
ประเภทข้อมูล
เช่นเดียวกับภาษาโปรแกรมอื่น ๆ เต็มรูปแบบ R มีหลายชนิดข้อมูลและโครงสร้างข้อมูล ไม่จำเป็นต้องระบุประเภทที่คุณกำหนดให้กับตัวแปร ล่ามจะทำเพื่อคุณ อย่างไรก็ตามคุณสามารถระบุหรือแปลงชนิดหากจำเป็นต้องเกิดขึ้น นี่เรียกว่า การหล่อ ข้อมูลสามประเภทมีดังนี้:
-
ตัวเลข: นี่คือตัวเลขทศนิยมทั่วไปของคุณ เหล่านี้เรียกว่า floats (ย่อมาจาก ตัวเลขจุดลอยตัว ) หรือ คู่ ในภาษาอื่น ๆ
-
อักขระ: สายอักขระเหล่านี้ประกอบด้วยชุดตัวอักษรตัวอักษรและตัวเลข พวกเขาไม่ได้หมายถึงที่จะมีความหมายเชิงตัวเลขใด ๆ เหล่านี้เรียกว่า สตริง ในภาษาอื่น ๆ
-
เหตุผล: TRUE หรือ FALSE มักใช้ประโยชน์จากค่าเหล่านี้ใน R. ค่าเหล่านี้เรียกว่า Booleans ในภาษาอื่น ๆ
การเปรียบเทียบสตริงของตัวเลขกับผลลัพธ์ตัวเลขในล่ามแปลงสตริงของตัวเลขเป็นตัวเลขและจากนั้นทำการเปรียบเทียบตัวเลข
ตัวอย่างของชนิดข้อมูลมีดังนี้: >> ijkm <- i == j # logical> n <- i == k # logical
หลังจากที่คุณรันโค้ดบรรทัดเหล่านี้แล้ว ค่าและชนิดโดยใช้ฟังก์ชัน str () การดำเนินการดังกล่าวมีลักษณะดังนี้:
str (i) num 10> str (j) num 10> str (k) chr "10"> str (m) logi TRUE> str (n) logi TRUE
นิพจน์ในงาน n คือตัวอย่างของล่ามชั่วคราวแปลงรูปแบบข้อมูลของ k เป็นตัวเลขเพื่อทำการประเมินระหว่างตัวเลข i และอักขระ k
โครงสร้างข้อมูล
R จะต้องมีที่เก็บกลุ่มข้อมูลประเภทต่างๆเพื่อให้สามารถทำงานได้อย่างมีประสิทธิภาพ เหล่านี้เรียกว่า
โครงสร้างข้อมูล ตัวอย่างแนวคิดในชีวิตจริงของโรงรถคือโครงสร้างที่สามารถจัดเก็บรถยนต์ได้อย่างมีประสิทธิภาพ ออกแบบมาเพื่อจอดรถยนต์ให้มากที่สุดเท่าที่จะเป็นไปได้และช่วยให้รถยนต์สามารถเข้าและออกจากโครงสร้างได้อย่างมีประสิทธิภาพนอกจากนี้ยังไม่มีวัตถุอื่นนอกจากรถยนต์ควรจอดในโครงสร้างที่จอดรถ
โครงสร้างข้อมูลประกอบด้วย:
เวกเตอร์:
-
เวกเตอร์เก็บชุดค่าของชนิดข้อมูลเดี่ยว คิดว่ามันเป็นหมาประจำสัปดาห์ แต่ละช่องในกระป๋องสามารถจัดเก็บวัตถุได้บางประเภทเท่านั้น หลังจากที่คุณใส่ยาบางอย่างลงในช่องใดช่องอื่น ๆ ทั้งหมดจะต้องเต็มไปด้วยยาที่เป็นศูนย์หรือยาอื่น ๆ คุณไม่สามารถวางเหรียญในกล่องเดียวกันได้ คุณต้องใช้กล่องยา "อื่น" (เวกเตอร์) สำหรับสิ่งนั้น ในทำนองเดียวกันเมื่อคุณเก็บตัวเลขไว้ในเวคเตอร์แล้วค่าในอนาคตทั้งหมดก็ควรเป็นตัวเลข มิฉะนั้นล่ามจะแปลงตัวเลขทั้งหมดของคุณเป็นตัวอักษร
Matrices:
-
A matrix ดูเหมือนว่าเป็นสเปรดชีต Excel: โดยทั่วไปแล้วจะเป็นตารางประกอบด้วยแถวและคอลัมน์ ข้อมูลจะเติมเซลล์ว่างตามแถวหรือลำดับของคอลัมน์ซึ่งคุณระบุเมื่อคุณสร้างเมทริกซ์ คอลัมน์ทั้งหมดต้องมีข้อมูลประเภทเดียวกัน
กรอบข้อมูล:
-
กรอบข้อมูลจะคล้ายกับเมทริกซ์ยกเว้นคอลัมน์ของกรอบข้อมูลสามารถมีข้อมูลประเภทต่างๆได้ ชุดข้อมูลที่ใช้ในการสร้างแบบจำลองคาดการณ์จะถูกโหลดลงในเฟรมข้อมูลและเก็บไว้ที่นั่นเพื่อใช้ในโมเดล ปัจจัย:
-
A factor เหมือนกับเวกเตอร์ที่มีค่าที่แตกต่างกันจำนวน จำกัด จำนวนค่าที่แตกต่างกันเรียกว่า ระดับ คุณสามารถใช้ปัจจัยเพื่อรักษาคอลัมน์ที่มีจำนวน จำกัด และเป็นที่รู้จักของค่าเป็นค่าที่จัดกลุ่ม โดยค่าเริ่มต้นข้อมูลอักขระจะถูกโหลดลงในเฟรมข้อมูลเป็นปัจจัย คุณเข้าถึงเวกเตอร์เมทริกซ์และเฟรมข้อมูลโดยใช้
อาร์เรย์สัญกรณ์ ตัวอย่างเช่นคุณต้องพิมพ์ v <599 เพื่อเข้าถึงองค์ประกอบที่ห้าของเวกเตอร์ v สำหรับเมทริกซ์สองมิติและกรอบข้อมูลคุณจะใส่หมายเลขแถวและหมายเลขคอลัมน์คั่นด้วยเครื่องหมายจุลภาคภายในวงเล็บเหลี่ยม ตัวอย่างเช่นคุณพิมพ์ m [2, 3] เพื่อเข้าถึงแถวที่สองค่าของคอลัมน์ที่สามสำหรับเมทริกซ์ m โครงสร้างข้อมูลเป็นหัวข้อขั้นสูงทางวิทยาการคอมพิวเตอร์ สำหรับตอนนี้เรากำลังยึดมั่นในทางปฏิบัติแล้ว เพียงจำไว้ว่าโครงสร้างข้อมูลถูกสร้างขึ้นเพื่อเก็บข้อมูลเฉพาะประเภทและมีหน้าที่ในการแทรกข้อมูลการลบและการดึงข้อมูล