ในมุมมองเป้าหมายเป้าหมายในการออกแบบสถาปัตยกรรมสำหรับการวิเคราะห์ข้อมูลจะนำมาสู่การสร้างกรอบสำหรับจับภาพจัดเรียงและวิเคราะห์ข้อมูลขนาดใหญ่เพื่อวัตถุประสงค์ การค้นพบผลลัพธ์ที่สามารถดำเนินการได้
การคิดสถาปัตยกรรมที่จะแปลงข้อมูลขนาดใหญ่ให้กลายเป็นผลลัพธ์ที่สามารถดำเนินการได้ไม่มีวิธีใดที่ถูกต้องในการออกแบบสภาพแวดล้อมทางสถาปัตยกรรมสำหรับการวิเคราะห์ข้อมูลขนาดใหญ่ อย่างไรก็ตามการออกแบบส่วนใหญ่จะต้องเป็นไปตามข้อกำหนดต่อไปนี้เพื่อสนับสนุนความท้าทายที่ข้อมูลขนาดใหญ่สามารถนำมาได้ เกณฑ์เหล่านี้สามารถกระจายได้มากกว่าหกชั้นและสามารถสรุปได้ดังนี้:
ด้วย RapidMiner คุณสามารถโหลดและจัดเตรียมข้อมูลสร้างและประเมินรูปแบบการทำนายได้อย่างรวดเร็วใช้กระบวนการข้อมูลในแอปพลิเคชันของคุณและแชร์กับผู้ใช้ทางธุรกิจของคุณ ด้วยการคลิกน้อยมากคุณสามารถสร้างแบบจำลองการวิเคราะห์ทำนายได้ง่ายๆ
การวิเคราะห์แบบลากและวางกับ RapidMiner
RapidMiner สามารถใช้ได้ทั้งผู้เริ่มต้นและผู้เชี่ยวชาญ RapidMiner Studio เป็นซอฟต์แวร์วิเคราะห์ข้อมูลแบบโอเพนซอร์สที่มีส่วนติดต่อแบบกราฟิกที่ง่ายต่อการใช้งานซึ่งคุณสามารถลากและวางอัลกอริทึมสำหรับการโหลดข้อมูลการประมวลผลข้อมูลล่วงหน้าอัลกอริธึมการวิเคราะห์เชิงคาดการณ์และการประเมินรูปแบบเพื่อสร้างกระบวนการวิเคราะห์ข้อมูลของคุณRapidMiner ถูกสร้างขึ้นเพื่อให้นักวิทยาศาสตร์ข้อมูลมีกล่องเครื่องมือที่ครอบคลุมซึ่งประกอบด้วยการดำเนินการและอัลกอริทึมต่างๆกว่าพันรายการ ข้อมูลสามารถโหลดได้อย่างรวดเร็วโดยไม่คำนึงว่าแหล่งข้อมูลของคุณอยู่ใน Excel, Access, MS SQL, MySQL, SPSS, Salesforce หรือรูปแบบอื่น ๆ ที่ RapidMiner สนับสนุน นอกเหนือจากการโหลดข้อมูลการสร้างแบบจำลองทำนายและการประเมินผลแบบจำลองแล้วเครื่องมือนี้ยังมีเครื่องมือในการแสดงข้อมูลซึ่งรวมถึงแผนที่การจัดตัวเองที่ปรับได้และกราฟ 3 มิติ
RapidMiner มีส่วนติดต่อการเขียนโปรแกรมแอ็พพลิเคชันส่วนขยายแบบเปิด (API) ที่ช่วยให้คุณรวมอัลกอริทึมของคุณลงในท่อที่สร้างขึ้นใน RapidMiner นอกจากนี้ยังสามารถทำงานร่วมกับหลายแพลตฟอร์มและสามารถทำงานบนระบบปฏิบัติการหลัก มีชุมชนออนไลน์แบบออนไลน์ของนักวิทยาศาสตร์ข้อมูลที่ใช้ RapidMiner ซึ่งสามารถแบ่งปันกระบวนการต่างๆและถามและตอบคำถามได้
อีกหนึ่งเครื่องมือที่ใช้งานง่ายซึ่งใช้กันอย่างแพร่หลายในโลกของการวิเคราะห์คือ KNIME KNIME ย่อมาจาก Konstanz Information Miner เป็นการวิเคราะห์ข้อมูลโอเพนซอร์สที่สามารถช่วยคุณสร้างแบบจำลองการคาดการณ์ได้ผ่านแนวคิดการวางท่อข้อมูล เครื่องมือนี้มีองค์ประกอบแบบลากและวางสำหรับ ETL (การสกัดการแปลงและการโหลด) และองค์ประกอบสำหรับการทำนายแบบคาดการณ์และการสร้างภาพข้อมูล
KNIME และ RapidMiner เป็นเครื่องมือที่ช่วยให้ทีมงานด้านข้อมูลของคุณสามารถเริ่มต้นสร้างแบบจำลองการคาดการณ์ได้อย่างง่ายดาย สำหรับกรณีการใช้งานที่ยอดเยี่ยมใน KNIME ให้ดูที่บทความ "The Seven Techniques for Dimensionality Reduction" RapidMiner Radoop เป็นผลิตภัณฑ์ของ RapidMiner ที่ขยายกล่องเครื่องมือการวิเคราะห์เชิงคาดการณ์ใน RapidMiner Studio เพื่อทำงานในสภาพแวดล้อม Hadoop และ SparkRadoop บรรจุหีบห่อ MapReduce หมู Mahout และ Spark หลังจากที่คุณกำหนดเวิร์กโฟลว์ของคุณบน Radoop คำแนะนำจะทำงานในสภาพแวดล้อม Hadoop หรือ Spark ดังนั้นคุณจึงไม่ต้องทำแบบจำลองการคาดการณ์ล่วงหน้า แต่มุ่งเน้นไปที่การประเมินโมเดลและการพัฒนาโมเดลใหม่
เพื่อความปลอดภัย Radoop สนับสนุนการตรวจสอบ Kerberos และทำงานร่วมกับ Apache Ranger และ Apache Sentry