ตัวอย่างของกลุ่มการจัดการตนเองที่คุณสามารถใช้ในการวิเคราะห์พฤติกรรมการคาดการณ์เป็นอาณานิคมของมดที่กำลังล่าอาหาร มดจะเพิ่มประสิทธิภาพการติดตามของพวกเขาเพื่อที่จะใช้เส้นทางที่สั้นที่สุดที่เป็นไปได้สำหรับเป้าหมายอาหาร
แม้ว่าคุณจะพยายามรบกวนกลุ่มอาณานิคมที่เดินขบวนและป้องกันไม่ให้พวกเขาไปถึงเป้าหมายอาหารก็ตามพวกเขาก็สามารถกลับมาดำเนินการได้อย่างรวดเร็วและหาทางที่สั้นที่สุดเท่าที่จะเป็นไปได้สำหรับเป้าหมายอาหารทั้งหมดหลีกเลี่ยงอุปสรรคเดียวกัน ขณะกำลังมองหาอาหาร ความสม่ำเสมอของพฤติกรรมนี้เป็นไปได้เพราะมดทุกตัวฝากรอยฟีโรโมนไว้บนพื้น
พิจารณากองทัพมดที่ไม่ได้ใช้งานอยู่ในรัง เมื่อพวกเขาเริ่มมองหาอาหารพวกเขาไม่มีข้อมูลเกี่ยวกับที่จะหามัน พวกเขาเดินขบวนสุ่มจนกว่าจะพบมดกินอาหาร; ตอนนี้มดที่โชคดี (เรียกว่า Ant X) ต้องติดต่อหาของมันกับมดที่เหลือ - และทำอย่างนั้นต้องหาทางกลับไปที่รัง
โชคดีที่ Ant X กำลังผลิตฟีโรโมนของตัวเองตลอดเวลาที่กำลังมองหาอาหาร มันสามารถทำตามเส้นทางของตัวเองของฟีโรโมนกลับไปที่รัง ตามทางกลับไปที่รังตามเส้นทางฟีโรโมนของตัวเอง Ant X ทำให้ฟีโรโมนมากกว่าบนเส้นทางเดียวกัน
ผลที่ตามมากลิ่นของ Ant X จะเป็นเส้นทางที่แข็งแกร่งที่สุดในบรรดาเส้นทางของมดอื่น ๆ เส้นทางที่แข็งแกร่งที่สุดของฟีโรโมนจะดึงดูดมดอื่น ๆ ทั้งหมดที่ยังคงค้นหาอาหารอยู่ พวกเขาจะทำตามกลิ่นแรงที่สุด เมื่อมดเข้าร่วมเส้นทางของ Ant X มากขึ้นจะเพิ่มฟีโรโมนมากขึ้น กลิ่นจะแข็งแรงขึ้น เร็ว ๆ นี้มดอื่น ๆ ทั้งหมดมีกลิ่นแรงที่จะปฏิบัติตาม
หากมดหลายตัวได้ค้นพบแหล่งอาหารเดียวกันมดที่ใช้เส้นทางที่สั้นที่สุดจะต้องเดินทางมากขึ้นเมื่อเปรียบเทียบกับมดที่อยู่ตามเส้นทางที่ยาวขึ้น - เพราะฉะนั้นฟีโรโมนมากกว่าจะเกิดขึ้นบนเส้นทางที่สั้นที่สุด ความสัมพันธ์ระหว่างพฤติกรรมส่วนบุคคลและพฤติกรรมร่วมกันเป็นตัวอย่างธรรมชาติ
ทุกจุดหมายถึงเอกสาร สมมติว่าจุดสีดำเป็นเอกสารเกี่ยวกับการวิเคราะห์เชิงคาดการณ์และจุดสีขาวเป็นเอกสารเกี่ยวกับมานุษยวิทยา จุดที่เป็นตัวแทนของเอกสารประเภทต่างๆจะถูกกระจายแบบสุ่มในตารางห้าเซลล์
"มด" จะถูกนำไปใช้แบบสุ่มในตารางเพื่อค้นหาเอกสารที่คล้ายกัน เซลล์ทุกตัวที่มีค่าอยู่ในตัวมันจะเป็นตัวอย่างของ "ฟีโรโมน" "การใช้เมทริกซ์เอกสารค่า" ฟีโรโมน "แต่ละเซลล์คำนวณจากเอกสารที่เกี่ยวข้อง
เอาล่ะความรู้ร่วมกันของกลุ่มมดจะก่อให้เกิดรูปแบบการจัดกลุ่มข้อมูลได้อย่างมีประสิทธิภาพอย่างไร? คำตอบอยู่ในรูปแบบง่ายๆ: มดกำลังค้นหาอาหารในสภาพแวดล้อมของตนมากที่สุดเท่าที่เรากำลังค้นหากลุ่มในชุดข้อมูล - กำลังมองหาเอกสารที่คล้ายกันภายในชุดเอกสารจำนวนมาก
พิจารณาชุดข้อมูลของเอกสารที่คุณต้องการจัดระเบียบตามหัวข้อ เอกสารที่คล้ายกันจะถูกจัดกลุ่มไว้ในกลุ่มเดียวกัน ที่นี่มดฝูงสามารถให้คำแนะนำเกี่ยวกับวิธีการจัดกลุ่มเอกสารที่คล้ายกัน
ลองจินตนาการถึงตารางสองมิติ (2D) ที่คุณสามารถแสดงเอกสารเป็นจุด ตาราง 2D แบ่งเป็นเซลล์ เซลล์แต่ละเซลล์มี "ฟีโรโมน" (ค่า) ที่เกี่ยวข้อง กล่าวสั้น ๆ ว่าค่า "ฟีโรโมน" จะแยกแยะความแตกต่างของเอกสารแต่ละฉบับในเซลล์หนึ่ง ๆ
จุดเริ่มต้นกระจายแบบสุ่ม - และทุกจุดในตารางแสดงถึงเอกสารที่ไม่ซ้ำกัน ขั้นตอนต่อไปคือการปรับใช้จุดอื่น ๆ แบบสุ่มบนตาราง 2D จำลองการค้นหามดฝูงเพื่อหาอาหารในสภาพแวดล้อม จุดเหล่านี้จะกระจัดกระจายอยู่ในตาราง 2D เดียวกันกับเอกสาร
แต่ละจุดใหม่ที่เพิ่มลงในตารางแสดงถึงมด "มด" เหล่านี้มักเรียกกันในอัลกอริทึมของมดฝูงเป็นตัวแทน กำลังเคลื่อนที่ในตาราง 2D "มด" แต่ละตัวจะรับหรือวางจุดอื่น ๆ (เอกสาร) ขึ้นอยู่กับว่าเอกสารใดเป็นของที่ดีที่สุด ในการเปรียบเทียบนี้ "อาหาร" ใช้รูปแบบเอกสารที่มีลักษณะคล้ายกันพอสมควรที่สามารถรวมกลุ่มกันได้
"มด" เดินแบบสุ่มในกริด หากพบเอกสารสามารถดำเนินการได้สองวิธี: เลือกหรือวาง เซลล์แต่ละเซลล์มีความเข้มของฟีโรโมนที่แสดงถึงความคล้ายคลึงกันของเอกสารกับเอกสารอื่น ๆ (จุด) ที่อยู่ใกล้กับเอกสารที่ถาม - ซึ่งเป็น "มด" กำลังจะหยิบขึ้นมา
โปรดทราบว่า "มด" ในเซลล์ 3 จะรับเอกสารจุดสีดำเนื่องจากค่า "ฟีโรโมน" สีขาวมีส่วนสำคัญ และย้ายไปที่เซลล์ที่มีค่าใกล้เคียงกับที่เซลล์ 4 (จุดสีดำหลายจุด) การค้นหาจะทำซ้ำจนกว่าจะมีกลุ่มฟอร์ม
ในการทำงาน "มด" จะย้ายเอกสารจากเซลล์หนึ่งไปยังอีกเซลล์หนึ่งเพื่อสร้างกลุ่มโดยดำเนินการอย่างใดอย่างหนึ่งในสองขั้นตอนเท่านั้น: หยิบเอกสารหรือวางเอกสาร
เมื่อ "มด" เริ่มเคลื่อนที่แบบสุ่มบนกริดพบจุด (เอกสาร) ส่งผลให้ "มด" เก็บเอกสารจากเซลล์ปัจจุบันเคลื่อนย้ายไปและวางลงในเซลล์ที่มี ความคล้ายคลึงกันเพียงพอที่จะพอดี
ant "จะเป็นตัวกำหนดเซลล์ที่ดีที่สุดในการวางเอกสารได้อย่างไร? คำตอบคือค่าในเซลล์ทำหน้าที่เหมือน "ฟีโรโมน" - และทุกเซลล์ในตาราง 2D มีค่าตัวเลขซึ่งสามารถคำนวณได้ในลักษณะที่แสดงถึงเอกสารในเซลล์
โปรดจำไว้ว่าแต่ละเอกสารจะแสดงเป็นชุดของตัวเลขหรือเวกเตอร์ของค่าตัวเลข "ความเข้มของฟีโรโมน" (ค่าตัวเลข) จะเพิ่มขึ้นเมื่อเอกสารจำนวนมากถูกทิ้งลงในเซลล์และค่าดังกล่าวจะลดลงหากจำนวนที่แสดงเอกสารถูกย้ายออกจากเซลล์