สารบัญ:
- วิธีการใช้การค้นหาตามคำสำคัญในการทำนาย การวิเคราะห์
- โครงการนี้มีจุดมุ่งหมายเพื่อตรวจสอบการค้นหาและการวิเคราะห์ขององค์กรขนาดใหญ่ที่มีอยู่ในตลาดและสร้างต้นแบบสำหรับกรอบงานที่ทันสมัยซึ่งจะจัดระเบียบข้อมูลของธนาคารโลกซึ่งส่วนใหญ่เป็นการรวบรวมเอกสารสิ่งพิมพ์รายงานโครงการ , กางเกงในและกรณีศึกษา
วีดีโอ: สังคมฯ ป.2 วิธีการสืบค้นข้อมูลอย่างง่ายเกี่ยวกับชุมชน ตอนที่ 1 ครูชุติญา บุญอุปถัมภ์ 2024
เพื่อใช้ประโยชน์ ข้อมูลการวิเคราะห์เชิงคาดการณ์ที่คุณต้องการทราบเพื่อหาข้อมูลที่คุณต้องการค้นหา มีสองแนวคิดหลักในการค้นหาข้อมูลของคุณเพื่อเตรียมพร้อมสำหรับการใช้ข้อมูลดังกล่าวในการวิเคราะห์เชิงคาดการณ์:
-
เตรียมตัวให้พร้อมสำหรับการค้นหาคำหลักขั้นพื้นฐาน
-
ทำให้ข้อมูลของคุณสามารถค้นหาได้
วิธีการใช้การค้นหาตามคำสำคัญในการทำนาย การวิเคราะห์
ลองจินตนาการว่าคุณได้รับมอบหมายให้ค้นหาข้อมูลจำนวนมากหรือไม่ วิธีหนึ่งในการแก้ปัญหาคือการออกคำค้นหาที่ประกอบด้วยคำพูด (ชัด) เครื่องมือค้นหาจะค้นหาคำที่ตรงกันในฐานข้อมูลคลังข้อมูลหรือไปที่การค้นหาผ่านข้อความใด ๆ ที่ข้อมูลของคุณอยู่
สมมติว่าคุณกำลังออกคำค้นหาต่อไปนี้: ประธานาธิบดีแห่งสหรัฐอเมริกาเดินทางไปแอฟริกา ผลการค้นหาจะประกอบด้วยข้อความที่มีคำว่า ประธานาธิบดี, สหรัฐอเมริกา, การเข้าชม, แอฟริกา คุณอาจได้รับข้อมูลที่แน่นอนที่คุณต้องการ แต่ไม่เสมอไป
เอกสารเกี่ยวกับที่ไม่มีคำใด ๆ ที่กล่าวมาก่อนหน้านี้มีดังต่อไปนี้: การเดินทางของโอบามาไปยังเคนยา
ไม่มีคำใดในตอนแรกที่คุณค้นหาอยู่ แต่มีผลการค้นหา semantically (meaningfully) useful คุณจะเตรียมข้อมูลของคุณให้สามารถเรียกคืนได้อย่างไร? คุณจะไปไกลกว่าการค้นหาคำหลักแบบเดิมได้อย่างไร คำตอบของคุณสามารถพบได้หากคุณอ่านต่อ
โครงการนี้มีจุดมุ่งหมายเพื่อตรวจสอบการค้นหาและการวิเคราะห์ขององค์กรขนาดใหญ่ที่มีอยู่ในตลาดและสร้างต้นแบบสำหรับกรอบงานที่ทันสมัยซึ่งจะจัดระเบียบข้อมูลของธนาคารโลกซึ่งส่วนใหญ่เป็นการรวบรวมเอกสารสิ่งพิมพ์รายงานโครงการ, กางเกงในและกรณีศึกษา
ความรู้อันมีค่ามหาศาลนี้เป็นทรัพยากรที่ใช้ในภารกิจหลักของธนาคารในการลดความยากจนในโลก แต่ความจริงที่ว่าไม่มีโครงสร้างทำให้การเข้าถึงการจับภาพแชร์เข้าใจค้นหาข้อมูลเหมืองแร่และเห็นภาพ
ธนาคารโลกเป็นองค์กรขนาดใหญ่ที่มีแผนกต่างๆทั่วโลก หน่วยงานหลัก ๆ คนหนึ่งกำลังมุ่งมั่นที่จะมีกรอบและพร้อมที่จะจัดสรรทรัพยากรเพื่อช่วยเหลือทีม Bari เป็นเครือข่ายการพัฒนามนุษย์ภายใน World Bank
รองประธานของเครือข่ายการพัฒนามนุษย์ระบุปัญหาหนึ่งที่เกิดขึ้นจากความกำกวม: ฝ่ายของเขาใช้คำและแนวคิดหลายอย่างที่มีความหมายโดยรวม แต่มีความแตกต่างกัน
การเปลี่ยนแปลงสภาพภูมิอากาศความแห้งแล้งของก๊าซโอโซน
และ
การปล่อยก๊าซเรือนกระจก ทั้งหมดมีความเกี่ยวข้องทางสัญศาสตร์ แต่ไม่เหมือนกันในความหมาย เขาต้องการความสามารถในการค้นหาที่ฉลาดพอที่จะดึงเอกสารที่มีแนวคิดที่เกี่ยวข้องเมื่อมีผู้ค้นหาคำเหล่านี้ ต้นแบบ 'กรอบสำหรับความสามารถที่ทีม Bari เลือกคือโครงสร้างการจัดการข้อมูลที่ไม่มีโครงสร้าง (UIMA) ซึ่งเป็นโซลูชันที่ใช้ซอฟต์แวร์ ได้รับการออกแบบโดย IBM Research, UIMA มีอยู่ในซอฟต์แวร์ IBM เช่น IBM Content Analytics ซึ่งเป็นหนึ่งในเครื่องมือที่ใช้ IBM Watson ซึ่งเป็นเครื่องคอมพิวเตอร์ที่มีชื่อเสียงซึ่งชนะเกม Jeopardy ทีมงาน Bari ได้ร่วมมือกับทีมงานที่มีพรสวรรค์จาก IBM Content Management และ Enterprise Search และต่อมาทีม IBM Watson เพื่อทำงานร่วมกันในโครงการนี้ โซลูชัน
การจัดการข้อมูลที่ไม่มีโครงสร้าง (UD)
คือระบบซอฟต์แวร์ที่วิเคราะห์ข้อมูลที่ไม่มีโครงสร้าง (ข้อมูลเสียงวิดีโอภาพ ฯลฯ) เพื่อค้นพบจัดและส่งมอบความรู้ที่เกี่ยวข้อง ลูกค้าหรือผู้ใช้แอพพลิเคชัน
ontology ของโดเมนคืออาร์เรย์ของแนวคิดและคำที่เกี่ยวข้องเฉพาะสำหรับโดเมน โซลูชันที่ใช้ UIMA ใช้ ontologic เพื่อให้การติดแท็กความหมายซึ่งช่วยให้การค้นหาที่อุดมสมบูรณ์ขึ้นอยู่กับรูปแบบข้อมูล (ข้อความคำพูดงานนำเสนอ PowerPoint อีเมลวิดีโอและอื่น ๆ) UIMA ผนวกอีกชั้นหนึ่งเข้ากับข้อมูลที่จับแล้วเพิ่มข้อมูล
เพื่อระบุข้อมูลที่สามารถค้นหาได้อย่างมีโครงสร้างและแบบ semantically การค้นหาความหมาย ขึ้นอยู่กับความหมายตามบริบทของคำค้นหาเมื่อปรากฏในพื้นที่ข้อมูลที่สามารถค้นหาได้ซึ่ง UIMA สร้างขึ้น การค้นหาความหมายมีความแม่นยำกว่าการค้นหาตามคำหลักตามปกติเนื่องจากการค้นหาของผู้ใช้จะส่งกลับผลการค้นหาของเอกสารไม่เพียง แต่ที่มีข้อความค้นหา แต่ยังรวมถึงเอกสารที่มีความเกี่ยวข้องกับแบบสอบถาม ความหลากหลายทางชีวภาพ
ในแอฟริกา การค้นหาโดยทั่วไปจะขึ้นต้นด้วยเอกสารที่มีคำว่า
ความหลากหลายทางชีวภาพ และ แอฟริกา . การค้นหาตามความหมาย UIMA จะไม่เพียง แต่นำเสนอเอกสารที่มีทั้งสองคำเท่านั้น แต่ยังมีเนื้อหาที่เกี่ยวข้องกับเอกสาร "ความหลากหลายทางชีวภาพในแอฟริกา" ที่มีคำว่า "แหล่งทรัพยากรพืชในแอฟริกา" "แหล่งทรัพยากรสัตว์ใน โมร็อกโก "หรือ" แหล่งพันธุกรรมในประเทศซิมบับเว " ด้วยการใช้แท็กความหมายและการใช้ ontologies ข้อมูลจะกลายเป็นความหมายที่สามารถเรียกคืนได้โดยไม่ขึ้นกับภาษาหรือสื่อที่มีการสร้างข้อมูล (Word, PowerPoint, อีเมล, วิดีโอเป็นต้น) โซลูชันนี้มีฮับเดียวที่สามารถรวบรวมข้อมูลจัดแลกเปลี่ยนและทำให้สามารถเรียกคืนข้อมูลได้ พจนานุกรมของคำพ้องความหมายและคำศัพท์ที่เกี่ยวข้องเป็นโอเพนซอร์ส (อิสระที่มีอยู่) - หรือคุณสามารถพัฒนาพจนานุกรมของคุณเองเฉพาะสำหรับโดเมนหรือข้อมูลของคุณ คุณสามารถสร้างสเปรดชีตที่มีคำรากศัพท์และคำที่เกี่ยวข้องคำพ้องความหมายและคำที่กว้างขึ้นได้ สเปรดชีตสามารถอัปโหลดลงในเครื่องมือค้นหาเช่น IBM Content Analytics (ICA) เพื่อเพิ่มประสิทธิภาพการค้นหาและการวิเคราะห์เนื้อหาขององค์กร