วันอาทิตย์ที่ 5 มกราคม พ.ศ. 2557

การค้นหาข้อมูลบนอินเทอร์เน็ต

ข้อมูลที่จะถูกสืบค้นได้ในอินเทอร์เน็ต
• อาจอยู่ในรูปแบบของ
–Web Pages
–Directories Index
• สืบค้นโดยใช้ Search Engine
โปรแกรมสืบค้นข้อมูล (Search Engine)
• ใช้สำหรับการสืบค้นข้อมูลจากอินเทอร์เน็ต
• มักจะเป็น Web-base Applications
• มีหลากหลายโปรแกรม
• มีคุณสมบัติและความสามารถที่แตกต่างกัน
• มีการออกแบบเพื่อกิจกรรมเฉพาะอย่าง
ตัวอย่าง Search Engine เว็บไซท์
• http://www.altavista.com/
• http://www.yahoo.com/
• http://www.google.com/
• http://www.sansarn.com/
• http://campus.acm.org/public/search/search.cfm
วิธีการใช้งาน Search Engine
• โดยทั่วไปแล้ว Search Engine สามารถทำงาน

แบบ Basic/SimpleSearch ได้เสมอ

สำหรับการค้นหาแบบเฉพาะเจาะจง หรือ Advanced Search จะ

ได้ผลตรงตามต้องการมากกว่า 

แต่ละ Search Engine จะมีวิธีการที่แตกต่างกันออกไป


รูปแบบต่างๆ ของ Advanced Search
การค้นหาแบบบูล (Boolean Search)
การค้นหาแบบระบุคุณสมบัติ เช่น
anchor:  near:                       applet:
host:                       image:                   link:
text:                        title:                       url:               
domain:                


ความสำคัญของ Keyword
หมายถึง คำ หรือ ข้อความ ที่ต้องการให้ Search Engine ค้นหา
นอกจาก Keyword แล้ว อาจจะต้องส่งสัญลักษณ์ หรือคำสั่งอื่น
เพื่อให้ Search Engine ทำงานตรงตามความต้องการ


ตัวอย่างวิธีการสืบค้นข้อมูลทั่วไป (1)
ค้นหาโดยใช้ คำ หรือ วลี ทั่วไป เช่น มหาวิทยาลัย  บูรพา ผลที่ได้จากการสืบค้น จะได้ เว็บเพจ ที่มีคำว่า มหาวิทยาลัย หรือ บูรพา


ตัวอย่างวิธีการสืบค้นข้อมูลทั่วไป (2)
การใช้เครื่องหมายคำพูด “….” เข้าช่วย เช่น “linux thai” ผลที่ได้จะได้ เว็บ เพจ ที่มีคำว่า linux และ thai ซึ่งอาจเป็น thailinux หรือ Thai Linux หรือ Linux Thai หรือ อื่นๆ ในทำนองนี้ก็ได้


ตัวอย่างวิธีการสืบค้นข้อมูลทั่วไป (3)
การค้นหาโดยการใช้เครื่องหมาย * ต่อท้าย Keyword เช่น Bang* ผลที่ได้จะได้ เว็บ เพจ ที่มีคำว่า Bang หรือ มี Bang เป็นส่วนประกอบของคำ เช่น Bang’s หรือ Bang! เป็นต้น


หลักการวิธีการของ Boolean Searching
สามารถพิจารณาได้ จากการพิจารณาผลของ and หรือ or หรื
and notอาจมีการใช้ operator อื่น เช่น near, w/s, w/p, w/# หรือ
proximity search operator อื่นๆอาจมีการใช้เครื่องหมาย (  )ใน
ลักษณะของ parentheses “Nesting”


ตัวอย่างการใช้ Boolean Search (1)
ใช้เครื่องหมาย + แทน and และ - แทน not เช่น +buraphalinux -burapha ผลที่ได้จะได้เว็บเพจ ที่มีคำว่า buraphalinux แต่ไม่มีคำว่า burapha ทดสอบได้ที่ www.altavista.com


ตัวอย่างการใช้ Boolean Search (2)
ใช้เครื่องหมายวงเล็บ เข้าช่วย เช่น ("burapha university") and (bangsaen) ผลที่ได้จะได้เว็บเพจ ที่มีคำว่า “Burapha University” และ Bangsaen หรืออื่นๆ ในลักษณะเดียวกัน


การค้นหาโดยระบุคุณสมบัติ (1)
ระบุ anchor: anchor: burapha จะได้เว็บเพจ ที่มี burapha เป็น anchor
ระบุ applet: applet:balls จะได้เว็บเพจ ที่มี Java Applet ชื่อ balls ทดสอบได้ที่ www.altavista.com


การค้นหาโดยระบุคุณสมบัติ (2)
ระบุ host: host: www.buraphalinux.org จะได้ directories index
ของ host ที่ระบุ

ระบุ link:
link: www.buu.ac.th จะได้เว็บเพจที่มี link ตามกำหนดทดสอบ
ได้ที่ www.altavista.com 
www.google.com เป็นเว็บไซท์ที่มีผู้นิยมมาก ทั่วโลก
มีเครื่องแม่ข่ายกระจายไปทั่วโลก หลายภาษา เช่น www.google.co.th
มีโปรแกรมคอย update ฐานข้อมูลของตนเองโดยอัตโนมัติตลอดเวลา ทำ Basic/Simple Search ได้ดี
มีผู้นิยมใช้มาก ทั่วโลกมีบริการเว็บเสริมมากมายมีการจัด 
Web Site Directories เรียงตาม Subjects ที่เหมาะสมต่อ
การใช้งานมีเครื่องแม่ข่ายกระจายไปตามภูมิภาคทั่วโลก


มีชื่อเสียงในเรื่องความสามารถในการทำ Advanced Search 
ลักษณะต่างๆโปรแกรม search engine ของ altavista ถูกนำไปใช้
โดย เว็บไซท์ต่างๆ หลายแห่ง


เป็นเว็บเพจ ที่ใช้สำหรับการค้นหาเอกสาร บทความทางด้าน
คอมพิวเตอร์ โดยเฉพาะข้อมูลบางส่วนเป็นบริการทั่วไปแบบ
สาธารณะข้อมูลในรายละเอียดมีไว้บริการเฉพาะสมาชิกเท่านั้น
สมาชิกจะต้องเสียค่าบริการ


Search Engine สำหรับภาษาไทย
Search Engine อื่นๆที่มีคุณภาพสูง ยังไม่สามารถทำงานได้ดีกับ
ภาษาไทย สรรสารเป็นโปรแกรมสืบค้นข้อมูล ภาษาไทย
พัฒนาโดย NECTEC


โครงสร้างของโปรแกรมสรรสาร
ส่วนจัดเตรียมข้อมูล (Data Preparation Servers)
ส่วนจัดเก็บฐานข้อมูล (Database Servers)
ส่วนค้นหาข้อมูล (Search Engine Servers)


ส่วนจัดเตรียมข้อมูล Data Preparation Servers
เป็นส่วนที่ทำหน้าที่นำข้อมูลเข้าระบบ โดยผู้บริหารระบบ
ข้อมูลที่ถูกนำเข้าอยู่ในรูปแบบต่างๆ เช่น text, HTML, PDF, doc
เป็นต้น
มีการสร้าง index ซึ่งจะได้ index files เพื่อใช้ในการค้นหา

ส่วนจัดเก็บฐานข้อมูล  Database Servers
ใช้ทำหน้าที่ในการเก็บ files ข้อมูล
ใช้ทำหน้าที่ในการเก็บ index files ที่ระบบสร้างขึ้น

ส่วนค้นหาข้อมูล Search Engine Servers
รับ keyword และคำสั่งจากผู้ใช้ทำหน้าที่ในการค้นหา จัดลำดับ
 เอกสารที่ค้นพบ ในฐานข้อมูล คืนสู่ผู้ใช้
การสืบค้นข้อมูลทางวิชาการจากอินเทอร์เน็ต
ระบุปัญหาให้ชัดเจน
เลือกแหล่งข้อมูลที่จะค้นหา
เลือกคำที่จะใช้ค้นหา
ดำเนินการค้นหา
พิมพ์เอกสารที่ค้นหา
ระบุปัญหาให้ชัดเจน
ผู้สืบค้นจะต้องกำหนดปัญหา ที่ต้องการศึกษาให้ชัดเจนเสียก่อน
พิจารณาว่าสิ่งที่เราต้องการศึกษานั้นคืออะไร ควรจะเป็นปัญหา
เฉพาะ ไม่กว้างจนเกินไป
พิจารณากำหนด Keywords ที่จะใช้ในการค้นหา ให้ครบถ้วน
รอบคอบ

เลือกแหล่งข้อมูลที่จะค้นหา

ในที่นี้หมายถึง เว็บไซท์ที่จะทำการสืบค้น
พิจารณาเว็บไซท์ ที่เกี่ยวข้องกับ

 เนื้อหาข้อมูลที่ต้องการค้นหาที่สามารถเข้าถึงได้ก่อน
ใช้เว็บไซท์ที่สามารถเรียกใช้ข้อมูลที่ต้องการได้จำนวนมากกว่า
พิจารณาความสามารถด้านภาษาของ Search Engine ด้วย

เลือกคำที่จะใช้ค้นหา
เลือกใช้ คำ หรือ คำพ้อง ทั้งนี้ต้องพิจารณา ความสามารถของ 
Search Engine ประกอบการเลือกคำด้วย
พยายามใช้หลักตรรกวิทยา ในการกำหนดคำ วลี หรือ คำพ้อง ที่
จะใช้เป็น Keywords

ดำเนินการค้นหา
ป้อน Keyword(s) และคำสั่ง ลงในช่องที่กำหนด แล้วสั่ง Search
ในกรณีที่เว็บไซท์มี Directory Subjects บริการ ก็สามารถที่จะ
ติดตาม link เหล่านั้น จนกว่าจะพบข้อมูลที่ต้องการพิมพ์เอกสาร
ที่ค้นหาเพื่อรวบรวมเว็บเพจ ที่ค้นหามาได้ ไว้อ้างอิงต่อไป
 สามารถทำได้ 2 แนวทางคือ
พิมพ์เอกสารลงกระดาษ ทำการบันทึก วันเวลา และข้อมูลที่
เกี่ยวข้องไว้
เก็บ file(s) ลง disk หรือ floopy disk พร้อมบันทึกข้อมูลวันเวลา
และข้อมูลที่เกี่ยวข้องไว้


แหล่งข้อมูลอ้างอิง
http://www.sansarn.com/
http://www.yahoo.com/
http://www.altavista.com/
http://www.acm.org/


ไม่มีความคิดเห็น:

แสดงความคิดเห็น