เสิร์ชเอนจิ้น (Search Engine) เครื่องมือสืบค้นข้อมูล

ทุกวันนี้ ด้วยความก้าวหน้าของเทคโนโลยีสารสนเทศที่ขยายตัวเติบโตขึ้น ทำให้คนในปัจจุบันสามารถเข้าถึงข้อมูลข่าวสารในรูปแบบต่างๆได้อย่างรวดเร็วกว่าในอดีต เครือข่ายอินเทอร์เน็ตนับเป็นแหล่งของข้อมูลข่าวสารมากมายมหาศาลจากทุกหนทุกแห่งทั่วโลก กล่าวคือ ไม่ว่าจะต้องการเข้าถึงข้อมูลในลักษณะต่างๆ จากแหล่งใด ไม่ว่าจะเป็นข้อความ รูปภาพ ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว ก็สามารถใช้เครือข่ายอินเตอร์เน็ตในการค้นหาข้อมูลที่ต้องการดังกล่าวได้โดยง่าย ด้วยจำนวนข้อมูลข่าวสารที่เพิ่มจำนวนขึ้นอย่างรวดเร็ว ทำให้มีความจำเป็นที่จะต้องมีการพัฒนาเสิร์ชเอนจิ้น (Search Engine) หรือเครื่องมือสืบค้นข้อมูลที่มีประสิทธิภาพ เพื่อช่วยให้ผู้ใช้งานสามารถสืบค้นข้อมูลให้ได้ตรงกับความต้องการมากที่สุด

ถ้ามองย้อนกลับไปจะเห็นว่า เสิร์ชเอนจิ้นครั้งแรกบนอินเทอร์เน็ตได้ถูกประยุกต์ใช้ขึ้นในปี 2533 โดยระบบที่ใช้มีชื่อว่า Archie ซึ่งทำหน้าที่จัดเก็บรายการ (directory) ของทุกไฟล์ที่อยู่บน เว็ปไซต์ FTP (File Transfer Protocol) สาธารณะ ลงบนฐานข้อมูลที่สามารถสืบค้นชื่อไฟล์เหล่านั้นได้ สำหรับระบบเสิร์ชเอนจิ้นที่มีการใช้บน World Wide Web ครั้งแรกได้เกิดขึ้นในปี 2536 โดยใช้ชื่อระบบว่า Wandex ภายใต้ระบบนี้มีการใช้เครื่องมือในการเก็บข้อมูลเว็บไซต์อัตโนมัติ (Web Crawler) เป็นครั้งแรก และในช่วงระยะเวลาเดียวกันได้มีการพัฒนาเสิร์ชเอนจิ้นตัวอื่น เช่น Aliweb และ JumpStation ซึ่งระบบเหล่านี้สามารถทำการค้นหาโดยดูจากชื่อหัวเรื่องของหน้าเว็บเท่านั้น ต่อมาในปี 2537 ได้เกิดระบบสืบค้นแบบเต็มเนื้อหา (Full-Text Search) โดยใช้ชื่อว่าWebCrawler ซึ่งเป็นระบบที่อนุญาตให้ผู้ใช้สามารถค้นหาคำหรือข้อความที่อยู่ในเนื้อหาบนหน้าเว็บได้ และในปีเดียวกัน เสิร์ชเอนจิ้นของบริษัทLycos ได้ถือกำเนิดขึ้นและเป็นระบบแรกที่มีการประยุกต์ใช้ในเชิงพาณิชย์ หลังจากนั้นอีกไม่นาน ได้มีการพัฒนาระบบเสิร์ชเอนจิ้นตัวอื่นๆที่เป็นที่รู้จักกันดี เช่น Magellan, Excite, Infoseek, Inktomi, Northern Light และAltaVista ต่อมาในปี 2539 บริษัท Googleได้คิดค้นนวัตกรรมใหม่ที่มีชื่อว่า PageRank ซึ่งเป็นการคำนวนหาค่าตัวเลขที่บอกถึงความสำคัญของเว็บเพจที่อยู่บนเว็บ ซึ่งแต่ละหน้าของเว็บเพจ จะมีค่า PageRankไม่เท่ากัน เพราะว่าการที่ได้ค่า PageRankนั้นจะขึ้นอยู่กับ ค่าความสําคัญที่ได้มาจากจํานวนของเว็บเพจ ที่มีการเชื่อมโยงเข้ามายังหน้าเว็บเพจของเรา ถ้าหน้าเว็บเพจที่ชื้เข้ามา มีค่า PageRankมาก จะทําให้เว็บเพจของเรามีค่า PageRankสูงตามไปด้วย นอกเหนือจากการประยุกต์ใช้วิธีการอันดับเว็บไซต์โดยใช้วิธีคำนวณ PageRank แล้ว จะเห็นได้ว่า Interface บนหน้าเว็บไซต์ของ Google ยังคงใช้รูปแบบที่เรียบง่าย เพื่อให้ง่ายต่อการใช้งาน แทนที่จะทำหน้า Interface ให้เป็นลักษณะ Web Portal เหมือนคู่แข่งขันรายอื่นๆ

เมื่อพูดถึงคู่แข่งของ Google หลายคนก็คงจะนึกถึง Yahoo และ Microsoft แต่โดยความเป็นจริงแล้วนั้น ทั้งสองบริษัทไม่เคยมีเทคโนโลยีเสิร์ชเอนจิ้น เป็นของตัวเองเลยจนกระทั่งปี 2547 โดยก่อนหน้านี้ Yahoo Search ใช้ข้อมูลจาก Inktomi และAltaVista และ รวมถึงใช้เสิร์ชเอนจิ้นของ Google ไปพร้อมๆ กันด้วย สำหรับ Microsoft หรือ MSN Search (ปัจจุบันเรียกว่า Live Serach) ใช้ข้อมูลจาก Inktomi และAltaVista เหมือนกับของ yahoo จนกระทั่งมาในปี 2547 ที่ Microsoft เริ่มเปลี่ยนมาใช้ เสิร์ชเอนจิ้นที่ตัวเองพัฒนาขึ้น โดยใช้ Web Crawler ที่มีชื่อว่า msnbot

จะเห็นได้ว่า Google, Yahoo และ Microsoft ถือเป็นสามบริษัทใหญ่ในตลาดของการสืบค้นข้อมูล แต่ในปัจจุบันเริ่มมีการคิดค้นเสิร์ชเอนจิ้นที่เป็นแบบเฉพาะท้องถิ่นหรือเฉพาะประเทศที่ใช้ภาษาแตกต่างกันเพิ่มมากขึ้น ดังนั้นบริษัททั้งสามอาจจะไม่ได้เป็นที่นิยมในแต่ละประเทศนั้นๆก็ได้ ยกตัวอย่างเช่น ในประเทศจีน มีการใช้เสิร์ชเอนจิ้นที่มีชื่อว่า Baidu ซึ่งได้รับความนิยมเป็นอย่างสูง นอกเหนือจากนี้ถ้าลองดูจากจำนวนสืบค้นทั่วโลก จะเห็นว่า Google มาเป็นอันดับหนึ่ง รองลงมาคือ Yahoo และ Baidu ส่วนอันดับสี่ตกเป็นของ Microsoft ดังข้อมูลที่แสดงในตารางที่ 1

ตารางที่ 1: บริษัทที่เป็นเจ้าของตลาดการสืบค้นข้อมูลทั่วโลก 10 อันดับแรก

ที่มา MEDIA ADVISORY: Baidu Ranked Third Largest Worldwide Search Property by comScore in December 2007

สำหรับประเทศไทยนั้น ระบบเสิร์ชเอนจิ้นสำหรับภาษาไทยที่พัฒนาโดยหน่วยงานของรัฐหรือบริษัทเอกชนยังไม่ได้รับความนิยมมากนักเนื่องจากในด้านงบลงทุนเพื่อใช้ในการทำวิจัยและพัฒนาในระบบเสิร์ชเอนจิ้นยังน้อยกว่าบริษัทต่างชาติมาก อีกทั้งมีจำนวนฐานข้อมูลน้อย แต่อย่างไรก็ตามเสิร์ชเอนจิ้นของไทยยังมีข้อได้เปรียบเกี่ยวกับข้อมูลภาษาไทย และ ความลึกในเนื้อหาที่เกี่ยวกับประเทศไทย ที่มีมากกว่าเสิร์ชเอนจิ้นต่างชาติ ดังนั้นนักพัฒนาไทยควรที่จะนำข้อได้เปรียบเหล่านี้มาพัฒนาสร้างระบบเสิร์ชเอนจิ้นเพื่อประโยชน์ของคนไทยที่จะได้มีแหล่งสืบค้นข้อมูลภาษาไทย โดยคนไทย เพื่อคนไทย