เสิร์ชเอนจิน (search engine) คือโปรแกรมที่ช่วยในการสืบค้นหาข้อมูล โดยเฉพาะข้อมูลบนอินเทอร์เน็ตโดยครอบคลุมทั้งข้อความ รูปภาพ ภาพเคลื่อนไหว เพลง ซอฟต์แวร์ แผนที่ ข้อมูลบุคคล กลุ่มข่าว และอื่น ๆ ซึ่งแตกต่างกันไปแล้วแต่โปรแกรมหรือผู้ให้บริการแต่ละราย. เสิร์ชเอนจินส่วนใหญ่จะค้นหาข้อมูลจากคำสำคัญที่ผู้ใช้ป้อนเข้าไป จากนั้นก็จะแสดงรายการผลลัพธ์ที่มันคิดว่าผู้ใช้น่าจะต้องการขึ้นมา ในปัจจุบัน เสิร์ชเอนจินบางตัว เช่น กูเกิล จะบันทึกประวัติการค้นหาและการเลือกผลลัพธ์ของผู้ใช้ไว้ด้วย และจะนำประวัติที่บันทึกไว้นั้น มาช่วยกรองผลลัพธ์ในการค้นหาครั้งต่อ ๆ ไป
ประเภท Search Engine
1. Keyword Index เป็นการค้นหาข้อมูล โดยการค้นจากข้อความในWeb Pageที่ได้ผ่านการสำรวจมาแล้ว จะอ่านข้อความ ข้อมูล อย่างน้อยๆ ก็ประมาณ
๒๐๐-๓๐๐ ตัวอักษรแรกของWeb Pageนั้นๆ โดยการอ่านนี้จะหมายรวมไปถึงอ่านข้อความที่อยู่ในโครงสร้างภาษา HTML ซึ่งอยู่ในรูปแบบของข้อความที่อยู่ในคำสั่ง Alt ซึ่งเป็นคำสั่งภายใน TAG คำสั่งของรูปภาพ แต่จะไม่นำคำสั่งของ TAG อื่นๆ ในภาษา HTML และคำสั่งในภาษา JAVA มาใช้ในการค้นหา วิธีการค้นหาของ Search Engine ประเภทนี้จะให้ความสำคัญกับการเรียงลำดับข้อมูลก่อน-หลัง
และความถี่ในการนำเสนอข้อมูลนั้น การค้นหาข้อมูล
โดยวิธีการเช่นนี้จะมีความรวดเร็วมาก
แต่มีความละเอียดในการจัดแยกหมวดหมู่ของข้อมูลค่อนข้างน้อย
เนื่องจากไม่ได้คำนึงถึงรายละเอียดของเนื้อหาเท่าที่ควร แต่หากว่าต้องการแนวทางด้านกว้างของข้อมูล
และความรวดเร็วในการค้นหา วิธีการนี้ก็ใช้ได้ผลดี
2. SubjectDirectories การจำแนกหมวดหมู่ข้อมูล Search Engine ประเภทนี้ จะจัดแบ่งโดยการวิเคราะห์เนื้อหา รายละเอียด ของแต่ละWeb Page ว่ามีเนื้อหาเกี่ยวกับอะไร โดยการจัดแบ่งแบบนี้จะใช้แรงงานคนในการพิจารณาWeb Page ซึ่งทำให้การจัดหมวดหมู่ขึ้นอยู่กับวิจารณญาณของคนจัดหมวดหมู่แต่ละคนว่าจะจัดเก็บข้อมูลนั้นๆ
อยู่ในเครือข่ายข้อมูลอะไร ดังนั้นฐานข้อมูลของ Search Engine ประเภทนี้จะถูกจัดแบ่งตามเนื้อหาก่อน แล้วจึงนำมาเป็นฐานข้อมูลในการค้นหาต่อไป
การค้นหาค่อนข้างจะตรงกับความต้องการของผู้ใช้ และมีความถูกต้องในการค้นหาสูง
เป็นต้นว่า หากเราต้องการหาข้อมูลเกี่ยวกับเว็บไซต์ หรือWeb Pageที่นำเสนอข้อมูลเกี่ยวกับคอมพิวเตอร์ Search Engine ก็จะประมวลผลรายชื่อเว็บไซต์ หรือWeb Pageที่เกี่ยวกับคอมพิวเตอร์ล้วนๆ
มาให้
3. Metasearch Engines จุดเด่นของการค้นหาด้วยวิธีการนี้ คือ สามารถเชื่อมโยงไปยัง Search Engine ประเภทอื่นๆ และยังมีความหลากหลายของข้อมูล
แต่การค้นหาด้วยวิธีนี้มีจุดด้อย คือ
วิธีการนี้จะไม่ให้ความสำคัญกับขนาดเล็กใหญ่ของตัวอักษร และมักจะผ่านเลยคำประเภท Natural Language (ภาษาพูด) ดังนั้น
หากจะใช้ Search
Engine แบบนี้ละก็
ขอให้ตระหนักถึงข้อบกพร่องเหล่านี้ด้วย
การทำงานของ Search Engine
ประกอบไปด้วย ๓ ส่วนหลัก ๆ คือ
๑. Spider หรือ Web Robot จะเป็นตัวที่ทำหน้าที่เข้าสำรวจเว็บไซต์ต่างๆ
แล้วดึงข้อมูลเหล่านั้นมาอัพเดทใส่ในรายการฐานข้อมูล ส่วนมาก Spider มักจะเข้าไปอัพเดทข้อมูลเป็นรายเดือน
๒. ฐานข้อมูล (Database) เป็นส่วนที่เก็บรายการเว็บไซต์
ฐานข้อมูลที่ดีควรจะมีขนาดใหญ่เพียงพอที่จะรองรับกับการเติบโตของเว็บไซต์ในปัจจุบัน
การออกแบบฐานข้อมูลที่ดีก็เป็นส่วนสำคัญเพราะถ้าฐานข้อมูลออกแบบมาทำงานช้าก็ทำให้การรอผลนานและจะไม่ได้รับความนิยมไปในที่สุด
๓.โปรแกรม Search Engine มีหน้าที่รับคำหรือข้อความที่ผู้ใช้งานป้อนเข้ามา
แล้วเข้าค้นหาตามเว็บไซต์ต่างๆ ที่จัดเก็บไว้ในฐานข้อมูล
จากนั้นก็จะรายงานผลเว็บไซต์ที่ค้นพบให้กับผู้ใช้
การสืบค้นด้วยวิธีนี้นอกจากจะต้องมีระบบการสืบค้นข้อมูลที่รวดเร็วและมีประสิทธิภาพแล้ว
การกลั่นกรองผลที่ได้
เพื่อให้ตรงกับความต้องการของผู้ใช้ก็เป็นอีกส่วนหนึ่งที่สำคัญของการสืบค้นข้อมูล