بقلم أميمة الدكاك
مدير بحوث في المعهد العالي للعلوم التطبيقية والتكنولوجيا
محركات البحث هي نظم لاسترجاع معلومات، وهي مصممة للمساعدة على الوصول إلى المعلومات المخزنة في نظام حاسوبي. تكون نتائج البحث في غالب الأحيان على شكل قوائم تسمى بالنقرات hits.
يعرِّف الموقع www.webnots.com الهدف من محركات البحث بأنه استخراج المعلومات المطلوبة من قواعد معطيات ضخمة من الموارد المتاحة على الإنترنت.
تُعد محركات البحث جزءًا من الحياة اليومية لمجموعتين من الناس، هما:
- المستخدمون الذين يبحثون عن المعلومات ويحصلون عليها.
- مالكو المواقع الذين يحاولون أمثَلة مواقعهم للحصول على أفضل ترتيب لنتائج البحث.
تختلف محركات البحث بحسب الأمكنة التي يجري فيها البحث عن المعلومات: قاعدة معطيات، حاسوب شخصي، مخدمات، حواسيب شركة معينة... إلخ. ولكنها في معظم الأحيان تعني محركات البحث الموصولة بالإنترنت والتي تمكّن من الوصول إلى معلومات محددة من قواعد معطيات موصولة على الخط online.
ثمة خيارات عديدة لتصنيف محركات البحث؛ من أهمها:
1. تصنيف محركات البحث بحسب المحتوى
يمكن تصنيف محركات البحث بحسب المحتوى أو المواضيع التي تتناولها؛ فمنها ما هو عام المحتوى، ومنها ما هو لمحتويات خاصة عديدة.
1-1 فمن أمثلة المحتوى العام الذي تدعمه مواقع عامة: Bing (AOL Search, HotBot, Excite,…), Google (Ask.com (formerly), MetaCrawler,..), Yahoo. وبعض هذه المحركات متعدد اللغات مثل Yahoo، وبعضها بالإنكليزية فقط مثل MetaCrawler، وبعضها بالصينية مثل Baidu. وثمة محركات بحث عامة أيضًا ولكنها موجهة للهواتف الذكية مثل: Taganode و Taptu، ومحركات بحث أخرى ترتبط بمناطق جغرافية محددة مثل Biglobe (في اليابان وباللغة اليابانية)، و Accoona (في الصين والولايات المتحدة الأمريكية وباللغتين الصينية والإنكليزية)، و Fireball (في ألمانيا باللغة الألمانية والإنكليزية).
1-2 محتوى متخصص بمواضيع محددة: كالمحاسبة، وإدارة الأعمال Business.com، والحواسيب Shodan (الذي يبحث عن أنواع محددة من الحواسيب مربوطة بالإنترنت)، والوب الظلامي Dark Web الموجود على الشبكات الظلامية darknets غير المفتوحة للجمهور أو المعماة التي تتطلب برمجيات خاصة أو تشكيلات خاصة أو تخويلًا للدخول مثل Grams. إضافة إلى مواضيع أخرى مثل: التعليم، والشركات، والأحداث، ووجبات الطعام، وتاريخ العائلات Mocavo، والبحث عن عمل، والقانون، والصحة، والأخبار Yahoo news، والناس عمومًا FindFace, InfoSpace وألعاب الفيديو وغيرها.
2. تصنيف محركات البحث بحسب نوع المعطيات
بعض محركات البحث مخصص لأنواع معينة من المعطيات؛ منها:
- الخرائط، ولعل أشهرها Google Maps وهي تمكّن من اكتشاف الأماكن وسبل الوصول إليها.
صورة موقع مبنى الجمعية العلمية السورية للمعلوماتية على Google Map.
وفي الصورة التي تليها يظهر الطريق بين مبنى الجمعية العلمية السورية للمعلوماتية ومشفى الأطفال، ويبدو فيها أن هذا الطريق يستغرق 7 دقائق بالسيارة عن طريق شارع بيروت أو شارع عمر بن عبد العزيز. ويمكن لهذا الموقع التعامل مع عمليات بحث أعقد، كعمليات البحث بين مدن من بلدان مختلفة، ويمكن أن يعطي بدائل الطرقات وأزمنتها: قطار سريع، سيارة، حافلة... ويمكن أن يعطي زمن الوصول سيرًا على الأقدام للطرق القصيرة.
- التسوق والأسعار، مثل: Google Shopping و shopping.com.
- الأرمزة المصدرية، مثل: Google Code Search و Koders.
- المدونات، والمنتديات، والبريد الإلكتروني.
- محركات الأسئلة والأجوبة Question and Answers. منها ما يجمع إجابات بشرية مثل: Answers.com و Yahoo! Answers، ومنها نظم آلية مثل: AskMeNow.
3. تصنيف محركات البحث بحسب الأنماط
- تطبيقات بحث لبعض الشركات مثل Searchdaimon، وهو محرك بحث مفتوح المصدر لشركة يتضمن البحث في النصوص الكاملة عن المعطيات المهيكلة وغير المهيكلة.
- محركات بحث للحواسيب desktops search engines: للبحث في ملفات الحواسيب بطريقة فعالة بعضها لنظم التشغيل ويندوز أو لينوكس، منها ما هو مجاني ومنها ما هو تجريبي أو منتج تجاري مثل Windows Search الشائع الاستعمال على حواسيبنا الشخصية الذي نستعمله للبحث في الملفات والمجلدات.
- محركات بحث آمنة للأطفال؛ مثل: Kiddle, KidRex, KidzSearch.
- محركات بحث فائقة Metasearch engines: وهي أدوات تأخذ الاستعلام وترسله إلى مجموعة محركات بحث، ثم تجمع الإجابات وتفهرسها وتقدمها إلى طالبها. ومن الأمثلة عليها Dogpile
- محركات بحث الوسائط المتعددة التي تبحث في ملفات الصوت والفيديو والصور؛ مثل: Bing Videos للبحث في ملفات الفيديو، و Find Sounds للبحث في ملفات الصوت والموسيقا والمؤثرات صوتية، و Google Videos الذي أنشئ على غرار Youtube لاستضافة الفيديوهات في عام 2007. وظهر إصدار آخر له للفيديو الحي Live Google Videos في عام 2009.
- محركات بحث باللغات الطبيعية: يمكنها أن تأخذ الكلمات والعبارات وغيرها، لتبحث عن المعلومات. ثمة واجهات بحث صوتية أيضًا. ومنها ما يبحث في الصور والفيديوهات وغيرها مثل Bing.
- محركات بحث مفتوحة المصدر تسمح للمطورين بإدخال التعديلات على عمل هذه المحركات ومنها: Apache Solr.
- محركات البحث الاجتماعية؛ مثل: Facebook و Google Groups. ولما كانت هذه المحركات واسعة الانتشار، فإن معظم الأشخاص والمؤسسات والأعمال يصممون صفحاتهم على هذه المواقع لسهولة الوصول إليها.
- محركات البحث التي تحافظ على خصوصية المستثمر ولا تنشر معطياته، ومن الأمثلة عليها: Swisscow و DuckDuckGo.
4. تصنيف محركات البحث حسب طريقة عملها
تقسم محركات البحث في هذا المجال إلى ثلاثة أصناف: محركات بحث تعتمد البحث عن المعلومات، ومجلدات يديرها أشخاص، ومحركات بحث هجينة.
- محركات البحث التي تعتمد على البحث عن المعلومات: وهي تَستعمل ما يسمى Crawler أو bot أو spider للبحث عن المعلومات، وتفهرس المحتوى الجديد للبحث في قواعد المعطيات. تَستعمل هذه المحركات أربع خطوات: تبدأ أولًا بالزحف crawling (مسح الإنترنت) لمعرفة صفحات الوب المتاحة. وبحسب محركات البحث يتغير تواتر هذه العملية بحسب المحركات (قد يصل إلى عدة أيام). الخطوة التالية هي الفهرسة indexing، وهي عملية العثور على الكلمات أو العبارات التي تحدد هوية هذه الصفحات وتسمى الكلمات المفتاحية. إذا لم يفهم الزاحف محتوى صفحتك، سيكون ترتيبها منخفضًا في نتائج البحث، لذلك تحتاج هذه الصفحات إلى عمليات الأمثَلة ليكون ترتيبها متقدمًا في نتائج البحث. الخطوة الثالثة هي حساب الصلة بالسياق calculating the relevancy حيث يقارن محرك البحث بين الصفحات الخاصة بالبحث من حيث الأهمية والصلة بموضوع البحث. توجد عدة خوارزميات لتحقيق ذلك، مثل: كثافة الكلمات المفتاحية والروابط وغيرها. الكثير من محركات البحث تغير خوارزمياتها وعليك أن تتابع هذه التغيرات. الخطوة الأخيرة هي استخراج النتائج Retrieving results وهنا يرتب محرك البحث النتائج حسب أهميتها من المهم إلى الأقل أهمية. من أهم هذه المحركات: Google, Bing, Baidu, Yahoo!, Yandex.
- المجلدات التي يديرها أشخاص Human Powered Directories: هنا يوصِّف مالكُ الموقع موقعه ويضع تصنيفه وكلماته المفتاحية، ويحدِّث معلوماته يدويًّا. وتجدر الإشارة هنا إلى أن محركات البحث الآلية مثل Google لا تهتم بهذه الصفحات.
- محركات البحث الهجينة: تَستعمل الزاحف ثم تهذب نتائجها يدويًّا. ولكن هذه المحركات تختفي تدريجيًّا لاختفاء المواقع (المجلدات) الشخصية تدريجيًّا.
الجدير بالذكر أن اللغة العربية على الإنترنت لا تحظى بما تحظى به اللغات الأخرى مع أنها اللغة الخامسة عالميًّا. والجميع مدعو لتحسين المحتوى العربي على الإنترنت والبحث عن سبل تحسين المواقع وتحسين ظهورها في نتائج البحث.