در فرهنگ رایانه، جویشگر یا همان موتور جست‌وجوگر به برنامه‌ای می‌گویند که کلمات کلیدی را در یک سند یا بانک اطلاعاتی جست‌وجو می‌کند.

در اینترنت، موتور جست‌وجو به برنامه‌ای گفته می‌شود که کلمات کلیدی موجود در سندهای وب جهانی، فایل‌ها، گروه‌های خبری و … را جست‌وجو می‌کند.

موتور جستجو

موتور جستجو

webano

تاریخچه موتور جست‌وجوگر

اولین موتور جست‌وجوگر با نام آرچی (Archie) به وجود آمد که فقط توانایی نمایش عناوین و فهرست کردن را داشت. به همین دلیل، کاربر باید فایل را با نام دقیق سرچ می‌کرد تا نتیجه به دست می‌آمد.

به دنبال موتور جست‌وجوگر آرچی، دو موتور جست‌وجوگر دیگر با نام‌های جاگ هد (Jughead) و ورونیکا (Veronica) به وجود آمدند که قابلیت ایندکس کردن متن را داشتند.

در سال 1993، رباتی با هدف ارزیابی پیشرفت وب ایجاد شد که قابلیت جمع‌آوری و نگه‌داری لینک‌های فعال را در یک دیتابیس واحد داشت. این ربات دسترسی به وب‌سایت‌ها را مشکل می‌کرد. برای رفع این مشکل، موتوری با نام آلی‌وب (ALIWEB) به وجود آمد. در این جست‌وجوگر، مالکان وب‌سایت می‌توانستند ایندکس را به‌صورت دستی وارد کنند.

در سال 1994، موتور جست‌وجوگر وب کراولر (Web Crawler) که قابلیت ایندکس تمام متن‌های موجود را در صفحات داشت، عرضه شد. از آن پس، موتورهای جست‌وجوگر مختلفی به عرصه وب معرفی شدند.

در نهایت، در سال 1998، موتور جست‌وجوگری با نام گوگل معرفی شد که تا به امروز به محبوب‌ترین و پراستفاده‌ترین جست‌وجوگر تبدیل شده است.

موتور جست‌وجو چیست؟

هر برنامه کامپیوتری را که برای یافتن اطلاعات در هر پلتفرمی مورداستفاده قرار گیرد، موتور جست‌وجو می‌گویند. در حقیقت، موتورهای جست‌وجو ماشین‌های پاسخ‌دهی هستند.

وظیفه اصلی موتور جست‌وجو پیدا کردن محتوا از جمله محتوای متنی، صوتی، ویدئویی، تصویری یا هر فایل دیگر موجود در شبکه جهانی وب است. به محتوایی که بیشترین مطابقت را با عبارت جست‌وجوشده کاربر داشته باشد، کوئری (Query) گفته می‌شود. موتور جست‌وجو از الگوریتم و پایگاه داده تشکیل شده است. الگوریتم موتور جست‌وجو، نحوه رتبه‌بندی و قواعد موتور جست‌وجو را مشخص می‌کند.

به‌طور کلی، از الگوریتم موتور جست‌وجو برای مشخص کردن رتبه‌دهی و اهمیت صفحه وب استفاده می‌شود. هرکدام از موتورهای جست‌وجو الگوریتم منحصربه‌فرد خود را دارند که در بحث سئو و بهینه‌سازی سایت باید به آن توجه کرد.

هر موتور جست‌وجویی قواعد مخصوص خود را دارد. این قواعد مشخص می‌کنند که آیا صفحه وب واقعی است یا اسپم یا حاوی اطلاعاتی است که مردم به آن علاقه دارند. الگوریتم هر موتور جست‌وجو متفاوت است. اصولاً محرمانه هستند و در یک سری از موارد خاص الگوریتم‌های موتور جست‌وجو مشترک می‌باشند.

الگوریتم‌ها از دو بخش داخلی و خارجی تشکیل می‌شوند. سوشال سیگنال‌ها و بک‌لینک‌ها جزء فاکتورهای خارجی هستند که بیرون از صفحه وب‌سایت ملزم به رعایت آن هستید. چهارچوبی که در داخل صفحه باید رعایت شود، از فاکتورهای داخلی به حساب می‌آید؛ مانند لینک‌های داخلی و چگالی کلمه کلیدی.

موتورجستجوچیست؟

موتورجستجوچیست؟

نحوه عملکرد الگوریتم

به‌طور کلی، نحوه عملکرد الگوریتم به‌ترتیب شامل تجزیه‌وتحلیل کوئری کاربران، پیدا کردن صفحات مطابق با جست‌وجو و اعمال عوامل محلی می‌باشند.

گام اول: تجزیه‌وتحلیل کوئری کاربران

اولین گام برای موتورهای جست‌وجو فهمیدن اطلاعاتی است که کاربر جست‌وجو می‌کند. موتور جست‌وجو کوئری کاربر را به چند کلمه کلیدی تجزیه می‌کند.

کلمه کلیدی کلمه‌ای است که هدف و معنی مشخصی دارد. به‌طور مثال، هنگامی که کاربر عبارت «چگونه محتوایی کاربردی و ارزشمند تولید کنیم» را جست‌وجو می‌کند، موتور جست‌وجو از کلمه «چگونه» می‌فهمد که کاربر از آن راهنمایی می‌خواهد.

بنابراین، موتور جست‌وجو نتایجی را نشان می‌دهد که در آن دستورالعمل‌های مربوطه باشد؛ مثلاً هنگامی که کاربر عبارت «خرید کامپیوتر» را جست‌وجو می‌کند، موتور جست‌وجو متوجه خواهد شد که کاربر به دنبال خرید است و نتایجی را ارائه می‌دهد که شامل فروشگاه‌های کامپیوتر آنلاین باشند.

سیستم هوش مصنوعی که در الگوریتم موتورهای جست‌وجو وجود دارد، به آن‌ها کمک می‌کند تا کلمات کلیدی را به یکدیگر ربط دهند. به‌طور مثال، موتور جست‌وجو می‌داند که معنی جمله «چگونه موبایل خود را به‌روزرسانی کنیم» با جمله «چگونه موبایل خود را آپدیت کنیم» یکسان است.

این سیستم به‌قدری هوشمند است که فعل‌های جمع و مفرد و مثبت و منفی را تشخیص می‌دهد و حتی متوجه غلط‌های املایی می‌شود.

گام دوم: پیدا کردن صفحات مطابق با جست‌وجو

در این گام، تصمیم‌گیری درباره این است که کدام‌یک از صفحات، بهترین پاسخ برای جست‌وجوی انجام‌شده می‌باشد. پیدا کردن صفحات مرتبط برای موتورهای جست‌وجو و صاحبان وب‌سایت گام بسیار مهمی است.

در این گام، وظیفه موتورهای جست‌وجو این است که بهترین نتایج را در سریع‌ترین زمان ارائه دهند تا رضایت کاربران خود را جلب کنند. صاحبان وب‌سایت هم می‌خواهند که سایتشان نتایج خوبی داشته باشد و ترافیک بیشتری دریافت کنند. برای تحقق این هدف، فاکتورهای مؤثر زیر باید در نظر گرفته شوند:

  • نوع محتوا: اگر کاربران در جست‌وجوی عکس هستند، نتایج شامل عکس باشد، نه متن.
  • کیفیت محتوا: محتوا باید مفید و کامل باشد.
  • ارتباط عنوان و کیفیت محتوا: عنوان و محتوا باید به کوئری کاربران یا جست‌وجویی که انجام داده‌اند، نزدیک باشد.
  • کیفیت وب‌سایت: کیفیت وب‌سایت باید طبق استانداردهای موتور جست‌وجو باشد.
  • زبان صفحه: زبان صفحه باید به زبان کاربران مخصوص خود نوشته شود.
  • سرعت صفحه: صفحاتی که با سرعت بیشتری بارگذاری می‌شوند، شانس بیشتری در مقابل صفحاتی که به‌کندی بارگذاری می‌شوند، دارند.
  • تاریخ انتشار: تاریخ انتشار محتوا در رتبه‌بندی سایت تأثیر دارد. برای اخبار و کوئری‌های مختلف به‌روز بودن محتوا از اهمیت بالایی برخوردار است.
  • محبوبیت صفحه: صفحاتی که بک‌لینک‌های مختلفی از دیگر وب‌سایت‌ها دارد، نسبت به صفحات دیگر که هیچ لینکی ندارند یا لینک کمتری دارند، محبوب‌تر هستند.
  • موقعیت جغرافیایی: نتایجی در اولویت هستند که با موقعیت جغرافیایی کاربران مطابقت بیشتری داشته باشند.
پیدا کردن صفحات مطابق

پیدا کردن صفحات مطابق

گام سوم: اعمال عوامل محلی

عوامل محلی هم در نمایش نتایج نقش دارند؛ به‌طور مثال، ممکن است نتیجه جست‌وجوی عبارت «بهترین سوپرمارکت» برای افراد مختلف، متفاوت باشد. گوگل نتایج را بر اساس محل سکونت و تاریخچه جست‌وجو به کاربر نمایش می‌دهد.

 موتورهای جست‌وجو چگونه کار می‌کنند؟

برای دسته‌بندی تعداد زیادی وب‌سایت که در فضای اینترنت وجود دارد، موتور جست‌وجو باید از اطلاعاتی که در دسترس است، آگاه باشد تا در مرحله بعد اطلاعات را به کاربران ارائه دهد.

این مراحل از طریق سه گام کراول کردن، ایندکس کردن و رتبه‌بندی انجام می‌شود. با استفاده از این مراحل موتورهای جست‌وجو محتواهایی را که به‌تازگی منتشر شده‌اند، کشف می‌کنند و آن‌ها را در پایگاه داده ذخیره می‌کنند تا برای استفاده کاربران طبقه‌بندی شوند.

کرال کردن

موتورهای جست‌وجو ربات‌هایی دارند که به عنکبوت و خزنده معروف هستند. این ربات‌ها را برای ارزیابی محتواهایی که اخیراً ایجاد شده یا تغییر کرده‌اند، ارسال می‌کنند.

این ربات‌ها وظیفه دارند با دقت صفحات وب را بررسی نمایند تا متوجه شوند که هرکدام از آن‌ها در چه زمینه‌ای تشکیل شده و دارای چه موضوعی هستند. با دنبال کردن لینک‌هایی که در صفحات وجود دارند، به صفحات دیگر رفته و آن‌ها را کراول می‌کنند.

کرال کردن

کرال کردن

ایندکس کردن

پس از کراول کردن وب‌سایت، موتورهای جست‌وجو تصمیم می‌گیرند که اطلاعات را چگونه طبقه‌بندی کنند. در واقع، ایندکس به ذخیره‌سازی صفحات کراول‌شده در دیتابیس‌های موتور جست‌وجو گفته می‌شود. لازم به ذکر است که هر موتور جست‌وجو دیتابیس مخصوص خود را دارد.

به عبارتی، ایندکس کردن از طرفی شناسایی عبارات و کلماتی است که صفحه را به‌خوبی توصیف می‌کند و از طرف دیگر، انتصاب کلمات کلیدی به صفحه می‌باشد.

رتبه‌بندی

اصلی‌ترین وظیفه موتورهای جست‌وجو ارائه بهترین نتایج به کاربران می‌باشد. موتورهای جست‌وجو برای اینکه بتوانند هنگام جست‌وجوی یک عبارت، بهترین نتایج را به کاربر نشان دهند، قوانینی برای وب‌سایت‌ها تعریف کرده‌اند که محتوای صفحات را به‌خوبی درک کنند و به‌سادگی به آن‌ها دسترسی داشته باشند.

هنگامی که کاربر جست‌وجویی انجام می‌دهد، موتور جست‌وجو به دیتابیس‌های خود می‌رود تا اطلاعات مرتبط را که قبلاً ایندکس کرده، ارائه دهد. این اطلاعات به‌صورت یک سیستم رتبه‌دهی برای کاربر فهرست می‌شود و ترتیب آن‌ها تصادفی نمی‌باشد. موتورهای جست‌وجو رتبه‌بندی را با در نظر داشتن فاکتورهای متفاوت و بر اساس کیفیت با توجه به کوئری کاربر انجام می‌دهند. در نتایج جست‌وجو، موتورهای جست‌وجو وب‌سایت‌هایی را در رتبه بالاتر قرار می‌دهند که دارای بیشترین ارتباط معنایی با عبارت جست‌وجوشده کاربران هستند.

مشکلات موجود در ایندکس کردن و خزیدن

ایندکس و خزش هم مشکلات خاص خود را دارند؛ مانند:

وجود فرم‌های آنلاین

موتورهای جست‌وجو در تکمیل فرم‌های آنلاین عملکرد خوبی ندارند. اگر در پشت صفحات محتوایی باشد، از دید موتورهای جست‌وجو پنهان می‌ماند.

وجود صفحات تکراری

وب‌سایت‌هایی که از سیستم مدیریت محتوا استفاده می‌کنند، بیشتر نسخه‌های تکراری از صفحات یکسان ایجاد می‌کنند. به همین دلیل، برای موتورهای جست‌وجوگر که به دنبال محتوای جدید هستند، مشکل ایجاد می‌شود.

صفحات تکراری

صفحات تکراری

مسدود کردن موتورهای جست‌وجو

خطاهایی که در کدهای راهنما وجود دارد، می‌تواند به مسدود کردن کلی موتورهای جست‌وجو منجر شود.

وجود محتوای غیرمتنی

موتورهای جست‌وجو در درک محتوای غیرمتنی که شامل فایل‌های فلش، تصاویر، فایل‌های ویدئویی و صوتی می‌باشند، مهارت دارند؛ اما هنوز هم تشخیص و درک این نوع محتوا برای موتورهای جست‌وجو دشوار می‌باشد.

انواع موتور جست‌وجو

هنگامی که اسم موتور جست‌وجو به میان می‌آید، اولین اسمی که به ذهن افراد خطور می‌کند، گوگل است. امروزه، تعداد موتورهای جست‌وجو بیشتر شده است که هرکدام از آن‌ها کارایی خاص خود را دارند. موتورهای جست‌وجو را می‌توان به دو نوع دایرکتوری‌ها و خزنده‌ها در سایت و پایگاه داده تقسیم کرد.

دایرکتوری‌ها

یکی از انواع موتور جست‌وجو که اطلاعاتی مانند فعالیت‌ها، کسب‌وکارها و … را برحسب دسته‌بندی خاصشان ذخیره و نگه‌داری می‌کند، یاهو است.

مالک کسب‌وکار لینک سایت و اطلاعات فعالیت‌های خود را بر اساس نوع کار در یکی از فهرست‌های دایرکتوری ثبت می‌کند. سپس کلمات کلیدی تعیین می‌شود و پس از ثبت اطلاعات، بر اساس مدیریت دایرکتوری بررسی و تأیید می‌گردد.

دایرکتوری ها

دایرکتوری ها

موتور جست‌وجو بر اساس خزش

یکی از دسته‌های کلی انواع موتور جست‌وجو می‌باشد که برای خزش در سایت، دارای عنکبوت است و در تمامی سایت‌ها به‌خصوص، سایت‌های جدید خزش می‌کند. این موتور جست‌وجو بر اساس کلمه کلیدی و دیگر معیارها شاخص‌گذاری می‌کند و اگر مشکلی نداشته باشد، آن را در پایگاه داده خود برای نمایش به کاربران ذخیره می‌کند.

معرفی موتورهای جست‌وجوی برتر

بهتر است با انواع موتورهای جست‌وجوی معروف آشنا شوید.

گوگل

گوگل اولین و پراستفاده‌ترین موتور جست‌وجو می‌باشد. گوگل از الگوریتم‌های متفاوتی استفاده می‌کند تا کاربران در زمان کوتاه به نتایج خود دست یابند. بیش از 72 درصد از کاربران اینترنت برای جست‌وجوی اطلاعات خود از گوگل استفاده می‌کنند.

گوگل معنی کلمه‌های کلیدی و ارتباط بین کلمات مختلف را بررسی می‌کند تا از درستی موضوع اطلاع یابد. همچنین، میزان رضایت کاربرانی را که قبلاً از سایت استفاده کرده‌اند، بررسی می‌کند.

گوگل به به‌روزرسانی مطالب توجه زیادی دارد. داده‌های بی‌شماری را بررسی می‌کند تا به ترتیب اولویت، نتایج بهتر را به کاربران نمایش دهد.

یاهو

یاهو یکی از قدیمی‌ترین موتورهای جست‌وجو می‌باشد. همچنین، یاهو دایرکتوری معروفی است که امروز بینگ آن را مدیریت می‌کند. سرویس ایمیل یاهو یکی از پراستفاده‌ترین سرویس‌های ارسال نامه می‌باشد.

جست‌وجوی پیشرفته، خرید آنلاین از یاهو، نمایش آب‌وهوای جهانی و … از ویژگی‌های این موتور جست‌وجو می‌باشد که طرفداران زیادی را جذب خود کرده است.

ASK

امروزه، اسک 3 درصد جست‌وجوی کل را به خود اختصاص داده است. نحوه کار این سایت بر اساس پرسش و پاسخ می‌باشد؛ به این صورت که کاربران سؤال می‌پرسند و موتور جست‌وجو جواب می‌دهد.

در سال 2007، موتور جست‌وجوی اسک مجدداً طراحی شد و تغییراتی در آن به وجود آمد. کاربران این موتور جست‌وجو علاوه بر جست‌وجوی کلمات کلیدی می‌توانند از جست‌وجو در قالب ریاضیات، فرهنگ لغت و … هم بهره‌مند شوند.

ASK

ASK

AOL

موتور جست‌وجوی AOL به دنبال ادغام شدن با یاهو می‌باشد. AOL علاوه بر جست‌وجوی سایت‌های موردنیاز، خدماتی مانند پلتفرم‌های مختلف، ایمیل و تبلیغات را به کاربران ارائه می‌دهد. همچنین، با استفاده از آن می‌توان تصاویر، صفحات وب، ویدئو و نقشه را جست‌وجو کرد.

WOW

این موتور جست‌وجو بیشتر بر اخبار جهان تمرکز دارد و به کاربران کمک می‌کند که جدیدترین اخبار را در حوزه‌های مختلف بخوانند.

WolframAlpha

این موتور جست‌وجو را بیشتر با نام موتور اطلاعات پردازشی می‌شناسند. سازندگان آن که فیزیکدان‌ها و ریاضیدان‌ها می‌باشند، مدعی هستند که به پنجاه‌هزار مدل الگوریتم و ریاضی دسترسی دارند.

DuckDuckGo

این نوع موتور جست‌وجو مزیت‌های بی‌شماری نسبت به موتورهای جست‌وجوی دیگر دارد. یکی از مزیت‌های این سایت پشتیبانی نکردن از آگهی‌های تبلیغاتی است. اگر این سایت در بین کاربران معروف شود، می‌تواند رقابت تنگاتنگی با گوگل داشته باشد.

Baidu

این سایت محبوب‌ترین موتور جست‌وجو در چین می‌باشد. با توجه به جمعیت بالای چین، میلیاردها کوئری در آن جست‌وجو می‌شود.

Baidu

Baidu

Yandex.ru

یکی دیگر از موتورهای جست‌وجوی محبوب جهان یاندکس می‌باشد. استفاده از این موتور جست‌وجو در مقایسه با موتورهای دیگر راحت‌تر است. یاندکس ابزارهای جالبی در اختیار کاربران قرار می‌دهد.

ویژگی‌های موتور جست‌وجو

همه موتورهای جست‌وجو دارای دو دسته ویژگی می‌باشند. یک دسته در همه آن‌ها یکسان و دسته دیگر متغیر است.

دسته اول که در همه یکسان است، رضایت کاربر . در نهایت، همه موتورهای جست‌وجو به‌دنبال رضایت کاربر هستند تا در دفعات بعدی هم کاربر به سراغ همین موتور جست‌وجوی مطلوب برود.

هنگامی که کاربر وب‌سایتی می‌سازد یا سایتی خریداری می‌کند، در واقع، می‌خواهد به کاربران و مشتریان خود خدمات، اخبار یا محصولات ارائه دهد. هنگامی که موتورهای جست‌وجو از این موضوع اطلاع یابند، آن‌ها را به نتایج درست‌تر و دقیق‌تر می‌رساند.

موتورهای جست‌وجو با توجه به تجزیه‌وتحلیل داده‌های جمع‌آوری‌شده تصمیم می‌گیرند که کدام‌یک از صفحات برای کدام کلمه کلیدی مناسب است تا رتبه برتری به آن بدهند.

یادگیری نحوه عملکرد موتور جست‌وجو

عملکرد موتور جست‌وجو چند بخش دارد:

برنامه‌ریزی

اولین نکته‌ای که باید برای یادگیری نحوه عملکرد موتور جست‌وجو بدانید، مفهوم برنامه‌ریزی است. در واقع، برنامه‌ریز اهمیت نسبی URLهای شناخته‌شده را ارزیابی می‌کند و پس از آن تصمیم‌گیری می‌کند که چه موقع URLهای جدید را کراول کند و چند مرتبه دیگر URLهای شناخته‌شده را مجدداً کراول کند.

خزیدن

دومین نکته برای رسیدن به جواب سؤال موتور جست‌وجو این است که بدانید کرال کردن به چه معنا می‌باشد.

برنامه رایانه‌ای که صفحات وب را بارگیری می‌کند، خزنده نام دارد. موتورهای جست‌وجو با کراول کردن صفحات شناخته‌شده که با گذشت زمان پیوندهای جدیدی به آن‌ها اضافه می‌شود، محتوای جدید را کشف می‌کنند.

به‌طور مثال، هر دفعه که پست وبلاگ جدیدی منتشر می‌کنید، مطلب به بالای صفحه اصلی وبلاگ، یعنی جایی که پیوند وجود دارد، منتقل می‌شود.

هنگامی که موتور جست‌وجو، مانند گوگل دو بار صفحه را کرال می‌کند، محتوای صفحه را با پیوندهایی که اخیراً اضافه شده است، بارگیری می‌کند. پس از آن، خزنده صفحه وب بارگیری‌شده را به تجزیه‌کننده منتقل می‌کند.

خزیدن

خزیدن

تجزیه کردن

سومین مورد برای درک نحوه کار موتور جست‌وجو تجزیه کردن است. تجزیه‌کننده پیوندها را به همراه سایر اطلاعات اصلی از صفحه مدنظر استخراج می‌کنند. پس از آن، URLهای استخراج‌شده را به برنامه‌ریزی ارسال و داده‌ها را برای نمایه‌سازی استخراج می‌کنند.

فهرست‌بندی

ایندکس کردن یعنی محلی که اطلاعات تجزیه‌شده، از صفحات خزیده‌شده به پایگاه داده فهرست جست‌وجو اضافه می‌شود. فهرست‌بندی را به‌عنوان یک کتابخانه دیجیتالی که از اطلاعات مربوط به میلیاردها صفحه وب پر شده است، در نظر می‌گیرند.

موتور جست‌وجوی ایرانی

در چند سال اخیر، توجه به موتور جست‌وجوی ایرانی با بحث راه‌اندازی اینترنت ملی افزایش یافت. بسیاری از ایرانی‌ها در رابطه با راه‌اندازی اینترنت ملی ایران نگرانی‌های زیادی دارند.

در حال حاضر، چند موتور جست‌وجوی ایرانی به دست متخصصین داخلی طراحی شده است. برخی از این موتورهای جست‌وجو در مرحله آزمایش می‌باشند.

موتور پارسی‌جو می‌تواند با جست‌وجوی عبارات کلیدی نتایج موردنظر را به کاربران ارائه دهد و اگر نقایصی نسبت به موتورهای جست‌وجوی شناخته‌شده در جهان دارد، در حال به‌روزرسانی می‌باشد.

نمونه‌هایی از موتورهای جست‌وجوی ایرانی پارسی‌جو، ایرانی سلام، موتور جست‌وجوی یوز، موتور جست‌وجوی جس‌جو، موتور جست‌وجوی گردو و موتور جست‌وجوی پارسیک هستند که در ادامه به توضیح هرکدام خواهیم پرداخت.

موتور جست‌وجوی پارسی‌جو

پارسی‌جو در حال حاضر کامل‌ترین موتور جست‌وجوی ایرانی می‌باشد. پارسی‌جو امکان جست‌وجوی تصویر، ویدئو، اخبار، اخبار استخدامی و وضعیت آب‌وهوا را به کاربران می‌دهد.

یکی از مشکلات موتور جست‌وجوی پارسی‌جو عدم به‌روزرسانی به‌موقع نتایج می‌باشد. مدت‌زمان زیادی نیاز است که یک سایت را بررسی کند و در تشخیص عبارت‌ها با سرعت کم عمل می‌کند.

موتورجستجوی پارسی جو

موتورجستجوی پارسی جو

موتور جست‌وجوگر ایرانی سلام

وب‌سایت سلام به‌عنوان یک ابرجست‌وجوگر معرفی شده است. این موتور جست‌وجو با به‌کارگیری الگوریتم‌های هوش مصنوعی، قابلیت جست‌وجو در هر زمینه‌ای را به کاربر می‌دهد. اکنون نسخه آزمایشی سلام در دسترس می‌باشد و متخصصان در حال به‌روزرسانی آن هستند و سعی در ارتقای آن دارند.

موتور جست‌وجوی یوز

یوز بر فهرست‌بندی منابع فارسی در وب تمرکز دارد. به گفته طراحان، تاکنون حدود یک میلیارد صفحه وب در دیتابیس آن ذخیره شده است.

موتور جست‌وجوگر جس‌جو

موتور جست‌وجوی جس‌جو دارای قابلیت‌های مختلفی مانند جست‌وجوی فیلم، لینک، صوت و صفحات وب می‌باشد. همچنین، بخش‌هایی مانند جست‌وجو در آیات قرآن کریم، نهج‌البلاغه، فال و راهنمای کشورها را در خود جای داده است.

موتور جست‌وجوگر گردو

یکی از محبوب‌ترین موتورهای جست‌وجوگر ایرانی که می‌تواند جایگزینی برای گوگل باشد، موتور جست‌وجوگر گردو است. این نوع از موتور جست‌وجو مانند گوگل پیش‌نمایشی از سایت را نشان می‌دهد تا اینکه تصمیم بگیرد بهترین لینک را باز کند.

موتور جست‌وجوی پارسیک

در سال 1381 موتور جست‌وجوگر پارسیک راه‌اندازی شد و در سال 1382 جایزه ذره‌بین طلایی را دریافت کرد. این جست‌وجوگر فقط امکان جست‌وجو در وب را به کاربران می‌دهد و تصاویر و فیلم‌ها را سرچ نمی‌کند.

موتور جستجوی پارسیک

موتور جستجوی پارسیک

چگونه موتورهای جست‌وجو محتوا را ارزیابی می‌کنند؟

عنکبوت‌ها برای ارزیابی محتوای صفحات تمام چیزها را موردبررسی قرار می‌دهند. عنکبوت‌ها بر اساس کلمات به‌کارگرفته‌شده در متن صفحه، عنوان و زیرعنوان به دنبال الگوهای مشخص هستند.

به‌طور مثال، اگر کلمه «شیر» در محتوای صفحه چندین مرتبه تکرار شده است، محتوا احتمالاً در رابطه با سلطان جنگل می‌باشد. اگر علاوه بر این، از استحکام استخوان و کلسیم در محتوا صحبت شده باشد، محتوا در مورد شیر پاستوریزه می‌باشد.

اگر قرار باشد کاربر صفحه «شیر پاستوریزه» را پیدا کند، بسنده کردن به این موضوع کافی نمی‌باشد. اینکه موتورهای جست‌وجو موضوع صفحه را متوجه می‌شوند، بخشی از فرایند لازم می‌باشد.

موتورهای جست‌وجو باید در بین تمام صفحات مربوط به شیر پاستوریزه، تعیین کنند که کدام‌یک با کوئری کاربر بیشتر در ارتباط است و کدام‌یک را باید اول ارائه دهد.

نتایج جست‌وجو به‌واسطه اعتبار صفحات فهرست‌بندی می‌شوند. فاکتورهای رتبه‌بندی بسیار پیچیده و مدام در حال تغییر می‌باشند. آنچه ثابت می‌باشد، این است که همهٔ آن‌ها رضایت کاربر را هدف اصلی قرار می‌دهند.

اگر فردی به دنبال اطلاعاتی درباره «شیر پاستوریزه» باشد، آن فرد کامل‌ترین توضیحات و بالاترین کیفیت را از محتوا می‌خواهد. پس هرچقدر محتوا برای کاربر کاربردی‌تر باشد، نشان‌دهنده این است که فاکتورهای بیشتری رعایت شده است.

رایج‌ترین روش برای کاربران در مسیر جست‌وجوی گوگل چیست؟

در ابتدا کاربر برای دریافت اطلاعات، پاسخ به سؤالات و … به گوگل مراجعه می‌کند. عبارت موردنظر را سرچ کرده و اولین نتیجه یا پاسخ را که توسط گوگل ارائه می‌شود، مشاهده می‌کند. از لیست یک یا چند گزینه را انتخاب و صفحاتی را باز می‌کند. سپس، محتوای آن‌ها را بررسی می‌کند و به دنبال پاسخ خود می‌گردد.

اگر کاربر پاسخی دریافت نکرد، به گوگل بازگشته و نتایج بعدی را بررسی یا عبارت دیگری را جست‌وجو می‌کند. تا زمانی که کاربر به پاسخ موردنظر خود برسد، این فرایند به‌صورت چرخه‌ای اتفاق می‌افتد.

رایج ترین روش برای کاربران در مسیر جستجوی گوگل

رایج ترین روش برای کاربران در مسیر جستجوی گوگل

حافظه پنهان موتور جست‌وجو

حافظه پنهان موتور جست‌وجو، یک حافظه پنهان از صفحه وب می‌باشد که صفحه را مانند زمانی که توسط یک خزنده وب نمایه‌سازی شده، نشان می‌دهد.

هنگامی که دسترسی به نسخه اصلی امکان‌پذیر نباشد، یا تغییر کرده باشد، می‌توان از نسخه ذخیره‌شده صفحات وب برای مشاهده محتواهای یک صفحه استفاده کرد.

حافظه پنهان موتور جست‌وجو برای مراحل قانونی، روزنامه‌نگاری و تحقیقات مربوط به جرم مورداستفاده قرار می‌گیرد.

بهینه‌سازی موتورهای جست‌وجو

سئو به معنی بهینه‌سازی برای موتورهای جست‌وجو است. همچنین، به مجموعه اقدامات برنامه‌ریزی‌شده‌ای گفته می‌شود که رنکینگ سایت را در رتبه‌بندی موتورهای جست‌وجو بهتر می‌کند.

متخصصان سئوکار سئوی سایت را انجام می‌دهند. بیشترین تکنیک‌هایی که در سئو استفاده می‌شود، به محتوا مربوط است.

به‌طور کلی، سئو فرایندی است که باعث می‌شود وب‌سایت، رتبه بسیار خوبی در موتورهای جست‌وجو به دست بیاورد؛ زیرا زیرمجموعه‌ای از بازاریابی اینترنتی می‌باشد.

بازاریابی سئو یعنی اطلاع داشتن از نحوه کار الگوریتم‌های جست‌وجو و شناسایی اینکه کاربران اینترنت چه چیزی را جست‌وجو می‌کنند.

انواع سئو

چهار نوع از سئو که در بهینه‌سازی موتورهای جست‌وجو وجود دارد و به کاربر کمک می‌کند که نتایج را بهتر مشاهده کند، در زیر توضیح داده خواهد شد.

سئوی کلاه سفید

سئو کلاه سفید به دستورالعمل‌های موتور جست‌وجو پایبند است. این نوع سئو از تغییرات الگوریتم‌های آینده تأثیر منفی نمی‌گیرد؛ زیرا بر اساس قوانین عمل می‌کند. به دلیل اینکه از مسیرهای میانجی اجتناب می‌شود، به دست آوردن نتایج زمان بیشتری نیاز دارد. این نوع از سئو ریسک کمتری دارد و در طول زمان ارزش و ماندگاری بیشتری دارد.

سئو کلاه سفید

سئو کلاه سفید

تکنیک‌های سئوی کلاه سفید

  • نوشتن مطالب مفید و مرتبط برای کاربر؛
  • تبلیغ و ترفیع محتوا در شبکه‌های اجتماعی؛
  • تحقیق کلمات کلیدی؛
  • استراتژی سئو؛
  • بک‌لینک طبیعی؛
  • سئوی تکنیکال، سئوی داخلی و سئوی خارجی.

سئوی کلاه‌سیاه

سئوی کلاه‌سیاه برخلاف راهنمایی‌های موتور جست‌وجو عمل می‌کند و این ریسک را به همراه دارد که محتوا یا وب‌سایت کاربر از نتایج جست‌وجو حذف شود.

این نوع از سئو کاربر را سریع‌تر به محل موردنظر می‌رساند؛ زیرا برخلاف قوانین گوگل می‌باشد. بسیاری از تکنیک‌های سئوی کلاه‌سیاه در دستورالعمل، به‌عنوان کارهایی بیان شده‌اند که کاربر نباید انجام دهد.

سئوی کلاه‌سیاه علاوه بر اینکه به‌سرعت ارزش‌آفرینی می‌کند، خطرات زیادی هم دارد؛ زیرا این ارزش نمی‌تواند پایدار باشد.

تکنیک‌های سئوی کلاه‌سیاه

  • پر یا پنهان کردن صفحه با کلمات کلیدی؛
  • پنهان کردن متن؛
  • خرید بک‌لینک؛
  • محتوای کپی‌شده؛
  • سرقت ادبی.

سئوی کلاه خاکستری

سئو کلاه خاکستری بین تکنیک‌های سئوی سفید و سیاه قرار دارد؛ زیرا تکنیک‌های آن معمولاً در دستورالعمل‌های سئو نیست.

سئو کلاه خاکستری

سئو کلاه خاکستری

تکنیک‌های سئوی کلاه خاکستری

  • تکنیک یا طعمه کلیک؛
  • تبادل لینک؛
  • محتوایی که تا حدودی تغییر داده شده؛
  • پرداخت پول برای کامنت گرفتن؛
  • تبلیغات بی‌ارزش و پولی برای کاربر.

سئوی منفی

سئوی منفی اجرای روش‌های سئوی خاکستری یا سئوی کلاه‌سیاه در وب‌سایت شخصی دیگر با هدف آسیب رساندن می‌باشد. رقبای کاربر آسیب می‌بینند و موجب می‌شود تا خود کاربر در نتایج جست‌وجو بالا بیاید.

تکنیک‌های سئوی منفی

  • ارسال نظرات منفی؛
  • سرقت مطالب؛
  • ایجاد لینک‌های غیرطبیعی؛
  • هک کردن سایت؛
  • تغییر محتوای سایت.

سئوی خارجی

در سئوهای خارجی موارد متفاوتی بررسی می‌شود. مهم‌ترین آن‌ها لینک‌سازی است که می‌توان در جاهای مختلف انجام داد. برخی از بهترین محل‌ها برای لینک‌سازی شبکه‌های اجتماعی، انجمن‌ها و فروم، استفاده از بوک‌مارک کردن، ثبت‌نام در دایرکتوری‌ها و … می‌باشد.

سئو خارجی

سئو خارجی

نحوه عملکرد سئو

عملکرد سئو به این طریق است که هر موتور جست‌وجویی که استفاده می‌کنید، دارای یک ربات خزنده است که اطلاعاتی را که از اینترنت جست‌وجو کرده‌اید، جمع‌آوری می‌کند.

این ربات تمام صفر و یک‌ها را به موتور جست‌وجو انتقال می‌دهد تا یک ایندکس ایجاد کند. ایندکس از طریق الگوریتم تشکیل می‌شود که تمام داده‌ها را با عبارت جست‌وجوشده، مطابقت می‌دهد.

عوامل متعددی وجود دارد که یک الگوریتم موتور جست‌وجو را لحاظ کند که کارشناسان آن‌ها را بر اساس اهمیتشان رتبه‌بندی کرده‌اند.

  • ویژگی‌های آتوریتی لینک در دامنه: پیج آتوریتی، تعداد بک‌لینک‌های وب‌سایت، کیفیت لینک‌ها
  • کیفیت لینک در سطح صفحه: کیفیت منابع لینک، توزیع انکر تکست
  • ویژگی محتوا در سطح صفحه وب‌سایت: کیفیت محتوا و تناسب آن با هدف وب‌سایت و نیاز کاربر
  • ویژگی کلمات کلیدی در صفحات وب‌سایت: خوانا بودن، سرعت بارگذاری، طول محتوا
  • ویژگی برند در سطح دامنه: رسانه‌ها، استفاده آفلاین از نام دامنه و برند، تعداد اشارات به برند
  • کارکرد و استفاده داده‌های ترافیک: نوارابزارها، سیگنال‌های دریافتی از مرورگرها
  • شاخص‌های اجتماعی: کیفیت و کمیت لینک‌های توئیت‌شده، اشتراک‌گذاری در فیس‌بوک، گوگل و…
  • استفاده از کلمات کلیدی در دامنه
  • طول نام دامنه و زمان پاسخ‌دهی پروتکل دامنه

اهداف سئو

  • برندسازی؛
  • تأثیرگذاری زیاد در بازدید وب‌سایت؛
  • بالا بردن ترافیک وب‌سایت؛
  • بالا بردن سطح فروش؛
  • بهترین ابزار تبلیغات و بازاریابی.

معماری کلی موتورهای جست‌وجو

موتورهای جست‌وجو متعدد هستند و استراتژی‌های آن‌ها با یکدیگر متفاوت است. برخی از موتورهای جست‌وجو به‌دلیل امنیت تجاری تلاش می‌کنند که الگوریتم‌های درونی خود را پنهان کنند.

معماری کلی موتورهای جستجو

معماری کلی موتورهای جستجو

اجزای معماری موتور جست‌وجو

ابتدا به معرفی اجزای معماری موتور جست‌وجو می‌پردازیم.

درون‌کاو

تمام موتورهای جست‌وجو به درون‌کاو متکی هستند که وب را به‌طور زمان‌بندی‌شده پیمایش می‌کنند و صفحات بی‌شمار ذخیره‌شده را جمع‌آوری کنند. درون‌کاو از تعدادی برنامه کوچک تشکیل شده است که هرکدام از آن‌ها از صفحه شروع وب‌سایت آغاز به کار می‌کنند.

پس از دریافت صفحه شروع و تحویل آن به انبار صفحات، بر طبق لینک‌های درون صفحه جاری، صفحات پیوندخورده را نیز به همین طریق استخراج و ذخیره می‌کنند.

کنترل درون‌کاو

وظیفه این این است که برنامه‌های درون‌کاوی را با تحویل URL مدنظر راه‌اندازی کند. پس از دریافت صفحات جاری، کنترل درون‌کاو تعیین می‌کند کدام‌یک از صفحات باید دریافت شوند؛ زیرا یک صفحه به صفحات دیگر لینک داده می‌شود.

کنترل درون‌کاو باید لینک‌ها را به‌ترتیب ملاقات کند و در مقابل ماژول درون‌کاو باید تمام آدرس‌های URL موجود را از صفحات دریافتی استخراج کند و آن‌ها را برای تصمیم‌گیری در اختیار کنترل درون‌کاو بگذارد.

انبار صفحات

صفحاتی که به‌وسیله ماژول درون‌کاو از گستره جهانی وب استخراج می‌شوند، در انبار صفحات که یک بانک اطلاعاتی است، ذخیره می‌شوند تا برای تحلیل محتوا و شاخص‌دهی در اختیار ماژول‌ها قرار بگیرند.

تفاوت موتورهای جست‌وجو در کنترل درون‌کاو بیشتر به چشم می‌آید. در برخی از الگوریتم‌ها، استخراج صفحه و عملیات جست‌وجوی صفحات وب آن‌قدر ادامه می‌یابد تا هیچ صفحهٔ مشاهده‌نشده‌ای باقی نماند.

در این الگوریتم‌ها، مشاهده صفحات از یک وب‌سایت با آدرس خاص شروع می‌شود و تا مشاهده تمام آدرس‌هایی که در این صفحه وجود دارند، ادامه می‌یابد. در برخی دیگر از الگوریتم‌ها، این عملیات به وب‌سایت با آدرس خاص و وب‌سایت‌هایی با پسوند نام حوزه متفاوت ادامه داده نمی‌شود.

در نوع دیگری از الگوریتم‌ها، کنترل درون‌کاو به استخراج و مشاهده صفحات بین حوزه‌های سطح بالا محدود می‌شود. همچنین، هنگامی که فرایند استخراج صفحات در حال انجام است، مشاهده صفحات حوزه دیگر با وجود لینک‌هایی که در صفحات دات کام به آن‌ها داده شده است، در دستور کار قرار نمی‌گیرد.

ماژول شاخص‌دهی

ماژول شاخص‌دهی تمام صفحات موجود در انبار را مرور و کلمات را پس از استخراج به همراه URL در جدول درج می‌کند. نتیجه این ماژول، جدولی می‌باشد که مشخص می‌کند هرکدام از کلمات در کدام صفحه و کجای صفحه و با چه آدرسی ظاهر شده است.

یکی دیگر از خروجی‌های ماژول شاخص‌دهی شاخص ساختاری است. این شاخص چگونگی پیوند خوردن صفحات به یکدیگر را منعکس می‌کند. همچنین، گراف به‌دست‌آمده از این صفحات و لینک‌هایی که به یکدیگر داده شده‌اند، در شاخص ساختاری درج شده است. این گراف منعکس‌کننده مسیری است که ماژول درون‌کاو بر طبق آن، صفحات وب را استخراج و مشاهده نموده است.

ماجول شاخص دهی

ماجول شاخص دهی

کلام آخر

به‌طور کلی، تصور دنیای بدون موتور جست‌وجوگر غیرممکن می‌باشد. نحوه عملکرد موتورهای جست‌وجو سبب شده تا افراد در سریع‌ترین زمان ممکن، جواب سؤالات خود را پیدا کنند.

موتورهای جست‌وجو در سال‌های اخیر به یکی از منابع قابل‌اطمینان انسان‌ها تبدیل شده است. برای دیده شدن در فضای مجازی و افزایش فروش، آگاهی داشتن از نحوه عملکرد موتورهای جست‌وجو از اهمیت زیادی برخوردار است.

سازمان‌ها و شرکت‌هایی که بتوانند با نحوه عملکرد موتورهای جست‌وجو آشنا شوند و از آن نهایت استفاده را کنند، به جایگاه مناسبی در موتورهای جست‌وجو دست می‌یابند که علاوه بر فروش برند خود، اعتباربخشی به آن را افزایش می‌دهند.

در این مقاله به بررسی تاریخچه موتور جست‌وجو، چگونگی کارکرد آن، انواع موتور جست‌وجو، عملکرد موتور جست‌وجو، موتورهای جست‌وجوی ایرانی، حافظه پنهان موتور جست‌وجو و … پرداخته‌ایم. امیدواریم ارائه این مطالب برای شما مفید واقع شده باشد.

 

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *