در فرهنگ رایانه، جویشگر یا همان موتور جستوجوگر به برنامهای میگویند که کلمات کلیدی را در یک سند یا بانک اطلاعاتی جستوجو میکند.
در اینترنت، موتور جستوجو به برنامهای گفته میشود که کلمات کلیدی موجود در سندهای وب جهانی، فایلها، گروههای خبری و … را جستوجو میکند.
تاریخچه موتور جستوجوگر
اولین موتور جستوجوگر با نام آرچی (Archie) به وجود آمد که فقط توانایی نمایش عناوین و فهرست کردن را داشت. به همین دلیل، کاربر باید فایل را با نام دقیق سرچ میکرد تا نتیجه به دست میآمد.
به دنبال موتور جستوجوگر آرچی، دو موتور جستوجوگر دیگر با نامهای جاگ هد (Jughead) و ورونیکا (Veronica) به وجود آمدند که قابلیت ایندکس کردن متن را داشتند.
در سال ۱۹۹۳، رباتی با هدف ارزیابی پیشرفت وب ایجاد شد که قابلیت جمعآوری و نگهداری لینکهای فعال را در یک دیتابیس واحد داشت. این ربات دسترسی به وبسایتها را مشکل میکرد. برای رفع این مشکل، موتوری با نام آلیوب (ALIWEB) به وجود آمد. در این جستوجوگر، مالکان وبسایت میتوانستند ایندکس را بهصورت دستی وارد کنند.
در سال ۱۹۹۴، موتور جستوجوگر وب کراولر (Web Crawler) که قابلیت ایندکس تمام متنهای موجود را در صفحات داشت، عرضه شد. از آن پس، موتورهای جستوجوگر مختلفی به عرصه وب معرفی شدند.
در نهایت، در سال ۱۹۹۸، موتور جستوجوگری با نام گوگل معرفی شد که تا به امروز به محبوبترین و پراستفادهترین جستوجوگر تبدیل شده است.
موتور جستوجو چیست؟
هر برنامه کامپیوتری را که برای یافتن اطلاعات در هر پلتفرمی مورداستفاده قرار گیرد، موتور جستوجو میگویند. در حقیقت، موتورهای جستوجو ماشینهای پاسخدهی هستند.
وظیفه اصلی موتور جستوجو پیدا کردن محتوا از جمله محتوای متنی، صوتی، ویدئویی، تصویری یا هر فایل دیگر موجود در شبکه جهانی وب است. به محتوایی که بیشترین مطابقت را با عبارت جستوجوشده کاربر داشته باشد، کوئری (Query) گفته میشود. موتور جستوجو از الگوریتم و پایگاه داده تشکیل شده است. الگوریتم موتور جستوجو، نحوه رتبهبندی و قواعد موتور جستوجو را مشخص میکند.
بهطور کلی، از الگوریتم موتور جستوجو برای مشخص کردن رتبهدهی و اهمیت صفحه وب استفاده میشود. هرکدام از موتورهای جستوجو الگوریتم منحصربهفرد خود را دارند که در بحث سئو و بهینهسازی سایت باید به آن توجه کرد.
هر موتور جستوجویی قواعد مخصوص خود را دارد. این قواعد مشخص میکنند که آیا صفحه وب واقعی است یا اسپم یا حاوی اطلاعاتی است که مردم به آن علاقه دارند. الگوریتم هر موتور جستوجو متفاوت است. اصولاً محرمانه هستند و در یک سری از موارد خاص الگوریتمهای موتور جستوجو مشترک میباشند.
الگوریتمها از دو بخش داخلی و خارجی تشکیل میشوند. سوشال سیگنالها و بکلینکها جزء فاکتورهای خارجی هستند که بیرون از صفحه وبسایت ملزم به رعایت آن هستید. چهارچوبی که در داخل صفحه باید رعایت شود، از فاکتورهای داخلی به حساب میآید؛ مانند لینکهای داخلی و چگالی کلمه کلیدی.
نحوه عملکرد الگوریتم
بهطور کلی، نحوه عملکرد الگوریتم بهترتیب شامل تجزیهوتحلیل کوئری کاربران، پیدا کردن صفحات مطابق با جستوجو و اعمال عوامل محلی میباشند.
گام اول: تجزیهوتحلیل کوئری کاربران
اولین گام برای موتورهای جستوجو فهمیدن اطلاعاتی است که کاربر جستوجو میکند. موتور جستوجو کوئری کاربر را به چند کلمه کلیدی تجزیه میکند.
کلمه کلیدی کلمهای است که هدف و معنی مشخصی دارد. بهطور مثال، هنگامی که کاربر عبارت «چگونه محتوایی کاربردی و ارزشمند تولید کنیم» را جستوجو میکند، موتور جستوجو از کلمه «چگونه» میفهمد که کاربر از آن راهنمایی میخواهد.
بنابراین، موتور جستوجو نتایجی را نشان میدهد که در آن دستورالعملهای مربوطه باشد؛ مثلاً هنگامی که کاربر عبارت «خرید کامپیوتر» را جستوجو میکند، موتور جستوجو متوجه خواهد شد که کاربر به دنبال خرید است و نتایجی را ارائه میدهد که شامل فروشگاههای کامپیوتر آنلاین باشند.
سیستم هوش مصنوعی که در الگوریتم موتورهای جستوجو وجود دارد، به آنها کمک میکند تا کلمات کلیدی را به یکدیگر ربط دهند. بهطور مثال، موتور جستوجو میداند که معنی جمله «چگونه موبایل خود را بهروزرسانی کنیم» با جمله «چگونه موبایل خود را آپدیت کنیم» یکسان است.
این سیستم بهقدری هوشمند است که فعلهای جمع و مفرد و مثبت و منفی را تشخیص میدهد و حتی متوجه غلطهای املایی میشود.
گام دوم: پیدا کردن صفحات مطابق با جستوجو
در این گام، تصمیمگیری درباره این است که کدامیک از صفحات، بهترین پاسخ برای جستوجوی انجامشده میباشد. پیدا کردن صفحات مرتبط برای موتورهای جستوجو و صاحبان وبسایت گام بسیار مهمی است.
در این گام، وظیفه موتورهای جستوجو این است که بهترین نتایج را در سریعترین زمان ارائه دهند تا رضایت کاربران خود را جلب کنند. صاحبان وبسایت هم میخواهند که سایتشان نتایج خوبی داشته باشد و ترافیک بیشتری دریافت کنند. برای تحقق این هدف، فاکتورهای مؤثر زیر باید در نظر گرفته شوند:
- نوع محتوا: اگر کاربران در جستوجوی عکس هستند، نتایج شامل عکس باشد، نه متن.
- کیفیت محتوا: محتوا باید مفید و کامل باشد.
- ارتباط عنوان و کیفیت محتوا: عنوان و محتوا باید به کوئری کاربران یا جستوجویی که انجام دادهاند، نزدیک باشد.
- کیفیت وبسایت: کیفیت وبسایت باید طبق استانداردهای موتور جستوجو باشد.
- زبان صفحه: زبان صفحه باید به زبان کاربران مخصوص خود نوشته شود.
- سرعت صفحه: صفحاتی که با سرعت بیشتری بارگذاری میشوند، شانس بیشتری در مقابل صفحاتی که بهکندی بارگذاری میشوند، دارند.
- تاریخ انتشار: تاریخ انتشار محتوا در رتبهبندی سایت تأثیر دارد. برای اخبار و کوئریهای مختلف بهروز بودن محتوا از اهمیت بالایی برخوردار است.
- محبوبیت صفحه: صفحاتی که بکلینکهای مختلفی از دیگر وبسایتها دارد، نسبت به صفحات دیگر که هیچ لینکی ندارند یا لینک کمتری دارند، محبوبتر هستند.
- موقعیت جغرافیایی: نتایجی در اولویت هستند که با موقعیت جغرافیایی کاربران مطابقت بیشتری داشته باشند.
گام سوم: اعمال عوامل محلی
عوامل محلی هم در نمایش نتایج نقش دارند؛ بهطور مثال، ممکن است نتیجه جستوجوی عبارت «بهترین سوپرمارکت» برای افراد مختلف، متفاوت باشد. گوگل نتایج را بر اساس محل سکونت و تاریخچه جستوجو به کاربر نمایش میدهد.
موتورهای جستوجو چگونه کار میکنند؟
برای دستهبندی تعداد زیادی وبسایت که در فضای اینترنت وجود دارد، موتور جستوجو باید از اطلاعاتی که در دسترس است، آگاه باشد تا در مرحله بعد اطلاعات را به کاربران ارائه دهد.
این مراحل از طریق سه گام کراول کردن، ایندکس کردن و رتبهبندی انجام میشود. با استفاده از این مراحل موتورهای جستوجو محتواهایی را که بهتازگی منتشر شدهاند، کشف میکنند و آنها را در پایگاه داده ذخیره میکنند تا برای استفاده کاربران طبقهبندی شوند.
کرال کردن
موتورهای جستوجو رباتهایی دارند که به عنکبوت و خزنده معروف هستند. این رباتها را برای ارزیابی محتواهایی که اخیراً ایجاد شده یا تغییر کردهاند، ارسال میکنند.
این رباتها وظیفه دارند با دقت صفحات وب را بررسی نمایند تا متوجه شوند که هرکدام از آنها در چه زمینهای تشکیل شده و دارای چه موضوعی هستند. با دنبال کردن لینکهایی که در صفحات وجود دارند، به صفحات دیگر رفته و آنها را کراول میکنند.
ایندکس کردن
پس از کراول کردن وبسایت، موتورهای جستوجو تصمیم میگیرند که اطلاعات را چگونه طبقهبندی کنند. در واقع، ایندکس به ذخیرهسازی صفحات کراولشده در دیتابیسهای موتور جستوجو گفته میشود. لازم به ذکر است که هر موتور جستوجو دیتابیس مخصوص خود را دارد.
به عبارتی، ایندکس کردن از طرفی شناسایی عبارات و کلماتی است که صفحه را بهخوبی توصیف میکند و از طرف دیگر، انتصاب کلمات کلیدی به صفحه میباشد.
رتبهبندی
اصلیترین وظیفه موتورهای جستوجو ارائه بهترین نتایج به کاربران میباشد. موتورهای جستوجو برای اینکه بتوانند هنگام جستوجوی یک عبارت، بهترین نتایج را به کاربر نشان دهند، قوانینی برای وبسایتها تعریف کردهاند که محتوای صفحات را بهخوبی درک کنند و بهسادگی به آنها دسترسی داشته باشند.
هنگامی که کاربر جستوجویی انجام میدهد، موتور جستوجو به دیتابیسهای خود میرود تا اطلاعات مرتبط را که قبلاً ایندکس کرده، ارائه دهد. این اطلاعات بهصورت یک سیستم رتبهدهی برای کاربر فهرست میشود و ترتیب آنها تصادفی نمیباشد. موتورهای جستوجو رتبهبندی را با در نظر داشتن فاکتورهای متفاوت و بر اساس کیفیت با توجه به کوئری کاربر انجام میدهند. در نتایج جستوجو، موتورهای جستوجو وبسایتهایی را در رتبه بالاتر قرار میدهند که دارای بیشترین ارتباط معنایی با عبارت جستوجوشده کاربران هستند.
مشکلات موجود در ایندکس کردن و خزیدن
ایندکس و خزش هم مشکلات خاص خود را دارند؛ مانند:
وجود فرمهای آنلاین
موتورهای جستوجو در تکمیل فرمهای آنلاین عملکرد خوبی ندارند. اگر در پشت صفحات محتوایی باشد، از دید موتورهای جستوجو پنهان میماند.
وجود صفحات تکراری
وبسایتهایی که از سیستم مدیریت محتوا استفاده میکنند، بیشتر نسخههای تکراری از صفحات یکسان ایجاد میکنند. به همین دلیل، برای موتورهای جستوجوگر که به دنبال محتوای جدید هستند، مشکل ایجاد میشود.
صفحات تکراری
مسدود کردن موتورهای جستوجو
خطاهایی که در کدهای راهنما وجود دارد، میتواند به مسدود کردن کلی موتورهای جستوجو منجر شود.
وجود محتوای غیرمتنی
موتورهای جستوجو در درک محتوای غیرمتنی که شامل فایلهای فلش، تصاویر، فایلهای ویدئویی و صوتی میباشند، مهارت دارند؛ اما هنوز هم تشخیص و درک این نوع محتوا برای موتورهای جستوجو دشوار میباشد.
انواع موتور جستوجو
هنگامی که اسم موتور جستوجو به میان میآید، اولین اسمی که به ذهن افراد خطور میکند، گوگل است. امروزه، تعداد موتورهای جستوجو بیشتر شده است که هرکدام از آنها کارایی خاص خود را دارند. موتورهای جستوجو را میتوان به دو نوع دایرکتوریها و خزندهها در سایت و پایگاه داده تقسیم کرد.
دایرکتوریها
یکی از انواع موتور جستوجو که اطلاعاتی مانند فعالیتها، کسبوکارها و … را برحسب دستهبندی خاصشان ذخیره و نگهداری میکند، یاهو است.
مالک کسبوکار لینک سایت و اطلاعات فعالیتهای خود را بر اساس نوع کار در یکی از فهرستهای دایرکتوری ثبت میکند. سپس کلمات کلیدی تعیین میشود و پس از ثبت اطلاعات، بر اساس مدیریت دایرکتوری بررسی و تأیید میگردد.
موتور جستوجو بر اساس خزش
یکی از دستههای کلی انواع موتور جستوجو میباشد که برای خزش در سایت، دارای عنکبوت است و در تمامی سایتها بهخصوص، سایتهای جدید خزش میکند. این موتور جستوجو بر اساس کلمه کلیدی و دیگر معیارها شاخصگذاری میکند و اگر مشکلی نداشته باشد، آن را در پایگاه داده خود برای نمایش به کاربران ذخیره میکند.
معرفی موتورهای جستوجوی برتر
بهتر است با انواع موتورهای جستوجوی معروف آشنا شوید.
گوگل
گوگل اولین و پراستفادهترین موتور جستوجو میباشد. گوگل از الگوریتمهای متفاوتی استفاده میکند تا کاربران در زمان کوتاه به نتایج خود دست یابند. بیش از ۷۲ درصد از کاربران اینترنت برای جستوجوی اطلاعات خود از گوگل استفاده میکنند.
گوگل معنی کلمههای کلیدی و ارتباط بین کلمات مختلف را بررسی میکند تا از درستی موضوع اطلاع یابد. همچنین، میزان رضایت کاربرانی را که قبلاً از سایت استفاده کردهاند، بررسی میکند.
گوگل به بهروزرسانی مطالب توجه زیادی دارد. دادههای بیشماری را بررسی میکند تا به ترتیب اولویت، نتایج بهتر را به کاربران نمایش دهد.
یاهو
یاهو یکی از قدیمیترین موتورهای جستوجو میباشد. همچنین، یاهو دایرکتوری معروفی است که امروز بینگ آن را مدیریت میکند. سرویس ایمیل یاهو یکی از پراستفادهترین سرویسهای ارسال نامه میباشد.
جستوجوی پیشرفته، خرید آنلاین از یاهو، نمایش آبوهوای جهانی و … از ویژگیهای این موتور جستوجو میباشد که طرفداران زیادی را جذب خود کرده است.
ASK
امروزه، اسک ۳ درصد جستوجوی کل را به خود اختصاص داده است. نحوه کار این سایت بر اساس پرسش و پاسخ میباشد؛ به این صورت که کاربران سؤال میپرسند و موتور جستوجو جواب میدهد.
در سال ۲۰۰۷، موتور جستوجوی اسک مجدداً طراحی شد و تغییراتی در آن به وجود آمد. کاربران این موتور جستوجو علاوه بر جستوجوی کلمات کلیدی میتوانند از جستوجو در قالب ریاضیات، فرهنگ لغت و … هم بهرهمند شوند.
AOL
موتور جستوجوی AOL به دنبال ادغام شدن با یاهو میباشد. AOL علاوه بر جستوجوی سایتهای موردنیاز، خدماتی مانند پلتفرمهای مختلف، ایمیل و تبلیغات را به کاربران ارائه میدهد. همچنین، با استفاده از آن میتوان تصاویر، صفحات وب، ویدئو و نقشه را جستوجو کرد.
WOW
این موتور جستوجو بیشتر بر اخبار جهان تمرکز دارد و به کاربران کمک میکند که جدیدترین اخبار را در حوزههای مختلف بخوانند.
WolframAlpha
این موتور جستوجو را بیشتر با نام موتور اطلاعات پردازشی میشناسند. سازندگان آن که فیزیکدانها و ریاضیدانها میباشند، مدعی هستند که به پنجاههزار مدل الگوریتم و ریاضی دسترسی دارند.
DuckDuckGo
این نوع موتور جستوجو مزیتهای بیشماری نسبت به موتورهای جستوجوی دیگر دارد. یکی از مزیتهای این سایت پشتیبانی نکردن از آگهیهای تبلیغاتی است. اگر این سایت در بین کاربران معروف شود، میتواند رقابت تنگاتنگی با گوگل داشته باشد.
Baidu
این سایت محبوبترین موتور جستوجو در چین میباشد. با توجه به جمعیت بالای چین، میلیاردها کوئری در آن جستوجو میشود.
Yandex.ru
یکی دیگر از موتورهای جستوجوی محبوب جهان یاندکس میباشد. استفاده از این موتور جستوجو در مقایسه با موتورهای دیگر راحتتر است. یاندکس ابزارهای جالبی در اختیار کاربران قرار میدهد.
ویژگیهای موتور جستوجو
همه موتورهای جستوجو دارای دو دسته ویژگی میباشند. یک دسته در همه آنها یکسان و دسته دیگر متغیر است.
دسته اول که در همه یکسان است، رضایت کاربر . در نهایت، همه موتورهای جستوجو بهدنبال رضایت کاربر هستند تا در دفعات بعدی هم کاربر به سراغ همین موتور جستوجوی مطلوب برود.
هنگامی که کاربر وبسایتی میسازد یا سایتی خریداری میکند، در واقع، میخواهد به کاربران و مشتریان خود خدمات، اخبار یا محصولات ارائه دهد. هنگامی که موتورهای جستوجو از این موضوع اطلاع یابند، آنها را به نتایج درستتر و دقیقتر میرساند.
موتورهای جستوجو با توجه به تجزیهوتحلیل دادههای جمعآوریشده تصمیم میگیرند که کدامیک از صفحات برای کدام کلمه کلیدی مناسب است تا رتبه برتری به آن بدهند.
یادگیری نحوه عملکرد موتور جستوجو
عملکرد موتور جستوجو چند بخش دارد:
برنامهریزی
اولین نکتهای که باید برای یادگیری نحوه عملکرد موتور جستوجو بدانید، مفهوم برنامهریزی است. در واقع، برنامهریز اهمیت نسبی URLهای شناختهشده را ارزیابی میکند و پس از آن تصمیمگیری میکند که چه موقع URLهای جدید را کراول کند و چند مرتبه دیگر URLهای شناختهشده را مجدداً کراول کند.
خزیدن
دومین نکته برای رسیدن به جواب سؤال موتور جستوجو این است که بدانید کرال کردن به چه معنا میباشد.
برنامه رایانهای که صفحات وب را بارگیری میکند، خزنده نام دارد. موتورهای جستوجو با کراول کردن صفحات شناختهشده که با گذشت زمان پیوندهای جدیدی به آنها اضافه میشود، محتوای جدید را کشف میکنند.
بهطور مثال، هر دفعه که پست وبلاگ جدیدی منتشر میکنید، مطلب به بالای صفحه اصلی وبلاگ، یعنی جایی که پیوند وجود دارد، منتقل میشود.
هنگامی که موتور جستوجو، مانند گوگل دو بار صفحه را کرال میکند، محتوای صفحه را با پیوندهایی که اخیراً اضافه شده است، بارگیری میکند. پس از آن، خزنده صفحه وب بارگیریشده را به تجزیهکننده منتقل میکند.
خزیدن
تجزیه کردن
سومین مورد برای درک نحوه کار موتور جستوجو تجزیه کردن است. تجزیهکننده پیوندها را به همراه سایر اطلاعات اصلی از صفحه مدنظر استخراج میکنند. پس از آن، URLهای استخراجشده را به برنامهریزی ارسال و دادهها را برای نمایهسازی استخراج میکنند.
فهرستبندی
ایندکس کردن یعنی محلی که اطلاعات تجزیهشده، از صفحات خزیدهشده به پایگاه داده فهرست جستوجو اضافه میشود. فهرستبندی را بهعنوان یک کتابخانه دیجیتالی که از اطلاعات مربوط به میلیاردها صفحه وب پر شده است، در نظر میگیرند.
موتور جستوجوی ایرانی
در چند سال اخیر، توجه به موتور جستوجوی ایرانی با بحث راهاندازی اینترنت ملی افزایش یافت. بسیاری از ایرانیها در رابطه با راهاندازی اینترنت ملی ایران نگرانیهای زیادی دارند.
در حال حاضر، چند موتور جستوجوی ایرانی به دست متخصصین داخلی طراحی شده است. برخی از این موتورهای جستوجو در مرحله آزمایش میباشند.
موتور پارسیجو میتواند با جستوجوی عبارات کلیدی نتایج موردنظر را به کاربران ارائه دهد و اگر نقایصی نسبت به موتورهای جستوجوی شناختهشده در جهان دارد، در حال بهروزرسانی میباشد.
نمونههایی از موتورهای جستوجوی ایرانی پارسیجو، ایرانی سلام، موتور جستوجوی یوز، موتور جستوجوی جسجو، موتور جستوجوی گردو و موتور جستوجوی پارسیک هستند که در ادامه به توضیح هرکدام خواهیم پرداخت.
موتور جستوجوی پارسیجو
پارسیجو در حال حاضر کاملترین موتور جستوجوی ایرانی میباشد. پارسیجو امکان جستوجوی تصویر، ویدئو، اخبار، اخبار استخدامی و وضعیت آبوهوا را به کاربران میدهد.
یکی از مشکلات موتور جستوجوی پارسیجو عدم بهروزرسانی بهموقع نتایج میباشد. مدتزمان زیادی نیاز است که یک سایت را بررسی کند و در تشخیص عبارتها با سرعت کم عمل میکند.
موتور جستوجوگر ایرانی سلام
وبسایت سلام بهعنوان یک ابرجستوجوگر معرفی شده است. این موتور جستوجو با بهکارگیری الگوریتمهای هوش مصنوعی، قابلیت جستوجو در هر زمینهای را به کاربر میدهد. اکنون نسخه آزمایشی سلام در دسترس میباشد و متخصصان در حال بهروزرسانی آن هستند و سعی در ارتقای آن دارند.
موتور جستوجوی یوز
یوز بر فهرستبندی منابع فارسی در وب تمرکز دارد. به گفته طراحان، تاکنون حدود یک میلیارد صفحه وب در دیتابیس آن ذخیره شده است.
موتور جستوجوگر جسجو
موتور جستوجوی جسجو دارای قابلیتهای مختلفی مانند جستوجوی فیلم، لینک، صوت و صفحات وب میباشد. همچنین، بخشهایی مانند جستوجو در آیات قرآن کریم، نهجالبلاغه، فال و راهنمای کشورها را در خود جای داده است.
موتور جستوجوگر گردو
یکی از محبوبترین موتورهای جستوجوگر ایرانی که میتواند جایگزینی برای گوگل باشد، موتور جستوجوگر گردو است. این نوع از موتور جستوجو مانند گوگل پیشنمایشی از سایت را نشان میدهد تا اینکه تصمیم بگیرد بهترین لینک را باز کند.
موتور جستوجوی پارسیک
در سال ۱۳۸۱ موتور جستوجوگر پارسیک راهاندازی شد و در سال ۱۳۸۲ جایزه ذرهبین طلایی را دریافت کرد. این جستوجوگر فقط امکان جستوجو در وب را به کاربران میدهد و تصاویر و فیلمها را سرچ نمیکند.
چگونه موتورهای جستوجو محتوا را ارزیابی میکنند؟
عنکبوتها برای ارزیابی محتوای صفحات تمام چیزها را موردبررسی قرار میدهند. عنکبوتها بر اساس کلمات بهکارگرفتهشده در متن صفحه، عنوان و زیرعنوان به دنبال الگوهای مشخص هستند.
بهطور مثال، اگر کلمه «شیر» در محتوای صفحه چندین مرتبه تکرار شده است، محتوا احتمالاً در رابطه با سلطان جنگل میباشد. اگر علاوه بر این، از استحکام استخوان و کلسیم در محتوا صحبت شده باشد، محتوا در مورد شیر پاستوریزه میباشد.
اگر قرار باشد کاربر صفحه «شیر پاستوریزه» را پیدا کند، بسنده کردن به این موضوع کافی نمیباشد. اینکه موتورهای جستوجو موضوع صفحه را متوجه میشوند، بخشی از فرایند لازم میباشد.
موتورهای جستوجو باید در بین تمام صفحات مربوط به شیر پاستوریزه، تعیین کنند که کدامیک با کوئری کاربر بیشتر در ارتباط است و کدامیک را باید اول ارائه دهد.
نتایج جستوجو بهواسطه اعتبار صفحات فهرستبندی میشوند. فاکتورهای رتبهبندی بسیار پیچیده و مدام در حال تغییر میباشند. آنچه ثابت میباشد، این است که همهٔ آنها رضایت کاربر را هدف اصلی قرار میدهند.
اگر فردی به دنبال اطلاعاتی درباره «شیر پاستوریزه» باشد، آن فرد کاملترین توضیحات و بالاترین کیفیت را از محتوا میخواهد. پس هرچقدر محتوا برای کاربر کاربردیتر باشد، نشاندهنده این است که فاکتورهای بیشتری رعایت شده است.
رایجترین روش برای کاربران در مسیر جستوجوی گوگل چیست؟
در ابتدا کاربر برای دریافت اطلاعات، پاسخ به سؤالات و … به گوگل مراجعه میکند. عبارت موردنظر را سرچ کرده و اولین نتیجه یا پاسخ را که توسط گوگل ارائه میشود، مشاهده میکند. از لیست یک یا چند گزینه را انتخاب و صفحاتی را باز میکند. سپس، محتوای آنها را بررسی میکند و به دنبال پاسخ خود میگردد.
اگر کاربر پاسخی دریافت نکرد، به گوگل بازگشته و نتایج بعدی را بررسی یا عبارت دیگری را جستوجو میکند. تا زمانی که کاربر به پاسخ موردنظر خود برسد، این فرایند بهصورت چرخهای اتفاق میافتد.
حافظه پنهان موتور جستوجو
حافظه پنهان موتور جستوجو، یک حافظه پنهان از صفحه وب میباشد که صفحه را مانند زمانی که توسط یک خزنده وب نمایهسازی شده، نشان میدهد.
هنگامی که دسترسی به نسخه اصلی امکانپذیر نباشد، یا تغییر کرده باشد، میتوان از نسخه ذخیرهشده صفحات وب برای مشاهده محتواهای یک صفحه استفاده کرد.
حافظه پنهان موتور جستوجو برای مراحل قانونی، روزنامهنگاری و تحقیقات مربوط به جرم مورداستفاده قرار میگیرد.
بهینهسازی موتورهای جستوجو
سئو به معنی بهینهسازی برای موتورهای جستوجو است. همچنین، به مجموعه اقدامات برنامهریزیشدهای گفته میشود که رنکینگ سایت را در رتبهبندی موتورهای جستوجو بهتر میکند.
متخصصان سئوکار سئوی سایت را انجام میدهند. بیشترین تکنیکهایی که در سئو استفاده میشود، به محتوا مربوط است.
بهطور کلی، سئو فرایندی است که باعث میشود وبسایت، رتبه بسیار خوبی در موتورهای جستوجو به دست بیاورد؛ زیرا زیرمجموعهای از بازاریابی اینترنتی میباشد.
بازاریابی سئو یعنی اطلاع داشتن از نحوه کار الگوریتمهای جستوجو و شناسایی اینکه کاربران اینترنت چه چیزی را جستوجو میکنند.
انواع سئو
چهار نوع از سئو که در بهینهسازی موتورهای جستوجو وجود دارد و به کاربر کمک میکند که نتایج را بهتر مشاهده کند، در زیر توضیح داده خواهد شد.
سئوی کلاه سفید
سئو کلاه سفید به دستورالعملهای موتور جستوجو پایبند است. این نوع سئو از تغییرات الگوریتمهای آینده تأثیر منفی نمیگیرد؛ زیرا بر اساس قوانین عمل میکند. به دلیل اینکه از مسیرهای میانجی اجتناب میشود، به دست آوردن نتایج زمان بیشتری نیاز دارد. این نوع از سئو ریسک کمتری دارد و در طول زمان ارزش و ماندگاری بیشتری دارد.
تکنیکهای سئوی کلاه سفید
- نوشتن مطالب مفید و مرتبط برای کاربر؛
- تبلیغ و ترفیع محتوا در شبکههای اجتماعی؛
- تحقیق کلمات کلیدی؛
- استراتژی سئو؛
- بکلینک طبیعی؛
- سئوی تکنیکال، سئوی داخلی و سئوی خارجی.
سئوی کلاهسیاه
سئوی کلاهسیاه برخلاف راهنماییهای موتور جستوجو عمل میکند و این ریسک را به همراه دارد که محتوا یا وبسایت کاربر از نتایج جستوجو حذف شود.
این نوع از سئو کاربر را سریعتر به محل موردنظر میرساند؛ زیرا برخلاف قوانین گوگل میباشد. بسیاری از تکنیکهای سئوی کلاهسیاه در دستورالعمل، بهعنوان کارهایی بیان شدهاند که کاربر نباید انجام دهد.
سئوی کلاهسیاه علاوه بر اینکه بهسرعت ارزشآفرینی میکند، خطرات زیادی هم دارد؛ زیرا این ارزش نمیتواند پایدار باشد.
تکنیکهای سئوی کلاهسیاه
- پر یا پنهان کردن صفحه با کلمات کلیدی؛
- پنهان کردن متن؛
- خرید بکلینک؛
- محتوای کپیشده؛
- سرقت ادبی.
سئوی کلاه خاکستری
سئو کلاه خاکستری بین تکنیکهای سئوی سفید و سیاه قرار دارد؛ زیرا تکنیکهای آن معمولاً در دستورالعملهای سئو نیست.
تکنیکهای سئوی کلاه خاکستری
- تکنیک یا طعمه کلیک؛
- تبادل لینک؛
- محتوایی که تا حدودی تغییر داده شده؛
- پرداخت پول برای کامنت گرفتن؛
- تبلیغات بیارزش و پولی برای کاربر.
سئوی منفی
سئوی منفی اجرای روشهای سئوی خاکستری یا سئوی کلاهسیاه در وبسایت شخصی دیگر با هدف آسیب رساندن میباشد. رقبای کاربر آسیب میبینند و موجب میشود تا خود کاربر در نتایج جستوجو بالا بیاید.
تکنیکهای سئوی منفی
- ارسال نظرات منفی؛
- سرقت مطالب؛
- ایجاد لینکهای غیرطبیعی؛
- هک کردن سایت؛
- تغییر محتوای سایت.
سئوی خارجی
در سئوهای خارجی موارد متفاوتی بررسی میشود. مهمترین آنها لینکسازی است که میتوان در جاهای مختلف انجام داد. برخی از بهترین محلها برای لینکسازی شبکههای اجتماعی، انجمنها و فروم، استفاده از بوکمارک کردن، ثبتنام در دایرکتوریها و … میباشد.
نحوه عملکرد سئو
عملکرد سئو به این طریق است که هر موتور جستوجویی که استفاده میکنید، دارای یک ربات خزنده است که اطلاعاتی را که از اینترنت جستوجو کردهاید، جمعآوری میکند.
این ربات تمام صفر و یکها را به موتور جستوجو انتقال میدهد تا یک ایندکس ایجاد کند. ایندکس از طریق الگوریتم تشکیل میشود که تمام دادهها را با عبارت جستوجوشده، مطابقت میدهد.
عوامل متعددی وجود دارد که یک الگوریتم موتور جستوجو را لحاظ کند که کارشناسان آنها را بر اساس اهمیتشان رتبهبندی کردهاند.
- ویژگیهای آتوریتی لینک در دامنه: پیج آتوریتی، تعداد بکلینکهای وبسایت، کیفیت لینکها
- کیفیت لینک در سطح صفحه: کیفیت منابع لینک، توزیع انکر تکست
- ویژگی محتوا در سطح صفحه وبسایت: کیفیت محتوا و تناسب آن با هدف وبسایت و نیاز کاربر
- ویژگی کلمات کلیدی در صفحات وبسایت: خوانا بودن، سرعت بارگذاری، طول محتوا
- ویژگی برند در سطح دامنه: رسانهها، استفاده آفلاین از نام دامنه و برند، تعداد اشارات به برند
- کارکرد و استفاده دادههای ترافیک: نوارابزارها، سیگنالهای دریافتی از مرورگرها
- شاخصهای اجتماعی: کیفیت و کمیت لینکهای توئیتشده، اشتراکگذاری در فیسبوک، گوگل و…
- استفاده از کلمات کلیدی در دامنه
- طول نام دامنه و زمان پاسخدهی پروتکل دامنه
اهداف سئو
- برندسازی؛
- تأثیرگذاری زیاد در بازدید وبسایت؛
- بالا بردن ترافیک وبسایت؛
- بالا بردن سطح فروش؛
- بهترین ابزار تبلیغات و بازاریابی.
معماری کلی موتورهای جستوجو
موتورهای جستوجو متعدد هستند و استراتژیهای آنها با یکدیگر متفاوت است. برخی از موتورهای جستوجو بهدلیل امنیت تجاری تلاش میکنند که الگوریتمهای درونی خود را پنهان کنند.
معماری کلی موتورهای جستجو
اجزای معماری موتور جستوجو
ابتدا به معرفی اجزای معماری موتور جستوجو میپردازیم.
درونکاو
تمام موتورهای جستوجو به درونکاو متکی هستند که وب را بهطور زمانبندیشده پیمایش میکنند و صفحات بیشمار ذخیرهشده را جمعآوری کنند. درونکاو از تعدادی برنامه کوچک تشکیل شده است که هرکدام از آنها از صفحه شروع وبسایت آغاز به کار میکنند.
پس از دریافت صفحه شروع و تحویل آن به انبار صفحات، بر طبق لینکهای درون صفحه جاری، صفحات پیوندخورده را نیز به همین طریق استخراج و ذخیره میکنند.
کنترل درونکاو
وظیفه این این است که برنامههای درونکاوی را با تحویل URL مدنظر راهاندازی کند. پس از دریافت صفحات جاری، کنترل درونکاو تعیین میکند کدامیک از صفحات باید دریافت شوند؛ زیرا یک صفحه به صفحات دیگر لینک داده میشود.
کنترل درونکاو باید لینکها را بهترتیب ملاقات کند و در مقابل ماژول درونکاو باید تمام آدرسهای URL موجود را از صفحات دریافتی استخراج کند و آنها را برای تصمیمگیری در اختیار کنترل درونکاو بگذارد.
انبار صفحات
صفحاتی که بهوسیله ماژول درونکاو از گستره جهانی وب استخراج میشوند، در انبار صفحات که یک بانک اطلاعاتی است، ذخیره میشوند تا برای تحلیل محتوا و شاخصدهی در اختیار ماژولها قرار بگیرند.
تفاوت موتورهای جستوجو در کنترل درونکاو بیشتر به چشم میآید. در برخی از الگوریتمها، استخراج صفحه و عملیات جستوجوی صفحات وب آنقدر ادامه مییابد تا هیچ صفحهٔ مشاهدهنشدهای باقی نماند.
در این الگوریتمها، مشاهده صفحات از یک وبسایت با آدرس خاص شروع میشود و تا مشاهده تمام آدرسهایی که در این صفحه وجود دارند، ادامه مییابد. در برخی دیگر از الگوریتمها، این عملیات به وبسایت با آدرس خاص و وبسایتهایی با پسوند نام حوزه متفاوت ادامه داده نمیشود.
در نوع دیگری از الگوریتمها، کنترل درونکاو به استخراج و مشاهده صفحات بین حوزههای سطح بالا محدود میشود. همچنین، هنگامی که فرایند استخراج صفحات در حال انجام است، مشاهده صفحات حوزه دیگر با وجود لینکهایی که در صفحات دات کام به آنها داده شده است، در دستور کار قرار نمیگیرد.
ماژول شاخصدهی
ماژول شاخصدهی تمام صفحات موجود در انبار را مرور و کلمات را پس از استخراج به همراه URL در جدول درج میکند. نتیجه این ماژول، جدولی میباشد که مشخص میکند هرکدام از کلمات در کدام صفحه و کجای صفحه و با چه آدرسی ظاهر شده است.
یکی دیگر از خروجیهای ماژول شاخصدهی شاخص ساختاری است. این شاخص چگونگی پیوند خوردن صفحات به یکدیگر را منعکس میکند. همچنین، گراف بهدستآمده از این صفحات و لینکهایی که به یکدیگر داده شدهاند، در شاخص ساختاری درج شده است. این گراف منعکسکننده مسیری است که ماژول درونکاو بر طبق آن، صفحات وب را استخراج و مشاهده نموده است.
کلام آخر
بهطور کلی، تصور دنیای بدون موتور جستوجوگر غیرممکن میباشد. نحوه عملکرد موتورهای جستوجو سبب شده تا افراد در سریعترین زمان ممکن، جواب سؤالات خود را پیدا کنند.
موتورهای جستوجو در سالهای اخیر به یکی از منابع قابلاطمینان انسانها تبدیل شده است. برای دیده شدن در فضای مجازی و افزایش فروش، آگاهی داشتن از نحوه عملکرد موتورهای جستوجو از اهمیت زیادی برخوردار است.
سازمانها و شرکتهایی که بتوانند با نحوه عملکرد موتورهای جستوجو آشنا شوند و از آن نهایت استفاده را کنند، به جایگاه مناسبی در موتورهای جستوجو دست مییابند که علاوه بر فروش برند خود، اعتباربخشی به آن را افزایش میدهند.
در این مقاله به بررسی تاریخچه موتور جستوجو، چگونگی کارکرد آن، انواع موتور جستوجو، عملکرد موتور جستوجو، موتورهای جستوجوی ایرانی، حافظه پنهان موتور جستوجو و … پرداختهایم. امیدواریم ارائه این مطالب برای شما مفید واقع شده باشد.
بدون دیدگاه