نوایندکس (Noindex) چیست و چگونه باید یک صفحه را نوایندکس کرد؟

قبل از هر چیزی بهتر است با خود ایندکس آشنا شویم.

ایندکس (Index) چیست؟

افرادی که در زمینه وب‌سایت فعالیت می‌کنند، بارها با این موضوع برخورد کرده‌اند و این اصطلاح را شنیده‌اند که فلان مطلب در گوگل ایندکس شده است. برخی از افراد هم آگاهی چندانی از این موضوع ندارند. ایندکس در حقیقت، به‌معنای فهرست شدن می‌باشد. عبارت «مطالبی که در گوگل ایندکس شده است»، یعنی آن مطلب توسط گوگل یافت می‌شود و قابل‌خواندن می‌باشد.

اگر وب‌سایتی به‌روزرسانی روزانه نداشته باشد، این مسئله می‌تواند در ایندکس شدن مطالب و خدمات آن‌ها تأثیرگذار باشد. هنگامی که مطالب توسط گوگل ایندکس نمی‌شوند، باید به دنبال علت مشکل به وجود آمده باشید تا بتوانید مشکل را برطرف کنید و وب‌سایت خود را تقویت کنید و رتبه و جایگاه مناسبی در نتایج گوگل به دست آورید.

در ادامه به موضوع اصلی مقاله یعنی نوایندکس و تمامی نکات مربوط به آن می‌پردازیم.

ایندکس چیست؟

ایندکس چیست؟

Noindex چیست؟

Noindex مقداری است که می‌تواند در تگ robots در کد HTML در هر صفحه از سایت استفاده شود. وقتی موتورهای جست‌وجو با مقدار Noindex در برچسب‌های متا برخورد می‌کنند، در فهرست موتور جست‌وجو، آن صفحه را برای کاربران نمایش نمی‌دهند.

درواقع، Noindex تگ پیغامی است که به موتورهای جست‌وجو هشدار می‌دهد که این صفحه از وب‌سایت نباید ایندکس شود. تمام وب‌سایت‌ها دارای صفحات مختلفی هستند و شما به‌عنوان صاحبان وب‌سایت تلاش نموده‌اید تا سئوی سایت موفقی داشته باشید تا رتبه و جایگاه مناسبی در نتایج جست‌وجوی گوگل کسب نمایید. صفحات وب‌سایت می‌تواند از دیدگاه موتورهای جست‌وجوی کاربری و غیرکاربری مشخص شود. مجموعه صفحات سایت شما با صفحاتی که به وب‌سایت شما لینک داده‌اند، موجب می‌شود سایت شما یک سایت ارزشمند یا بی‌ارزش شناخته شود.

Indexing طرف مقابل Noindex می‌باشد که اجازه Index شدن صفحه را به موتور جست‌وجو می‌دهد. Index شدن صفحه به معنای این می‌باشد که محتوای آن در فهرست موتورهای جست‌وجو ثبت شود.

Noindex چیست؟

Noindex چیست؟

نحوه اجرای Noindex

برای حذف یک صفحه خاص از indexing یا به عبارتی فهرست موتورهای جست‌وجو، اضافه کردن Noindex به متاتگ robots در هدر صفحه پیشنهاد می‌شود.

برای انجام این کار باید به‌صورت خودکار یا دستی قطعه کد زیر را به صفحه موردنظر اضافه کنید:

=noindex content- robots=meta name

اجرای Noindex به‌صورت خودکار

اگر بخواهید روش خودکار را به کار بگیرید، باید از افزونه SEO Yoast استفاده نمایید. برای نصب و فعال کردن افزونه، ابتدا باید Yoast SEO را از مخزن وردپرس دانلود کنید.

Yoast SEO برای هر صفحه که ایجاد شود، قسمتی را اضافه کنید که از آن برای بهینه‌سازی محتوا استفاده می‌شود.

زمانی که محتوا را می‌نویسید، به پایین ویرایشگر مراجعه کنید. در تب Advanced گزینه‌ای وجود دارد که صفحه موردنظر را از دید موتورهای جست‌وجو پنهان می‌کند که همان Noindex می‌باشد.

اجرای Noindex به‌صورت دستی

هر سایتی فایلی به نام robots.txt دارد که وبمسترها می‌توانند آن را به‌صورت دستی ویرایش کنند. این فایل در Root هاست قرار دارد.

پس از آدرس دامنه، اولین مسیر Root می‌باشد که در فضای هاست‌ها public – html گفته می‌شود. امکان خارج شدن دسته‌جمعی صفحات از فهرست موتور جست‌وجو با استفاده از robots.txt فراهم می‌شود. این صفحات عبارت‌اند از: صفحه سبد خرید، صفحات جست‌وجو، صفحه پروفایل کاربران، صفحه پشتیبانی یا چت و صفحه از خرید شما سپاسگزاریم.

چه صفحاتی را در سایت Noindex کنیم؟

بعضی از صفحات برای هدف خاصی در سایت ایجاد شده‌اند؛ اما هدف آن‌ها این نیست که در موتورهای جست‌وجو رتبه بگیرند یا ترافیک به دست آورند. این صفحات را معمولاً نمی‌توان حذف کرد؛ زیرا بخش‌هایی از سایت از طریق آن‌ها به یکدیگر متصل شده‌اند یا به خاطر اطلاعاتی که به کاربر می‌دهند، باید در سایت باقی بمانند.

در حالت کلی، هر سایتی دارای صفحاتی است که نیازی به ایندکس شدن ندارند. این صفحات شامل موارد زیر است:

Noindex چیست؟

Noindex چیست؟

آرشیو نویسندگان در یک بلاگ تک نویسنده‌ای

اگر فقط خودتان هستید که برای وبلاگتان مطلب می‌نویسید، نود درصد صفحه آرشیو نویسندگان سایت شما مشابه صفحه اصلی سایت می‌باشد. به همین دلیل، کاربردی برای گوگل ندارد و یک محتوای تکراری در نظر گرفته می‌شود. برای جلوگیری از چنین اتفاقی، آرشیو نویسندگان را غیرفعال کنید. اگر به هر دلیلی می‌خواهید این صفحه در سایت باشد، باید آن را Noindex کنید که در نتایج صفحات جست‌وجو مشاهده نشود.

انواع پست سفارشی

گاهی یک افزونه یا پلاگین به‌طور خودکار، پست‌های سفارشی به سایت اضافه می‌کند که نیازی به ایندکس شدن آن‌ها نیست. به‌طور مثال، وب‌سایتی هستید که فروشگاه آنلاین حساب نمی‌شوید و به‌جای اینکه محصولی بفروشید، خدمات ارائه می‌دهید. در این صورت، در صفحه خرید و معرفی آن‌ها نیازی به تصویر محصول، ابعاد و سایر ویژگی‌های آن ندارید. در چنین حالتی، می‌توانید تمام صفحات پیش‌فرض محصولات را Noindex کنید و به‌جای آن یک صفحه محصول سفارشی بسازید.

صفحات تأیید و تشکر

برخی از صفحات در سایت به غیر از ارسال پیغام تأیید و تشکر، هدف دیگری ندارند. این‌گونه صفحات معمولاً محتواهای خاصی هم ندارند و ارزشی برای موتورهای جست‌وجو و کاربران ایجاد نمی‌کنند؛ بنابراین بهتر است در صفحه نتایج دیده نشوند.

صفحات ورود و ادمین

اغلب، صفحات ورود به سایت نباید در گوگل دیده شوند. با استفاده از Noindex می‌توان این صفحات را از دید گوگل پنهان نمود. این مورد مربوط به صفحات ورود به سایتی است که به یک جامعه سرویس می‌دهند.

نتایج جست‌وجوی داخلی

صفحات نتایج جست‌وجوی داخلی، بدترین چیزی می‌باشد که گوگل بخواهد به کاربرانش نشان دهد. اگر یک صفحه جست‌وجو را به صفحه جست‌وجوی دیگری لینک بدهید، نتیجه مطلوبی نمی‌گیرید.

هدف کاربر از جست‌وجو، رسیدن به صفحه نتیجه و دریافت اطلاعات باارزش می‌باشد. به همین دلیل، باید تمام صفحات جست‌وجوی داخلی را Noindex کنید.

نتایج جستجوی داخلی

نتایج جستجوی داخلی

صفحاتی که به خاطر رعایت برخی قوانین در سایت درج شده‌اند.

برخی از صفحات سایت، مانند صفحات اعلام شکایات، صفحه قوانین و مقررات یا فرضیات قوانین و عودت وجه فقط برای پیروی از قوانین در سایت شما قرار دارند. تصمیم‌گیری دربارهٔ Noindex شدن این‌گونه صفحات، بر عهده شخص می‌باشد و کاربران نیازی ندارند با سرچ در موتورهای جست‌وجو به این صفحات دسترسی پیدا کنند. بنابراین، بهتر است این صفحات را Noindex کنید و از نمایان شدن آن‌ها در نتایج جست‌وجو جلوگیری کنید تا دسترسی به این صفحات فقط از طریق مراجعه به خود سایت امکان‌پذیر باشد.

صفحات ویژه اعضا

اگر قسمتی از وب‌سایت خود را به اعضا یا کارمندان سازمان اختصاص داده‌اید و نمی‌خواهید در دسترس عموم قرار گیرند، دستورالعمل Noindex را برای این صفحات اعمال کنید.

دلایل مهم ایندکس نشدن سایت

گاهی اوقات ممکن است سایت شما ایندکس نشود. ایندکس نشدن سایت به چند دلیل اتفاق می‌افتد که در ادامه به شرح این دلایل می‌پردازیم.

ریسپانسیو نبودن سایت

اگر سایت شما در تبلت یا تلفن همراه ظاهر مناسبی نداشته باشد، ممکن است گوگل سایت شما را در لیست نتایج صفحه نخست خود index نکند.

سرعت پایین سایت

از نظر گوگل، پایین بودن سرعت سایت مهم می‌باشد؛ زیرا کاربر اگر با سرعت پایین مواجه شود، بلافاصله سایت را می‌بندد و به سراغ سایت دیگری می‌رود.

سرعت پایین سایت

سرعت پایین سایت

خطاهای احتمالی سایت

ابزارهای گوگل نظیر سرچ کنسول کمک بسیاری به شما می‌کند تا خطاهای مربوط به ایندکس نشدن را مشاهده کنید. پس از آن، باید به بررسی و رفع ایرادات بپردازید. در سرچ کنسول، امکان نمایش خطاها تا 90 روز اخیر وجود دارد که برخی از این خطاها، خطای سرور، خطای ربات، خطای دسترسی ردشده و … می‌باشند.

محتوای نسبتاً طولانی و قوی

باید در نظر داشته باشید که تعداد کلمات متن موردقبول گوگل حداقل 300 کلمه می‌باشد و هرچه از این تعداد بیشتر باشد، محتوا مفیدتر و باارزش‌تر خواهد بود؛ اما به این معنا نمی‌باشد که با نوشتن مطالب غیرضروری به یک متن طولانی برسیم. بارها دیده شده است که بعضی سایت‌ها، صدها محتوای کمتر از 300 کلمه دارند که دیده نمی‌شوند؛ دلیل آن هم کم بودن تعداد کلمات از حداقل تعداد موردنظر گوگل می‌باشد. سایت‌هایی که متن آن‌ها 300 کلمه است در جایگاه یک و دو قرار می‌گیرند.

کاربرد Noindex در سئو

یکی از پرکاربردترین تگ‌های سئو Noindex می‌باشد که اگر برای صفحات به‌درستی از آن‌ها استفاده شود، تأثیر بسزایی در سئوی سایت می‌گذارد.

محتوای تکراری

معمول‌ترین دلیل استفاده از تگ Noindex جلوگیری از محتوای تکراری می‌باشد. هنگامی که بیش از یک نسخه از صفحه توسط موتورهای جست‌وجو ایندکس شود، محتوای تکراری در سایت ایجاد می‌شود که آن صفحه با افت رتبه مواجه خواهد شد.

محتوای ضعیف

برخی از صفحات وب هیچ سودی برای ایندکس شدن ندارند. این‌گونه صفحات، نه اطلاعات مفیدی برای کاربر دارند و نه حاوی کلیدواژهٔ خاصی هستند. به‌طور مثال، هدف صفحه تشکر که پس از خرید نمایش داده می‌شود، برقراری رابطه دوستانه با کاربر می‌باشد که کسب رتبه و ایندکس شدن آن به‌دلیل محتوای غیرمفید، باعث افت رتبه سایت می‌شود.

چگونه از تگ Noindex در فایل robots.txt استفاده کنیم؟

فایل robots.txt نوعی فایل متنی است که دارای نقشه سایت و یک سری دستورات برای خزنده‌ها است. زمانی که خزنده‌ها به یک سایت می‌رسند، فایل را چک می‌کنند و بر اساس دستورات آن عمل می‌کنند.

با قرار دادن دستورات Noindex در فایل robots.txt می‌توانید به خزنده‌ها اطلاع‌رسانی کنید که کدام صفحات نباید ایندکس شوند.

همچنین، می‌توان با استفاده از فایل robots.txt تصویر یا فایل را به حالت نوایندکس در آورد. در این فایل، دستور robots.txt را بنویسید و سپس در گوگل کنسول ثبت کنید.

کدام خطاهای سایت باعث ایندکس نشدن سایت می‌شود؟

چند خطای مهم سایت که باعث نوایندکس شدن سایت می‌شود، به شرح زیر است:

خطاهای DNS

هنگامی که سعی داریم به صفحه‌ای دسترسی پیدا کنیم، اما ارتباط با سرور DNS برقرار نمی‌شود، خطای DNS  ایجاد می‌شود. دلیل این خطا می‌تواند از کار افتادن سرور یا مشکلی در مسیریابی DNS  به دامنه باشد. این ارورها اهمیت زیادی دارند و باید در اولین فرصت به رفع آن‌ها بپردازید؛ زیرا وجود این خطاها باعث می‌شود ربات‌های گوگل نتوانند به سایت دسترسی داشته باشند.

آموزش رفع خطاهای DNS

برای رفع این خطا وارد صفحه وبمستر شوید. از منوی crawl روی گزینه Fetch as Google کلیک کنید. در کادر جست‌وجو، URL صفحه موردنظر را وارد کنید و گزینه FETCH AND RENDER را بزنید. سپس، گوگل نتایج بررسی را به شما نمایش می‌دهد. اگر مشکلی داشته باشد، در مقابل URL صفحه‌ای که وارد کرده‌اید، یک تیک قرمز زده می‌شود. توجه داشته باشید که اگر گوگل بدون مشکل با صفحه اول سایت ارتباط برقرار کرد، نشانه این است که هیچ مشکلی در این وب‌سایت وجود ندارد.

خطاهای DNS  معمولاً دو نوع می‌باشند:

خطای Timeout: این خطا هنگامی رخ می‌دهد که سرور DNS  قادر به پاسخگویی به درخواست گوگل در یک زمان خاص نباشد.

خطای Lookup: هنگامی که سرور DNS  قادر به شناسایی نام میزبان نباشد، این خطا رخ می‌دهد.

خطاهای Dnc

خطاهای Dnc

وجود خطاهای سرور

هنگامی که سرور برای پاسخگویی به یک درخواست زمان زیادی صرف کند و مهلت درخواست پایان یابد، خطای سرور اتفاق می‌افتد. این خطا اصولاً زمانی رخ می‌دهد که ترافیک سایت بیش از اندازه باشد که سرور بتواند آن را مدیریت کند.

خطاهای سرور شش نوع هستند:

  • Timeout: زمان انتظار برای یک درخواست به پایان می‌رسد.
  • Truncated headers: گوگل می‌تواند به سرور متصل شود؛ اما اتصال را قبل از ارسال header قطع کرده‌اند.
  • Connection: سرور درخواست گوگل را پردازش کرده است و به‌دلیل اینکه ارتباط با سرور ریست شده است، هیچ محتوایی را بر نمی‌گرداند.
  • Truncated response: قبل از اینکه گوگل بتواند پاسخ کاملی دریافت کند، سرور قطع شده است.
  • Connection failed: گوگل نمی‌تواند به سرور متصل شود؛ زیرا شبکه از کار افتاده است یا غیرقابل‌دسترس شده است.
  • No response: گوگل می‌تواند قبل از ارسال داده‌های موردنیاز به سرور متصل شود.

راهکارهایی برای رفع خطاهای سرور

  • بارگذاری صفحات را کاهش دهید.
  • از پارامترهای URL کمتری استفاده کنید و آن‌ها را کوتاه نگه دارید.
  • هنگامی که با مشکل اتصال برخورد نمودید، با ارائه‌دهنده هاست مشورت کنید و توانایی سایت را برای مدیریت ترافیک افزایش دهید.
  • اطمینان داشته باشید که هاست به‌طور صحیح کار می‌کند و پهنای باند آن تمام نشده است.

 رفع خطاهای موجود در فایل Robots.txt

این خطا یعنی گوگل نمی‌تواند به فایل Robots.txt دسترسی پیدا کند. خزنده‌های گوگل حداقل یک بار فایل Robots.txt را بازبینی می‌کنند تا از ایندکس کردن صفحات و خزیده شدن وب‌سایت اطلاع یابند. در فایل Robots.txt می‌توانید رفتار خزنده‌های موتور جست‌وجو را درباره سایت خود معین کنید و به آن‌ها بفهمانید که کدام قسمت از صفحات را نباید ایندکس و جست‌وجو کنند. برای این کار از متاتگ Noindex استفاده کنید.

نداشتن سایت مپ

برای وب‌سایت خود نقشه سایت داشته باشید و آن را به‌درستی بارگذاری و معرفی کنید. نداشتن نقشه سایت مانعی برای ایندکس شدن سایت در گوگل می‌باشد. پس از آنکه سایت مپ آپلود شد، درخواست خزیدن گوگل را به‌منظور ایندکس شدن سایت به گوگل ارسال نمایید تا گوگل پس از بررسی، برای ایندکس کردن سایت اقدام کند.

سایت مپ

سایت مپ

خطاهای URL

خطاهای URL یکی از انواع زیر می‌باشند:

خطای 404

هنگامی که کاربر آدرس صفحه‌ای از سایت را بدهد که وجود خارجی نداشته باشد، سرور صفحه‌ای با عنوان خطای 404 به کاربر نمایش می‌دهد و به او و موتورهای جست‌وجو می‌گوید که چنین صفحه‌ای در این سایت موجود نیست. بنابراین، محتوای آن صفحه به‌وسیله موتورهای جست‌وجو می‌تواند ایندکس یا بررسی شود.

رفع خطای 404

برخی از خطاهای 404 به رتبه‌بندی سایت آسیب نمی‌رساند و نیازی به رفع خطا نمی‌باشد. اگر صفحه‌ای از روی سایت پاک شده است، استفاده از صفحه با خطای 404 را می‌توانید انجام دهید.

اما اگر لینک‌هایی به صفحه 404 در GSC پیدا کردید:

  • اگر محتوا را به صفحه دیگری انتقال داده‌اید، ریداکت انجام دهید.
  • اگر صفحه دارای تعداد زیادی از ترافیک ورودی است، ترافیک را به سطح بالاتر هدایت کنید.
  • لینک‌های اشتباه را بررسی کنید تا بدانید از چه سایت و صفحه‌ای لینک شده‌اند.
  • می‌توانید از خطاهای 404 چشم‌پوشی کنید؛ زیرا مشکل چندانی برای سایت ایجاد نمی‌کنند.
خطای 404

خطای 404

خطای Access denied

گوگل همه محتواهایی را که در نت موجود هستند، به کمک لینک‌هایی که بین صفحات وجود دارد، بررسی می‌کند. اگر ربات گوگل بخواهد صفحه‌ای را بررسی کند، باید به آن دسترسی داشته باشد. وجود خطاها به این معنی می‌باشد که امکان دسترسی به لینک موردنظر برای ربات گوگل وجود ندارد. عدم دسترسی‌ها به دلایل مختلفی می‌باشد که در زیر توضیح داده می‌شود.

  • ربات گوگل نمی‌تواند مطلب را ببیند؛ زیرا فقط کاربرانی که در سایت ثبت‌نام کرده‌اند و رمز عبور دارند، می‌توانند به مطلب دسترسی پیدا کنند.
  • ممکن است فایل txt دسترسی ربات گوگل به بعضی از فایل‌ها یا کل سایت را مسدود کند.
  • ممکن است سرور سایت یک سری موارد امنیتی برای کاربر در نظر گرفته باشد و به‌طور کلی دسترسی به ربات گوگل را مسدود کند.
رفع خطای Access denied
  • امکان لاگین کردن را از صفحاتی که می‌خواهید گوگل در آن crawl کند، بردارید.
  • وب‌سایت خود را با screaming اسکن نمایید.
  • فایل txt را بررسی کنید تا مطمئن شوید که صفحات ذکرشده در آن به‌منظور جلوگیری از crawl مسدود نشده باشد.
  • از یکی از ابزارهای گوگل مانند fetch استفاده کنید تا ببینید سایت شما در Googlebot چگونه ظاهر می‌شود.

به‌طور کلی، همان‌طور که مشاهده کردید Noindex به عوامل مختلفی بستگی دارد. برای انجام این کار، به دو سؤال باید پاسخ دهید: یکی اینکه آیا می‌خواهید صفحه شما در نتایج جست‌وجوی گوگل مشاهده شود یا خیر و دوم اینکه آیا قصد دارید موتورهای جست‌وجو لینک‌هایی را که در این صفحه وجود دارند، دنبال کند یا نه.

در این مقاله به Noindex چیست و نحوه Noindex کردن صفحات پرداخته‌ایم. امیدواریم توانسته باشیم مطالب مفیدی را در اختیار شما قرار داده باشیم.

بدون دیدگاه

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *