محتوای تکراری ؛ چرا اتفاق می‌افتد؟ و چگونه می‌توان آن را اصلاح کرد؟

0

محتوای تکراری محتوایی است که در اینترنت در بیش از یک صفحه ظاهر می‌شود. این “صفحات” به عنوان مکانی با آدرس وب سایت منحصر به فرد (URL) تعریف می‌شوند. بنابراین، اگر همان محتوا در بیش از یک آدرس وب ظاهر گردد، محتوای تکراری نامیده می‌شود.

اگرچه از نظر فنی این کار مجازات نیست، اما محتوای تکراری هنوز هم ممکن است بر رتبه بندی موتور جستجو تأثیر بگذارد. هنگامی که چندین بخش از محتوای “به طور قابل ملاحظه ای مشابه” در بیش از یک صفحه وجود داشته باشد، برای موتورهای جستجو بررسی و تصمیم‌گیری در مورد آن محتوا دشوار خواهد بود.

چرا محتوای تکراری مهم است؟

۱- برای موتورهای جستجو

محتوای تکراری می تواند سه مسئله اصلی را برای موتورهای جستجو ایجاد کند:

موتورهای ‌جستوگر نمی دانند کدام نسخه را به عنوان شاخص در نظر بگیرند یا آن را حذف کنند.

موتورهای ‌جستوگر نمی‌دانند معیارهای لینک (معتبر بودن، آتوریتی، متن لنگر، ارزش ویژه لینک و…) را به کدام یک از صفحات هدایت کنند یا آن را بین نسخه‌های مختلف متفاوت در نظر بگیرد.

موتورها‌جستوگر نمی‌دانند کدام نسخه را برای نتایج جستجو رتبه بندی کنند.

۲- برای دارندگان سایت

وقتی محتوای تکراری وجود دارد، دارندگان سایت می‌توانند رتبه بندی و بازدید کنندگان خود را از دست بدهند. این خسارات اغلب از دو مشکل اصلی ناشی می‌شود:

برای ارائه بهترین تجربه جستجو، موتورهای جستجو به ندرت نسخه‌های مختلفی از یک محتوا را نشان می‌دهند، بنابراین مجبور به انتخاب بهترین نسخه برای نمایش در موتور جستجو می‌شوند. این باعث کاهش دیده شدن هر یک از نسخه‌های تکراری می شود.

ارزش لینک‌های ورودی در اینجا بسیار حیاتی است، ‌زیرا موتور‌های جستجو از بین سایت‌ها باید یک نسخه را انتخاب کند. از آنجا که پیوندهای ورودی یک عامل رتبه‌بندی است، بنابراین می‌تواند بر قابلیت جستجو در یک محتوا تأثیر بگذارد.

محتوای تکراری ؛ چرا اتفاق می‌افتد؟ و چگونه می‌توان آن را اصلاح کرد؟

چطور محتوای تکراری اتفاق می‌افتد؟

در اکثر قریب به اتفاق موارد، صاحبان وب‌سایت عمداً محتوای تکراری ایجاد نمی کنند. در واقع طبق برخی تخمین ها، تا ۲۹ درصد محتوای وب‌سایت‌ها دارای محتوای تکراری است!

حال نگاهی به برخی از متداول‌ترین روش‌های ایجاد ناخواسته محتوای تکراری می‌اندازیم:

تغییرات URL

پارامترهای URL، مانند ردیابی کلیک و برخی از کدهای تجزیه و تحلیل، می توانند مشکلات محتوای تکراری ایجاد کنند. این مشکلات نه تنها توسط خود پارامترها بلکه به ترتیب نمایش آن پارامترها در خود URL نیز ایجاد شود.

۱- به همین ترتیب، شناسه‌ها در ساختار لینک‌ها،یک مشکل رایج در تولید محتوای تکراری است. این اتفاق زمانی رخ می دهد که به هر کاربری که از وب‌سایت بازدید می‌کند، شناسه متفاوتی با شناسه URL ذخیره شده اختصاص داده شود.

محتوای تکراری ؛ چرا اتفاق می‌افتد؟ و چگونه می‌توان آن را اصلاح کرد؟۲- نسخه‌های قابل چاپ برای محتوا همچنین می‌توانند با تکرار شدن چندین نسخه از صفحه، مشکلات محتوای تکراری ایجاد کنند.قرار گرفتن کلمه Print در عنوان لینک باعث بروز همچین خطایی می‌شود.

محتوای تکراری ؛ چرا اتفاق می‌افتد؟ و چگونه می‌توان آن را اصلاح کرد؟صفحات HTTP در مقابل HTTPS یا داشتن WWW در مقابل نداشتن WWW

اگر سایت شما نسخه‌های جداگانه ای در “www.site.com “site.com”, ” دارد (با و بدون پیشوند “www”)  و محتوای یکسانی در هر دو نسخه وجود داشته باشد. شما به طور موثر نسخه‌های تکراری از هر یک از محتواها را ایجاد کرده‌اید. همین امر برای سایت‌هایی که نسخه های خود را در هر دو  http و https نگهداری می کنند نیز اتفاق می‌افتد.

محتوای کپی شده

دامنه محتواها بسیار گسترده است،‌گاهی ممکن است شامل پست‌های یک وبلاگ،‌مقالات،‌اطلاعات یک محصول و … باشد. بازنشر کنندگان مطالب شما نیز ممکن است مطالبی مشابه با عناوین شما داشته باشند که به مرور باعث گسترش محتوای‌های تکراری می‌شود.

موضوع محتوای کپی شده برای سایت‌هایی که محصولات ارائه می‌دهند بیشتر به چشم می‌خورد زیرا بسیاری از وب‌سایت‌های مختلف نیز وجود دارند که محصولات مشابهی را به فروش می‌رسانند،‌اگر همه آن‌ بخواهند از توضیحات سازنده در مورد آن محصولات استفاده کنند،‌باعث ایجاد تعداد زیادی محتوای یکسان چندین مکان خواهد شد. پس سعی کنید تا حد امکان محتوای را خودتان بنویسید.

چگونه مشکلات محتوای تکراری را برطرف کنیم؟

رفع مشکلات محتوای تکراری به یک ایده اصلی برمی‌گردد: مشخص کردن اینکه کدام یک از نسخه‌های تکراری “صحیح” است.

هر زمان که محتوای یک سایت در چندین URL یافت شود، باید برای موتورهای جستجو تعریف شده باشد. در ادامه چهار روش اصلی برای انجام این کار را مرور کنیم: استفاده از کد ۳۰۱ برای تصحیح URL، ویژگی rel = canonical ، Meta Robots Noindexو استفاده از ابزار مدیریت پارامتر در Google Search Console

۱- ریدایرکت ۳۰۱ برای تصحیح URL

ریدایرکت ۳۰۱ به این معنی است که یک صفحه برای همیشه به مکان جدیدی منتقل شده است. در بسیاری از موارد، بهترین راه برای رفع مشکل محتوای تکراری، تنظیم کد ۳۰۱ از صفحه “تکرار” به صفحه محتوای اصلی است.

هنگامی که چندین صفحه با قابلیت رتبه‌بندی خوب در یک صفحه واحد ترکیب می‌شوند،باعث محبوبیت بیشتری برای ربات‌های گوگل می‌شود. از این رو بر توانایی صفحه‌بندی “صحیح” به طور مثبت تأثیر می گذارد.

محتوای تکراری ؛ چرا اتفاق می‌افتد؟ و چگونه می‌توان آن را اصلاح کرد؟۲- استفاده از برچسب rel = canonical

برچسب canonical  با نام مستعار  ( “rel canonical”) روشی است که به موتورهای جستجو می‌گوید که یک URL خاص نمایانگر نسخه اصلی یک صفحه است. استفاده از برچسب متعارف از بروز مشکلات ناشی از نمایش محتوای یکسان یا “تکراری” در چندین URL جلوگیری می ‌کند. و تمام پیوندها، معیارهای محتوا و “قدرت رتبه‌بندی” که موتورهای جستجو برای این صفحه اعمال می‌کنند باید برای آدرس مشخص شده اختصاص داده شوند.

محتوای تکراری ؛ چرا اتفاق می‌افتد؟ و چگونه می‌توان آن را اصلاح کرد؟

ویژگی  rel = “canonical” بخشی از عنوان HTML یک صفحه وب است و به صورت زیر استفاده می‌شود:

عبارت rel = canonical باید به اول HTML هر نسخه تکراری یک صفحه اضافه شود، در حالی که قسمت  ” URL OF ORIGINAL PAGE” در بالا با پیوند به صفحه اصلی (متعارف) جایگزین شده است. (اطمینان حاصل کنید که گیومه‌ها را نگه دارید.) ویژگی تقریبا همان مقدار از ارزش پیوند (قدرت رتبه بندی) را به عنوان تغییر مسیر ۳۰۱ منتقل می کند، و چون در سطح صفحه (به جای سرور) پیاده‌سازی می‌شود، معمولاً زمان کمتری برای پیاده سازی آن طول می‌کشد.

در زیر مثالی از rel = “canonical”  در نشان می‌دهیم:

<head>…[other code that might be in your document’s HTML head]…<link href=”URL OF ORIGINAL PAGE” rel=”canonical” />…[other code that might be in your document’s HTML head]…</head>

اگرچه این صفحه توسط دو URL قابل دسترسی است، ویژگی rel = canonical اطمینان می‌دهد که کلیه ارزش پیوند و معیارهای محتوا به صفحه اصلی اعطا می‌شوند.

۳- استفاده از Meta Robots Noindex

یکی از برچسب‌های متا که می‌تواند به ویژه در پرداختن به محتوای تکراری مفید باشد، ربات‌های متا هستند که با مقادیر  “noindex,follow” استفاده می‌شود. این ربات متا را که معمولاً Meta Noindex می‌نامند، از نظر فنی به عنوان محتوا  “noindex,follow” می‌توان به هر صفحه اضافه کرد که از فهرست موتور جستجو خارج شود.

برچسب ربات‌های متا به موتورهای جستجو اجازه می‌دهد تا پیوندهای یک صفحه را بررسی کنند اما آن‌ها را اثر بخشی در رتبه‌بندی بازمی دارد. مهم است که صفحه کپی همچنان قابل بررسی باشد. حتی اگر بخواهید که گوگل محتوا‌ها را در جستجوها نشان ندهد،‌ اما صریحا گوگل تمایل دارد محتواها را بررسی کند و در صورت عدم توانایی در این کار به شما اخطار خواهد داد.

۴- مدیریت دامنه و پارامترهای ترجیحی در Google Search Console

گوگل سرچ کنسول به شما امکان می‌دهد دامنه مورد نظر سایت خود را تنظیم کنید (به عنوان مثال http://yoursite.com به جای http://www.yoursite.com) ) و تعیین کنید که آیا Googlebot باید پارامترهای مختلف URL را به طور متفاوتی بررسی کند. (مدیریت پارامترها).

محتوای تکراری ؛ چرا اتفاق می‌افتد؟ و چگونه می‌توان آن را اصلاح کرد؟

بسته به ساختار URL شما و علت مشکلات محتوای تکراری، با راه اندازی دامنه یا پارامتر مورد نظر خود (یا هر دو!) ممکن است به راه حل مناسبی دست یابید.

اشکال اصلی استفاده از مدیریت پارامترها به عنوان روش اصلی شما در برخورد با محتوای تکراری این است که تغییراتی که ایجاد می‌کنید فقط برای گوگل کارساز است. قوانینی که با استفاده از Google Search Console وضع شده اند، تأثیری در نحوه تفسیر Bing یا سایر ربات‌ها موتور جستجو از سایت شما ندارند. علاوه بر تغییرات تنظیمات در سرچ کنسول، باید از ابزارهای مدیر وب برای سایر موتورهای جستجو استفاده کنید.

ارسال دیدگاه

آدرس ایمیل شما منتشر نخواهد شد.