محتوای تکراری ؛ چرا اتفاق میافتد؟ و چگونه میتوان آن را اصلاح کرد؟
محتوای تکراری محتوایی است که در اینترنت در بیش از یک صفحه ظاهر میشود. این “صفحات” به عنوان مکانی با آدرس وب سایت منحصر به فرد (URL) تعریف میشوند. بنابراین، اگر همان محتوا در بیش از یک آدرس وب ظاهر گردد، محتوای تکراری نامیده میشود.
اگرچه از نظر فنی این کار مجازات نیست، اما محتوای تکراری هنوز هم ممکن است بر رتبه بندی موتور جستجو تأثیر بگذارد. هنگامی که چندین بخش از محتوای “به طور قابل ملاحظه ای مشابه” در بیش از یک صفحه وجود داشته باشد، برای موتورهای جستجو بررسی و تصمیمگیری در مورد آن محتوا دشوار خواهد بود.
چرا محتوای تکراری مهم است؟
۱- برای موتورهای جستجو
محتوای تکراری می تواند سه مسئله اصلی را برای موتورهای جستجو ایجاد کند:
موتورهای جستوگر نمی دانند کدام نسخه را به عنوان شاخص در نظر بگیرند یا آن را حذف کنند.
موتورهای جستوگر نمیدانند معیارهای لینک (معتبر بودن، آتوریتی، متن لنگر، ارزش ویژه لینک و…) را به کدام یک از صفحات هدایت کنند یا آن را بین نسخههای مختلف متفاوت در نظر بگیرد.
موتورهاجستوگر نمیدانند کدام نسخه را برای نتایج جستجو رتبه بندی کنند.
۲- برای دارندگان سایت
وقتی محتوای تکراری وجود دارد، دارندگان سایت میتوانند رتبه بندی و بازدید کنندگان خود را از دست بدهند. این خسارات اغلب از دو مشکل اصلی ناشی میشود:
برای ارائه بهترین تجربه جستجو، موتورهای جستجو به ندرت نسخههای مختلفی از یک محتوا را نشان میدهند، بنابراین مجبور به انتخاب بهترین نسخه برای نمایش در موتور جستجو میشوند. این باعث کاهش دیده شدن هر یک از نسخههای تکراری می شود.
ارزش لینکهای ورودی در اینجا بسیار حیاتی است، زیرا موتورهای جستجو از بین سایتها باید یک نسخه را انتخاب کند. از آنجا که پیوندهای ورودی یک عامل رتبهبندی است، بنابراین میتواند بر قابلیت جستجو در یک محتوا تأثیر بگذارد.
چطور محتوای تکراری اتفاق میافتد؟
در اکثر قریب به اتفاق موارد، صاحبان وبسایت عمداً محتوای تکراری ایجاد نمی کنند. در واقع طبق برخی تخمین ها، تا ۲۹ درصد محتوای وبسایتها دارای محتوای تکراری است!
حال نگاهی به برخی از متداولترین روشهای ایجاد ناخواسته محتوای تکراری میاندازیم:
تغییرات URL
پارامترهای URL، مانند ردیابی کلیک و برخی از کدهای تجزیه و تحلیل، می توانند مشکلات محتوای تکراری ایجاد کنند. این مشکلات نه تنها توسط خود پارامترها بلکه به ترتیب نمایش آن پارامترها در خود URL نیز ایجاد شود.
۱- به همین ترتیب، شناسهها در ساختار لینکها،یک مشکل رایج در تولید محتوای تکراری است. این اتفاق زمانی رخ می دهد که به هر کاربری که از وبسایت بازدید میکند، شناسه متفاوتی با شناسه URL ذخیره شده اختصاص داده شود.
۲- نسخههای قابل چاپ برای محتوا همچنین میتوانند با تکرار شدن چندین نسخه از صفحه، مشکلات محتوای تکراری ایجاد کنند.قرار گرفتن کلمه Print در عنوان لینک باعث بروز همچین خطایی میشود.
صفحات HTTP در مقابل HTTPS یا داشتن WWW در مقابل نداشتن WWW
اگر سایت شما نسخههای جداگانه ای در “www.site.com “site.com”, ” دارد (با و بدون پیشوند “www”) و محتوای یکسانی در هر دو نسخه وجود داشته باشد. شما به طور موثر نسخههای تکراری از هر یک از محتواها را ایجاد کردهاید. همین امر برای سایتهایی که نسخه های خود را در هر دو http و https نگهداری می کنند نیز اتفاق میافتد.
محتوای کپی شده
دامنه محتواها بسیار گسترده است،گاهی ممکن است شامل پستهای یک وبلاگ،مقالات،اطلاعات یک محصول و … باشد. بازنشر کنندگان مطالب شما نیز ممکن است مطالبی مشابه با عناوین شما داشته باشند که به مرور باعث گسترش محتوایهای تکراری میشود.
موضوع محتوای کپی شده برای سایتهایی که محصولات ارائه میدهند بیشتر به چشم میخورد زیرا بسیاری از وبسایتهای مختلف نیز وجود دارند که محصولات مشابهی را به فروش میرسانند،اگر همه آن بخواهند از توضیحات سازنده در مورد آن محصولات استفاده کنند،باعث ایجاد تعداد زیادی محتوای یکسان چندین مکان خواهد شد. پس سعی کنید تا حد امکان محتوای را خودتان بنویسید.
چگونه مشکلات محتوای تکراری را برطرف کنیم؟
رفع مشکلات محتوای تکراری به یک ایده اصلی برمیگردد: مشخص کردن اینکه کدام یک از نسخههای تکراری “صحیح” است.
هر زمان که محتوای یک سایت در چندین URL یافت شود، باید برای موتورهای جستجو تعریف شده باشد. در ادامه چهار روش اصلی برای انجام این کار را مرور کنیم: استفاده از کد ۳۰۱ برای تصحیح URL، ویژگی rel = canonical ، Meta Robots Noindexو استفاده از ابزار مدیریت پارامتر در Google Search Console
۱- ریدایرکت ۳۰۱ برای تصحیح URL
ریدایرکت ۳۰۱ به این معنی است که یک صفحه برای همیشه به مکان جدیدی منتقل شده است. در بسیاری از موارد، بهترین راه برای رفع مشکل محتوای تکراری، تنظیم کد ۳۰۱ از صفحه “تکرار” به صفحه محتوای اصلی است.
هنگامی که چندین صفحه با قابلیت رتبهبندی خوب در یک صفحه واحد ترکیب میشوند،باعث محبوبیت بیشتری برای رباتهای گوگل میشود. از این رو بر توانایی صفحهبندی “صحیح” به طور مثبت تأثیر می گذارد.
۲- استفاده از برچسب rel = canonical
برچسب canonical با نام مستعار ( “rel canonical”) روشی است که به موتورهای جستجو میگوید که یک URL خاص نمایانگر نسخه اصلی یک صفحه است. استفاده از برچسب متعارف از بروز مشکلات ناشی از نمایش محتوای یکسان یا “تکراری” در چندین URL جلوگیری می کند. و تمام پیوندها، معیارهای محتوا و “قدرت رتبهبندی” که موتورهای جستجو برای این صفحه اعمال میکنند باید برای آدرس مشخص شده اختصاص داده شوند.
ویژگی rel = “canonical” بخشی از عنوان HTML یک صفحه وب است و به صورت زیر استفاده میشود:
عبارت rel = canonical باید به اول HTML هر نسخه تکراری یک صفحه اضافه شود، در حالی که قسمت ” URL OF ORIGINAL PAGE” در بالا با پیوند به صفحه اصلی (متعارف) جایگزین شده است. (اطمینان حاصل کنید که گیومهها را نگه دارید.) ویژگی تقریبا همان مقدار از ارزش پیوند (قدرت رتبه بندی) را به عنوان تغییر مسیر ۳۰۱ منتقل می کند، و چون در سطح صفحه (به جای سرور) پیادهسازی میشود، معمولاً زمان کمتری برای پیاده سازی آن طول میکشد.
در زیر مثالی از rel = “canonical” در نشان میدهیم:
<head>…[other code that might be in your document’s HTML head]…<link href=”URL OF ORIGINAL PAGE” rel=”canonical” />…[other code that might be in your document’s HTML head]…</head>
اگرچه این صفحه توسط دو URL قابل دسترسی است، ویژگی rel = canonical اطمینان میدهد که کلیه ارزش پیوند و معیارهای محتوا به صفحه اصلی اعطا میشوند.
۳- استفاده از Meta Robots Noindex
یکی از برچسبهای متا که میتواند به ویژه در پرداختن به محتوای تکراری مفید باشد، رباتهای متا هستند که با مقادیر “noindex,follow” استفاده میشود. این ربات متا را که معمولاً Meta Noindex مینامند، از نظر فنی به عنوان محتوا “noindex,follow” میتوان به هر صفحه اضافه کرد که از فهرست موتور جستجو خارج شود.
برچسب رباتهای متا به موتورهای جستجو اجازه میدهد تا پیوندهای یک صفحه را بررسی کنند اما آنها را اثر بخشی در رتبهبندی بازمی دارد. مهم است که صفحه کپی همچنان قابل بررسی باشد. حتی اگر بخواهید که گوگل محتواها را در جستجوها نشان ندهد، اما صریحا گوگل تمایل دارد محتواها را بررسی کند و در صورت عدم توانایی در این کار به شما اخطار خواهد داد.
۴- مدیریت دامنه و پارامترهای ترجیحی در Google Search Console
گوگل سرچ کنسول به شما امکان میدهد دامنه مورد نظر سایت خود را تنظیم کنید (به عنوان مثال http://yoursite.com به جای http://www.yoursite.com) ) و تعیین کنید که آیا Googlebot باید پارامترهای مختلف URL را به طور متفاوتی بررسی کند. (مدیریت پارامترها).
بسته به ساختار URL شما و علت مشکلات محتوای تکراری، با راه اندازی دامنه یا پارامتر مورد نظر خود (یا هر دو!) ممکن است به راه حل مناسبی دست یابید.
اشکال اصلی استفاده از مدیریت پارامترها به عنوان روش اصلی شما در برخورد با محتوای تکراری این است که تغییراتی که ایجاد میکنید فقط برای گوگل کارساز است. قوانینی که با استفاده از Google Search Console وضع شده اند، تأثیری در نحوه تفسیر Bing یا سایر رباتها موتور جستجو از سایت شما ندارند. علاوه بر تغییرات تنظیمات در سرچ کنسول، باید از ابزارهای مدیر وب برای سایر موتورهای جستجو استفاده کنید.