Duplicitní obsah je definován jako obsah, který je přesnou kopií obsahu nalezeného jinde. Termín duplicitní obsah se může vztahovat i na téměř identický obsah (například pouze výměna názvu produktu, značky nebo lokality). Pouhá výměna několika slov nemusí nutně zachránit stránku před tím, aby byla považována za duplicitní obsah. V reakci na to může dojít k negativnímu ovlivnění výkonu vašeho organického vyhledávání.
Duplicitní obsah se týká také obsahu, který je stejný na více stránkách vašeho webu. Duplicitě se nevyhnete ani když stejný obsah publikujeta na více samostatných webech. Existuje však mnoho metod, jak zabránit duplicitnímu obsahu nebo minimalizovat jeho dopad, které lze řešit technickými opravami.
Vliv duplicitního obsahu
Stránky vytvořené s naprosto stejným obsahem mohou mít za následek několik důsledků ve výsledcích vyhledávání Google a někdy i sankce. Mezi nejčastější problémy s duplicitním obsahem patří:
- Špatná verze stránek zobrazující se v SERP
- Klíčové stránky, které se neočekávaně špatně zobrazují v SERP nebo mají problémy s indexací.
- Kolísání nebo pokles hlavních metrik webu (návštěvnost, pozice na žebříčku nebo kritéria E-A-T).
- Další neočekávané akce vyhledávačů v důsledku matoucích signálů o prioritě.
Ačkoli si nikdo není jistý, které prvky obsahu budou společností Google upřednostňovány a které nikoli, gigant vyhledávačů vždy doporučoval webmasterům a tvůrcům obsahu, aby „vytvářeli stránky především pro uživatele, nikoli pro vyhledávače„.
S ohledem na tuto skutečnost by výchozím bodem pro každého webmastera nebo SEO optimalizátora mělo být vytváření jedinečného obsahu, který uživatelům přináší jedinečnou hodnotu. To však není vždy snadné a ani možné. Faktory, jako je šablonování obsahu, funkce vyhledávání, značky UTM, sdílení informací nebo syndikace obsahu, mohou být zatíženy rizikem duplicity.
Zajistit, aby na vlastním webu nehrozilo riziko duplikace obsahu, znamená kombinaci jasné architektury, pravidelné údržby a technického porozumění, abyste co nejvíce bojovali proti vytváření identického obsahu.
Prevence duplicitního obsahu
Existuje mnoho různých metod a strategií, jak zabránit vytváření duplicitního obsahu na vlastních stránkách a jak zabránit jiným stránkám, aby těžily z kopírování vašeho obsahu:
- Taxonomie
- Kanonické značky
- Meta tagy
- Zpracování parametrů
- Duplicitní adresy URL
- Přesměrování
Už jste četli? Bořivoj
Taxonomie
Pro začátek je vhodné se obecně podívat na taxonomii vašeho webu. Ať už máte nový, stávající nebo revidovaný dokument, zmapování stránek z procházení a přiřazení jedinečného klíčového slova H1 a zaměření je skvělým začátkem. Uspořádání obsahu do tematického shluku vám pomůže vytvořit promyšlenou strategii, která omezí duplicity.
Kanonické značky
Pravděpodobně nejdůležitějším prvkem v boji proti duplicitě obsahu na vlastním webu nebo na více webech jsou značky Canonical Tags.
Prvek rel=canonical je kousek kódu HTML, který dává společnosti Google jasně najevo, že vydavatel vlastní část obsahu, i když jej lze najít i jinde. Tyto značky označují pro Google, která verze stránky je „hlavní verzí“.
Značku canonical lze použít pro tiskové a webové verze obsahu, verze stránek pro mobilní zařízení a pro stolní počítače nebo pro stránky zaměřené na více umístění. Lze jej použít i pro všechny ostatní případy, kdy existují duplicitní stránky, které vycházejí z hlavní verze stránky.
Existují dva typy kanonických značek, ty, které odkazují na stránku, a ty, které odkazují od stránky. Ty, které odkazují na jinou stránku, říkají vyhledávačům, že jiná verze stránky je „hlavní verzí“.
Druhým typem jsou ty, které se samy rozpoznají jako hlavní verze, známé také jako kanonické značky odkazující samy na sebe. Odkazující kanonické značky jsou nezbytnou součástí rozpoznávání a odstraňování duplicitního obsahu a samoodkazující kanonické značky jsou záležitostí správné praxe.
Metaznačky
Další užitečnou technickou položkou, na kterou je třeba se zaměřit při analýze rizika identického obsahu na vašem webu, jsou metaroboti a signály, které aktuálně vysíláte ze svých stránek vyhledávačům.
Značky Meta robots jsou užitečné, pokud chcete určitou stránku nebo stránky vyloučit z indexace Googlem a chcete, aby se ve výsledcích vyhledávání nezobrazovaly.
Přidáním značky metarobotů „no index“ do kódu HTML stránky účinně sdělíte společnosti Google, že si nepřejete, aby se zobrazovala ve vyhledávačích SERP. Jedná se o upřednostňovanou metodu před blokováním souboru Robots.txt, protože tato metodika umožňuje podrobnější blokování konkrétní stránky nebo souboru, zatímco u souboru Robots.txt se většinou jedná o rozsáhlejší akci.
Ačkoli tento pokyn může být vydán z mnoha důvodů, Google tento pokyn pochopí a měl by duplicitní stránky ze SERP vyloučit.
Zacházení s parametry
Parametry URL naznačují vyhledávačům, jak efektivně a účinně procházet stránky. Parametry často způsobují duplikaci obsahu, protože jejich použití vytváří kopie stránky. Pokud by například existovalo několik různých stránek stejného produktu, společnost Google by je považovala za shodný obsah.
Zpracování parametrů však usnadňuje efektivnější a účinnější prohledávání stránek. Přínos pro vyhledávače je prokazatelný a jejich řešení, aby se zabránilo vytváření duplicitního obsahu, je jednoduché. Zejména u větších webů a webů s integrovanou funkcí vyhledávání je důležité používat manipulaci s parametry prostřednictvím služby Google Search Console a Bing Webmaster Tools.
Označením parametrizovaných stránek v příslušném nástroji a signalizací společnosti Google může být vyhledávači jasné, že tyto stránky nemají být procházeny a jaké případné další kroky má podniknout.
Duplicitní adresy URL
Problémy s duplikací může na webových stránkách způsobit několik strukturálních prvků URL. Mnohé z nich jsou způsobeny způsobem, jakým vyhledávače vnímají adresy URL. Pokud neexistují žádné další směrnice nebo pokyny, bude jiná adresa URL vždy znamenat jinou stránku.
Tato nejasnost nebo neúmyslná špatná signalizace může způsobit výkyvy nebo pokles hlavních metrik webu (návštěvnost, pozice na žebříčku nebo kritéria E-A-T), pokud se neřeší. Jak jsme již uvedli, parametry URL způsobené funkcemi vyhledávání, sledovacími kódy a dalšími prvky třetích stran mohou způsobit vytvoření více verzí stránky.
Mezi nejčastější způsoby, jak mohou vznikat duplicitní verze adres URL, patří např: HTTP a HTTPS verze stránek, www. a newww. a stránky s koncovými lomítky a bez nich.
V případě www. vs. newww a koncové lomítko vs. bez koncového lomítka je třeba určit verzi, která se na webu používá nejčastěji, a této verze se držet na všech stránkách, abyste se vyhnuli riziku duplicity. Dále je třeba nastavit přesměrování na tu verzi stránky, která má být indexována, a odstranit riziko duplicity, např. mysite.com > www.mysite.com.
Na druhou stranu adresy URL HTTP představují bezpečnostní problém, protože verze stránky HTTPS by používala šifrování (SSL), čímž by byla stránka bezpečná.
Přesměrování
Přesměrování jsou velmi užitečná pro eliminaci duplicitního obsahu. Stránky duplikované z jiné lze přesměrovat a vrátit zpět na hlavní verzi stránky.
Pokud jsou na vašem webu stránky s velkým objemem návštěvnosti nebo hodnotou odkazů, které jsou duplicitní z jiné stránky, může být přesměrování vhodnou možností, jak tento problém vyřešit.
Při použití přesměrování k odstranění duplicitního obsahu je třeba mít na paměti dvě důležité věci: vždy přesměrujte na stránku s vyšším výkonem, abyste omezili dopad na výkon webu, a pokud je to možné, použijte přesměrování 301. Pokud chcete získat více informací o tom, jaká přesměrování zavést, přečtěte si našeho průvodce přesměrováním 301.
Co když byl můj obsah zkopírován proti mé vůli?
Co byste měli dělat, pokud byl váš obsah zkopírován a vy jste nepoužili kanonickou značku, která by označovala, že váš obsah je původní?
- Pomocí nástroje Search Console zjistěte, jak pravidelně je váš web indexován.
- Kontaktujte správce webu odpovědného za web, který zkopíroval váš obsah, a požádejte ho o akreditaci nebo odstranění.
- Používejte samoodkazovací kanonické značky u veškerého nově vytvořeného obsahu, abyste zajistili, že váš obsah bude rozpoznán jako „skutečný zdroj“ informací.
Kontrola duplicitního obsahu
Zamezení duplicitnímu obsahu začíná zaměřením na vytváření jedinečného kvalitního obsahu vašeho webu; postupy, jak se vyhnout riziku, že vás ostatní zkopírují, však mohou být složitější. Nejbezpečnějším způsobem, jak se vyhnout problémům s duplicitním obsahem, je pečlivě promyslet strukturu webu a zaměřit se na uživatele a jejich cesty na webu. Pokud dojde k duplikaci obsahu z technických důvodů, popsané taktiky by měly riziko pro váš web zmírnit.
Při zvažování rizik duplicitního obsahu je důležité vyslat společnosti Google správné signály, aby označila váš obsah jako původní zdroj. To platí zejména v případě, že je váš obsah syndikován nebo jste zjistili, že váš obsah byl již dříve replikován z jiných zdrojů.
V závislosti na tom, jakým způsobem k duplikaci došlo, můžete použít jednu nebo více taktik, abyste stanovili, že obsah má původní zdroj a ostatní verze rozpoznali jako duplikáty.

