Při redesignu webu proběhlém před více než rokem došlo ke zrušení několika URL, které přiváděly určitou návštěvnost z vyhledávačů. Sledoval jsem, jak dlouho tyto URL zůstanou v indexu vyhledávačů. A držely se nečekaně dlouho.
Uvedení do kontextu
Nová verze lyžařského webu KamZaSněhem.cz byla spuštěna 26.10.2018. Šlo o redesign spojený s přechodem na HTTPS. Převážná většina URL byla zachována, menší část pak přesměrována. Jen několik málo URL jsem se rozhodl zrušit, či přesměrovat na jinou doménu.
KamZaSněhem.cz je webem existujícím déle než 10 let. Jeho návštěvnost je s ohledem na téma logicky značně sezónní a aktuálně překračuje milion návštěv za sezónu (vývoj po letech je vidět v sekci reklama). Většina návštěvnosti přichází z vyhledávačů, placený marketing ani emailing se nedělá. Indexovatelných URL web nemá moc, řekněme tisíce, s dříve indexovanými URL pro stránkování možná menší desetitisíce, ale těch zásadních je málo.
Zrušené vstupní stránky přiváděly desítky návštěv ročně. Pro každou ze 3 zrušených stránek jsem vybral frázi, která přiváděla nejvíce hledanosti. I tak šlo o velmi málo hledané fráze – dle statistik Google s hledaností 0 (= pod jeho rozlišovací hodnotu). Na Seznamu dvě ze frází nehledal za poslední rok vůbec nikdo, poslední z nich pak měla v průměru 2 hledání měsíčně. Vývoj pozic a vstupních stránek pro dané fráze jsem začal měřit s pomocí Marketing Mineru necelé 2 dny po spuštění nové verze webu a sledovány byly denně.
Někdo může (oprávněně) namítat, že dělat závěry z chování u vyhledávačů u 3 URL nejde. Na druhou stranu lepší než nic…
URL, které začaly vracet chybu 404
O existenci URL http://www.kamzasnehem.cz/bezky/luzicke-hory/horni-podluzi a http://www.kamzasnehem.cz/sjezdovky/jeseniky/hruby-jesenik jsem se dozvěděl asi až při kontrole statistik jednotlivých URL před redesignem. Evidentně šlo o stránky, které neměly nikterak relevantní obsah a vznikly omylem při nějaké chybě. Která nejspíš byla i opravena, ale vyhledávače ty URL stihly zaindexovat, aniž by na ně vedl dlouhodobě nějaký odkaz.
Tyto URL jsem 26.10.2018 nikam nepřesměroval a od té doby vrací chybu 404. Začal jsem sledovat pozice a vstupní stránky pro dotazy:
- běžky horní podluží – pro http://www.kamzasnehem.cz/bezky/luzicke-hory/horni-podluzi
- sjezdovky hrubý jeseník – pro http://www.kamzasnehem.cz/sjezdovky/jeseniky/hruby-jesenik
Google si držel v indexu původní stránku o běžkách v Horním Podluží dlouho, jen občas místo ní vracel URL s archivem zpráv http://www.kamzasnehem.cz/bezky/luzicke-hory/horni-podluzi?rok=2015_2016, která od redesignu také vedla na chybu 404. Až 26.9., tedy přesně 11 měsíců po zrušení dané URL, se ve výsledcích Google na dotaz „běžky horní podluží“ začala zobrazovat existující stránka, o sjezdovkách v Horním Podluží. Vývoj pozic a změn vstupních stránek ukazuje screenshot z Marketing Mineru.
Zkoumat chování Seznamu v tomto případě není potřeba, dané nesmyslné stránky si nevšiml nebo ji ignoroval.
Zrušená URL o sjezdovkách v Hrubém Jeseníku se poprvé přestala zobrazovat na dotaz „sjezdovky hrubý jeseník“ ve výsledcích Google už 6.11. Místo ní se tam však objevila URL se stránkováním http://www.kamzasnehem.cz/sjezdovky/jeseniky/hruby-jesenik?stranka=4. Protože jsme stránkování s redesignem zrušili, tato URL byla pomocí 301 přesměrována, nicméně cílová URL tohoto přesměrování zas vracela chybu 404. Již 16.11. se na daný dotaz začala zobrazovat URL existující a relevantní – https://www.kamzasnehem.cz/sjezdovky/jeseniky. Ale nevydržela tam dlouho. Google od té doby vystřídal ještě několik dalších URL se stránkováním včetně třeba http://www.kamzasnehem.cz/sjezdovky/jeseniky/hruby-jesenik?stranka=20. Až od 19.7.2019 je trvale vstupní stránkou zas výše zmíněná existující URL o sjezdovkách v Jeseníkách a nemění se.
Seznam si se stránkováním těchto URL nevěděl rady už dříve – v době spuštění redesignu vracel https://www.kamzasnehem.cz/sjezdovky/jeseniky/hruby-jesenik?stranka=22. Pak vystřídal množství URL po redesignu přesměrovaných na chybu 404, z nich nejbizarnější je https://www.kamzasnehem.cz/sjezdovky/jeseniky/hruby-jesenik?stranka=41. Ale už 5.3.2019 se těmito starými stránkami přestal zabývat a vybral si existující https://www.kamzasnehem.cz/lyzovani/jeseniky. Od té doby se vstupní stránka sice také mnohokrát změnila, ale to se nemůže rozhodnout mezi skutečně existujícími stránkami.
URL přesměrovaná na jinou doménu
V roce 2011 jsem na KamZaSněhem.cz umístil fotky z jedné skvělé dovolené, přestože se tam tematicky vůbec nehodily. Ale zveřejnění si zasloužily a neměl jsem je kam dát, tento blog ještě neexistoval. Na nový web jsem je již přenášet nechtěl a proto jsem pro fotky z Azor vytvořil samostatný článek zde. Nešlo o kopii 1:1 z hlediska obsahu, text jsem rozšířil a článek vydal několik měsíců před spuštěním nového KamZaSněhem.cz (to nebyl plán, ale vyplynulo to z okolností trochu naznačených v článku o mých aktivitách na částečné rodičovské).
Fotky se souhrnně nacházely na URL http://www.kamzasnehem.cz/fotky/azory, jejíž pozice jsem začal měřit pro dotaz „azory fotogalerie„. K tomu existovalo 27 fotek, každá na stránce s vlastní URL. I na blogu má každá fotka vlastní URL a 301 přesměrování na jinou doménu proběhlo 1:1.
Vstupní stránka se pro zmíněný dotaz na Google mnohokrát změnila. Vystřídalo se zde několik URL odpovídajících jednotlivým fotkám, jako například http://www.kamzasnehem.cz/fotky/azory/sao-miguel/lagoa-das-furnas-pico-do-ferro. Častokrát dokonce měla úspěch URL http://www.kamzasnehem.cz/fotky/azory/sao-miguel. Ta neměla žádný obsah, jak ukazuje její screenshot z archive.org, jen na ní vedly odkazy z drobečkové navigace.
Ta „původní správná“ URL http://www.kamzasnehem.cz/fotky/azory se téměř 20x vrátila, její návrat byl vždy spojen se zlepšením pozice (nejhůř na 4. místo, nejčastěji na 2.) a to často výrazným. A obráceně, změna vstupní stránky na jinou bývala spojena s propadem.
Zmíněná URL se nachází vysoko na Google i nyní – tedy více než 1 rok, 1 měsíc a 1 den po jejím přesměrování na jinou doménu. A co je ještě zajímavější, na dotaz „azory fotogalerie“ se mezi prvními třemi výsledky zobrazuje jak původní URL, tak stránka na nové doméně, na kterou je přesměrovaná.
Seznam byl i tentokrát rychlejší. URL na původní doméně zobrazoval naposledy 16.9.2019. A skutečně ji z indexu vyhodil – nezobrazila se ani v případě, kdy jsem ji do vyhledávacího pole vložil. To se na prvních pěti pozicích zobrazily URL z domény cestanahoru.cz.
Závěry
Co si z toho vzít v obecnější rovině? Může trvat opravdu dlouho, než zrušená URL zmizí z výsledků vyhledávaní. I pokud je URL zrušena přesměrováním, může zůstat indexována velmi dlouho. Obojí jsem pocitově sledoval i v jiných případech a u jiných webů, kde jsem to tak důkladně nezkoumal. A Seznam vyhazoval z indexu zrušené URL překvapivě rychleji než Google.
Domnívám se, že pokud v tomto lze něco zobecňovat, nebude to platit pro výrazně častěji hledané dotazy. Před pár lety jsem zkoumal chování Google v situaci, kdy nastal problém u domény Pepa.cz. Tam mizely URL z indexu o poznání rychleji, i když šlo o poněkud jiný příběh.