Az URL paraméterek helyes kezelése a Google Search Console-ban

Üdvözöljük a digitális marketing és a keresőoptimalizálás komplex világában! Ha valaha is foglalkozott már weboldal-üzemeltetéssel, SEO-val, vagy egyszerűen csak azon gondolkodott, hogyan „látja” a Google az Ön webhelyét, akkor valószínűleg találkozott már az URL paraméterek fogalmával. Ezek a kis kiegészítések, amelyek az URL-ek végén, egy kérdőjel után jelennek meg, első pillantásra ártalmatlannak tűnhetnek, de helytelen kezelésük komoly problémákat okozhat a weboldal láthatóságában és rangsorolásában. Ebben a cikkben mélyrehatóan tárgyaljuk, hogyan működnek az URL paraméterek, miért fontos a helyes kezelésük a SEO szempontjából, és hogyan igazodjunk el a Google Search Console (GSC) adta lehetőségek (és változások) között, hogy webhelyünk a lehető legjobban teljesítsen a keresőmotorokban.

Mi az az URL paraméter és miért jelent kihívást?

Az URL paraméterek olyan változó értékek, amelyeket az URL-hez fűzünk, hogy dinamikusan módosítsuk a weboldal tartalmát vagy funkcióját anélkül, hogy különálló URL-t hoznánk létre minden egyes variációhoz. Jellemzően egy kérdőjel (?) után következnek, és egy kulcs-érték párból állnak, például ?szin=piros vagy ?oldal=2. Több paramétert az ‘&’ (ampersand) jellel választunk el: ?szin=piros&meret=XL.

Gyakori felhasználási területeik:

Szűrés és rendezés: Például egy webshopban a termékek rendezése ár, méret vagy szín szerint (/termekek?szin=kek, /termekek?rendezes=ar_csokkeno).
Lapozás: Egy blog vagy fórum következő oldalai (/blog?oldal=2).
Keresési eredmények: A belső keresőmotor által generált oldalak (/kereses?q=seo).
Kampánykövetés (UTM paraméterek): Marketingkampányok forrásának azonosítása (?utm_source=google&utm_medium=cpc).
Szekció azonosítók: Ritkábban, de néha a felhasználói munkamenetek azonosítására is használják.

Miért jelentenek kihívást ezek a paraméterek a SEO szempontjából? A fő probléma a duplikált tartalom és a kúszási költségvetés (crawl budget) pazarlása. A Google keresőmotorja minden olyan URL-t külön entitásként érzékel, amelynek tartalma lényegében megegyezik egy másikkal. Ha például van egy termékoldalunk /termek/piros-cipo címen, és létezik hozzá egy szűrt változat /termek/piros-cipo?szin=piros, amely pontosan ugyanazt a tartalmat jeleníti meg, akkor a Google számára ez két azonos tartalmú oldalnak minősül. Ez zavart okozhat a rangsorolásban, és hígíthatja a linkértéket.

Ezenkívül, a keresőrobotok rengeteg időt és erőforrást pazarolhatnak arra, hogy felkutassák és indexeljék az URL paraméterek által generált, lényegében azonos tartalmú oldalakat. Ez a kúszási költségvetés pazarlásához vezethet, ami azt jelenti, hogy a Google kevesebb időt tud fordítani az igazán fontos, egyedi tartalmú oldalaink felfedezésére és indexelésére. Kisebb webhelyek esetében ez nem feltétlenül jelent azonnali katasztrófát, de nagyobb oldalak, webshopok vagy dinamikusan generált tartalmak esetén komoly indexelési problémákhoz vezethet.

Hogyan viszonyul a Google az URL paraméterekhez?

A Google célja mindig is az volt, hogy a felhasználók számára a legrelevánsabb és legjobb minőségű tartalmat mutassa meg. Ennek érdekében a keresőmotor folyamatosan fejleszti algoritmás képességeit, hogy megértse és kezelje a webhelyek összetettségét, beleértve az URL paramétereket is. A Google azt szeretné azonosítani, hogy az adott paraméterezett URL valójában egy „kanonikus” (eredeti, legfontosabb) tartalom egy variációja-e, vagy egy teljesen új, indexelésre érdemes oldal.

A Google automatikusan próbálja felismerni a paraméterek funkcióját. Például, az UTM paraméterek (utm_source, utm_medium, stb.) esetében a Google általában intelligensen ignorálja őket az indexelés szempontjából, és a paraméterek nélküli URL-t tekinti kanonikusnak. Azonban más paraméterek, mint például a szűrők vagy rendezések, már összetettebb kihívást jelentenek, és ezekhez szükség van a webmester segítségére.

Történelmileg a Google Search Console rendelkezett egy „URL paraméterek” eszközzel, amely lehetővé tette a webmesterek számára, hogy direkt módon tájékoztassák a Google-t az adott paraméterek kezeléséről. Ez az eszköz rendkívül hasznos volt a duplikált tartalom és a kúszási költségvetés optimalizálásában, különösen a dinamikusan generált URL-ek esetében.

A Google Search Console és az URL paraméterek kezelése: Történelem és Jelen

Ahogy fentebb említettem, a Google Search Console (GSC) sokáig kínált egy dedikált eszközt az URL paraméterek kezelésére. Ez az „URL paraméterek” eszköz lehetővé tette a webmestereknek, hogy beállítsák, hogyan kezelje a Google az adott paramétereket (pl. ignorálja-e, ha változik, vagy indexeljen-e új URL-ként). Ez egy rendkívül erős és közvetlen vezérlési lehetőség volt, amivel például jelezhettük, hogy az ?szin= paraméter nem módosítja a tartalom lényegét, így a Google-nak nem kellene indexelnie az ebből fakadó variációkat.

A nagy változás: Az eszköz megszüntetése 2022 áprilisában.
A Google 2022. április 19-én hivatalosan is bejelentette az „URL paraméterek” eszköz végleges megszüntetését a Search Console-ból. Ez a hír sok webmestert meglepett, és felvetette a kérdést: miért? A Google indoklása szerint az évek során jelentősen javultak algoritmusaik a paraméterek felismerésében és kezelésében, így az eszközre már nem volt szükség. Azt állították, hogy a legtöbb webhely számára az eszköz már nem volt kritikus, sőt, egyes esetekben helytelen használata akár kárt is okozhatott.

Mit jelent ez a webmesterek számára? A legfontosabb üzenet az, hogy a Google ma már sokkal autonómabban képes értelmezni és kezelni az URL paramétereket. Azonban ez nem jelenti azt, hogy nekünk, mint webmestereknek, ne kellene proaktívan tennünk a kanonizálás érdekében. Sőt, mivel nincs már közvetlen paraméterkezelő eszköz, még inkább felértékelődik a megfelelő technikai SEO beállítások alkalmazása webhelyünkön.

A Google azt javasolja, hogy a kanonikus URL beállításaival, a robots.txt fájl használatával és a noindex meta taggel szabályozzuk az indexelést és a kúszást. A következő fejezetben részletesen bemutatjuk ezeket a modern stratégiákat és a legjobb gyakorlatokat.

A Modern Megoldások és a Legjobb Gyakorlatok

1. A Kanonikus URL (`rel="canonical"`) Tag

Ez a tag az egyik legerősebb eszköz a duplikált tartalom kezelésére. A <link rel="canonical" href="https://pelda.hu/eredeti-oldal"> tag segítségével jelezhetjük a keresőmotoroknak, hogy az adott oldalnak van egy „preferált” vagy „kanonikus” verziója, amit szeretnénk, ha indexelnének és rangsorolnának. Minden más URL-t, amely ugyanazt a tartalmat mutatja, egyszerűen ezen az elsődleges URL-en keresztül fognak kezelni.

Mikor használjuk?

Szűrők és rendezések: Ha az URL paraméterek csak a tartalom megjelenítését módosítják (pl. szín, méret, ár szerinti rendezés), de nem adnak hozzá új, egyedi tartalmat. Ebben az esetben a paraméterezett URL-ek mutassanak a paraméter nélküli, alap URL-re.
Lapozás: Bár a Google sokszor képes felismerni a lapozott oldalakat, a rel="canonical" segít elkerülni a duplikált tartalom problémáját. Egyes esetekben érdemes lehet az első lapot kanonikusnak beállítani, ha a lapozott oldalak tartalma kevésbé releváns.
A/B tesztelés: Ha ugyanazt az oldalt több URL-en is teszteljük, a tesztelt változatok kanonikus tagja mutasson az eredeti, indexelni kívánt URL-re.
UTM paraméterek: Bár a Google többnyire intelligensen kezeli ezeket, egyértelmű kanonikus tag beállítása sosem árt.
Szekció azonosítók vagy alias URL-ek: Ha a CMS-ünk különböző URL-eken keresztül éri el ugyanazt a tartalmat.

Implementáció: A kanonikus tagot általában az oldal <head> szekciójában helyezzük el. Fontos, hogy abszolút URL-eket használjunk (pl. https://pelda.hu/oldal, és ne /oldal), és győződjünk meg róla, hogy csak egy kanonikus tag van egy oldalon.

2. Robots.txt

A robots.txt fájl arra szolgál, hogy utasításokat adjon a keresőmotorok robotjainak arról, hogy melyik részeire kúszhatnak rá a webhelynek, és melyekre nem. A Disallow direktívával megakadályozhatjuk, hogy a Googlebot felkutasson bizonyos URL-eket vagy URL mintákat.

Mikor használjuk? Akkor ideális, ha nagyszámú, teljesen felesleges, értéktelen paraméterezett URL-ünk van, amit semmiképpen sem szeretnénk, ha a Google felkeresne. Például, ha egy oldalon végtelen számú szűrési kombináció jöhet létre, amelyek alig tartalmaznak releváns tartalmat, és pazarlnák a kúszási költségvetést. A Disallow: /*paraméterneve= vagy Disallow: /*?paraméterneve= formátumú szabályokkal tudunk blokkolni.

Mire figyeljünk? A robots.txt csak a kúszást tiltja meg, az indexelést nem. Ha egy külső webhely linkel egy robots.txt-vel tiltott, de kanonikus tag nélküli oldalra, a Google akkor is indexelheti az URL-t (tartalom nélkül), ami negatívan befolyásolhatja a SEO-t. Ezért a robots.txt-t óvatosan és megfontoltan kell használni, elsősorban a kúszási költségvetés optimalizálására, és nem a duplikált tartalom kezelésére. Ha egy oldalt nem szeretnénk indexeltetni, a noindex tag megbízhatóbb.

3. Noindex Meta Tag

A <meta name="robots" content="noindex, follow"> tag segítségével direkt módon tudjuk utasítani a Google-t, hogy ne indexelje az adott oldalt, de engedélyezzük, hogy kövesse a rajta található linkeket. Ez azt jelenti, hogy az oldal nem jelenik meg a keresési eredmények között, de a rajta lévő linkek továbbra is átadják a linkértéket.

Mikor használjuk? Akkor érdemes, ha az oldalnak kúszhatónak kell lennie (pl. belső linkeken keresztül elérhető), de nem szeretnénk, ha megjelenne a Google találatai között. Például, bizonyos belső keresési eredmény oldalak, felhasználói profil oldalak, vagy ideiglenes landing oldalak esetében. A noindex tag megbízhatóbb, mint a robots.txt a tényleges indexelés megakadályozására, mivel a Google látja a taget, és ennek megfelelően jár el.

4. Tiszta URL-ek (Clean URLs)

A legjobb megoldás sok esetben az, ha teljesen elkerüljük az URL paraméterek használatát a releváns, indexelni kívánt oldalak esetében. A „tiszta” URL-ek, amelyek hierarchikus mappastruktúrára épülnek (pl. /termekek/piros-cipo a /termekek?szin=piros helyett), felhasználóbarátabbak, könnyebben megjegyezhetők, és gyakran SEO-barátabbak.

Ezt URL átírási szabályokkal (URL rewriting, pl. Apache mod_rewrite vagy Nginx rewrite szabályok) lehet elérni. Bár ez technikai beavatkozást igényel, hosszú távon megtérülő befektetés a jobb felhasználói élmény és a SEO szempontjából.

5. Belső Linkelési Stratégia

Mindig törekedjünk arra, hogy a weboldalon belüli linkjeink a kanonikus URL-ekre mutassanak. Ha a belső linkjeink paraméterezett, nem indexelendő URL-ekre mutatnak, az összezavarhatja a Google-t, és feleslegesen pazarolja a kúszási költségvetést. Egy konzisztens belső linkstruktúra segít a Google-nek megérteni a webhely hierarchiáját és a fontos oldalak azonosítását.

A Google Search Console mint diagnosztikai eszköz a paraméterekkel kapcsolatos problémákhoz

Bár a dedikált „URL paraméterek” eszköz megszűnt, a Google Search Console továbbra is felbecsülhetetlen értékű diagnosztikai eszköz a paraméterekkel kapcsolatos problémák azonosításában és kezelésében.

1. URL-ellenőrző eszköz (URL Inspection Tool)

Ez az eszköz az egyik legfontosabb a GSC-ben. Bármelyik URL-t beírva ellenőrizhetjük, hogy a Google hogyan látja az oldalt. Megtudhatjuk:

Indexelési állapot: Indexelt-e az oldal, vagy van-e valamilyen probléma (pl. „Kizárt: Kanonikus URL-ként jelölt, de nem a Google által választott kanonikus”).
Google által kiválasztott kanonikus URL: A Google jelzi, hogy melyik URL-t tartja az adott oldal kanonikus verziójának. Ha ez nem az Ön által elvárt URL, akkor valószínűleg a rel="canonical" tag vagy más beállítások hibásak.
Feltérképezési állapot: Mikor járt utoljára a Googlebot az oldalon, és volt-e bármilyen hiba.

Rendszeresen ellenőrizze a paraméterezett URL-eket ezzel az eszközzel, hogy megbizonyosodjon arról, hogy a Google a kívánt módon kezeli őket.

2. Indexelési jelentés (Indexing Coverage Report)

Ez a jelentés átfogó képet ad arról, hány URL-t indexelt a Google a webhelyéről, és hányat zárt ki, vagy tapasztalt hibát. Különösen figyeljen a „Kizárt” szekcióra, ahol olyan okokat találhat, mint:

„Keresztülkúszott, de nincs indexelve”
„Kizárt: Duplikált, a Google által választott kanonikus URL nem ez az oldal”
„Kizárt: Duplikált, felhasználó által megadott kanonikus URL nem ez az oldal”
„Kizárt: noindex tag”

Ezek a státuszok mind arra utalhatnak, hogy a paraméterek miatt duplikált tartalom problémákkal küzd, vagy a kanonikus URL beállítása nem a kívánt módon működik. A jelentés segítségével azonosíthatja a problémás URL mintákat.

3. Kúszási statisztikák (Crawl Stats)

A kúszási statisztikák jelentés segít megérteni, hogyan interaktál a Googlebot a webhelyével. Figyelje a „Feltérképezett URL-ek” számát és az „Átlagos válaszidőt”. Ha azt látja, hogy a Googlebot aránytalanul sok időt tölt paraméterezett URL-ek feltérképezésével, amelyek nem hoznak hozzáadott értéket, az azt jelenti, hogy a kúszási költségvetése nem optimálisan van felhasználva. Ez esetben érdemes megfontolni a robots.txt vagy a noindex tagek stratégiai alkalmazását.

Gyakori hibák és elkerülésük

Hibás kanonikus tag beállítás: Relatív URL használata abszolút helyett, vagy több rel="canonical" tag elhelyezése egy oldalon. Mindig abszolút URL-t használjon, és csak egyet!
Rossz kanonikus cél: Egy releváns oldalt egy irreleváns vagy nem létező oldalra kanonizálni. Mindig a legfontosabb, indexelni kívánt oldalra mutasson a kanonikus tag.
Robots.txt túlzott használata: Túl sok oldal vagy paraméter blokkolása a robots.txt-vel, ami a kanonikus tag és a noindex tag felfedezését is megakadályozza. Ha a Google nem tudja feltérképezni az oldalt, nem látja a kanonikus taget sem, így nem tudja helyesen kezelni a duplikátumot.
noindex tag elrejtése robots.txt-vel: Ha egy oldalt noindex taggel láttunk el, de a robots.txt-ben letiltjuk a kúszását, akkor a Google sosem fogja látni a noindex tag-et, és az oldal továbbra is megjelenhet a keresési eredmények között. A noindex tag csak akkor működik, ha az oldal kúszható.
Az UTM paraméterek túlaggódása: A Google intelligensen kezeli az UTM paramétereket, általában ignorálja őket az indexelés szempontjából. A kanonikus tag beállítása jó gyakorlat, de a robots.txt blokkolása felesleges lehet.

Összegzés és Jövőkép

Az URL paraméterek kezelése a SEO egyik legfinomabb területe, amely precizitást és folyamatos odafigyelést igényel. Bár a Google egyre okosabb és algoritmikusan egyre jobban megérti a webhelyek struktúráját, a webmesterek feladata továbbra is az, hogy a lehető legtisztább és legegyértelműbb jelzéseket adják a keresőmotoroknak.

A GSC dedikált paraméterkezelő eszközének megszüntetése egyértelműen azt jelzi, hogy a Google a weboldalaink saját, belső optimalizálására helyezi a hangsúlyt. A rel="canonical" tag ma már messze a legfontosabb eszköz a duplikált tartalom kezelésére és a megfelelő oldal indexelésére.

Rendszeresen ellenőrizze a Google Search Console jelentéseit, különösen az URL-ellenőrző eszköz és az Indexelési jelentés adatait. Legyen proaktív a tiszta URL-ek kialakításában, és gondosan alkalmazza a robots.txt és a noindex meta tag direktívákat. Ezekkel a stratégiákkal biztosíthatja, hogy webhelye hatékonyan használja fel a kúszási költségvetést, elkerülje a duplikált tartalom problémákat, és optimálisan rangsoroljon a Google keresési eredményei között.

A SEO egy folyamatosan fejlődő terület, és az URL paraméterek kezelése is a folyamatos tanulás és alkalmazkodás része. A modern stratégiák elsajátításával és a GSC adta lehetőségek maximális kihasználásával Ön is mesterien kezelheti ezt a komplex kihívást, és stabil alapokat teremthet webhelye online sikeréhez.