Com detectar contingut duplicat a la teva botiga online
Laia Ordoñez
-
-
És més que sabut que el contingut duplicat és un dels factors que més problemes poden portar-te quan parlem de les penalitzacions de Google Panda, i per aquest motiu és fonamental saber com detectar contingut duplicat a la teva botiga online.
Però primer, diguem les coses com són: un ecommerce sempre tindrà contingut duplicat. Facis el que facis, tard o d'hora acabaràs tenint una mica de text duplicat en el teu site, bé sigui perquè facis servir un fragment d'un text proporcionat per un fabricant o inspirat en una altra web, bé sigui perquè simplement, per casualitat, utilitzis les mateixes paraules per expressar el mateix que un competidor. Hi ha descripcions de producte que no donen per més i de vegades no es pot reinventar la roda a l'hora d'explicar què són certs productes.
Però el que hem d'evitar sigui com sigui és l'excés de textos duplicats i d'URLs duplicades amb el mateix contingut. En aquest sentit, fa uns dies vam explicar com evitar aquestes URLs duplicades a través de l'arxiu robots.txt, i avui ens centrem en els textos duplicats.
-
Com detecta Google els duplicats?
-
Fa poc John Mueller de Google Webmaster Central va comentar en un hangout públic què és per a ells contingut duplicat i què no.
Per a Google, el contingut duplicat és:
- Pàgina exacta duplicada o mateix contingut (o mateixos fragments de contingut)
- URL duplicada amb www i sense www o amb http i https
- URL duplicades en versió escriptori i versió mobile: la clàssica web mobile que està en un subdomini tipus m.midominio.com i que és un duplicat adaptat a smartphone de la URL dominio.com
I el contingut no duplicat és:
- Diferents versions del mateix contingut traduïdes a diversos idiomes
- Pàgines diferents amb el mateix títol i descripció
- Contingut duplicat en apps
- Contingut localitzat duplicat
Tenint en compte això, Google filtra els duplicats així:
-
-
Com pots detectar tu els duplicats
-
Com pots imaginar, hi ha eines que poden ajudar-te a detectar aquests textos duplicats. Fer-ho a mà és un calvari i més si a la botiga online hi tenim moltes fitxes de producte.
La primera referència que farem servir serà Google Search Console (antic Webmaster Tools). Dins de les opcions de dades que ens dóna, trobarem "Aspecte de la cerca> Millores d'HTML". És el millor punt de partida per a començar, encara que només se centra en la meta informació (meta títol, meta descripció...), però podem assumir que si tenim aquest contingut duplicat, és molt probable que les descripcions de productes i de categories estiguin igualment duplicades.
-
-
Com realitzar una anàlisi similar a les descripcions de producte? L'eina gratuïta que millor acostuma a funcionar és Siteliner, que disposa d'una versió free amb limitacions que es poden solucionar pagant. La limitació principal de la versió gratuïta és la quantitat d'URLs a revisar. Siteliner analitza gratuïtament fins a 250 URLs del nostre site i ens diu si els textos que troba són originals, genèrics (molt semblants a d'altres que corren online i dins del nostre propi site) o, directament, duplicats. La versió de pagament de Siteliner ens permet analitzar fins a 25.000 URLs. El que obtindrem és un diagrama de formatge com aquest:
-
-
Enllaçat a un informe detallat de la quantitat de contingut duplicat de cada URL analitzada:
-
-
I la comparativa amb altres sites similars:
-
-
Altres eines que podem utilitzar (de pagament) són el Site Auditor de Raven Tools o la funcionalitat "Content> Duplicate Body Content" del crawler Deepcrawl, que ens proporcionaran dades detalladíssimes sobre contingut duplicat dins de les descripcions de productes.
Esperem que aquestes eines et serveixin per tenir el contingut duplicat sota control a la teva botiga online i evitar penalitzacions de Google. Que tinguis una feliç setmana!
Imatges | Google, Fotolia.