Cómo detectar contenido duplicado en tu tienda online
Laia Ordoñez
-
-
Es más que sabido que el contenido duplicado es uno de los factores que más problemas pueden traerte cuando hablamos de las penalizaciones de Google Panda, y por este motivo es fundamental saber cómo detectar contenido duplicado en tu tienda online.
Pero primero, digamos las cosas cómo son: un ecommerce siempre tendrá contenido duplicado. Hagas lo que hagas, tarde o temprano acabarás teniendo algo de texto duplicado en tu site, bien sea porque uses un fragmento de un texto proporcionado por un fabricante o inspirado en otra web, bien sea porque simplemente, por casualidad, utilices las mismas palabras para expresar lo mismo que un competidor. Hay descripciones de productos que no dan para más y a veces no se puede reinventar la rueda a la hora de explicar qué son ciertos productos.
Pero lo que debemos evitar a toda costa es el exceso de textos duplicados y de URLs duplicadas con el mismo contenido. En este sentido, hace unos días explicamos cómo evitar dichas URLs duplicadas a través del archivo robots.txt, y hoy nos centramos en los textos duplicados.
-
¿Cómo detecta Google los duplicados?
-
Hace poco John Mueller de Google Webmaster Central comentó en un hangout público qué es para ellos contenido duplicado y qué no.
Para Google, el contenido duplicado es:
- Página exacta duplicada o mismo contenido (o mismos fragmentos de contenido)
- URL duplicada en www y sin www o en http y https
- URLs duplicadas en versión escritorio y versión mobile: la clásica web mobile que está en un subdominio tipo m.midominio.com y que es un duplicado adaptado a smartphone de la URL dominio.com
Y el contenido no duplicado es:
- Diferentes versiones del mismo contenido traducidas a varios idiomas
- Páginas diferentes con el mismo título y descripción
- Contenido duplicado en apps
- Contenido localizado duplicado
Teniendo en cuenta esto, Google filtra los duplicados así:
-
-
Cómo puedes detectar tú los duplicados
-
Como imaginarás, hay herramientas que pueden ayudarnos a detectar dichos textos duplicados. Hacerlo a mano es un calvario y más si en la tienda online tenemos muchas fichas de producto.
La primera referencia que utilizaremos será Google Search Console (antiguo Webmaster Tools). Dentro de las opciones de datos que nos da, encontraremos “Aspecto de la búsqueda > Mejoras de HTML”. Es el mejor punto de partida para empezar, aunque sólo se centra en la meta-información (meta título, meta descripción…), pero podemos asumir que si tenemos ese contenido duplicado, es muy probable que las descripciones de productos y de categorías estén igualmente duplicadas.
-
-
¿Cómo realizar un análisis similar en las descripciones de producto? La herramienta gratuita que mejor suele funcionar es Siteliner, que dispone de una versión free con limitaciones que pueden solucionarse pagando. La limitación principal de la versión gratuita es la cantidad de URLs a revisar. Siteliner analiza gratuitamente hasta 250 URLs de nuestro site y nos dice si los textos que encuentra son originales, genéricos (muy parecidos a otros que corren online y dentro de nuestro propio site) o, directamente, duplicados. La versión de pago de Siteliner nos permite analizar hasta 25.000 URLs. Lo que obtendremos es un diagrama de quesito como este:
-
-
Enlazado a un informe detallado de la cantidad de contenido duplicado de cada URL analizada:
-
-
Y la comparativa con otros sites similares:
-
-
Otras herramientas que podemos utilizar (de pago) son el Site Auditor de Raven Tools o la funcionalidad “Content > Duplicate Body Content” del crawler Deepcrawl, que nos proporcionarán datos detalladísimos sobre contenido duplicado dentro de las descripciones de productos.
Esperamos que estas herramientas te sirvan para tener el contenido duplicado bajo control en tu tienda online y evitar penalizaciones de Google. ¡Que tengas una feliz semana!
Imágenes | Google, Fotolia.