Es una pregunta sin respuesta que siempre circula en la comunidad SEO, y un usuario en Twitter le preguntó a John Mueller de Google si había algún tipo de porcentaje que las personas pudieran utilizar para determinar si su contenido puede considerarse duplicado o no. Mueller dijo que no hay ninguno y preguntó cómo medirías tal cosa.
Bill Hartzer hizo la pregunta, «¿hay un porcentaje que represente contenido duplicado?» Preguntó incluso si Google incluso lo mide.
John Mueller respondió diciendo, «no hay número» y luego preguntó, «¿cómo se mide de todos modos?»
Estos son esos tuits:
No hay número (también, ¿cómo se mide de todos modos?)
fuente: @JOHNMU 23 DE SEPTIEMBRE DE 2022
Pues bien, poco tenemos que discutirle a John Mueller, pero podemos detectar y medir el contenido duplicado dentro de una web. Escribí acerca de este tema hace un par de años.
Si bien el comentario de Mueller debe ser tenido en cuenta, es como siempre, un poco tirar balones fuera. El contenido duplicado es un problema muy común en las webs, especialmente para aquellas que generan algún tipo de listado como pueden ser las e-Commerce.
¿Qué vas a leer?
¿Cómo detectar contenido con Screaming Frog?
La manera más eficaz de ponerle un número al contenido duplicado es con la función de Screaming Frog «Duplicados». Esta función, una vez configurada, permite detectar qué páginas dentro de una misma web contienen el mismo contenido, y en qué porcentaje.
Este tipo de auditoría está centrada de manera exclusiva a detectar el contenido duplicado dentro del un mismo sitio.
- Configura Screaming Frog para detectar contenido duplicado
- Rastrea todo el sitio
- Realiza un análisis de rastreo
- Determina qué es contenido duplicado
Configura Screaming Frog para detectar contenido duplicado
En el menú superior de la herramienta, debes ir a Configuración > Contenido > Duplicados. en la ventana emergente, podrás determinar cuál es el límite a partir del cuál quieres detectar en contenido duplicado:
En este caso yo me decanté por el 75%, que cualquier contenido que supere ese porcentaje los consideraré contenido duplicado.
Rastrea todo el sitio utilizando Screaming Frog
Realiza un rastreo de todo el sitio utilizando la opción «Spider», de esta manera podrás extraer todas las URLs del sitio, y no solo las que estás enviando a Google mediante el sitemap.
Realiza un análisis de rastreo
Una vez finalizado el rastreo del sitio, debes proceder al análisis de ese rastreo. Para ellos debes ir a Análisis de rastreo > Empezar. Dependiendo del tamaño del sitio, demorará lo suyo, pero suele ser rápido.
Una vez finalizado, en la solapa Contenido encontrarás la columna «Coincidencia de similitud más cercana«, que no es otra cosa que el porcentaje del contenido de esa URL que está duplicado.
Determina qué es contenido duplicado
Para determinar qué piezas del contenido de una URL está duplicado. Para ello debes ir a la opción «Detalles de duplicados» en menú de opciones inferior de la ventana de Screaming Frog.
Al momento de seleccionar una URL de contenido, en la parte inferior podrás ver cuáles son las diferencias entre las URLs que la herramienta considera contenido duplicado y cuáles son las diferencias entre una y otra. En este ejemplo, las diferencias están resaltadas en verde y rojo entre una URL y otra.
Si quieres saber más sobre contenido duplicado y cómo actuar, te recomiendo estos dos artículos en mi blog: