Cómo detectar contenido duplicado en WordPress

Cómo detectar contenido duplicado en WordPress

El contenido duplicado es común en muchos sitios web y, a menudo, sin malicia. El contenido copiado no se penaliza, pero tampoco suele ser una configuración óptima para las páginas. Cuida tus textos para hacerlos únicos.

El contenido duplicado significa que cierto contenido de tu sitio web está disponible varias veces en internet.

Esto tiene grandes desventajas para todas las partes involucradas, tanto para el creador como para el «ladrón», y generalmente terminan en una posición mala (o ninguna) en los resultados de búsqueda de Google.

Sin embargo, dicho contenido duplicado también puede ocurrir dentro de tu sitio web de WordPress.

Afortunadamente, puedes usar plugins para configurar tu sitio de modo que Google no se vea perjudicado por este contenido duplicado.

Google «no penaliza» los sitios web con contenido duplicado, es uno de los mitos del SEO.

Existen diferentes tipos de problemas de contenido que pueden afectar a tu sitio, desde los basados ​​en URL hasta contenido físico duplicado, que en realidad se replica de página en página sin apenas cambios.

Identificar estos problemas de contenido duplicado es sólo ganar una batalla.

Ganar la guerra viene cuando solucionas estos problemas.

En algunos casos, es mucho más fácil decirlo que hacerlo.

El contenido duplicado es origen de problemas

Para comprender el problema del contenido duplicado, es útil saber cómo funciona Google.

Su motor de búsqueda lee los contenidos de todos los sitios web a través de pequeños programas automáticos y los guarda en una tremenda base de datos.

Cada búsqueda se utiliza para verificar qué sitios web tienen el contenido que mejor se ajusta a los términos de búsqueda que el usuario utiliza.

El objetivo de los motores de búsqueda es mostrar una lista de sitios web relevantes que respondan a las consultas de búsqueda del usuario.

Por lo tanto, el contenido se evalúa con ciertos criterios y las «mejores» páginas se muestran en los resultados.

El contenido duplicado se utiliza para clasificar el contenido que existe varias veces en la base de datos del motor de búsqueda.

Este es el caso si un texto similar o muy parecido está disponible en diferentes páginas web.

El hecho es que el contenido duplicado también se puede crear dentro del mismo sitio web.

El contenido duplicado causa dos problemas.

  1. Google no sabe exactamente qué página mostrar para la búsqueda consultada. Ambos contienen el mismo contenido y los resultados duplicados no agregan valor a un buscador. El motor de búsqueda decide mostra uno u otro.
  2. Google puede suponer que se trata de spam o plagio y clasifica a la baja. El sitio afectado aparece más abajo en los resultados de búsqueda (o se elimina por completo) y casi ya no encuentra lectores potenciales. Este caso sólo ocurre cuando el contenido se está desmoronando, es decir, contenido que está en varios sitios web diferentes.

Incluso sin una intención maliciosa, muchas de esas duplicidades pueden ocurrir automáticamente con tu sitio web de WordPress.

Porque cuando creas una publicación, el texto de WordPress aparece en varios lugares.

Por mucho que lo intentes, nunca podrás ofrecer un contenido 100% original.

El texto también se muestra en la página que lista las entradas del blog, la página en la que todos los artículos aparecen en orden cronológico inverso.

Según el tema y la configuración, se mostrará el texto completo o un extracto del mismo.

Al comienzo de cada publicación también se muestra cuando los usuarios hacen clic en las categorías o etiquetas (tags).

Aparecerá una lista de todos los artículos que usan esa categoría o palabra clave.

También en las páginas de archivo, que muestran todas los artículos de un mes o de un autor (en el caso de que haya varios editores escribiendo).

Google clasificará estos textos como contenido duplicado.

Al realizar una consulta de búsqueda, no aparecerá la página adecuada, sino la página de entradas del blog o incluso una página de categoría o la de archivo.

Además, copiar secciones de texto de otras páginas puede generar contenido duplicado.

Si quieres citar algo de un artículo, mantén la cita lo más breve posible, o cambia las palabras.

Detectar contenido duplicado con Siteliner y CopyScape

El uso de la herramienta Siteliner.com te ayudará a identificar contenido duplicado en tu sitio rápidamente.

Ofrece una vista fácil de ver que te muestra qué páginas tienen un porcentaje de coincidencia y qué páginas coinciden con otras páginas.

La versión gratuita de Siteliner limita el análisis mensual a sitios web que tengan hasta 250 páginas.

El servicio Premium te permite escanear y analizar hasta 25.000 páginas, tantas veces como quieras.

En las opciones avanzadas puedes controlar qué páginas de tu sitio se escanean.

También puedes guardar y revisar tus resultados anteriores.

Podrás descargarte los resultados del informe en formato CSV o en formato PDF para estudiarlo tranquilamente desde tu escritorio.

Con la herramienta online Copyscape puedes verificar y ver qué páginas de tu sitio se han duplicado en la web.

Copyscape está considerada una de las herramientas de auditoría estándar en SEO.

Esta herramienta puede ayudarte a identificar contenido duplicado en todo tu sitio usando la funcionalidad de índice privado de su servicio Premium.

Detectar contenido plagiado con Google

Para cubrir todas tus bases, consulta en el buscador de Google para ver si existe alguna copia plagiada del contenido de tu sitio web.

Selecciona una porción de texto que quieras verificar y simplemente copia y pega en la caja de búsqueda de Google, escribiéndolas entre comillas.

Esto debería ayudarte a identificar los sitios que te han robado textos.

Detectar contenido duplicado con Google Webmaster Tools

Esta herramienta gratuita de Google es imprescindible que la tengas instalada.

Proporcionar infinidad de información útil sobre tu sitio web y una de ellas es precisamente la de detectar duplicidades.

Accede al apartado: Apariencia en el buscador > Mejoras de HTML y fíjate en las etiquetas de metadescripciones y de títulos duplicadas.

El informe generado te dice el número de réplicas existentes y las páginas donde se han encontrado para que puedas corregir las etiquetas.

Evita el contenido duplicado en WordPress con Yoast SEO

Afortunadamente, para evitar contenido duplicado, puedes configurar WordPress con el plugin Yoast SEO.

Se puede descargar de forma gratuita y una vez instalado lo tendrás disponible en tu administrador con el nombre de SEO.

Gracias al comando «noindex», ciertas páginas se pueden bloquear para no mostrarse en Google.

Con Yoast SEO, puedes poner las páginas de archivo específicas (página de autor, página de fecha, etc.) en «noindex».

Esto evita que el contenido duplicado y el artículo del blog optimizado para la palabra clave o la página aparezca en los resultados de búsqueda.

La configuración se puede encontrar en la opción de menú «Títulos y Metas» y en la pestaña «Archivos».

Cuida tus contenidos periódicamente

La identificación de contenido duplicado no se limita al contenido del texto de la página.

La búsqueda de la URL que conduce al contenido duplicado también puede revelar problemas que confunde a Google cuando rastrea tu sitio.

Verifica lo siguiente:

  • ¿Son recientes las actualizaciones de mis contenidos?
  • Magnitud de las actualizaciones de mi contenido
  • Tendencia histórica de las actualizaciones de mi página

La magnitud se refiere a la importancia de editar, agregar, actualizar y hacer cambios en la página para dotar de frescura al contenido.

En lugar de simplemente cambiar un par de palabras, agregar o quitar secciones del documento aumenta la clasificación de la página web.

Para esto puedes utilizar Screaming Frog.

Desplázate hasta la derecha y encontrarás una columna llamada Last Modified.

Esta puede ayudarte a determinar qué tan recientes son las actualizaciones de tu contenido y la magnitud de las actualizaciones de contenido en el sitio.

Esto también puede ayudarlo a desarrollar tendencias históricas de actualizaciones de páginas.

Si estás obsesionado con tus competidores, puedes realizar un rastreo cada mes y tener estos datos a mano para determinar lo que están haciendo.

Sería muy fácil analizar y mantener estos datos actualizados en una tabla de Excel e identificar tendencias históricas si quieres ver qué hacen los competidores en su estrategia de contenido.

Consideraciones finales

Ninguna herramienta es infalible y puede que no detecte algunos contenidos.

Deberías probar diferentes herramientas o combinar varias de ellas.

Ten en cuenta que estás realizando las consultas con versiones gratuitas limitadas que tienen funciones capadas.

Estas son las más recomendables:

Algunos de estos programas requiere de instalación y configuración.

Lo ideal es que pruebes todas las opciones para ver la que mejor satisface tus necesidades.

¿Seguro que no tienes problemas de contenido duplicado en tu sitio?

Publicaciones Similares

Deja una respuesta

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *