Google Analytics te está engañando

Google Analytics es una gran herramienta, potente y gratuita, cuando se trata de hacer analítica de los datos de nuestra web. Sin embargo no debes creerte todo lo que te dice como dogma de fe, al menos no sin haber hecho una criba previa para obtener una “vista limpia” de esos datos. Y esto desafortunadamente no lo hace todo el mundo.

Tienes menos visitas a tu web de lo que crees

Me explico. Si nunca has filtrado los datos en tu vista de Analytics, se te estará colando tráfico spam que estará contaminando tus datos de forma descarada. He visto casos más y menos graves, pero últimamente este tráfico spam se ha ido incrementando (hay más gente malvada ahí fuera y cada vez se la cuelan más a Google) y normalmente supone alrededor de un 30% o más del tráfico total.

La imagen a continuación es la captura de la evolución de visitas de una cuenta real a la que he aplicado un segmento para diferenciar el tráfico SPAM del total de sesiones. Como se puede ver, en el último mes el tráfico SPAM se ha disparado y supone un 37,17% del total de “visitas” a la web. Una cifra así es como para mosquearse.

Cremiento del tráfico spam en Google Analytics

Crecimiento del tráfico spam en Google Analytics

Por qué es malo tener tráfico spam/fantasma

Básicamente porque te hace tomar malas decisiones. Pierdes la noción del estado real de tu sitio web y te impide analizar correctamente el comportamiento de tus usuarios. No es sólo que pensarás que tienes por ejemplo 1000 visitas al mes cuando en realidad tienes 700, sino que además tendrás una impresión errónea de cuales son tus principales fuentes de tráfico, de la tasa de rebote, el número de páginas vistas, y en general cualquier métrica que se te ocurra. Para que nos entendamos, tus datos de analítica se volverán completamente inútiles.

En la siguiente captura puedes ver de qué manera desvirtúa el tráfico spam la distribución de las fuentes de tráfico. En el gráfico superior, el tráfico SPAM, que en su mayoría es directo y referido,  y debajo el tráfico válido, que tiene una distribución más homogénea entre las diversas fuentes:

 

Fuentes de tráfico spam vs tráfico válido

Fuentes de tráfico spam vs tráfico válido

 

Esto hace que pienses que por ejemplo la mayor parte de visitas viene por tráfico directo, cuando en realidad viene por tráfico orgánico.

Te pongo un caso práctico de las consecuencias que puede acarrear manejar datos contaminados:

Tienes un ecommerce y debido al tráfico fantasma interpretas que tu tasa de conversión es baja, así que decides invertir 5000 euros en rediseñarlo para hacerlo más atractivo con la esperanza de mejorar la conversión. Sin embargo más tarde filtras el tráfico spam y te das cuenta de que tu tasa de conversión era buena, y de que la verdadera causa de tus bajas ventas era que tenías poco tráfico. Con lo cual, ese dinero debías haberlo invertido en SEO, SEM, Marketing de Contenidos, o cualquier otra estrategia encaminada a aumentar las visitas reales. Y ahora estás como al principio pero con 5000 euros menos que nunca volverán. Ya he visto más de un ecommerce tener que cerrar por equivocarse de esta manera.

Características del tráfico spam

  • El tráfico SPAM tiene una tasa de rebote cercana al 100%
  • El tráfico SPAM tiene una duración media de sesión de cero segundos (por lo general).
  • El tráfico SPAM no interactúa con tu web
  • Y sobre todo…¡¡¡el tráfico SPAM no convierte!!!

Y este último punto es el que te va a frustrar. Vas a ver que la gente te visita, pero no te compra/contacta. Esto se hace especialmente patente en sitios con poco tráfico.

A continuación puedes ver cómo afecta el tráfico spam a dos métricas tan importantes para saber el interés del usuario por nuestros contenidos como son la duración media de sesión y la tasa de rebote. El tráfico spam aumenta tu tasa de rebote y baja la duración media de sesión. Como puedes ver, a los fantasmas no les gusta mucho leer.

Comportamiento del tráfico spam

Comportamiento del tráfico spam

Cómo saber si mi web tiene tráfico basura (spam)

Para poder identificar el tráfico basura en los datos de analytics, primero tenemos que saber que existen dos tipos de tráfico spam. Por un lado está el tráfico spam referido, y otro al que llamaremos tráfico fantasma a secas. A continuación te explico en qué consiste cada uno y cómo identificarlo.

Tráfico referido spam

Se trata de tráfico referido (referral) que proviene de fuentes dudosas y que no son visitas reales. Por si no sabes lo que es el tráfico de referencia (o referido), son visitas que llegan a nuestra página web mediante enlaces externos. Es decir, si Pepito hace click en un enlace a nuestra página web desde el blog de Fulanito, esa visita se considera tráfico referido, y la web de Pepito aparecerá en Analytics como fuente de dicho tráfico referido. Puedes ver el tráfico de referencia en Google Analytics en Adquisición > Todo el tráfico > Referencias.

Pero en el caso del tráfico referido spam no hay Fulanitos ni Pepitos (personas reales y de buena fe), sino que se trata de robots que simulan una visita desde webs inexistentes o maliciosas. ¿Para qué? Pues hay teorías para todo, pero la más aceptada es que tratan de captar visitas a webs terceras vía curiosos del Analytics como tú o yo, con la esperanza de que te pique la curiosidad y hagas click en esa fuente de tráfico a ver qué es. Yo una vez busqué una y acabé redirigido al portal de AliExpress. Ahí lo dejo.

Some men just want to watch the world burn

A continuación puedes ver una captura de pantalla del tráfico referido donde he resaltado las fuentes de spam y la duración media de la sesión.

Tráfico referido spam

Tráfico referido spam

¿Cómo saber si se trata de tráfico spam? Pues hay una serie de factores que nos van a hacer sospechar:

  • Fuentes de tráfico sospechoso. Existen listas en internet, pero sobre todo sospecha de sitios que no estén relacionados con tu negocio y que estén en un idioma distinto al tuyo y no te suenen de nada. Si dudas de alguna en concreto, sólo tienes que buscarlo en Google y seguramente halles la respuesta.
  • Duración media de la sesión cercana a cero. Esto sí que te sacará de dudas definitivamente. Si tienes muchas visitas de una fuente en concreto y su duración media de sesión es cero, se trata de tráfico spam. Puedes ver como se repite este patrón en la captura de arriba.

Te pongo unas cuantas fuentes que ya tengo identificadas como tráfico spam:

  • semalt.com
  • social-buttons.com
  • buttons-for-website.com
  • free-share-buttons.com
  • Get-Free-Traffic-Now.com
  • event-tracking.com
  • free-share-buttons.com

Tráfico fantasma

Mi preferido, si no andas muy listo te la cuelan fácilmente. He querido distinguirlo del tráfico referido porque en este caso la fuente puede ser cualquiera (directo, orgánico, referido, social), y lo que lo caracteriza es el host desde el cual se disparó el código de seguimiento de Analytics, así que podemos decir que se trata de un tipo de spam más “evolucionado” que el anterior.

Para poder identificarlo tenemos que fijarnos en el dominio del host de donde proviene el tráfico, si no hacemos esto nos será imposible diferenciarlo del tráfico natural. Si no desglosas tu tráfico con mayor detalle, podrás creer inocentemente que estás mejorando en SEO y que tu tráfico orgánico va en aumento. En mi caso de estudio, detecté un volumen anormalmente alto de tráfico directo que me hizo ponerme sobre aviso. Para ver este tipo de tráfico debes ir a Adquisición > Fuente / Medio y en Dimensión Secundaria selecciona “Nombre de host”.

Tráfico por Fuente y Medio en Google Analytics

Tráfico por Fuente y Medio en Google Analytics

En la primera columna aparece la fuente y el medio desde el que vino la visita a nuestra web, y la segunda columna es el nombre de host que lanzó el código de Analytics. Si recuerdas, cuando creaste tu página web tuviste que introducir un pequeño código javascript con tu ID de Universal Analytics para poder hacer el seguimiento de tu sitio en Google Analytics. Pues esa columna lo que te dice es desde qué dominio se lanzó el código de seguimiento. La trampa que aprovechan los sitios spammers es que Google Analytics no pone restricción sobre los dominios en los que instales dicho código, y tampoco hace ningún tipo de validación posterior. Tu puedes instalar tu código de seguimiento en tantos dominios como quieras y Google no dirá nada.

– Vale, no me hables en chino ¿y esto qué quiere decir? – Pues que en la columna de “Nombre de host” sólo debería aparecer el dominio de tu web y de aquellas en las que tú hayas metido ese código de seguimiento o hayas autorizado expresamente para que lo hagan. ¿Lo demás? basura, spam, y gentes del mal vivir. Lo vas a ver más claro en la siguiente captura:

Tabla de tráfico por Fuente y Nombre de Host

Tabla de tráfico por Fuente y Nombre de Host

El tráfico con (not set) en la columna de Nombre de Host es tráfico fantasma. Eso quiere decir que el código de seguimiento de Analytics fue disparado desde una máquina que Google Analytics no es capaz de identificar. El resto, fueron disparados desde www.mipaginaweb.com, que sería lo correcto.

Si te fijas, el 26,42% del tráfico directo proviene de (not set). Si no te preocupas de mirar el nombre de host y sólo prestas atención a la fuente de tráfico, cualquier analista web te diría que tu sitio web goza de buena salud y que tienes una potente imagen de marca porque la gente escribe directamente el nombre de tu web en el navegador, bla bla bla. ¿Qué bien verdad? ¡Pues no! Se trata de tráfico fantasma.

Evidentemente no siempre va a aparecer (not set), te pongo captura con un nombre de host que enseguida te va a oler a chamusquina:

Host spammer Darodar

Host spammer “Darodar”

Vale, ese era fácil de identificar. Pero estos fantasmas no se cortan, y van a tratar de engañarte suplantando la identidad de hosts que sí nos suenan de confianza. Por ejemplo…¿google? Te propongo un ejercicio de agudeza visual con la siguiente captura a ver qué le ves de extraño. Te prometo que no la he manipulado, los spammers a veces son así de cachondos.

Host spammer suplantando a Google

Host spammer suplantando a Google

Por eso hay que prestar mucha atención y ser muy analítico para identificar los hosts “buenos” de los que no lo son. Aparte de tu propio dominio, es normal que te encuentres otros dominios en el hostname que sí son tráfico real. Te pongo los más comunes para hacerte la tarea un poco más fácil:

  • www.youtube.com: Sitio de Youtube.
  • m.youtube.com: Sitio móvil de Youtube.
  • webcache.googleusercontent.com: Caché de Google.
  • translate.googleusercontent.com: Traductor de Google.
  • translate.baiducontent.com: Traductor de Baidu (El “Google chino”).
  • us2.campaign-archive.com: Campaña de Newsletter de Mailchimp.

 Cómo filtrar el tráfico spam en Google Analytics

 

Si has aguantado leyendo hasta aquí, te estarás comiendo las uñas por saber la respuesta a esta pregunta. Entonces no pierdas más tiempo y lee la continuación de este artículo:

Cómo filtrar el tráfico spam en Google Analytics – La guía definitva.

  • Carlos Manuel Díaz Honrado

    Hola.

    Interesante el post.

    En el primer caso, tengo curiosidad por ver como lo resuelves.
    En el segundo, bueno ese es claro. Basta con poner un filtro en el que restrinjas los host de los que aceptas hits…

    Saludos y nos seguimos leyendo

    • Hola Carlos Manuel,

      Me alegro de que te haya resultado interesante. Efectivamente como bien apuntas se trata de filtrar por hosts y por fuente, aunque tiene un pequeño truco. En el siguiente artículo lo cuento, aunque una vez tengas identificado el tráfico spam, filtrarlo es fácil 🙂

  • Dani Losada

    Buenas, muy buen artículo. Aunque ya tiene un tiempo de cuando lo he visto.

    A mi me acaba de pasar algo parecido, me ha subida el tráfico algo exagerado desde EEUU. Pero por lo que veo el host es correcto, por lo que deduzco que no es tráfico fantasma y referral tampoco porque ya lo solucioné.

    Sabes si ha día de hoy algo a cambiado y como solucionarlo?

    • Hola Dani,
      Que sepamos, no hay novedades en ese sentido.
      ¡Saludos!

      • Dani Losada

        Ya imaginaba. Yo tampoco he encontrado nada, pero si que he visto es que parece como si le hubieran hecho un repaso a todo el sitemap un par de veces, porque la página de destino no ha sido una solamente. Sino todas un par de veces.
        De momento he filtrado la información a mostrar, a ver que pasa con el posicionamiento ahora.
        Mañana veré si ha sido algo puntual o continua la cosa.
        Gracias por contestar.

©2017 Bukimedia S.L.U. Todos los derechos reservados.

Inicia Sesión con tu Usuario y Contraseña

¿Olvidó sus datos?