Experto de Semalt sobre cómo evitar que el spam de referencia perjudique sus análisis web

El análisis web es crítico, ya que ayuda a medir la actividad del sitio. Universal Analytics tiene más funcionalidad que el antiguo Google Analytics y los usuarios deberían implementar más UA. Sin embargo, la desventaja de usar UA es que recibe una gran cantidad de spam de referencia. Sin embargo, no es una razón suficiente para no actualizarlo. Si uno no detiene el correo no deseado, puede afectar seriamente el análisis, especialmente para las PYME. Lisa Mitchell, Gerente de Éxito del Cliente de Semalt , describe cómo superar este molesto spam.
Spam de referencia
El spam de referencia se considera cualquier visita no humana que aparezca en el informe analítico. Para revisar todo el dominio de referencia, abra el informe de Google Analytics y seleccione Todo el tráfico en la pestaña Adquisición. El tráfico de referencia es el resultado de robots y arañas que rastrean el sitio, o de robots que envían códigos a UA para crear registros para una visita inexistente.
Por qué esto es un problema y por qué debería importarle
El spam de referencia genera visitas adicionales al sitio que no ocurren. El resultado es que se mete con la información en análisis y crea una imagen incorrecta sobre el rendimiento del sitio. Resulta en altas tasas de rebote y una tasa de conversión subestimada.

¿Cuál es el punto y por qué hacen esto?
El objetivo detrás del spam de referencia es hacer que personas desconocidas visiten el sitio fuente. Cuando estas URL aparecen en el informe analítico, apuntan a la curiosidad del propietario para saber qué contenido tienen que genera tanto tráfico. Nunca se debe visitar un sitio que no reconocen. Los sitios son relativamente inofensivos, ya que solo buscan obtener tráfico orgánico y aumentar su clasificación de búsqueda. Pero, de nuevo, al igual que cualquier otro correo no deseado, podrían vincularse a un sitio malicioso, por lo que uno debe evitarlos en su totalidad.
Tipos de spam de referencia
Antes de intentar detener el spam de referencia, uno debe comprender las diferentes formas que toma. Son esencialmente dos: rastreadores que visitan el sitio y robots que solo envían referencias de fantasmas. Como actúan de manera diferente, acéptelos como tales.
Rastreadores
Se disfrazan de sitios web legítimos y siguen enlaces con la intención de rastrear el sitio. En su mayoría vienen en forma de programas e intentan visitar todos los sitios de la página. Los rastreadores legítimos encontrarán información que ayuda a que la web sea más fácil de usar. Los rastreadores sombreados solo rastrearán la web para que dejen su URL para que obtengan un vínculo de retroceso a su sitio. Bloquéelos usando el archivo .httaccess o configure un filtro personalizado en Google Analytics.
Referentes fantasmas
Estos también son programas, pero son diferentes de los rastreadores en la forma en que operan. Existe un protocolo de medición en Universal Analytics que permite medir y monitorear actividades fuera de línea. Algunas personas con intenciones maliciosas se aprovechan de esto y envían datos aleatorios a las ID de Google Analytics. Lanzan la mayor cantidad de datos que pueden para aumentar las posibilidades de recibir un golpe. Si logran obtener un éxito, se registra como una visita e incluye la fuente de referencia para garantizar que algunas personas sigan la fuente al sitio de referencia.
Eventos fantasma
Algunos bots nuevos ahora envían información de Analytics Event. Para ver si aparece algún evento fantasma, abra eventos de comportamiento y navegue hasta el informe de eventos principales. Es un intento de atraer a usuarios novatos de análisis para que visiten su sitio.
Lucha contra el spam de referencia
La edición del archivo .htaccess no funciona para las referencias de Ghost y los eventos de Ghost. Filtre estos dominios utilizando filtros personalizados o segmentos personalizados en Google Analytics.

Filtros para referentes fantasmas
Concéntrese en el hecho de que los referentes fantasmas no saben de qué se trata el sitio web. El nombre de host es lo que usa el visitante para llegar al sitio. Una versión del nombre de host del sitio aparece en el informe de Google Analytics. Sin embargo, la lista de referencias fantasmas como (no establecida) o el nombre de un sitio web. Encuentre la lista de todos los nombres de host configurando un rango de tiempo como dos años, haga clic en Tecnología y luego en Red. La dimensión principal debe ser el nombre de host. Recuperará los resultados de todos los nombres de host que visitaron el sitio durante los últimos dos años.
Configurar el filtro
Establezca una lista de todos los nombres de host que desea permitir. Luego abra Google Analytics, diríjase a la sección Administrador y, en Ver, haga clic en Filtros. Cree un nuevo filtro y asígnele un nuevo nombre, como "Hosts válidos" y, en Tipo de filtro, déjelo en Personalizado. Seleccione incluir y elija nombre de host en el campo de filtro. Ingrese todos los hosts válidos separándolos por una barra vertical. Guarde el filtro y deje en blanco la casilla de verificación "Mayúsculas y minúsculas".
Al hacer todo esto, asegúrese de tener un filtro separado como una vista de "Prueba" con los datos de origen y para fines de comparación.
Filtros para rastreadores
Agregue rastreadores a una lista que desea excluir. Sigue el mismo procedimiento que el de Ghost Referrers. La única diferencia es que en lugar de "Incluir", elija Excluir el origen de la campaña en el filtro archivado. Ingrese la lista de rastreadores que los separa con una barra vertical.

Identificación de rastreadores
Graban sus propias sesiones con una tasa de rebote del 100% y una sola página por sesión. Muestran usuarios 100% nuevos.
Filtros vs. Segmentos
Los filtros mantienen otros datos fuera de esa vista particular por completo. Solo funciona desde la fecha de creación hacia el futuro. Analizar datos antiguos requerirá el uso de segmentos en su lugar.