SocialMedia

Análisis avanzado de términos de búsqueda con Google Correlate

Google acaba de publicar una herramienta gratuita que permite analizar y comparar términos de búsqueda. Aunque en muchos lugares han dado la noticia como «una nueva herramienta de minería de datos de Google», en realidad compara series temporales, cosa que yo personalmente no llamaría herramienta de minería de datos.

Google tiene publicadas tres herramientas más que permiten acceder a datos agregados de términos de búsqueda: Google Trends y Google Insights son ya herramientas conocidas que permiten obtener actividad espacio-temporal sobre un término dado. Pero no son capaces de representar consultas que se corresponden con un patrón particular de actividad. Google Correlate se basa en otra, menos conocida, llamada Google Flu Trends, que muestra tendencias de la gripe a nivel mundial (al igual que el último Google Dengue Trends).

La idea de Correlate es que si introducimos un término en el buscador, analiza la cantidad de veces que ese término ha sido buscado semanalmente, desde el 2003. Con esa serie temporal, nos busca además qué otras series de otros términos tienen la misma frecuencia de búsqueda. Para encontrar los términos más parecidos sí que utiliza un algoritmo de minería de datos, llamado Approximate Nearest Neighbor (ANN), pero explicarlo no es el objetivo de este post.

Veámoslo con un ejemplo: «El pepino está de moda»… Pero no por las últimas acusaciones cruzadas del E.coli. Google Correlate nos dice que cada año se busca más el término «cucumber» (y recetas que lo contienen) por Internet:



El resultado de la correlación del término nos dice además que la búsqueda se hace sobre todo en verano, cuando más apetece una ensaladita fresca de pepino (bien correlacionada), e incluso coincide con las búsquedas del melón ;).

Como os he comentado, los picos son cada vez más altos, lo que indica que, o cada vez se come más pepino en EEUU, o que cada vez se busca más en Google. La gráfica también muestra que ahora mismo está subiendo la tendencia. Será interesante volver a correlacionar el término dentro de unas semanas para ver si se han enterado de algo de lo ha ocurrido en Europa…

La verdad es que es una herramienta muy potente y rápida en mi opinión. Desde el punto de vista del Social Media, nos permite utilizarla para seleccionar nuevas palabras clave y ayudarnos en el posicionamiento.

Además, nos permite hacer pruebas con series temporales subidas por el usuario (mediante una hoja de cálculo). Aunque sé que esto no será muy útil para no pocos lectores, sé de otros que nos estamos frotando las manos…

Otra opción que da la herramienta es la de hacer las correlaciones, pero en lugar de utilizar series temporales, utilizando series relativas al espacio (estados de EEUU), lo que por el momento me resulta menos interesante.

La parte negativa, es que las series de términos de búsqueda que tiene almacenadas son sólo norteamericanas, por lo que en este momento no nos resulta de gran ayuda para la comunidad Social Media del entorno. Esperemos que no tarden en abrirlo al mundo entero!

Salir de la versión móvil