Ahora con el beta liberado de Bigquery ML, todos los usuarios de Google Analytics 360 pueden montarse a la ola de la transformación digital generando modelos con sus propios datos que permitan optimizar, clasificar o predecir resultados a partir de la data de Analytics.

 

Sobre Bigquery ML

 
Bigquery es un servicio que permite almacenar grandes cantidades de datos (incluso petabytes) y consultarlos en segundos usando SQL. Las principales bondades de este producto son:

  • Costo: es relativamente bajo, se cobra por consulta y cantidad de data almacenada. Es muy accesible.
  • Velocidad: Se puede consultar grandes cantidades de datos en tan sólo segundos.
  • Uso: Cualquier persona con un conocimiento mínimo de SQL puede extraer data.

Bigquery ML es una serie de funciones agregadas a Bigquery que se llaman en una query para crear y ejecutar modelos de Machine Learning usando solo SQL.

 

Al grano, ¿qué acciones puedo tomar ahora con la data que tengo en Analytics?

 
Bigquery ML en su documentación parte con un tutorial en donde indica como predecir si un visitante hará una transacción en un sitio.

Para el tutorial se usa data de una tienda online real cuya data de Google Analytics está liberada de manera pública y se puede acceder a través de Bigquery.

Se puede predecir si un visitante recurrente volverá a comprar, categorizado por cualquier dimensión (de sesión) de Analytics (país, navegador, sistema operativo, fuente de tráfico, dispositivo, página de destino, etc.).

Con este modelo es posible encontrar insights como el que muestran en el minuto 2:35. Donde indican que, para Google Merchandise Store, haciendo remarketing al Top 6% de usuarios tienen un ROAS (Retorno de inversión publicitaria) 9 veces mayor que el ROAS calculado sobre todos los usuarios del sitio.

 

 

¿Cómo llegar al Top “x%” de usuarios de sus sitios?, es una pregunta que se la dejaremos a sus equipos de analistas y publicidad digital ya que hay varias maneras de obtenerlo. Una manera, por ejemplo, es configurando un objetivo de Analytics específico cuando el ticket de una compra sea superior al ticket medio de su sitio. Otra más sencilla, es generando una audiencia a partir de un segmento de Analytics cuya característica sea que el revenue de la transacción sea “z” dólares.

La ventaja de tener un modelo de Machine Learning, como su nombre lo dice, es que aprende automáticamente; bueno casi automáticamente, es decir no nos vamos a conformar con que el reporte diga TOP 6% de usuarios ya que sus características pueden variar de acuerdo a lo que el modelo arroje cuando se actualice.

En Bigquery ML esta actualización es manual, conforme vayamos acumulando más data, tendremos que correr el modelo de nuevo para tener resultados actualizados.

Si deseamos un servicio que aprenda automáticamente es más complejo y sería tema para otro post más adelante.
 

Otros casos

 
Al momento Bigquery ML presenta soluciones para predecir y clasificación binaria (por ejemplo si un correo es spam o no, si un cliente es comprador potencial o no).

Con esta premisa en mente, revisaremos algunos reportes de Analytics y plantearemos casos donde se pueda “modelar” el comportamiento de los usuarios para luego poder brindarle esta información al equipo de análisis. El caso elegido es el siguiente:

 
Shopping Behavior Analysis

 

 

Rápidamente vemos que la conversión del sitio es 1.4% (850/61K) y esto se puede dar por varios motivos: entre ellos (1) la estrategia de adquisición apunta no sólo a performance sino a educar a los usuarios sobre los productos (see, think) y (2), hay visitantes que buscan trabajo en el sitio, etc.

Vamos a enfocarnos en sesiones que han mostrado interés de compra, la conversión de los que vieron un producto es 7.5% (850/11333). Con esta información en mente planteamos la siguiente pregunta:

“¿Cómo llegan los usuarios a los detalles de producto?”, o aún mejor “¿Cómo llegan los usuarios que compran a los detalles de producto?”, o incluso aún mejor “¿Qué tanta probabilidad tengo de vender el producto que me deja mayor margen cuando llegue a la página?”.

Supongamos que Google Nest es el producto que deja mayor margen por unidad vendida -aunque ahora mismo no lo estén vendiendo. Lo siguiente que haremos es ir al reporte de páginas, filtrar las de los productos y jugar con las dimensiones secundarias de Analytics hasta que alguna nos haga sentido.

 

 

Y que tal si en vez de pasar un día entero analizando por separado dimensiones como: campaña, fuente/medio, dispositivo, país, etc; dejamos que Bigquery ML lo haga.

Encontrando un patrón que determine si un usuario va a comprar o no cuando llegue a una página de producto de modo tal que si no compra, podemos tomar acciones en el momento (personalización de la web/app) o posteriormente (retargeting o disparar un pixel específico de Facebook y encontrar audiencias con similares características).

La ventaja de que lo haga una máquina es que en vez de solo modelar la venta de un producto (en caso se haya elegido el de mayor margen), es que este modelo estadístico puede aplicarse a todas las páginas de producto.

Otra ventaja es que Google Analytics no es la única fuente de datos que podemos montar sobre Bigquery. La data de Adwords puede importarse con una sencilla configuración, así como la de Google Play, Firebase y/o cualquier otra fuente de datos, por ejemplo el CRM.

Para finalizar, la clave para llevar exitosamente a cabo proyectos de Machine Learning localmente no es empezar invirtiendo extensamente en aprender tecnología de punta como Tensorflow, Hadoop, etc; y desarrollar departamentos de Data Science.

El desafío se encuentra en realizar las preguntas de negocio correctas que se pueden contestar con innovación y automatización.

 
Si tienes alguna iniciativa de este tipo en mente o deseas hallar una me escribes a acampos@attachmedia.com