Analyse des logs via Apache Mahout?

May 1, 2011 | In: Adwords

Lors du Mix-IT de  Lyon, j’ai assisté à la session «Intelligence collective avec Apache Mahout» présentée par Michaël Figuere.

Les solutions présentées lors de cette conférence ainsi que les cas d’utilisation évoqués rejoignent une problématique qui me trotte dans la tête depuis quelque temps déjà.

Comment analyser plus finement les actions des internautes qui viennent sur notre site pour améliorer nos taux de conversions.

Split Tests classiques

Google Analytics offre une première lecture du comportement sur notre site. Il ne s’avère pas suffisant pour une bonne optimisation.

Ainsi pour tester notre site, nous avons toujours 2 versions parallèles qui tournent. Une version, nommée  HARD  et une version SOFT. La version est stockée dans la session de l’utilisateur. Durant tout son passage sur le site, il aura une version différente de l’internaute arrivé juste après lui.

Les variations portent sur:

  • les textes des incitations à l’action («Voir mon taux» vs «Accéder au détail de ma simulation»)
  • les couleurs,
  • la cinématique (être plus ou moins agressif pour demander les coordonnées de l’internaute).

J’ai ensuite un suivi des scénarios qui me permet de voir les taux de conversion par version. Après avoir laissé suffisamment tourner 2 versions en parallèle, je suis en mesure de déclarer la version gagnante. Cette version est conservée tandis que la perdante est remplacée pour améliorer encore la conversion globale.

Pourquoi ça ne suffit pas

Le nombre de variables qui rentre en jeu dans le comportement d’un internaute est énorme. Je citerai en vrac:

  1. sa provenance (google, site référent, …),
  2. l’étape de son projet

C’est pourquoi des splits test simples ne suffisent pas. Il faut pouvoir les corréler avec des patterns d’internautes. Pour optimiser un site il faut être capable de réaliser des analyses multiaxes des taux de transformation.

Migrer les logs de postgres vers une base NoSql

Les données à analyser se trouvent aujourd’hui dans une base relationnelle, postgres en l’occurence. Les informations pertinentes sont dans des tables relativement éloignées dans le modèle de données.

La prochaine étape de mes expérimentations consistera à migrer ces données dans une base NoSql.

La suite au prochain épisode.

No related posts.

Comment Form

Categories

Archives

Lien simulateur rachat

Latest comments