Moteur de
profilage


Définition

Selon la RGPD [article 4.4], le moteur de profilage de 10h11 peut se définir comme le traitement automatisé de données à caractère personnel qui consiste à utiliser ces données afin d’évaluer certains aspects de la personne concernée et analyser (ou prédire) ses préférences ou centres d’intérêt personnels, son comportement et d’autres attributs. Ces individus étudiés sont ensuite placés dans une catégorie représentant un certain profil. En accord avec la protection des données personnelles, l’anonymat des personnes étudiées est respecté.

Bénéfices

Le profilage peut permettre à une entreprise de cibler ses opérations marketing. En effet, grâce à l’analyse des préférences et des comportements de ses clients, l’entreprise peut mieux les connaître et ainsi identifier les “bons” acheteurs. L’entreprise peut ensuite attirer les personnes, non clientes, répondant aux critères d’un “bon” acheteur. Plus généralement, le profilage permet de segmenter et d’identifier plus finement sa cible afin de lui adresser un message personnalisé.

Méthodologie scientifique

Lorsqu’un client souhaite utiliser notre moteur, afin d’optimiser le processus de développement algorithmique, il serait optimal qu’il sélectionne dans sa base de données les variables sur lesquelles le profilage doit être centré. Par exemple, si le client souhaite créer des groupes d’individus en fonction de leur profil socio-démographique, il serait préférable que le client se limite à fournir des variables comme l’âge, le genre, la situation maritale, etc.
Ensuite, selon les données, il peut être nécessaire d’effectuer des traitements sur celles-ci de façon à ce que le profilage réalisé soit le plus optimal possible (valeurs manquantes par exemple).
Selon le type des données (traitées ou non), notre moteur applique différentes méthodes d’apprentissage non supervisé, communément appelées méthodes de clustering. Elles permettent d’affecter des observations à des classes telles que les observations dans les classes soient similaires entre elles, c’est-à-dire qui ont des préférences ou des comportements communs.
Notre moteur a vocation à s’exprimer sur les types de données suivantes :

  • - pour des variables numériques (quantitatives)
  • - pour des variables catégorielles (qualitatives)
  • - pour des variables mixtes (numériques et catégorielles).
Architecture

Les données utilisées peuvent être directement fournies par l’entreprise elle-même sous forme de base de données SQL. Si l’entreprise le souhaite et si cela est possible, l’équipe de 10h11 peut collecter des données via des APIs.
Les éventuels traitements des données et les méthodes de clustering sont réalisés sur le logiciel R et/ou Python.
La puissance computationnelle nécessaire dépendra de la taille de la base de données (nombre d’observations, nombre de colonnes).
Pour retrouver un exemple d’application : merci de télécharger la fiche technique associée.

Installation / Intégration

Le moteur peut être utilisé à distance ou bien être installé dans l'environnement client. Ces paramètres sont à déterminer lors de la commande.

Licence

Une licence d’utilisation est proposée lors de la commande.
Si le client souhaite pouvoir accéder aux sources et maintenir le moteur en interne, l’hypothèse est envisageable et les conditions sont à définir avec notre équipe.

Coût

À définir en fonction du volume de données à traiter et du calibrage nécessaire à effectuer sur le moteur.

Contact

william.brojanigo@10h11.com - Responsable Data Science.

10h11.com utilise des cookies afin de vous proposer une expérience de navigation personnalisée.
Si vous désirez en savoir plus sur l’utilisation des cookies par 10h11, cliquez sur ce lien.

Refuser
Accepter