Appariements flous de données textuelles en grande dimension.

L’objectif de cette étude est de proposer une cartographie fine des comportements de consommation d’aliments gras, sucrés et salés.

Pour cela, il est nécessaire d’utiliser des méthodes d’appariement flous pour trouver, à partir de noms de produits dans les données de supermarchés, le même produit dans l’OpenFoodFacts. Nous utilisons ElasticSearch pour effectuer ce travail.

La présentation est disponible ici.

Voici une vision partielle du pipeline mis en oeuvre pour mettre en relation les différentes sources:

Lino Galiana
Lino Galiana
Data Scientist

I am data scientist in French national statistical institute, Insee. I study how emerging data or new computational methods help to renew the production of statistical knowledge.