
Analyse et Exploration des Données Nutritionnelles pour la Santé Publique

Présentation du Projet
Ce projet vise à exploiter le jeu de données d’Open Food Facts afin d’analyser les caractéristiques nutritionnelles des produits alimentaires et leur impact sur le Nutri-Score. L’objectif principal était de démontrer la faisabilité d’une application permettant de mieux comprendre les relations entre les variables nutritionnelles, d’identifier les produits problématiques ou exemplaires, et d’aider à concevoir des outils pour sensibiliser les consommateurs et améliorer les politiques de santé publique.
Grâce à une méthodologie rigoureuse alliant nettoyage des données, analyses statistiques et visualisations avancées, ce projet offre des insights précieux sur les facteurs influençant la qualité nutritionnelle des aliments.

Les points clés

Approche Méthodologique
- Nettoyage des Données :
- Gestion des valeurs manquantes (imputation avec médiane pour les variables numériques et mode pour les catégorielles).
- Traitement des valeurs aberrantes à l’aide de techniques basées sur l’IQR (Interquartile Range).
- Sélection des variables pertinentes en se concentrant sur les nutriments les plus impactants (graisses saturées, sucres, énergie, etc.).
- Analyse Exploratoire :
- Analyse univariée : Compréhension des distributions des variables comme
energy_100g
etsugars_100g
. - Analyse bivariée : Étude des corrélations entre variables et leur impact sur le Nutri-Score.
- Visualisations : Histogrammes, boxplots, scatter plots et diagrammes en barres.
- Analyse univariée : Compréhension des distributions des variables comme
- Analyse Multivariée avec ACP (Analyse en Composantes Principales) :
- Réduction de dimensionnalité pour identifier les variables expliquant la majorité de la variance.
- Création de cercles de corrélation pour visualiser les relations entre variables.
- Projection des produits alimentaires pour détecter des regroupements naturels.
- Calculs Statistiques :
- Utilisation d’ANOVA pour confirmer les relations significatives entre le Nutri-Score et les variables nutritionnelles.
- Analyse des contributions des variables et des individus à la structure des composantes principales.

Algorithmes et Techniques Utilisés
- Standardisation des données : Égalisation des échelles des variables à l’aide de
StandardScaler
. - Réduction de dimensionnalité : ACP (Analyse en Composantes Principales) avec
scikit-learn
. - Tests statistiques : Analyse de variance (ANOVA), calcul des contributions des variables et des individus.
- Visualisations : Création de graphiques avec
matplotlib
etseaborn
.

Fonctionnalités et Étapes Clés
- Nettoyage avancé des données : Prétraitement robuste pour gérer des données complexes et souvent incomplètes.
- Exploration des relations entre variables : Mise en évidence des variables nutritionnelles influentes comme
fat_100g
etsaturated_fat_100g
. - Visualisations interactives : Projection des produits dans un espace réduit grâce à l’ACP, avec un cercle de corrélation pour interpréter les relations entre variables.
- Détection des clusters : Identification des regroupements naturels de produits en fonction de leurs caractéristiques nutritionnelles.

Points Forts du Projet
- Approche méthodologique rigoureuse : Chaque étape a été pensée pour garantir des résultats fiables et reproductibles.
- Analyse multivariée avancée : L’utilisation de l’ACP a permis de simplifier et d’interpréter un jeu de données complexe.
- Insights concrets : Identification des nutriments clés influençant le Nutri-Score, permettant de cibler les efforts d’amélioration pour l’industrie alimentaire.
- Visualisations impactantes : Graphiques clairs et intuitifs pour expliquer des concepts complexes à des publics variés.

Applications Potentielles
- Sensibilisation des consommateurs :
- Développement d’applications interactives pour visualiser les impacts nutritionnels des produits alimentaires.
- Éducation sur les nutriments à privilégier ou à limiter.
- Optimisation pour l’industrie alimentaire :
- Identification des produits nécessitant des reformulations pour améliorer leur Nutri-Score.
- Aide à la prise de décision pour développer des gammes plus équilibrées.
- Santé publique et recherche :
- Soutien aux politiques de santé publique pour promouvoir des choix alimentaires sains.
- Base méthodologique pour des études plus poussées sur les comportements alimentaires.