Projet de prédiction du prix des voitures

Présentation du Projet

Ce projet utilise des techniques de science des données et d’apprentissage automatique pour prédire le prix des voitures en fonction de leur poids à vide. Il met en œuvre une régression linéaire pour établir la relation entre le poids d’une voiture et son prix.

Les points clés

Algorithmes Utilisés

Régression Linéaire: Le modèle de régression linéaire est utilisé pour prédire le prix des voitures en fonction de la caractéristique ‘curb-weight’. La régression linéaire est une méthode statistique qui permet de modéliser la relation entre une variable dépendante et une ou plusieurs variables indépendantes.

Fonctionnalités du Projet

  1. Prétraitement des Données:
    • Chargement des données depuis un fichier CSV (Automobile_data.csv).
    • Remplacement des valeurs manquantes représentées par ‘?’ par NaN.
    • Suppression des lignes contenant des valeurs manquantes pour assurer la qualité des données.
    • Conversion de la colonne ‘price’ en type float pour permettre les calculs.

  2. Visualisation des Données:
    • Utilisation de plotly.express pour visualiser la relation entre le poids à vide (‘curb-weight’) et le prix des voitures.

  3. Construction du Modèle:
    • Séparation des données en variables indépendantes (X) et dépendantes (y).
    • Entraînement d’un modèle de régression linéaire avec scikit-learn.

  4. Évaluation du Modèle:
    • Calcul et affichage de la pente et de l’ordonnée à l’origine du modèle.
    • Évaluation de la performance du modèle à l’aide du coefficient de détermination 
      R2

      .

  5. Prédictions:
    • Prédiction des prix pour de nouvelles voitures en fonction de leur poids à vide.
    • Visualisation du modèle de régression avec une ligne de tendance.

  6. Sauvegarde et Chargement du Modèle:
    • Sauvegarde du modèle entraîné à l’aide de joblib.
    • Chargement du modèle sauvegardé pour de futures prédictions.

  7. Interaction Utilisateur:
    • Création d’une fonction interactive permettant aux utilisateurs de comparer le prix prédit par le modèle avec le prix annoncé pour une voiture.
    • L’utilisateur peut se positionner en tant qu’acheteur ou vendeur pour obtenir des conseils basés sur les prédictions du modèle.

Points Forts

  • Interactivité: Le projet inclut une interface utilisateur simple qui permet d’interagir avec le modèle pour obtenir des prédictions personnalisées.
  • Visualisation: Utilisation de graphiques interactifs pour illustrer les relations entre les variables et les prédictions du modèle.
  • Modularité: Le modèle est sauvegardé et peut être réutilisé pour de nouvelles prédictions sans nécessiter de réentraînement.

Applications Potentielles

  1. Industrie Automobile: Les constructeurs automobiles peuvent utiliser ce modèle pour estimer le prix de nouveaux modèles de voitures en fonction de leur poids, ce qui peut les aider à positionner leurs produits sur le marché de manière compétitive.
  2. Concessionnaires Automobiles: Les concessionnaires peuvent utiliser ce modèle pour évaluer le prix des voitures d’occasion en fonction de leur poids, ce qui peut faciliter le processus de tarification et de négociation avec les clients.
  3. Plateformes de Vente de Voitures en Ligne: Des sites web de vente de voitures peuvent intégrer ce modèle pour fournir des estimations de prix aux utilisateurs qui souhaitent vendre ou acheter des voitures, en leur offrant une référence basée sur des données historiques.
  4. Assurances Automobiles: Les compagnies d’assurance peuvent utiliser les prédictions de prix pour évaluer la valeur des voitures dans le cadre de la souscription de polices d’assurance ou de l’évaluation des réclamations.
  5. Analyses de Marché: Les analystes de marché peuvent utiliser ce modèle pour étudier les tendances de prix dans l’industrie automobile et comprendre l’impact du poids des voitures sur leur valeur marchande.
  6. Applications Éducatives: Ce projet peut servir d’exemple pédagogique pour enseigner les concepts de régression linéaire et de prétraitement des données dans des cours de science des données ou d’apprentissage automatique.

Ce projet démontre l’application pratique des techniques de régression linéaire pour résoudre des problèmes de prédiction de prix dans le domaine automobile.