La Modélisation Du Risque De Crédit est essentielle pour les institutions financières afin d’évaluer la probabilité qu’un emprunteur fasse défaut sur un prêt. Ce projet implique l’analyse de plusieurs jeux de données pour identifier les facteurs influençant le risque de crédit, conduisant à de meilleures décisions. Le projet fournit un système d’évaluation du risque de crédit basé sur le machine learning. Il évalue le risque de défaut des emprunteurs, calcule des scores de crédit et attribue des notes de crédit. Le projet est développé en Python et Streamlit, offrant une interface interactive et conviviale.
Ce projet vise à développer un modèle de machine learning pour prédire le risque de défaut, en garantissant haute précision et interprétabilité. Le modèle final utilise des techniques avancées pour fournir des informations exploitables, le rendant adapté au déploiement en conditions réelles.
-
Jeu de données : problème de classification déséquilibré avec 10 % de défauts.
-
Techniques utilisées :
- Feature engineering basé sur la pertinence métier et l’analyse statistique.
- Méthodes de rééchantillonnage (sur-échantillonnage via SMOTE, sous-échantillonnage).
-
Modèles évalués :
- Régression logistique
- Random Forest
- XGBoost
-
Modèle : XGBoost avec hyperparamètres optimisés via Optuna et sous-échantillonnage.
-
Metrics :
- AUC : 0,98
- Coefficient de Gini : 0,97
- Statistique KS : 86,87 %
-
Outils d’interprétabilité :
- Le modèle montre une excellente capacité à classer les défauts avec précision et rappel élevés.
- L’analyse par déciles confirme une séparation claire des instances à haut risque.
-
Points forts :
- Performance élevée sur toutes les métriques
- Interprétabilité assurant la conformité aux exigences métier et réglementaires
-
Stratégies d’atténuation : gérer les risques liés au sous-échantillonnage via des réentraînements périodiques.
-
Courbe AUC-ROC avec performance quasi parfaite (AUC : 0,99)
-
Graphique récapitulatif SHAP montrant les features ayant le plus d’influence sur les prédictions.
- Entraîner le modèle : Scripts pour prétraitement des données, entraînement et optimisation des hyperparamètres inclus.
- Évaluer le modèle : Outils pour générer les métriques, analyse par déciles et graphiques d’interprétabilité.
- Déployer le modèle : Pipeline de déploiement préconstruit pour intégration dans les systèmes métiers.
- Combine des techniques de machine learning de pointe avec l’interprétabilité.
- Résout un problème métier réel avec rigueur et précision.
- Offre un chemin clair du développement du modèle jusqu’au déploiement.
- Évaluation interactive du risque de crédit : saisie des informations sur l’emprunteur et le prêt avec prédictions en temps réel.
- Machine Learning avancé : utilisation d’un modèle XGBoost finement ajusté pour des prédictions robustes et précises.
- Design évolutif : structure modulaire avec utilitaires réutilisables et optimisation des hyperparamètres.
project-root/
│
├── model/
│ ├── model_data.pkl # Modèle ML sérialisé et données de prétraitement
│ ├── tuned_hyperparameters.txt # Détails des hyperparamètres optimisés
│
├── Jeff Finance.jpg # Logo du projet ou image associée
├── Readme.md # Fichier de documentation
├── main.py # Fichier de l’application Streamlit
├── requirements.txt # Liste des packages Python requis
├── utils.py # Fonctions utilitaires pour prédiction et prétraitement
Téléchargez le dépôt du projet sur votre machine :
git clone https://github.com/username/repository-name.git
cd repository-name//project-rootAssurez-vous d’avoir Python 3.8 ou supérieur. Il est recommandé d’utiliser un environnement virtuel :
python -m venv venv
source venv/bin/activate # Sur macOS/Linux
venv\Scripts\activate # Sur WindowsInstallez tous les packages Python listés dans requirements.txt :
pip install -r requirements.txtDémarrez l’application Streamlit avec la commande suivante :
streamlit run main.py-
Ouvrez l’URL affichée dans le terminal après
streamlit run main.py(typiquementhttp://localhost:8501/). -
Utilisez l’interface interactive pour :
-
Entrer les informations de l’emprunteur (âge, revenu, montant du prêt, etc.)
-
Ajuster les curseurs et menus déroulants pour d’autres paramètres
-
Cliquer sur “Calculate Risk” pour afficher :
- Probabilité de défaut
- Score de crédit
- Note de crédit
-
-
Consultez les analyses et recommandations fournies.
Le projet requiert les bibliothèques suivantes :
streamlit: pour l’interface web interactivescikit-learn: pour le prétraitement et la gestion du modèlejoblib: pour charger le modèle sérialisépandasetnumpy: pour la manipulation des donnéesxgboostet autres
Toutes les dépendances sont listées dans requirements.txt.
- Pour utiliser un autre modèle ML, remplacez
model_data.pklpar votre modèle sérialisé et ajustez les features dansutils.py. - Modifiez l’interface dans
main.pysi les entrées ou sorties changent.
- Page d’accueil : affiche le titre du projet et l’interface de saisie.
- Page des résultats : montre la probabilité de défaut, le score de crédit et la note avec des recommandations exploitables.


