# ML - Plant Disease Detection *Par Jade Freneau, Lise Kleiber et Jeanne Dionisi* Nous nous basons sur l'article suivant et les gits associés suivants : - [Using Deep Learning for Image-Based Plant Disease Detection](https://arxiv.org/pdf/1604.03169.pdf) - [Git des données](https://github.com/digitalepidemiologylab/plantvillage_deeplearning_paper_dataset) - [Git du code](https://github.com/digitalepidemiologylab/plantvillage_deeplearning_paper_analysis) Ainsi que les données suivantes : - https://www.kaggle.com/c/cassava-leaf-disease-classification/overview ## Le projet Dans le cadre de notre cours de Machine Learning à l'INSA de Rouen, nous avons réalisé un projet. L'objectif de celui-ci est de faire une critique de l'article, puis d'essayer de trouver une architecture récente qui donne des meilleurs résultats avec un poids raisonnable. Nous avons donc entraîné des modèles pour la détection des maladies végétales sur des feuilles. Pour cela, nous sommes parties de cet [article](https://arxiv.org/pdf/1604.03169.pdf), qui utilise 2 réseaux de neurones pour détecter des maladies sur des plantes. Notre objectif étant d'atteindre une meilleure précision, nous avons tout d'abord fait un état de l'art de plusieurs réseaux de neurones performants à l'heure actuelle. Après avoir porté notre choix sur l'EfficientNet, nous avons réalisé l'entraînement de notre réseau selon plusieurs configurations : * la version de l'EfficientNet : * B0 (la taille des images est de 224) * B4 (la taille des images est de 380) * la taille des lots : * 24 * 100 * le nombre de classes : * 38 : les feuilles sont différenciées selon leur espèce et maladie (ou sain) * 18 : les feuilles sont différenciées selon leur maladie * 2 : les feuilles sont soit malades, soit saines, il n'y a pas d'autre différentiation * le nombre d'epoch : 30 par défaut, mais moins si présence d'overfitting Nous avons entraîné ces différents modèles sur le jeu de données de l'article **en couleurs**, puis nous les avons testé sur : * le jeu de données de l'article **en couleurs** * le jeu de données de l'article **en gris** * un **nouveau** jeu de données Les codes utilisés sont les suivants : * B0_24batch30epoch38classes (mettre le lien) * [B0_100batch30epoch38classes](Code/B0_100batch30epoch38classes.ipynb) * [B4_100batch30epoch38classes](Code/B4_100batch30epoch38classes.ipynb) * [B0_24batch30epoch18classes](Code/B0_24batch30epoch18classes.ipynb) * [B0_100batch30epoch18classes](Code/B0_100batch30epoch18classes.ipynb) * [B0_24batch30epoch2classes](Code/B0_24batch30epoch2classes.ipynb) * [B0_100batch12epoch2classes](Code/B0_100batch12epoch2classes.ipynb) Les résultats de ces évaluations sont à retrouver [ici](Résultats/Résultats_comparaisons.md).