Lecture et interprétation des résultats
Cliquez sur votre modèle de classification pour voir les résultats de l'entrainement.
Pour rappel, nos modèles (classification et extraction) sont entraînés sur 80% des données initiales. 20% des données sont mises de côté pour la validation. Les scores de performances affichés sont les scores de validation.
Le premier tableau donne les F1-scores de chaque classe.
On retrouve ensuite une matrice de confusion avec les labels prédits par le modèle en colonne, et les vrais labels en ligne.
La performance d'un modèle de classification dépend principalement de deux facteurs:
Le nombre de classes: Plus le nombre de classes à discriminer est important, plus le modèle a de chances de se tromper.
La similarité entre plusieurs classes: Certaines classes trop proches les unes des autres (par exemple, une facture de location vs une facture de vente) auront du mal à être discriminées par le modèle de classification. Une extraction de certains éléments clés du document peut permettre d'affiner une classification.
Last updated