Glossaire reciTAL
Concept | |
---|---|
Agent | Un Agent reciTAL est un objet paramétrable permettant de réaliser une classification ou une extraction selon son type. Cet Agent peut être configuré à partir de modèles d'IA (depuis le studio), de règles, ou d'une combinaison des deux. |
Agent d'extraction | Un Agent d'extraction est composé d'extracteurs. Son objectif est d'extraire tous les champs préalablement définis. On peut configurer le prétraitement, la normalisation des champs et les règles de gestion. |
Agent de classification | Son objectif est de prédire la bonne classe d'un document ou d'un mail. On peut configurer le pré-processing ou l'activation du déliassage. |
Annotation | L'annotation consiste à labelliser (étiqueter) un document. Pour chaque label, on indique la valeur présente sur le document. |
Classe | La nature d'un document ou d'un mail. On parle de classe d'un document dans le cadre de la classification. |
Dataset | Le terme "dataset" signifie "jeu de données". Dans l'interface reciTAL, un dataset correspond à un type de document (par exemple, CNI, Factures, etc.). Un dataset est donc l'ensemble des documents permettant d'entraîner un modèle d'extraction (dataset d'entraînement) ou de valider un agent (dataset de validation). |
Documents "simples" | Documents structurés, semi-structurés ou non structurés sans tableaux, courts et avec des formats peu diversifiés. |
Documents "complexes" | Documents non structurés longs, avec des tableaux ou des formats très diversifiés. |
Etiquette (Label) | Champ à annoter pour l'extraction. On y fait référence pendant la phase d'annotation d'un modèle d'extraction. |
Extracteur | Étiquette ou groupe d'étiquettes paramétrables. On peut paramétrer la nature d'un extracteur afin de le normaliser (Date, Float, Str, …) |
Modèle | Un modèle, de classification ou d'extraction, est un objet mathématique générant une prédiction à partir de données d’entrée. Le modèle est estimé à partir du dataset annoté lors de la phase d’entraînement. |
Règles de gestion | Ensemble de règles métier permettant de vérifier la cohérence d'une extraction. (Par exemple Total HT + Total TVA = Total TTC) |
Validation | La validation est la phase d'évaluation manuelle d'un Agent. C'est une étape optionnelle permettant de mieux comprendre ses forces et ses faiblesses. |
Vidéo-codage | Étape optionnelle permettant une intervention humaine dans le traitement d'un document. On peut la déclencher à partir de règles de gestion. |
Last updated