# Glossaire reciTAL

<table><thead><tr><th width="295">Concept</th><th></th><th data-hidden></th></tr></thead><tbody><tr><td><strong>Agent</strong></td><td>Un Agent reciTAL est un objet paramétrable permettant de réaliser une classification ou une extraction selon son type. Cet Agent peut être configuré à partir de modèles d'IA (depuis le studio), de règles, ou d'une combinaison des deux.</td><td></td></tr><tr><td><strong>Agent d'extraction</strong></td><td>Un Agent d'extraction est composé d'extracteurs. Son objectif est d'extraire tous les champs préalablement définis. On peut configurer le prétraitement, la normalisation des champs et les règles de gestion.</td><td></td></tr><tr><td><strong>Agent de classification</strong></td><td>Son objectif est de prédire la bonne classe d'un document ou d'un mail. On peut configurer le pré-processing ou l'activation du déliassage.</td><td></td></tr><tr><td><strong>Annotation</strong></td><td>L'annotation consiste à labelliser (étiqueter) un document. Pour chaque label, on indique la valeur présente sur le document.</td><td></td></tr><tr><td><strong>Classe</strong></td><td>La nature d'un document ou d'un mail. On parle de classe d'un document dans le cadre de la classification.</td><td></td></tr><tr><td><strong>Dataset</strong></td><td>Le terme "dataset" signifie "jeu de données". Dans l'interface reciTAL, un dataset correspond à un type de document (par exemple, CNI, Factures, etc.). Un dataset est donc l'ensemble des documents permettant d'entraîner un modèle d'extraction (dataset d'entraînement) ou de valider un agent (dataset de validation).</td><td></td></tr><tr><td><strong>Documents "simples"</strong> </td><td>Documents structurés, semi-structurés ou non structurés sans tableaux, courts et avec des formats peu diversifiés.</td><td></td></tr><tr><td><strong>Documents "complexes"</strong></td><td>Documents non structurés longs, avec des tableaux ou des formats très diversifiés.</td><td></td></tr><tr><td><strong>Etiquette (Label)</strong></td><td>Champ à annoter pour l'extraction. On y fait référence pendant la phase d'annotation d'un modèle d'extraction.</td><td></td></tr><tr><td><strong>Extracteur</strong></td><td>Étiquette ou groupe d'étiquettes paramétrables. On peut paramétrer la nature d'un extracteur afin de le normaliser (Date, Float, Str, …)</td><td></td></tr><tr><td><strong>Modèle</strong></td><td>Un modèle, de classification ou d'extraction, est un objet mathématique générant une prédiction à partir de données d’entrée. Le modèle est estimé à partir du dataset annoté lors de la phase d’entraînement.</td><td></td></tr><tr><td><strong>Règles de gestion</strong></td><td><p>Ensemble de règles métier permettant de vérifier la cohérence d'une extraction.</p><p>(Par exemple Total HT + Total TVA = Total TTC)</p></td><td></td></tr><tr><td><strong>Validation</strong></td><td>La validation est la phase d'évaluation manuelle d'un Agent. C'est une étape optionnelle permettant de mieux comprendre ses forces et ses faiblesses.</td><td></td></tr><tr><td><strong>Vidéo-codage</strong></td><td>Étape optionnelle permettant une intervention humaine dans le traitement d'un document. On peut la déclencher à partir de règles de gestion.</td><td></td></tr></tbody></table>
