Glossaire reciTAL

Concept

Agent

Un Agent reciTAL est un objet paramétrable permettant de réaliser une classification ou une extraction selon son type. Cet Agent peut être configuré à partir de modèles d'IA (depuis le studio), de règles, ou d'une combinaison des deux.

Agent d'extraction

Un Agent d'extraction est composé d'extracteurs. Son objectif est d'extraire tous les champs préalablement définis. On peut configurer le prétraitement, la normalisation des champs et les règles de gestion.

Agent de classification

Son objectif est de prédire la bonne classe d'un document ou d'un mail. On peut configurer le pré-processing ou l'activation du déliassage.

Annotation

L'annotation consiste à labelliser (étiqueter) un document. Pour chaque label, on indique la valeur présente sur le document.

Classe

La nature d'un document ou d'un mail. On parle de classe d'un document dans le cadre de la classification.

Dataset

Le terme "dataset" signifie "jeu de données". Dans l'interface reciTAL, un dataset correspond à un type de document (par exemple, CNI, Factures, etc.). Un dataset est donc l'ensemble des documents permettant d'entraîner un modèle d'extraction (dataset d'entraînement) ou de valider un agent (dataset de validation).

Documents "simples"

Documents structurés, semi-structurés ou non structurés sans tableaux, courts et avec des formats peu diversifiés.

Documents "complexes"

Documents non structurés longs, avec des tableaux ou des formats très diversifiés.

Etiquette (Label)

Champ à annoter pour l'extraction. On y fait référence pendant la phase d'annotation d'un modèle d'extraction.

Extracteur

Étiquette ou groupe d'étiquettes paramétrables. On peut paramétrer la nature d'un extracteur afin de le normaliser (Date, Float, Str, …)

Modèle

Un modèle, de classification ou d'extraction, est un objet mathématique générant une prédiction à partir de données d’entrée. Le modèle est estimé à partir du dataset annoté lors de la phase d’entraînement.

Règles de gestion

Ensemble de règles métier permettant de vérifier la cohérence d'une extraction.

(Par exemple Total HT + Total TVA = Total TTC)

Validation

La validation est la phase d'évaluation manuelle d'un Agent. C'est une étape optionnelle permettant de mieux comprendre ses forces et ses faiblesses.

Vidéo-codage

Étape optionnelle permettant une intervention humaine dans le traitement d'un document. On peut la déclencher à partir de règles de gestion.

Dernière mise à jour