LogoLogo
  • 📖Suite reciTAL - Documentation
  • 🚀Démarrage rapide
    • Utiliser un modèle d'extraction reciTAL sur étagère
  • 🎯Extraction
    • 🎯Introduction
    • Entraîner un modèle d'extraction
      • Constituer un Dataset
      • Annoter un Dataset
      • Entraîner un modèle
    • Configurer un Agent d'Extraction
      • Créer un Agent
      • Configurer les extracteurs d'un Agent
      • Configurer les paramètres d'un Agent
    • Valider un Agent
      • Charger des documents en validation
      • Valider un Agent
    • Ecran de correction
  • 🗃️Classification
    • 🗃️Introduction
    • Entraîner un modèle de classification
      • Constitution des datasets
      • Entrainement du modèle
      • Lecture et interprétation des résultats
    • Configurer un Agent de Classification
  • 🪄Workflow
    • 🪄Introduction
    • Créer un Workflow
    • Les modules Workflow
    • Jobs
    • Inputs
  • 🔌Intégration API
    • Authentification
    • Extraction
      • Envoyer des documents en extraction
      • Structure des résultats d'extraction
    • Classification
      • Envoyer des documents en classification
      • Structure des résultats de classification
    • Workflow
      • Envoyer des documents dans un Workflow
      • Structure des résultats du workflow
  • 📺Autres
    • Glossaire reciTAL
    • Astuces d'annotation
    • Gestion des utilisateurs
    • Métriques d'évaluation
    • Connection avec OpenID Connect (OIDC)
  • 🏗️Nos APIs
    • Swagger Workflow
    • Swagger Extraction
    • Swagger Classification
    • Swagger Auth
  • ⚙️Changelogs
    • Version 25.5.x (14/05/2025)
    • Mises à jours précédentes
      • Version 25.4.x (22/04/2025)
      • Version 25.3.x (24/03/2025)
      • Version 25.2.x (05/02/2025)
      • Version 24.12.x (23/12/2024)
      • Version 24.11.x (2024-11-05)
      • Version 24.9.x (2024-09-20)
      • Version 24.7.x (2024-07-09)
      • Version 24.6.x (20/06/2024)
      • Version 24.1.x (12/01/2024)
      • Version 23.12.x (12/12/2023)
      • Version 1.0.12 (05/12/2023)
      • Version 1.0.11 (30/11/2023)
      • Version 1.0.10 (22/11/2023)
      • Version 1.0.9 (27/10/2023)
      • Version 1.0.8 (18/10/2023)
      • Version 1.0.7 (03/10/2023)
      • Version 1.0.6 (11/09/2023)
      • Version 1.0.5 (23/08/2023)
      • Version 1.0.4 (18/08/2023)
      • Version 1.0.3 (27/06/2023)
      • Version 1.0.2 (02/05/2023)
      • Version 1.0.1 (24/03/2023)
  • 📧Contact
    • Nous contacter
Powered by GitBook
On this page
  1. Autres

Glossaire reciTAL

Concept

Agent

Un Agent reciTAL est un objet paramétrable permettant de réaliser une classification ou une extraction selon son type. Cet Agent peut être configuré à partir de modèles d'IA (depuis le studio), de règles, ou d'une combinaison des deux.

Agent d'extraction

Un Agent d'extraction est composé d'extracteurs. Son objectif est d'extraire tous les champs préalablement définis. On peut configurer le prétraitement, la normalisation des champs et les règles de gestion.

Agent de classification

Son objectif est de prédire la bonne classe d'un document ou d'un mail. On peut configurer le pré-processing ou l'activation du déliassage.

Annotation

L'annotation consiste à labelliser (étiqueter) un document. Pour chaque label, on indique la valeur présente sur le document.

Classe

La nature d'un document ou d'un mail. On parle de classe d'un document dans le cadre de la classification.

Dataset

Le terme "dataset" signifie "jeu de données". Dans l'interface reciTAL, un dataset correspond à un type de document (par exemple, CNI, Factures, etc.). Un dataset est donc l'ensemble des documents permettant d'entraîner un modèle d'extraction (dataset d'entraînement) ou de valider un agent (dataset de validation).

Documents "simples"

Documents structurés, semi-structurés ou non structurés sans tableaux, courts et avec des formats peu diversifiés.

Documents "complexes"

Documents non structurés longs, avec des tableaux ou des formats très diversifiés.

Etiquette (Label)

Champ à annoter pour l'extraction. On y fait référence pendant la phase d'annotation d'un modèle d'extraction.

Extracteur

Étiquette ou groupe d'étiquettes paramétrables. On peut paramétrer la nature d'un extracteur afin de le normaliser (Date, Float, Str, …)

Modèle

Un modèle, de classification ou d'extraction, est un objet mathématique générant une prédiction à partir de données d’entrée. Le modèle est estimé à partir du dataset annoté lors de la phase d’entraînement.

Règles de gestion

Ensemble de règles métier permettant de vérifier la cohérence d'une extraction.

(Par exemple Total HT + Total TVA = Total TTC)

Validation

La validation est la phase d'évaluation manuelle d'un Agent. C'est une étape optionnelle permettant de mieux comprendre ses forces et ses faiblesses.

Vidéo-codage

Étape optionnelle permettant une intervention humaine dans le traitement d'un document. On peut la déclencher à partir de règles de gestion.

PreviousStructure des résultats du workflowNextAstuces d'annotation

Last updated 1 year ago

📺