LogoLogo
  • 📖Suite reciTAL - Documentation
  • 🚀Démarrage rapide
    • Utiliser un modèle d'extraction reciTAL sur étagère
  • 🎯Extraction
    • 🎯Introduction
    • Entraîner un modèle d'extraction
      • Constituer un Dataset
      • Annoter un Dataset
      • Entraîner un modèle
    • Configurer un Agent d'Extraction
      • Créer un Agent
      • Configurer les extracteurs d'un Agent
      • Configurer les paramètres d'un Agent
    • Valider un Agent
      • Charger des documents en validation
      • Valider un Agent
    • Ecran de correction
  • 🗃️Classification
    • 🗃️Introduction
    • Entraîner un modèle de classification
      • Constitution des datasets
      • Entrainement du modèle
      • Lecture et interprétation des résultats
    • Configurer un Agent de Classification
  • 🪄Workflow
    • 🪄Introduction
    • Créer un Workflow
    • Les modules Workflow
    • Jobs
    • Inputs
  • 🔌Intégration API
    • Authentification
    • Extraction
      • Envoyer des documents en extraction
      • Structure des résultats d'extraction
    • Classification
      • Envoyer des documents en classification
      • Structure des résultats de classification
    • Workflow
      • Envoyer des documents dans un Workflow
      • Structure des résultats du workflow
  • 📺Autres
    • Glossaire reciTAL
    • Astuces d'annotation
    • Gestion des utilisateurs
    • Métriques d'évaluation
    • Connection avec OpenID Connect (OIDC)
  • 🏗️Nos APIs
    • Swagger Workflow
    • Swagger Extraction
    • Swagger Classification
    • Swagger Auth
  • ⚙️Changelogs
    • Version 25.5.x (14/05/2025)
    • Mises à jours précédentes
      • Version 25.4.x (22/04/2025)
      • Version 25.3.x (24/03/2025)
      • Version 25.2.x (05/02/2025)
      • Version 24.12.x (23/12/2024)
      • Version 24.11.x (2024-11-05)
      • Version 24.9.x (2024-09-20)
      • Version 24.7.x (2024-07-09)
      • Version 24.6.x (20/06/2024)
      • Version 24.1.x (12/01/2024)
      • Version 23.12.x (12/12/2023)
      • Version 1.0.12 (05/12/2023)
      • Version 1.0.11 (30/11/2023)
      • Version 1.0.10 (22/11/2023)
      • Version 1.0.9 (27/10/2023)
      • Version 1.0.8 (18/10/2023)
      • Version 1.0.7 (03/10/2023)
      • Version 1.0.6 (11/09/2023)
      • Version 1.0.5 (23/08/2023)
      • Version 1.0.4 (18/08/2023)
      • Version 1.0.3 (27/06/2023)
      • Version 1.0.2 (02/05/2023)
      • Version 1.0.1 (24/03/2023)
  • 📧Contact
    • Nous contacter
Powered by GitBook
On this page
  1. Changelogs
  2. Mises à jours précédentes

Version 24.12.x (23/12/2024)

Agents de classification, Amélioration de l'écran de review de classification, Amélioration du workflow

Fonctionnalités

Dataset

  • Possibilité d'importer des datasets d'email depuis un fichier ZIP

Extraction

  • Une option a été ajoutée pour permettre à un extracteur de renvoyer le paragraphe entier plutôt que simplement la valeur extraite.

  • Une barre de progression a été ajoutée lors de l'entrainement d'un modèle d'extraction.

Classification

  • Une notification a été créée pour avertir que l'entrainement de son modèle de classification a échoué.

  • Les Agents de Classification sont maintenant disponibles sur la plateforme. Ils permettent de configurer différents paramètres pour la classification :

    • Renommer les catégories du modèle de classification

    • Ajouter des catégories supplémentaires (sélectionnable lors de la review de classification)

    • Définir un seuil de classification. En dessous de ce seuil, la prédiction sera remplacée par la classe "Unknown".

    • Définir les raisons du rejet d'une page ou d'un document

    • Choisir son moteur d'OCR

  • Une étape "Agents de classification" a été ajoutée dans les workflow. La classification directement depuis un modèle est toujours possible. Le résultat JSON pour l'étape "Agents de classification" est la même que pour celle d'un modèle de classification.

Écran de review de classification

  • Pour le déliassage ou pour la classification simple, il est désormais possible de supprimer des pages (pages blanches, pages indésirables, etc) et d'en indiquer la raison.

  • Un champ "contexte" a été ajouté à l'écran, afin d'apporter des instructions à l'opérateur. Un texte explicatif y figure par défaut. Il est possible de le configurer dans l'étape de classification review du workflow.

  • Les classes proposées à l'opérateur dans le dropdown sont maintenant triées par ordre de probabilité

  • Il est possible de changer la classe de plusieurs pages en même temps avec le principe de "bundle".

  • Des informations concernant la review ont été ajoutées dans le JSON de sortie :

    • id et email du reviewer

    • date et heure de début et de fin de la review

    • le nombre d'éléments modifiés

Workflows

  • L'interface générale a été retravaillée.

  • Les noms des statuts des étapes ont été modifiés :

    • "done" -> "completed"

  • Il est dorénavant possible d'ajouter des fichiers "ressources".

  • Dans le code personnalisé, il est possible d'accéder aux fichiers ressources, mais également aux fichiers des différentes collections

    • ./resources/filename.doc

    • ./collection_x/filename.doc

  • Pour les sous-workflows, ou toutes les étapes sur lesquelles il est possible d'itérer, des logs ont été rajoutés pour visualiser les input data, et les fichiers dans le scope.

  • Les transitions ont été ajoutées dans les jobs. Cet ajout permet de capturer toutes les erreurs liées aux transitions, mais également à la gestion des inputs dans une étape.

  • Il est maintenant possible d'archiver un workflow.

  • Étape "Webhook": ajout de tous les paramètres permettant de configurer le callback

OCR

  • Un redimensionnement des images est effectué sur tous les documents passant par les OCR de Google ou d'Azure. L'objectif étant de s'assurer que les images envoyées respectent la taille recommandée par ces OCR.

Production

  • Les fichiers de production en attente de review sont automatiquement supprimés après un certain temps (60 jours), s'il y a plus d'un certain nombre de documents en attente (100 documents).

Autres

  • Les restrictions au niveau des noms des datasets et agents ont été revues.

  • La redirection vers l'URL de connexion est désormais fonctionnelle lors de la création ou de la modification d'un mot de passe.

PreviousVersion 25.2.x (05/02/2025)NextVersion 24.11.x (2024-11-05)

Last updated 5 months ago

⚙️