Les modules Workflow
Un grand nombre de modules existent pour compléter votre Worflow. Cette page permet d'avoir une vue d'ensemble sur ces derniers, et ce qu'ils permettent de faire.
Last updated
Un grand nombre de modules existent pour compléter votre Worflow. Cette page permet d'avoir une vue d'ensemble sur ces derniers, et ce qu'ils permettent de faire.
Last updated
Les modules sont étiquettés afin de pouvoir les retrouver plus facilement. Il y a plusieurs types d'étiquettes :
La nature de l'action : "Classification, "Extraction", "Post-traitement", "Automation"
La nature du media : "Mails", "Document"
Le type du module : "Input", "AI Agent", "Review", "Etat", "Code", "Output"
Ce module suppose qu'une boite mail a été configurée (voir lnputs).
Paramètre | Description |
---|---|
Nom | Le nom du module |
Expression d'entrée | La collection d'email à traiter. files["email"] par défaut. |
Output key | La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module. |
Output collection | La collection dans laquelle seront envoyées les pièces jointes. "attachments" par défaut. |
Iterate over input | Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats. |
Paramètre | Description |
---|---|
Nom | Le nom du module |
Modèle | La sélection parmi les modèles de classification de document existants |
Per page | (SAM) Permet d'avoir une classification page à page. Il peut être couplé à un module split-pdf à la suite pour déliasser un document. |
Use Google OCR | Utilisation de google OCR si activé. Sinon, utilisation d'un modèle OCR open-source. |
Expression d'entrée | Le ou les fichiers à classifier. files["file"] par défaut. |
Expression du modèle | Sélection dynamique du modèle d'extraction. |
Output key | La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module. |
Iterate over input | Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats. |
Paramètre | Description |
---|---|
Nom | Le nom du module |
Expression d'entrée | Le mail à classifier. La valeur par défaut est : data['email'] |
Expression des pièces jointes | La collection des pièces jointes. La valeur par défaut est : files['attachments'] |
Modèle | La sélection parmi les modèles de classification de mails existants |
Expression du modèle | Sélection dynamique du modèle d'extraction. |
Clé de sortie | La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module. |
Iterate over input | Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats. |
Paramètre | Description |
---|---|
Nom | Le nom du module |
Agent d'extraction | La sélection parmi les agents d'extraction existant |
Expression d'entrée | Le ou les fichiers à classifier. files["file"] par défaut. |
Expression du modèle | Sélection dynamique du modèle d'extraction. |
Output key | La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module. |
Iterate over input | Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats. |
WIP
Les étape de review sont bloquantes tant que le document n'a pas été validé par un opérateur.
Active le vidéo-typage suite à une classification.
Active le vidéo-codage suite à une extraction.
Rajouter des modules d'état permet:
De recevoir automatiquement une notification de changement d'état.
De filtrer / trier les jobs en fonction de leur état.
Indique au système une fin de branche avec un statut Success
. Aucune transition n'est possible après un Etat de fin.
Indique au système une fin de branche avec un statut Error
. Aucune transition n'est possible après un Etat d'erreur.
Les modules d'état personnalisé peuvent être ajoutés à n'importe quelle transition. Ils permettent de mettre à jour l'état général d'un job, et de notifier si une url de callback a été définie lors de la création du job.
Il est possible d'imbriquer des workflows enfants dans un workflow parent. Cela présente plusieurs utilités:
Réutilisation d'un workflow dans plusieurs workflow.
Dans le cas de création de sous-documents (module split-pdf) durant le workflow parent, pouvoir itérer sur l'ensemble de ces sous-documents. Un job 'enfant' sera crée par sous-documents.
Utiliser la récursivité. Un workflow peut s'appeler lui-même. Attention cependant a bien vérifier les conditions d'arrêt.
Paramètre | Description |
---|---|
Nom | Le nom du module |
Workflow | La sélection parmi les workflow existants |
Expression d'entrée | Les informations auxquels aura accès le sous-workflow.
Par exemple après un split-pdf, on peut avoir : |
Workflow Expression | Permet de sélectionner dynamiquement un workflow en fonction d'une expression. |
Output key | La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module. |
Iterate over input | Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats. |
Ce module permet de séparer un document en sous-documents. Très utile par exemple pour Déliasser un document après une classification page par page.
Paramètre | Description |
---|---|
Nom | Le nom du module |
Expression d'entrée | La liste des labels de chaque page. Le document sera divisé à chaque fois qu'un label est différent de la page précédente. |
Output key | La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module. |
Output collection | La collection dans laquelle seront envoyées les pièces jointes. "splits" par défaut. |
Iterate over input | Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats. |
Le module de code personnalisé permet de faire tout ce qui n'a pas encore été préconçu par d'autre module.
Le paramètre d'entrée job
contient toutes les informations utiles dans job.data
.
Il est également possible de rajouter de nouvelles informations dans data
avec le return
.
Pour plus de détails sur le fonctionnement du module de code personnalisé, et sur le workflow de manière générale, veuillez contacter l'équipe Projet.
Permet de renvoyer les résultats en cours (ou une partie) vers une url donnée.
Paramètre | Description |
---|---|
Nom | Le nom du module |
URL | L'url de callback |
Ignorer les erreurs | Boolean. Si l'option est activée, les flux ne sera pas interrompu, même si le code de réponse est une erreur. |
Expression d'entrée | Les données à renvoyer. "data" par défaut. |
Output key | La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module. |
Iterate over input | Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats. |
WIP. Une fonctionnalité est à venir pour transformer les données dans le format de votre choix grâce à des templates.