Les modules Workflow
Un grand nombre de modules existent pour compléter votre Worflow. Cette page permet d'avoir une vue d'ensemble sur ces derniers, et ce qu'ils permettent de faire.
Last updated
Un grand nombre de modules existent pour compléter votre Worflow. Cette page permet d'avoir une vue d'ensemble sur ces derniers, et ce qu'ils permettent de faire.
Last updated
Les modules sont étiquettés afin de pouvoir les retrouver plus facilement. Il y a plusieurs types d'étiquettes :
La nature de l'action : "Classification, "Extraction", "Post-traitement", "Automation"
La nature du media : "Mails", "Document"
Le type du module : "Input", "AI Agent", "Review", "Etat", "Code", "Output"
Ce module suppose qu'une boite mail a été configurée (voir lnputs), ou bien que les documents envoyés sont des .msg ou .eml.
Cette étape permet de récupérer toutes les informations concernant le mail et de les conserver dans "data". Elle permet également de mettre les pièces jointes dans une collection.
Nom
Le nom de l'étape
Expression d'entrée
La collection d'email à traiter. files["email"] par défaut.
Taille minimale de pièce jointe (ko)
Limite minimale à une pièce jointe pour qu'elle soit prise en compte.
Taille maximale de pièce jointe (ko)
Limite maximale à une pièce jointe pour qu'elle soit prise en compte.
Ignorer pièce jointe si le nom contient
Si le nom de la pièce jointe contient le texte renseigné, alors la pièce jointe sera ignorée. Mettre le nom entre "".
Extensions acceptées pour pièce jointe
Les fichiers n'ayant pas ces extensions ne seront pas pris en compte. Si aucune extension n'est renseignée, tous les fichiers sont pris en compte.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Collection de sortie
La collection dans laquelle seront envoyées les pièces jointes. "attachments" par défaut.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
Nom
Le nom de l'étape
Modèle
La sélection parmi les modèles de classification de document existants
Per page
(SAM) Permet d'avoir une classification page à page. Il peut être couplé à un module split-pdf à la suite pour déliasser un document.
Use Google OCR
Utilisation de google OCR si activé. Sinon, utilisation d'un modèle OCR open-source.
Expression d'entrée
Le ou les fichiers à classifier. files["file"] par défaut.
Expression du modèle
Sélection dynamique du modèle d'extraction.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
Voir Structure des résultats de Classification
Nom
Le nom de l'étape
Expression d'entrée
Le mail à classifier. La valeur par défaut est : data['email']
Expression des pièces jointes
La collection des pièces jointes. La valeur par défaut est : files['attachments']
Modèle
La sélection parmi les modèles de classification de mails existants
Expression du modèle
Sélection dynamique du modèle d'extraction.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
Voir Structure des résultats de Classification
Nom
Le nom de l'étape
Agent d'extraction
La sélection parmi les agents d'extraction existant
Expression d'entrée
Le ou les fichiers à classifier. files["file"] par défaut.
Expression du modèle
Sélection dynamique du modèle d'extraction.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
Voir Structure des résultats d'Extraction
WIP
Les étape de review sont bloquantes tant que le document n'a pas été validé par un opérateur.
Active le vidéo-typage suite à une classification.
Nom
Le nom de l'étape
Contexte
Permet d'afficher des informations pendant la review
Expression d'entrée
Le ou les fichiers à classifier. files["file"] par défaut.
Expression du contexte
Permet d'afficher des informations pendant la review. Le paramètre supporte des expressions dynamiques.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
Voir Structure des résultats de Classification.
Active le vidéo-codage suite à une extraction.
Nom
Le nom de l'étape
Expression d'entrée
Le ou les fichiers à classifier. files["file"] par défaut.
Expression du contexte
Permet d'afficher des informations pendant la review. Le paramètre supporte des expressions dynamiques.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
Voir Structure des résultats d'Extraction
Il est possible d'imbriquer des workflows enfants dans un workflow parent. Cela présente plusieurs utilités:
Réutilisation d'un workflow dans plusieurs workflow.
Dans le cas de création de sous-documents (module split-pdf) durant le workflow parent, pouvoir itérer sur l'ensemble de ces sous-documents. Un job 'enfant' sera crée par sous-documents.
Utiliser la récursivité. Un workflow peut s'appeler lui-même. Attention cependant a bien vérifier les conditions d'arrêt.
Nom
Le nom du module
Workflow
La sélection parmi les workflow existants
Expression d'entrée
Les informations auxquels aura accès le sous-workflow.
Par exemple après un split-pdf, on peut avoir : zip(data['split-pdf']['files'], files['classified'])
On prend les informations renvoyées par split-pdf, ainsi que l'ensemble des fichiers ajoutés dans la collection "classified" par split-pdf. A utiliser avec l'option "Iterate over input".
Workflow Expression
Permet de sélectionner dynamiquement un workflow en fonction d'une expression.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
Voir Structure des résultats du Workflow
Ce module permet de séparer un document en sous-documents. Très utile par exemple pour Déliasser un document après une classification page par page. Les sous-documents générés sont stocké dans la collection de sortie
Nom
Le nom du module
Collection de sortie
La collection dans laquelle sont envoyés les sous-documents générés.
Expression d'entrée
Le ou les fichiers à déliasser. files["file"] par défaut.
Labels Expr
La liste des labels de chaque page. Le document sera divisé à chaque fois qu'un label est différent de la page précédente.
Labels To Ignore
Les pages ayant ce label seront automatiquement mis à l'écart, et ne figureront pas dans les sous-documents générés.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
Ce module permet de décompresser un dossier archivé et d'extraire les fichiers compressés dans une collection de sortie.
Nom
Le nom du module
Collection de sortie
La collection dans laquelle sont envoyés les fichiers décompressés.
Expression d'entrée
Le ou les fichiers à décompresser. files["file"] par défaut.
Extensions
Une liste d'extension valide. (Exemple : "pdf, doc, jpg, png"). Les fichiers ayant une extension différente dans l'archive seront ignorés.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
Ce module permet de fusionner les pages de plusieurs documents en entrée en un seul document.
Nom
Le nom du module
Collection de sortie
La collection dans laquelle est envoyé le fichier fusionné.
Nom du fichier de sortie
Le nom du fichier de sortie
Expression d'entrée
Les fichiers à fusionner. files["file"] par défaut.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.
En cours de développement
Le module de code personnalisé permet de faire tout ce qui n'a pas encore été préconçu par d'autre module.
Le paramètre d'entrée job
contient toutes les informations utiles dans job.data
.
Il est également possible de rajouter de nouvelles informations dans data
avec le return
.
Pour plus de détails sur le fonctionnement du module de code personnalisé, et sur des détails du Workflow, veuillez contacter l'équipe Projet.
Rajouter un module d'état permet de:
Recevoir automatiquement une notification de changement d'état. Avec les données accumulées jusque là.
Filtrer / trier les jobs en fonction de leur état.
Les modules d'état peuvent être ajoutés à n'importe quelle transition. Ils permettent de mettre à jour l'état général d'un job, et de notifier si une url de callback a été définie lors de la création du job.
Permet de renvoyer les résultats en cours (ou une partie) vers une URL donnée.
Nom
Le nom du module
URL
L'url de callback
Ignorer les erreurs
Boolean. Si l'option est activée, les flux ne sera pas interrompu, même si le code de réponse est une erreur.
Expression d'entrée
Les données à renvoyer. "data" par défaut.
Clé de sortie
La clé de "data" dans lesquels seront stockées toutes les informations relatives à ce module.
Itérer sur l'entrée
Activer l'option si l'entrée est une liste. Le module traitera les documents 1 à 1, et la sortie sera une liste de résultats.