# Version 24.9.x (2024-09-20)

## Fonctionnalités

<table><thead><tr><th width="71">#</th><th width="548">Description</th></tr></thead><tbody><tr><td>1</td><td>Il est désormais possible de créer des datasets d'emails. Les fichiers .msg ou .eml sont acceptés. <br>La possibilité d'entraîner un classifieur de mails à également été ajoutée.</td></tr><tr><td>2</td><td>Un mode "Datascience" est activable par organisation. Ce mode permet entre autre d'avoir accès à des fonctionnalités avancées permettant de visualiser l'ordre de lecture,  afficher les blocks de mots, afficher la détection des tableaux. Ce mode est activable par l'équipe reciTAL au besoin.</td></tr><tr><td>3</td><td>DocTR, Un nouveau modèle interne d'OCR a été ajouté. Il peut être sélectionné en remplacement du modèle Google s'il y a des contraintes de confidentialité des données.</td></tr><tr><td>4</td><td><p>La détection des cases à cocher est désormais possible lors de la phase d'annotation. Elles peuvent être encadrées comme n'importe quel autre mot du document.</p><p>Si l'OCR de google est utilisé, nous utilisons les prédictions de ce même modèle.</p><p>Si un autre OCR est utilisé (Tesseract ou DocTR), nous utilisons un modèle reciTAL pour la détection de cases à cocher. Nous sommes actuellement en train d'analyser les performances de notre détecteur sur différents types de document.</p></td></tr><tr><td>5</td><td>Les images supérieurs à 4.2 MB étaient rejetées car trop volumineuses. Un pré-traitement a été mis en place pour réduire la taille d'une image, jusqu'à atteindre une taille acceptée.</td></tr><tr><td>6</td><td>La date et l'heure d'entrainement d'un modèle sont maintenant affichées dans les détails d'un modèle.</td></tr><tr><td>7</td><td>L'interface du choix des modules dans le Workflow a été complètement revue.</td></tr><tr><td>8</td><td>Lorsqu'un champs est automatiquement validé par une règle de gestion dans l'écran de review, on affiche la règle de gestion en information.</td></tr><tr><td>9</td><td>Ajout des liens des différentes API et de leur état dans les paramètres généraux de l'organisation.</td></tr><tr><td>10</td><td>Possibilité d'utiliser une url dynamique dans le module "Webhook" dans le workflow.</td></tr><tr><td>11</td><td>Ajout d'un module de vidéo-typage (review de classification) dans le Workflow.</td></tr><tr><td>12</td><td>Amélioration du module "custom code" (python) dans le workflow. Le module est plus grand et la couleur de police est dynamique lors de l'édition. </td></tr><tr><td>13</td><td>Ajout d'une notification à la fin de l'entrainement d'un modèle, que ce dernier soit un succès ou soit en erreur.</td></tr><tr><td>14</td><td>Un fichier déjà en review par un autre utilisateur n'est plus cliquable.</td></tr></tbody></table>

## Bugs corrigés

<table><thead><tr><th width="71">#</th><th width="548">Description</th></tr></thead><tbody><tr><td>1</td><td>L'url personnalisée pour la connexion Open ID Connect a été corrigée.</td></tr><tr><td>2</td><td>Le filtrage des jobs dans le workflow a été amélioré.</td></tr><tr><td>3</td><td>Prise en compte des pages supprimées dans un dataset lors de l'entrainement d'un modèle de classification. (Elles sont maintenant supprimées du dataset de classification)</td></tr><tr><td>4</td><td>Affichage du bouton "Cancel" qui était bogué lors de l'ajout d'un groupe manquant pendant la review.</td></tr><tr><td>5</td><td>Le paramètre "Custom Metadata" est bien renvoyé dans le Webhook.</td></tr><tr><td>6</td><td>Les croix pour supprimer un module workflow n'apparaissent plus lorsque ce dernier n'est pas en mode édition.</td></tr><tr><td>7</td><td>Le téléchargement d'un Agent d'extraction est maintenant fonctionnel.</td></tr><tr><td>8</td><td>Il y avait de forte latences lorsqu'un nombre important de documents étaient dans un dataset / en validation. Le problème a été identifié et traité.</td></tr><tr><td>9</td><td>L'ajout d'une boite mail dans les workflow est fonctionnelle.</td></tr><tr><td>10</td><td>Correction de légers bugs visuels sur la plateforme.</td></tr><tr><td>11</td><td>La fonctionnalité de recherche au sein d'un document lors de la phase d'annotation est maintenant fonctionnelle.</td></tr><tr><td>12</td><td>Correction de la lisibilité des notifications.</td></tr><tr><td>13</td><td>La matrice de confusion pour les modèles de classification a été corrigée.</td></tr><tr><td>14</td><td>Correction de la colonne "Updated On" pour prendre en compte la dernière date d'édition du workflow.</td></tr><tr><td>15</td><td>La fonctionnalité "Re-traiter un document" en validation était boguée, elle a été corrigée.</td></tr><tr><td>16</td><td>La collection de sortie par défaut pour le module "split-pdf" est passée de "file" à "split-file".</td></tr><tr><td>17</td><td>Les fichiers .msg dans les datasets d'Emails sont maintenant bien gérés.</td></tr><tr><td>18</td><td>Correction de l'étape "Cleanup" dans le worfklow qui n'avait pas le comportement souhaité.</td></tr><tr><td>19</td><td>L'entrainement d'un modèle de classification ne fonctionnait pas lorsque des documents corrompus étaient présent dans les datasets. Ils sont maintenant ignorés.</td></tr><tr><td>20</td><td>"Attachments" au lieu de "Attachment" comme nom de collection utilisée lors des tests du Workflow.</td></tr><tr><td>21</td><td>Dans le workflow, les transitions sans nom n'affichent plus "null".</td></tr></tbody></table>
