Efficacité Opérationnelle
Automatisation du traitement des documents dans le secteur de l'assurance
Dans le secteur de l’assurance, le traitement de volumes importants de documents manuscrits tout en garantissant un haut niveau de précision demeure un défi opérationnel majeur. Agilytic a développé pour le compte d'un grand assureur santé une solution d'automatisation du traitement des documents précise et efficace.
Pour protéger la confidentialité, nous pouvons modifier certains détails tout en préservant l'essence de notre contribution principale.
Contexte et objectifs
Un grand assureur santé traitait chaque jour des milliers de documents de manière entièrement manuelle. Ces documents manuscrits comprenaient de nombreuses questions fermées (oui/non), qu'il était difficile de traiter de manière fiable et rapide.
Afin d’optimiser ses opérations, l’assureur souhaitait automatiser l’extraction des informations contenues dans ces documents. Bien que ses outils et processus aient été progressivement améliorés au fil du temps, ils restaient insuffisants pour atteindre un traitement entièrement automatisé. Une solution technologique plus avancée était donc nécessaire.
Le principal enjeu consistait à maximiser la couverture des documents tout en garantissant une précision proche de 100 %. Cette exigence était cruciale, compte tenu du caractère sensible des décisions prises à partir de ces données. Le système d'automatisation du traitement des documents devait notamment :
gérer différents types de documents, avec des formats variés ;
traiter des fichiers PDF comportant des pages manquantes, dans le désordre ou en surplus.
Approche
Architecture et technologies utilisées
Le système prend en entrée des documents numérisés contenant des cases à cocher et génère en sortie une synthèse des réponses aux questions identifiées.
La solution d'automatisation du traitement des documents a été développée à l’aide des technologies suivantes :
Docker
Environnement cloud AWS
PyTorch
OpenCV
Grâce à des techniques avancées de traitement automatique du langage naturel (NLP), finement ajustées, nous avons obtenu une classification précise des textes, permettant un traitement documentaire fiable et automatisé.
Processus de reconnaissance et de traitement
Le modèle suit les étapes suivantes :
Identification automatique du modèle du document
Comparaison avec des modèles de référence afin de déterminer la correspondance la plus fiable
Association de chaque page du PDF à sa page de référence, en tenant compte des pages manquantes ou désordonnées
Détection automatique des cases à cocher sur chaque page
Classification des cases (cochée, non cochée ou incertaine) à l’aide d’un réseau de neurones convolutionnel (CNN)
Résultats
La solution développée a permis à l’assureur de gagner un temps précieux et d’optimiser ses ressources grâce à :
une couverture de plus de 50 % des documents avec une précision de 100 % pour la prise de décision ;
un traitement automatisé de plusieurs centaines de documents par jour ;
la prise en charge de différents types de documents et jeux de données ;
une interface simple et intuitive, accessible à tous les profils d’utilisateurs.
La solution, conçue de manière modulaire, offre également une grande flexibilité et une forte capacité d’évolution grâce à son déploiement en cloud hybride. Le client peut ainsi enrichir facilement la chaîne de traitement, mettre en place un suivi des performances avec des alertes automatisées et étendre progressivement la couverture à d’autres étapes du processus.
Pour garantir la confidentialité, nous modifions parfois certains détails dans nos études de cas.
