Utilisation de l’API OpenAi pour analyser des documents juridiques
Développement, pour un client, d’un outil d’analyse automatisée de PDF juridiques en droit des sociétés.
Enjeux : documents scannés, longs, hétérogènes, riches en données complexes, nécessitant une extraction conforme à une ontologie stricte et avec un niveau de certitude défini.
Approche :
– OCRisation et extraction textuelle des PDF.
– Découpage des textes volumineux en sous-sections pertinentes.
– Structuration des informations obtenues.
– Mise en place d’un environnement de test permettant aux juristes d’expérimenter différentes méthodes de questionnement via un module IA (tests menés avec un modèle Llama on-premise et l’API OpenAI).
– Constitution de corpus qualifiés et adaptables, avec possibilité d’ajouter de nouveaux types de documents.
– Intégration d’un mécanisme de contrôle continu pour vérifier que les évolutions des méthodes d’extraction n’entraînent pas de régressions en qualité.