From 0a752bc03f1d28493ad94d9e2f164b5522ece697 Mon Sep 17 00:00:00 2001 From: Nacim Date: Mon, 16 Jun 2025 03:04:43 +0200 Subject: [PATCH] Update default.yaml --- conf/default.yaml | 27 ++++++--------------------- 1 file changed, 6 insertions(+), 21 deletions(-) diff --git a/conf/default.yaml b/conf/default.yaml index c7bbf3d..20a17c1 100644 --- a/conf/default.yaml +++ b/conf/default.yaml @@ -1,8 +1,9 @@ # ===================================================================== -# FICHIER DE CONFIGURATION MAÎTRE DE QUALITÉ PRODUCTION +# FICHIER DE CONFIGURATION MAÎTRE FINAL ET GARANTI # ===================================================================== # 1. Configuration du moteur de langage (NLP) +# On déclare notre support pour le français et on l'associe au bon modèle. nlp_engine_name: spacy supported_languages: [en, fr] models: @@ -12,33 +13,16 @@ models: model_name: fr_core_news_sm # 2. Configuration du comportement du moteur NLP -# On ignore l'étiquette "MISC" pour éviter les faux positifs. +# On ignore l'étiquette "MISC" pour éviter les faux positifs et les warnings. ner_model_configuration: labels_to_ignore: - MISC # 3. Configuration des détecteurs (Recognizers) - LA PARTIE LA PLUS IMPORTANTE -# On charge explicitement tous les outils dont nous avons besoin. +# On dit à Presidio de charger d'ABORD tous ses détecteurs par défaut... recognizer_registry: - # On charge le moteur principal pour les entités de base (PERSON, LOCATION, ORG) - - name: SpacyRecognizer - supported_language: fr - - name: SpacyRecognizer - supported_language: en - - # On charge TOUS les reconnaisseurs universels pertinents pour le RGPD - - name: EmailRecognizer - - name: PhoneRecognizer # --> Sera amélioré par notre règle custom - - name: IbanRecognizer # --> Sera amélioré par notre règle custom - - name: CreditCardRecognizer - - name: DateRecognizer - - name: UrlRecognizer - - name: IpRecognizer - - name: MedicalLicenseRecognizer - - name: CryptoRecognizer - - # On charge TOUTES nos règles personnalisées - default + # ...ET ENSUITE d'ajouter les nôtres depuis notre fichier Python. - presidio_config.custom_recognizers.custom_recognizers # 4. Configuration de la post-analyse (Allow List) @@ -53,6 +37,7 @@ analysis_explanations: - Société - Investisseur - Montant + - Prêt - Intérêt - Intérêts - Partie