diff --git a/conf/default.yaml b/conf/default.yaml index 034aef8..e3f6874 100644 --- a/conf/default.yaml +++ b/conf/default.yaml @@ -1,5 +1,5 @@ # ===================================================================== -# CONFIGURATION PRESIDIO - v24 (COMPLÈTE, AVEC VOTRE REGEX TÉLÉPHONE) +# CONFIGURATION PRESIDIO - v24 (CORRIGÉE ET COMPLÉTÉE) # ===================================================================== supported_languages: [en, fr] @@ -84,7 +84,8 @@ recognizer_registry: patterns: - name: BIC/SWIFT Code regex: "\\b[A-Z]{4}[A-Z]{2}[A-Z0-9]{2}(?:[A-Z0-9]{3})?\\b" - score: 0.5 + # CORRIGÉ : Le score est maintenant à 1.0 pour éviter les conflits + score: 1.0 context: ["bic", "swift"] - name: SmartOrganizationRecognizer @@ -96,6 +97,26 @@ recognizer_registry: score: 1.0 context: ["société", "entreprise"] + # --- AJOUTÉ : Détecteur pour les Titres de Fonction --- + - name: JobTitleRecognizer + supported_language: fr + supported_entity: JOB_TITLE + patterns: + - name: Common Job Titles + regex: "(?i)\\b(Gérant|Directeur des Investissements|Directeur|Président)\\b" + score: 0.9 + context: ["Par :", "Représentée par :"] + + # --- AJOUTÉ : Détecteur pour les Montants Financiers --- + - name: MoneyRecognizer + supported_language: fr + supported_entity: MONEY + patterns: + - name: Money Pattern EUR + regex: "(?:EUR|€)\\s*\\d{1,3}(?:[.,\\s]\\d{3})*(?:[.,]\\d{2})?|\\d{1,3}(?:[.,\\s]\\d{3})*(?:[.,]\\d{2})?\\s*(?:EUR|€)" + score: 0.9 + context: ["montant", "prix"] + # --- NUMÉROS D'IDENTIFICATION --- - name: BelgianEnterpriseRecognizer supported_language: fr @@ -163,6 +184,26 @@ allow_list: - Taux - Valeur - Prix + - CONTRAT + - PROJET + - CONSEILS + - PARTIES + - DOCUMENT + - DEMANDER + - CONSEILLERS + - QUALIFIÉS + - ÉVALUER + - IMPLICATIONS + - UTILISATION + - ATTENDU + - QUE + - OBLIGATION + - QUALIFIÉ + - TAXES + - DROITS + - INFORMATION + - DISPOSITIONS + - DIVERSES # 4. CONFIGURATION DES TRANSFORMATIONS D'ANONYMISATION # ===================================================================== @@ -173,7 +214,6 @@ anonymizer_config: LOCATION: replace ORGANIZATION: replace DATE_TIME: replace - MONEY: replace # Entités détectées par nos règles personnalisées CUSTOM_DATE: replace @@ -185,6 +225,9 @@ anonymizer_config: FR_SOCIAL_SECURITY_NUMBER: replace SWIFT_CODE: replace BE_PHONE_NUMBER: replace + # AJOUTÉ + JOB_TITLE: replace + MONEY: replace replacements: PERSON: "" @@ -193,7 +236,6 @@ anonymizer_config: DATE_TIME: "" CUSTOM_DATE: "" CREDIT_CARD_NUMBER: "" - MONEY: "" EMAIL_ADDRESS: "" IBAN: "" BE_ENTERPRISE_NUMBER: "" @@ -201,3 +243,6 @@ anonymizer_config: FR_SOCIAL_SECURITY_NUMBER: "" SWIFT_CODE: "" BE_PHONE_NUMBER: "" + # AJOUTÉ + JOB_TITLE: "" + MONEY: ""