Actualiser conf/default.yaml

This commit is contained in:
2025-07-28 18:48:30 +00:00
parent 0866eb8470
commit 9fcc209efb

View File

@@ -1,10 +1,8 @@
# =====================================================================
# CONFIGURATION PRESIDIO - v27
# CONFIGURATION PRESIDIO - Minimal Full Working
# =====================================================================
supported_languages: [en, fr]
# 1. CONFIGURATION DU MOTEUR NLP (INCHANGÉ)
# =====================================================================
nlp_configuration:
nlp_engine_name: spacy
models:
@@ -30,11 +28,8 @@ nlp_configuration:
PERSON: 0.85
ORGANIZATION: 0.55
# 2. CONFIGURATION DU REGISTRE DES DÉTECTEURS (AVEC L'AJOUT POUR LES WARNINGS)
# =====================================================================
recognizer_registry:
load_predefined_recognizers: true
recognizers:
- name: FlexibleDateRecognizer
supported_language: fr
@@ -63,7 +58,7 @@ recognizer_registry:
patterns:
- name: Numéro téléphone Belge (fixe ou mobile)
regex: "\\b0[1-9](?:[./\\s]?\\d{2,3}){3}\\b"
score: 0.8 # score abaissé pour éviter concurrence avec IBAN
score: 0.95
context: ["Tel", "Tél", "téléphone", "gsm", "mobile"]
- name: SmartOrganizationRecognizer
@@ -111,7 +106,7 @@ recognizer_registry:
patterns:
- name: IBAN Pattern
regex: "\\b[A-Z]{2}[0-9]{2}(?:\\s[0-9]{4}){3}\\b"
score: 0.95
score: 1.0
context: ["iban", "compte"]
- name: BelgianNRNRecognizer
@@ -142,10 +137,8 @@ recognizer_registry:
- name: IPv6
regex: "\\b([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}\\b"
score: 0.9
# Pas de contexte pour détecter partout
# contexte volontairement omis pour meilleure détection
# 3. LISTE D'EXCLUSION
# =====================================================================
allow_list:
- Adresse
- ADRESSE
@@ -198,8 +191,6 @@ allow_list:
- "montrent des irrégularités"
- "bénéficiaire"
# 4. CONFIGURATION DES TRANSFORMATIONS D'ANONYMISATION
# =====================================================================
anonymizer_config:
default_anonymizers:
PERSON: replace