Actualiser conf/default.yaml
This commit is contained in:
@@ -1,10 +1,8 @@
|
|||||||
# =====================================================================
|
# =====================================================================
|
||||||
# CONFIGURATION PRESIDIO - v27
|
# CONFIGURATION PRESIDIO - Minimal Full Working
|
||||||
# =====================================================================
|
# =====================================================================
|
||||||
supported_languages: [en, fr]
|
supported_languages: [en, fr]
|
||||||
|
|
||||||
# 1. CONFIGURATION DU MOTEUR NLP (INCHANGÉ)
|
|
||||||
# =====================================================================
|
|
||||||
nlp_configuration:
|
nlp_configuration:
|
||||||
nlp_engine_name: spacy
|
nlp_engine_name: spacy
|
||||||
models:
|
models:
|
||||||
@@ -30,11 +28,8 @@ nlp_configuration:
|
|||||||
PERSON: 0.85
|
PERSON: 0.85
|
||||||
ORGANIZATION: 0.55
|
ORGANIZATION: 0.55
|
||||||
|
|
||||||
# 2. CONFIGURATION DU REGISTRE DES DÉTECTEURS (AVEC L'AJOUT POUR LES WARNINGS)
|
|
||||||
# =====================================================================
|
|
||||||
recognizer_registry:
|
recognizer_registry:
|
||||||
load_predefined_recognizers: true
|
load_predefined_recognizers: true
|
||||||
|
|
||||||
recognizers:
|
recognizers:
|
||||||
- name: FlexibleDateRecognizer
|
- name: FlexibleDateRecognizer
|
||||||
supported_language: fr
|
supported_language: fr
|
||||||
@@ -63,7 +58,7 @@ recognizer_registry:
|
|||||||
patterns:
|
patterns:
|
||||||
- name: Numéro téléphone Belge (fixe ou mobile)
|
- name: Numéro téléphone Belge (fixe ou mobile)
|
||||||
regex: "\\b0[1-9](?:[./\\s]?\\d{2,3}){3}\\b"
|
regex: "\\b0[1-9](?:[./\\s]?\\d{2,3}){3}\\b"
|
||||||
score: 0.8 # score abaissé pour éviter concurrence avec IBAN
|
score: 0.95
|
||||||
context: ["Tel", "Tél", "téléphone", "gsm", "mobile"]
|
context: ["Tel", "Tél", "téléphone", "gsm", "mobile"]
|
||||||
|
|
||||||
- name: SmartOrganizationRecognizer
|
- name: SmartOrganizationRecognizer
|
||||||
@@ -111,7 +106,7 @@ recognizer_registry:
|
|||||||
patterns:
|
patterns:
|
||||||
- name: IBAN Pattern
|
- name: IBAN Pattern
|
||||||
regex: "\\b[A-Z]{2}[0-9]{2}(?:\\s[0-9]{4}){3}\\b"
|
regex: "\\b[A-Z]{2}[0-9]{2}(?:\\s[0-9]{4}){3}\\b"
|
||||||
score: 0.95
|
score: 1.0
|
||||||
context: ["iban", "compte"]
|
context: ["iban", "compte"]
|
||||||
|
|
||||||
- name: BelgianNRNRecognizer
|
- name: BelgianNRNRecognizer
|
||||||
@@ -142,10 +137,8 @@ recognizer_registry:
|
|||||||
- name: IPv6
|
- name: IPv6
|
||||||
regex: "\\b([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}\\b"
|
regex: "\\b([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}\\b"
|
||||||
score: 0.9
|
score: 0.9
|
||||||
# Pas de contexte pour détecter partout
|
# contexte volontairement omis pour meilleure détection
|
||||||
|
|
||||||
# 3. LISTE D'EXCLUSION
|
|
||||||
# =====================================================================
|
|
||||||
allow_list:
|
allow_list:
|
||||||
- Adresse
|
- Adresse
|
||||||
- ADRESSE
|
- ADRESSE
|
||||||
@@ -198,8 +191,6 @@ allow_list:
|
|||||||
- "montrent des irrégularités"
|
- "montrent des irrégularités"
|
||||||
- "bénéficiaire"
|
- "bénéficiaire"
|
||||||
|
|
||||||
# 4. CONFIGURATION DES TRANSFORMATIONS D'ANONYMISATION
|
|
||||||
# =====================================================================
|
|
||||||
anonymizer_config:
|
anonymizer_config:
|
||||||
default_anonymizers:
|
default_anonymizers:
|
||||||
PERSON: replace
|
PERSON: replace
|
||||||
|
|||||||
Reference in New Issue
Block a user