Update default.yaml

This commit is contained in:
Nacim
2025-06-23 15:49:32 +02:00
committed by GitHub
parent f4f2cf7a69
commit cb963b6b2f

View File

@@ -11,7 +11,7 @@ models:
model_name: en_core_web_lg
- lang_code: fr
model_name: fr_core_news_sm
# Configuration fine du modèle NLP pour réduire les faux positifs
# CORRECTION : La configuration fine du NLP est maintenant ici, dans le modèle 'fr'
ner_model_configuration:
labels_to_ignore:
- MISC
@@ -119,21 +119,24 @@ recognizers:
# 3. ACTIVATION DES DÉTECTEURS
# =====================================================================
# Remplacer 'default' par la liste explicite pour éviter les warnings
# CORRECTION : Liste explicite pour éviter les conflits et les warnings
recognizer_registry:
# - default # Remplacé par une liste explicite ci-dessous
# Détecteurs par défaut pour 'en' et 'fr' que nous voulons garder
# Détecteur de base pour les entités NLP (PERSON, LOCATION, etc.)
- SpacyRecognizer
# Détecteurs par défaut que nous voulons garder pour 'en' et 'fr'
- CreditCardRecognizer
- CryptoRecognizer
- DateRecognizer
- EmailRecognizer
- IbanRecognizer
- IpRecognizer
- MedicalLicenseRecognizer
- PhoneRecognizer
- UrlRecognizer
# Nos détecteurs personnalisés
# NOS DÉTECTEURS PERSONNALISÉS pour le français, qui remplacent
# les versions par défaut pour cette langue.
- EmailRecognizer
- PhoneRecognizer
- IbanRecognizer
- MoneyRecognizer
- BelgianNRNRecognizer
- BelgianEnterpriseRecognizer
@@ -142,7 +145,6 @@ recognizer_registry:
# 4. LISTE D'EXCLUSION (ALLOW LIST)
# =====================================================================
# ... (votre liste est correcte) ...
allow_list:
- Contrat
- Document
@@ -207,11 +209,10 @@ anonymizer_config:
DATE_TIME: replace
CREDIT_CARD_NUMBER: replace
EMAIL_ADDRESS: replace
# IBAN_CODE: replace # <-- Incohérent, le nom de l'entité est IBAN
IP_ADDRESS: replace
PHONE_NUMBER: replace
URL: replace
IBAN: replace
IBAN: replace # Corrigé de IBAN_CODE à IBAN
MONEY: replace
BE_NATIONAL_REGISTER_NUMBER: replace
BE_ENTERPRISE_NUMBER: replace
@@ -225,8 +226,7 @@ anonymizer_config:
DATE_TIME: "<DATE>"
CREDIT_CARD_NUMBER: "<NUMERO_CARTE_BANCAIRE>"
EMAIL_ADDRESS: "<EMAIL>"
# IBAN_CODE: "<IBAN>" # <-- Incohérent, le nom de l'entité est IBAN
IBAN: "<IBAN>"
IBAN: "<IBAN>" # Corrigé de IBAN_CODE à IBAN
IP_ADDRESS: "<ADRESSE_IP>"
PHONE_NUMBER: "<TELEPHONE>"
URL: "<URL>"