Update default.yaml
This commit is contained in:
@@ -11,7 +11,7 @@ models:
|
||||
model_name: en_core_web_lg
|
||||
- lang_code: fr
|
||||
model_name: fr_core_news_sm
|
||||
# Configuration fine du modèle NLP pour réduire les faux positifs
|
||||
# CORRECTION : La configuration fine du NLP est maintenant ici, dans le modèle 'fr'
|
||||
ner_model_configuration:
|
||||
labels_to_ignore:
|
||||
- MISC
|
||||
@@ -119,21 +119,24 @@ recognizers:
|
||||
|
||||
# 3. ACTIVATION DES DÉTECTEURS
|
||||
# =====================================================================
|
||||
# Remplacer 'default' par la liste explicite pour éviter les warnings
|
||||
# CORRECTION : Liste explicite pour éviter les conflits et les warnings
|
||||
recognizer_registry:
|
||||
# - default # Remplacé par une liste explicite ci-dessous
|
||||
# Détecteurs par défaut pour 'en' et 'fr' que nous voulons garder
|
||||
# Détecteur de base pour les entités NLP (PERSON, LOCATION, etc.)
|
||||
- SpacyRecognizer
|
||||
|
||||
# Détecteurs par défaut que nous voulons garder pour 'en' et 'fr'
|
||||
- CreditCardRecognizer
|
||||
- CryptoRecognizer
|
||||
- DateRecognizer
|
||||
- EmailRecognizer
|
||||
- IbanRecognizer
|
||||
- IpRecognizer
|
||||
- MedicalLicenseRecognizer
|
||||
- PhoneRecognizer
|
||||
- UrlRecognizer
|
||||
# Nos détecteurs personnalisés
|
||||
|
||||
# NOS DÉTECTEURS PERSONNALISÉS pour le français, qui remplacent
|
||||
# les versions par défaut pour cette langue.
|
||||
- EmailRecognizer
|
||||
- PhoneRecognizer
|
||||
- IbanRecognizer
|
||||
- MoneyRecognizer
|
||||
- BelgianNRNRecognizer
|
||||
- BelgianEnterpriseRecognizer
|
||||
@@ -142,7 +145,6 @@ recognizer_registry:
|
||||
|
||||
# 4. LISTE D'EXCLUSION (ALLOW LIST)
|
||||
# =====================================================================
|
||||
# ... (votre liste est correcte) ...
|
||||
allow_list:
|
||||
- Contrat
|
||||
- Document
|
||||
@@ -207,11 +209,10 @@ anonymizer_config:
|
||||
DATE_TIME: replace
|
||||
CREDIT_CARD_NUMBER: replace
|
||||
EMAIL_ADDRESS: replace
|
||||
# IBAN_CODE: replace # <-- Incohérent, le nom de l'entité est IBAN
|
||||
IP_ADDRESS: replace
|
||||
PHONE_NUMBER: replace
|
||||
URL: replace
|
||||
IBAN: replace
|
||||
IBAN: replace # Corrigé de IBAN_CODE à IBAN
|
||||
MONEY: replace
|
||||
BE_NATIONAL_REGISTER_NUMBER: replace
|
||||
BE_ENTERPRISE_NUMBER: replace
|
||||
@@ -225,8 +226,7 @@ anonymizer_config:
|
||||
DATE_TIME: "<DATE>"
|
||||
CREDIT_CARD_NUMBER: "<NUMERO_CARTE_BANCAIRE>"
|
||||
EMAIL_ADDRESS: "<EMAIL>"
|
||||
# IBAN_CODE: "<IBAN>" # <-- Incohérent, le nom de l'entité est IBAN
|
||||
IBAN: "<IBAN>"
|
||||
IBAN: "<IBAN>" # Corrigé de IBAN_CODE à IBAN
|
||||
IP_ADDRESS: "<ADRESSE_IP>"
|
||||
PHONE_NUMBER: "<TELEPHONE>"
|
||||
URL: "<URL>"
|
||||
|
||||
Reference in New Issue
Block a user