diff --git a/conf/default.yaml b/conf/default.yaml index 7ce5200..7b23fd1 100644 --- a/conf/default.yaml +++ b/conf/default.yaml @@ -11,7 +11,7 @@ models: model_name: en_core_web_lg - lang_code: fr model_name: fr_core_news_sm - # Configuration fine du modèle NLP pour réduire les faux positifs + # CORRECTION : La configuration fine du NLP est maintenant ici, dans le modèle 'fr' ner_model_configuration: labels_to_ignore: - MISC @@ -119,21 +119,24 @@ recognizers: # 3. ACTIVATION DES DÉTECTEURS # ===================================================================== -# Remplacer 'default' par la liste explicite pour éviter les warnings +# CORRECTION : Liste explicite pour éviter les conflits et les warnings recognizer_registry: - # - default # Remplacé par une liste explicite ci-dessous - # Détecteurs par défaut pour 'en' et 'fr' que nous voulons garder + # Détecteur de base pour les entités NLP (PERSON, LOCATION, etc.) - SpacyRecognizer + + # Détecteurs par défaut que nous voulons garder pour 'en' et 'fr' - CreditCardRecognizer - CryptoRecognizer - DateRecognizer - - EmailRecognizer - - IbanRecognizer - IpRecognizer - MedicalLicenseRecognizer - - PhoneRecognizer - UrlRecognizer - # Nos détecteurs personnalisés + + # NOS DÉTECTEURS PERSONNALISÉS pour le français, qui remplacent + # les versions par défaut pour cette langue. + - EmailRecognizer + - PhoneRecognizer + - IbanRecognizer - MoneyRecognizer - BelgianNRNRecognizer - BelgianEnterpriseRecognizer @@ -142,7 +145,6 @@ recognizer_registry: # 4. LISTE D'EXCLUSION (ALLOW LIST) # ===================================================================== -# ... (votre liste est correcte) ... allow_list: - Contrat - Document @@ -207,11 +209,10 @@ anonymizer_config: DATE_TIME: replace CREDIT_CARD_NUMBER: replace EMAIL_ADDRESS: replace - # IBAN_CODE: replace # <-- Incohérent, le nom de l'entité est IBAN IP_ADDRESS: replace PHONE_NUMBER: replace URL: replace - IBAN: replace + IBAN: replace # Corrigé de IBAN_CODE à IBAN MONEY: replace BE_NATIONAL_REGISTER_NUMBER: replace BE_ENTERPRISE_NUMBER: replace @@ -225,8 +226,7 @@ anonymizer_config: DATE_TIME: "" CREDIT_CARD_NUMBER: "" EMAIL_ADDRESS: "" - # IBAN_CODE: "" # <-- Incohérent, le nom de l'entité est IBAN - IBAN: "" + IBAN: "" # Corrigé de IBAN_CODE à IBAN IP_ADDRESS: "" PHONE_NUMBER: "" URL: ""