Update default.yaml

This commit is contained in:
Nacim
2025-06-23 13:04:50 +02:00
committed by GitHub
parent c074f727be
commit b6e4c1a8e9

View File

@@ -17,12 +17,6 @@ ner_model_configuration:
- MISC - MISC
- ORG # Éviter les faux positifs sur les noms d'organisations - ORG # Éviter les faux positifs sur les noms d'organisations
# Seuils de confiance par entité
confidence_threshold:
default: 0.35
EMAIL_ADDRESS: 0.5
PHONE_NUMBER: 0.6
PERSON: 0.7
# Configuration des détecteurs (Recognizers) # Configuration des détecteurs (Recognizers)
recognizer_registry: recognizer_registry:
@@ -30,88 +24,3 @@ recognizer_registry:
- default - default
# Liste des mots à ignorer (faux positifs courants)
allow_list:
# Termes contractuels génériques
- Contrat
- contrat
- Contrats
- Document
- document
- Société
- Investisseur
- Montant
- Prêt
- Intérêt
- Intérêts
- Partie
- Parties
- Annexe
- Remboursement
- Conversion
- Financement
- Sortie
- "Juste Valeur Marchande"
- Échéance
- Clause
- Clauses
- Principe
- Coûts
- Notifications
- Article
- Paragraphe
- Directeur
- Gérant
- Président
# Termes financiers courants
- Euro
- EUR
- Euros
- Pourcentage
- Taux
- Valeur
- Prix
- Montant
# Termes juridiques
- Loi
- Code
- Règlement
- Décret
- Arrêté
# Mois et dates génériques
- Janvier
- Février
- Mars
- Avril
- Mai
- Juin
- Juillet
- Août
- Septembre
- Octobre
- Novembre
- Décembre
# Configuration des transformations d'anonymisation
anonymizer_config:
# Remplacements par défaut
default_anonymizers:
PERSON: replace
EMAIL_ADDRESS: replace
PHONE_NUMBER: replace
BE_NATIONAL_REGISTER_NUMBER: replace
BE_ENTERPRISE_NUMBER: replace
FR_SOCIAL_SECURITY_NUMBER: replace
IBAN: replace
BE_BANK_ACCOUNT: replace
# Valeurs de remplacement personnalisées
replacements:
PERSON: "<PERSONNE>"
EMAIL_ADDRESS: "<EMAIL>"
PHONE_NUMBER: "<TELEPHONE>"
BE_NATIONAL_REGISTER_NUMBER: "<NRN_BELGE>"
BE_ENTERPRISE_NUMBER: "<NUM_ENTREPRISE_BE>"
FR_SOCIAL_SECURITY_NUMBER: "<NUM_SECU_FR>"
IBAN: "<IBAN>"
BE_BANK_ACCOUNT: "<COMPTE_BANCAIRE_BE>"