82 lines
1.3 KiB
YAML
82 lines
1.3 KiB
YAML
# Configuration Presidio pour documents français/belges
|
|
nlp_engine_name: spacy
|
|
supported_languages: [en, fr]
|
|
|
|
# Configuration des modèles NLP
|
|
models:
|
|
- lang_code: en
|
|
model_name: en_core_web_lg
|
|
- lang_code: fr
|
|
model_name: fr_core_news_sm
|
|
|
|
# Configuration du moteur NLP
|
|
ner_model_configuration:
|
|
labels_to_ignore:
|
|
- MISC
|
|
confidence_threshold:
|
|
default: 0.35
|
|
EMAIL_ADDRESS: 0.4
|
|
PHONE_NUMBER: 0.5
|
|
PERSON: 0.6
|
|
|
|
# Configuration des reconnaisseurs - UTILISER SEULEMENT LES RECONNAISSEURS PAR DÉFAUT
|
|
recognizer_registry:
|
|
- default
|
|
|
|
# Liste des termes à ignorer (faux positifs)
|
|
allow_list:
|
|
- Contrat
|
|
- contrat
|
|
- Contrats
|
|
- Document
|
|
- document
|
|
- Société
|
|
- Investisseur
|
|
- Montant
|
|
- Prêt
|
|
- Intérêt
|
|
- Intérêts
|
|
- Partie
|
|
- Parties
|
|
- Annexe
|
|
- Remboursement
|
|
- Conversion
|
|
- Financement
|
|
- Sortie
|
|
- Juste Valeur Marchande
|
|
- Échéance
|
|
- Clause
|
|
- Clauses
|
|
- Principe
|
|
- Coûts
|
|
- Notifications
|
|
- Article
|
|
- Paragraphe
|
|
- Directeur
|
|
- Gérant
|
|
- Président
|
|
- Euro
|
|
- EUR
|
|
- Euros
|
|
- Pourcentage
|
|
- Taux
|
|
- Valeur
|
|
- Prix
|
|
- Loi
|
|
- Code
|
|
- Règlement
|
|
- Décret
|
|
- Arrêté
|
|
- Janvier
|
|
- Février
|
|
- Mars
|
|
- Avril
|
|
- Mai
|
|
- Juin
|
|
- Juillet
|
|
- Août
|
|
- Septembre
|
|
- Octobre
|
|
- Novembre
|
|
- Décembre
|