Update default.yaml

This commit is contained in:
Nacim
2025-06-16 03:04:43 +02:00
committed by GitHub
parent d1ac59fa23
commit 0a752bc03f

View File

@@ -1,8 +1,9 @@
# =====================================================================
# FICHIER DE CONFIGURATION MAÎTRE DE QUALITÉ PRODUCTION
# FICHIER DE CONFIGURATION MAÎTRE FINAL ET GARANTI
# =====================================================================
# 1. Configuration du moteur de langage (NLP)
# On déclare notre support pour le français et on l'associe au bon modèle.
nlp_engine_name: spacy
supported_languages: [en, fr]
models:
@@ -12,33 +13,16 @@ models:
model_name: fr_core_news_sm
# 2. Configuration du comportement du moteur NLP
# On ignore l'étiquette "MISC" pour éviter les faux positifs.
# On ignore l'étiquette "MISC" pour éviter les faux positifs et les warnings.
ner_model_configuration:
labels_to_ignore:
- MISC
# 3. Configuration des détecteurs (Recognizers) - LA PARTIE LA PLUS IMPORTANTE
# On charge explicitement tous les outils dont nous avons besoin.
# On dit à Presidio de charger d'ABORD tous ses détecteurs par défaut...
recognizer_registry:
# On charge le moteur principal pour les entités de base (PERSON, LOCATION, ORG)
- name: SpacyRecognizer
supported_language: fr
- name: SpacyRecognizer
supported_language: en
# On charge TOUS les reconnaisseurs universels pertinents pour le RGPD
- name: EmailRecognizer
- name: PhoneRecognizer # --> Sera amélioré par notre règle custom
- name: IbanRecognizer # --> Sera amélioré par notre règle custom
- name: CreditCardRecognizer
- name: DateRecognizer
- name: UrlRecognizer
- name: IpRecognizer
- name: MedicalLicenseRecognizer
- name: CryptoRecognizer
# On charge TOUTES nos règles personnalisées
- default
# ...ET ENSUITE d'ajouter les nôtres depuis notre fichier Python.
- presidio_config.custom_recognizers.custom_recognizers
# 4. Configuration de la post-analyse (Allow List)
@@ -53,6 +37,7 @@ analysis_explanations:
- Société
- Investisseur
- Montant
- Prêt
- Intérêt
- Intérêts
- Partie