Update default.yaml
This commit is contained in:
@@ -1,8 +1,9 @@
|
|||||||
# =====================================================================
|
# =====================================================================
|
||||||
# FICHIER DE CONFIGURATION MAÎTRE DE QUALITÉ PRODUCTION
|
# FICHIER DE CONFIGURATION MAÎTRE FINAL ET GARANTI
|
||||||
# =====================================================================
|
# =====================================================================
|
||||||
|
|
||||||
# 1. Configuration du moteur de langage (NLP)
|
# 1. Configuration du moteur de langage (NLP)
|
||||||
|
# On déclare notre support pour le français et on l'associe au bon modèle.
|
||||||
nlp_engine_name: spacy
|
nlp_engine_name: spacy
|
||||||
supported_languages: [en, fr]
|
supported_languages: [en, fr]
|
||||||
models:
|
models:
|
||||||
@@ -12,33 +13,16 @@ models:
|
|||||||
model_name: fr_core_news_sm
|
model_name: fr_core_news_sm
|
||||||
|
|
||||||
# 2. Configuration du comportement du moteur NLP
|
# 2. Configuration du comportement du moteur NLP
|
||||||
# On ignore l'étiquette "MISC" pour éviter les faux positifs.
|
# On ignore l'étiquette "MISC" pour éviter les faux positifs et les warnings.
|
||||||
ner_model_configuration:
|
ner_model_configuration:
|
||||||
labels_to_ignore:
|
labels_to_ignore:
|
||||||
- MISC
|
- MISC
|
||||||
|
|
||||||
# 3. Configuration des détecteurs (Recognizers) - LA PARTIE LA PLUS IMPORTANTE
|
# 3. Configuration des détecteurs (Recognizers) - LA PARTIE LA PLUS IMPORTANTE
|
||||||
# On charge explicitement tous les outils dont nous avons besoin.
|
# On dit à Presidio de charger d'ABORD tous ses détecteurs par défaut...
|
||||||
recognizer_registry:
|
recognizer_registry:
|
||||||
# On charge le moteur principal pour les entités de base (PERSON, LOCATION, ORG)
|
|
||||||
- name: SpacyRecognizer
|
|
||||||
supported_language: fr
|
|
||||||
- name: SpacyRecognizer
|
|
||||||
supported_language: en
|
|
||||||
|
|
||||||
# On charge TOUS les reconnaisseurs universels pertinents pour le RGPD
|
|
||||||
- name: EmailRecognizer
|
|
||||||
- name: PhoneRecognizer # --> Sera amélioré par notre règle custom
|
|
||||||
- name: IbanRecognizer # --> Sera amélioré par notre règle custom
|
|
||||||
- name: CreditCardRecognizer
|
|
||||||
- name: DateRecognizer
|
|
||||||
- name: UrlRecognizer
|
|
||||||
- name: IpRecognizer
|
|
||||||
- name: MedicalLicenseRecognizer
|
|
||||||
- name: CryptoRecognizer
|
|
||||||
|
|
||||||
# On charge TOUTES nos règles personnalisées
|
|
||||||
- default
|
- default
|
||||||
|
# ...ET ENSUITE d'ajouter les nôtres depuis notre fichier Python.
|
||||||
- presidio_config.custom_recognizers.custom_recognizers
|
- presidio_config.custom_recognizers.custom_recognizers
|
||||||
|
|
||||||
# 4. Configuration de la post-analyse (Allow List)
|
# 4. Configuration de la post-analyse (Allow List)
|
||||||
@@ -53,6 +37,7 @@ analysis_explanations:
|
|||||||
- Société
|
- Société
|
||||||
- Investisseur
|
- Investisseur
|
||||||
- Montant
|
- Montant
|
||||||
|
- Prêt
|
||||||
- Intérêt
|
- Intérêt
|
||||||
- Intérêts
|
- Intérêts
|
||||||
- Partie
|
- Partie
|
||||||
|
|||||||
Reference in New Issue
Block a user