From 0866eb8470264288fa22366ee2c056d8caa267f3 Mon Sep 17 00:00:00 2001 From: nacim Date: Mon, 28 Jul 2025 18:30:49 +0000 Subject: [PATCH] Actualiser conf/default.yaml --- conf/default.yaml | 10 ++++------ 1 file changed, 4 insertions(+), 6 deletions(-) diff --git a/conf/default.yaml b/conf/default.yaml index 5c896f6..d824dd6 100644 --- a/conf/default.yaml +++ b/conf/default.yaml @@ -30,7 +30,7 @@ nlp_configuration: PERSON: 0.85 ORGANIZATION: 0.55 -# 2. CONFIGURATION DU REGISTRE DES DÉTECTEURS +# 2. CONFIGURATION DU REGISTRE DES DÉTECTEURS (AVEC L'AJOUT POUR LES WARNINGS) # ===================================================================== recognizer_registry: load_predefined_recognizers: true @@ -63,7 +63,7 @@ recognizer_registry: patterns: - name: Numéro téléphone Belge (fixe ou mobile) regex: "\\b0[1-9](?:[./\\s]?\\d{2,3}){3}\\b" - score: 0.95 + score: 0.8 # score abaissé pour éviter concurrence avec IBAN context: ["Tel", "Tél", "téléphone", "gsm", "mobile"] - name: SmartOrganizationRecognizer @@ -110,8 +110,7 @@ recognizer_registry: supported_entity: IBAN patterns: - name: IBAN Pattern - # Remplacement de \s? par \s obligatoire pour éviter recouvrement trop grand - regex: "\\b[A-Z]{2}[0-9]{2}(?:\\s[A-Z0-9]{4}){4,7}\\b" + regex: "\\b[A-Z]{2}[0-9]{2}(?:\\s[0-9]{4}){3}\\b" score: 0.95 context: ["iban", "compte"] @@ -143,8 +142,7 @@ recognizer_registry: - name: IPv6 regex: "\\b([0-9a-fA-F]{1,4}:){7}[0-9a-fA-F]{1,4}\\b" score: 0.9 - # On retire le contexte pour plus de souplesse - # context: ["adresse ip", "ip", "serveur", "exposé"] + # Pas de contexte pour détecter partout # 3. LISTE D'EXCLUSION # =====================================================================