Update default.yaml

This commit is contained in:
Nacim
2025-06-24 15:43:26 +02:00
committed by GitHub
parent 5c440435f9
commit 899c4dbc1a

View File

@@ -78,35 +78,6 @@ recognizer_registry:
patterns: [{name: IBAN Pattern, regex: "\\b[A-Z]{2}[0-9]{2}\\s?(?:[A-Z0-9]{4}\\s?){2,7}[A-Z0-9]{1,4}\\b", score: 0.95}] patterns: [{name: IBAN Pattern, regex: "\\b[A-Z]{2}[0-9]{2}\\s?(?:[A-Z0-9]{4}\\s?){2,7}[A-Z0-9]{1,4}\\b", score: 0.95}]
context: ["iban", "compte"] context: ["iban", "compte"]
# --- DÉTECTEUR SWIFT CORRIGÉ ---
# --- DÉTECTEUR SWIFT CORRIGÉ ET VALIDE ---
# Nous écrasons le détecteur par défaut de Presidio ("SwiftCodeRecognizer")
# avec notre propre version, plus intelligente et contextuelle.
- name: SwiftCodeRecognizer # Nom exact pour écraser le détecteur par défaut
supported_language: fr
supported_entity: SWIFT_CODE
# LA CORRECTION EST ICI : La deny_list est au niveau du Recognizer, pas du Pattern.
# Ces mots, même s'ils correspondent à une regex ci-dessous, seront ignorés.
deny_list: [
"CONTRAT", "DOCUMENT", "DOCUMENTS", "CONSTITUE", "D'INVESTISSEMENT",
"UTILISANT", "DEVRAIENT", "ENVISAGER", "CONSEIL", "QUALIFIÉS", "ÉVALUER",
"IMPLICATIONS", "ACCUMULE", "OBLIGATIONS", "FINANCEMENT", "EXCLUANT",
"CONVERTIBLE", "INSTRUMENTS", "CIRCULATION", "ENTREPRISES", "COMMERCE",
"ÉVÉNEMENT", "PAYABLES", "INCLUANT", "JURIDICTION", "INFORMATION",
"FOURNIRA", "DISPOSITIONS", "RELATIFS", "RELATION", "PRESTATAIRE",
"SERVICES", "RECONNAÎT"
]
# Les patterns sont définis séparément.
patterns:
- name: BIC/SWIFT Code with context
# La regex est correcte, mais son score est intentionnellement très bas.
regex: "\\b[A-Z]{4}[A-Z]{2}[A-Z0-9]{2}(?:[A-Z0-9]{3})?\\b"
score: 0.01 # Le match seul ne vaut presque rien.
# Le contexte reste essentiel pour valider une détection qui n'est pas dans la deny_list.
context: ["bic", "swift", "code swift"]
- name: SmartOrganizationRecognizer - name: SmartOrganizationRecognizer
supported_language: fr supported_language: fr