From 29e19fcd228a76ce0eb3c1ec15d5e7b1e17629be Mon Sep 17 00:00:00 2001 From: nacim Date: Mon, 4 Aug 2025 05:39:03 +0000 Subject: [PATCH] Actualiser app.py --- app.py | 24 +----------------------- 1 file changed, 1 insertion(+), 23 deletions(-) diff --git a/app.py b/app.py index dd16485..2210d7b 100644 --- a/app.py +++ b/app.py @@ -23,29 +23,7 @@ except Exception as e: logger.exception("Error during AnalyzerEngine initialization.") analyzer = None -# Regex strict pour IBAN belge format attendu -IBAN_REGEX = re.compile(r"\b[A-Z]{2}[0-9]{2}(?:\s[0-9]{4}){3}\b", re.IGNORECASE) -# Regex IPv4 -IPV4_REGEX = re.compile( - r"\b(?:(?:25[0-5]|2[0-4][0-9]|1\d{2}|[1-9]?\d)\.){3}" - r"(?:25[0-5]|2[0-4][0-9]|1\d{2}|[1-9]?\d)\b" -) - -# Liste des labels/phrases à exclure d’anonymisation (en minuscules) -IGNORE_LABELS = { - "témoins", - "témoins clés", - "coordonnées", - "coordonnées bancaires", - "contexte financier", - "données sensibles", - "contexte", - "montrent", - "montrent des", - "montrent des irrégularités", - "bénéficiaire", -} def normalize_label(text: str) -> str: return text.strip().lower() @@ -91,7 +69,7 @@ def analyze_text(): logger.warning(f"Invalid IBAN detected, skipping: '{ent_text}'") continue - # Recadrage IP_ADDRESS strict IPv4 (wildcard possible pour IPv6 si besoin) + # Recadrage IP_ADDRESS strict IPv4 if res.entity_type == "IP_ADDRESS": match = IPV4_REGEX.search(ent_text) if match: