Update Dockerfile.analyzer

This commit is contained in:
Nacim
2025-06-23 12:00:45 +02:00
committed by GitHub
parent 3431d78d6e
commit 77fbaa230d

View File

@@ -2,31 +2,26 @@ FROM mcr.microsoft.com/presidio-analyzer:latest
USER root USER root
# Installer les dépendances système (comme curl, toujours utile) # Installer les dépendances système
RUN apt-get update && apt-get install -y curl && rm -rf /var/lib/apt/lists/* RUN apt-get update && apt-get install -y curl && rm -rf /var/lib/apt/lists/*
# Installer le modèle spaCy français # Installer le modèle spaCy français
# Cette étape est spécifique et ne devrait pas interférer.
RUN pip install --no-cache-dir \ RUN pip install --no-cache-dir \
https://github.com/explosion/spacy-models/releases/download/fr_core_news_sm-3.7.0/fr_core_news_sm-3.7.0-py3-none-any.whl https://github.com/explosion/spacy-models/releases/download/fr_core_news_sm-3.7.0/fr_core_news_sm-3.7.0-py3-none-any.whl
# Copier et installer votre requirements.txt MODIFIÉ (sans presidio-analyzer/anonymizer) # Copier et installer requirements.txt
# Il installera gunicorn, pyyaml, etc., SANS toucher à l'installation de base de Presidio.
COPY requirements.txt /tmp/requirements.txt COPY requirements.txt /tmp/requirements.txt
RUN pip install --no-cache-dir -r /tmp/requirements.txt RUN pip install --no-cache-dir -r /tmp/requirements.txt
# **** CHEMINS DE COPIE POUR LA CONFIGURATION ET RECOGNIZERS **** # Définir le WORKDIR sur le répertoire parent de presidio_analyzer
# Basé sur votre confirmation que /usr/bin/presidio-analyzer/presidio_analyzer/conf/default.yaml est le bon chemin. WORKDIR /usr/bin
# Cela signifie que l'application est dans /usr/bin/presidio-analyzer/
WORKDIR /usr/bin/presidio-analyzer # Assurez-vous que le WORKDIR est bien à la racine de l'application Presidio # Copier vos fichiers de configuration au bon endroit
COPY default.yaml /usr/bin/presidio-analyzer/presidio_analyzer/conf/default.yaml
COPY custom_recognizers /usr/bin/presidio-analyzer/custom_recognizers
# Copier votre default.yaml dans le dossier 'conf' du package Presidio Analyzer # Ajouter le répertoire presidio-analyzer au PYTHONPATH
COPY default.yaml presidio_analyzer/conf/default.yaml ENV PYTHONPATH=/usr/bin/presidio-analyzer:$PYTHONPATH
# Copier le dossier de vos recognizers Python au niveau du WORKDIR pour qu'il soit dans le PYTHONPATH implicite. # Commande de démarrage avec le bon répertoire de travail
COPY custom_recognizers custom_recognizers CMD ["gunicorn", "-w", "1", "-b", "0.0.0.0:3000", "presidio_analyzer.app:app"]
# Pas besoin de définir un PYTHONPATH explicite si WORKDIR est correctement géré.
# L'image de base de Presidio doit avoir un CMD ou ENTRYPOINT qui lance l'application correctement.
# NOUS NE DÉFINISSONS PAS DE CMD DANS CE DOCKERFILE POUR LAISSER L'IMAGE DE BASE S'EN CHARGER.