École de technologie supérieure (ÉTS), Université du Québec à Montréal (UQAM)
5a. Résumé
Dans un environnement où les fuites de données représentent une menace majeure pour les organisations, cette recherche se concentre sur la problématique de l’équilibre entre l’automatisation de la protection des données sensibles et la supervision humaine dans les processus critiques. Le projet propose un système de prévention des pertes de données (DLP) assisté par intelligence artificielle (IA), intégrant les modèles GPT-4-Turbo et XGBoost pour automatiser la classification des données sensibles. La contribution principale de cette recherche réside dans la démonstration de l'efficacité d'un modèle hybride, combinant IA et intervention humaine, pour améliorer la détection des fuites tout en minimisant les erreurs de classification. La méthodologie comprend l’analyse de courriels réels à partir d'une base de données publique, avec une phase de prétraitement des données (nettoyage, tokenization, TF-IDF) suivie de l'entraînement des modèles. Les performances ont été évaluées par des mesures standard telles que la matrice de confusion, la précision et le rappel. Les résultats préliminaires montrent que les performances de XGBoost et de GPT-4-Turbo sont comparables à celles de la classification humaine. En combinant ces trois approches, nous obtenons un système DLP solide. Cette étude valide ainsi l’intérêt d’un système DLP hybride dans des environnements organisationnels complexes.
Connexion requise
Pour ajouter un commentaire, vous devez être connecté.