Engineering Sciences

Détection des Données Hors Distribution : Une Approche Basée sur un Auto-Encodeur Variationnel Structuré

Publié le - GRETSI'25

Auteurs : Maxime Ossonce, Pierre Duhamel, Florence Alberge

Les modèles d’intelligence artificielle (IA) sont généralement entraînés sur des ensembles de données représentatifs de leur tâche. Cependant, leur performance peut être gravement affectée lorsqu’ils rencontrent des données hors distribution (OoD). Cet article explore une approche fondée sur un auto-encodeur variationnel structuré, permettant de mieux distinguer les données OoD des données légitimes sans nécessiter un ensemble d’entraînement OoD spécifique mais en tirant partie des échantillons OoD disponibles lors du déploiement. En particulier, nous montrons l’utilité d’un travail en deux étapes, et d’un "padding" à l’aide de données OoD connues et de types divers, ce qui permet une amélioration sensible des performances.