EP-4490692-B1 - METHOD FOR DETECTING ANOMALIES USING A GLOBAL-LOCAL MODEL

EP4490692B1EP 4490692 B1EP4490692 B1EP 4490692B1EP-4490692-B1

Inventors

ARTOLA, AITOR

Dates

Publication Date: 20260506
Application Date: 20230310

Claims (9)

Unsupervised method for detecting anomalies in an image or a series of images under test, which method is implemented by a computing unit, comprising the following steps: • a step (Ee) of determining a model from so-called conformal images, • an inference step (Ei) comprising determining an anomaly score by applying said model to said image or to the series of images under test, the model determination step comprising the following step: • determining (EGMM) a global Gaussian mixture model from conformal image data, said K-component Gaussian model having a set Θ = ( π k , µ k , Σ k ) k =1... K of parameters such that, for a given k, µ k is the average and Σ k is the covariance of the Gaussian, π k being the weight of this Gaussian in said global model, characterized in that the model determination step also comprises the following steps: • for each Gaussian of said Gaussian mixture, determining (ELWM) a set of local weights π k ( x ) at the position x while preserving the covariance matrices and fixed averages, • determining a local model, a so-called global local model (EGLM), by replacing the set of weights of the Gaussian mixture with the set of determined local weights.
Method according to claim 1, wherein the conformal image data are features.
Method according to claim 2, wherein the features are extracted from a pre-trained neural network.
Method according to claim 3, wherein the features are extracted (ECnn) by a network pre-trained using aligned, so-called conformal images.
Method according to claim 4, wherein the aligned conformal images are determined by alignment with a reference image (Iref) from the so-called conformal images.
Method according to claim 1, wherein the conformal image data are pieces of the conformal images.
Method according to claim 2, wherein the features originate from a wavelet decomposition of the conformal images.
Method according to any of the preceding claims, wherein determining (EGMM) the Gaussian mixture model of the features implements an online learning method.
Method according to any of the preceding claims, wherein determining (EGMM) the Gaussian mixture model of the features implements a learning method with the K-MLE algorithm.

Description

Domaine technique La présente invention propose un procédé de détection d'anomalies dans des images. État de la technique antérieure La détection d'anomalies dans les images consiste à trouver des images, ou des régions d'images, qui ne sont pas conformes au reste des données. Il s'agit d'un problème important dans de nombreuses applications industrielles, médicales ou biologiques. La détection d'anomalies ou de défauts sur des objets industriels est un problème complexe qui nécessite souvent l'intervention d'un opérateur. Cela explique pourquoi le contrôle de la qualité visuelle ou d'aspect dans les chaînes de production a historiquement été laissé aux opérateurs humains. Pourtant, l'automatisation du processus peut accélérer, réduire le coût de production et atténuer les variations de performance causées par la fatigue des opérateurs [24, 33]. Le problème reste cependant un défi pour la vision par ordinateur, car il n'existe pas de définition claire et directe de la normalité dans des données arbitraires ou bien de d'une anomalie de manière générale car les cas d'usage sont très variés. La détection d'anomalies non supervisée pour les applications industrielles fait l'objet d'une attention particulière ces derniers temps, notamment après la publication d'un nouvel ensemble de données de référence par MvTec [3]. L'exigence « non supervisée » est un défi, mais pourrait conduire à une solution générale. Il est généralement admis que la détection d'anomalies n'est pas un problème de classification classique [30]. En effet, les anomalies ne forment pas des classes bien définies. Elles peuvent être rares ou inconsistantes. De nouveaux types d'anomalies peuvent apparaître plus tard, mais doivent être détectées comme telles sur la base de l'expérience passée des données normales. Cela rend l'annotation des anomalies intrinsèquement impossible. Au contraire, les données normales sont abondantes et peuvent être utilisées pour modéliser la normalité. Cela conduit à considérer la détection d'anomalies comme un problème de détection d'un événement hors distribution normale. La détection des anomalies a fait l'objet d'un examen approfondi dans la littérature [13, 23, 29]. Les méthodes peuvent être classées en trois grandes catégories : les méthodes antérieures à l'apprentissage profond, les méthodes basées sur des réseaux préentraînés et enfin les méthodes purement basées sur les réseaux de neurones. Méthodes antérieures à l'apprentissage profond Ces méthodes se concentrent sur la modélisation de données normales, également appelées modèle de fond. Les méthodes homogènes et stochastiques [1, 12, 34, 35, 37] supposent que le modèle de fond suit une distribution connue. Les méthodes centre/ environnement [15, 16, 25] modélisent les anomalies comme des événements locaux contrastant avec leur environnement immédiat. Les méthodes basées sur la sparsité [4, 6, 7, 21] apprennent un dictionnaire clairsemé représentant des données normales. Les anomalies sont définies comme des données qui ne vérifient pas la condition de sparsité. Les méthodes non locales [10,41] supposent que chaque patch d'image dans les données normales appartient à un cluster dense dans l'espace des patchs de l'image. Les anomalies se trouvent plutôt loin de leurs plus proches voisins. Les anomalies sont mesurées en regroupant des petits morceaux d'image, aussi appelés patch en langue anglaise, ce qui conduit directement à une mesure de la rareté. La méthode de Davy et al. [10] comble le fossé avec les méthodes utilisant des réseaux préentraînés, car cette méthode peut être appliquée directement sur des patchs d'images ou sur des caractéristiques de réseaux neuronaux. Méthodes basées sur des réseaux préentraînés. Utilisation de réseaux préentraînés. Ces méthodes utilisent des réseaux neuronaux pour intégrer des informations sémantiques dans le processus de détection. Ces réseaux peuvent être préentrainés sur des bases de données publiques généralistes comme COCO [19]. SPADE [9] crée une base de caractéristiques à partir d'un réseau neuronal préentraîné avec les images de référence et utilise la norme L2 entre les caractéristiques d'une image et ses K plus proches voisins, aussi désignés sous le terme kNN, de la base de référence en tant que score. Il implique des caractéristiques à différentes couches pour effectuer une analyse multiéchelle. MahaAD [26] modélise chaque couche comme un modèle gaussien global unique. Les anomalies sont ensuite détectées en calculant et en seuillant la distance de Mahalanobis par rapport à cette gaussienne. PaDim [11] étend MahaAD [26] en apprenant un modèle gaussien par position au lieu d'un modèle global. Réseau de neurones et apprentissage profond En utilisant un auto-encodeur variationnel (VAE), le document [1] et [36] apprennent une représentation des données normales. Afin de localiser l'anomalie, la technique d'attention Grad-cam [32] est utilisée : lorsque l'image n'est pas une anomalie, l'attention doit être uniforme