Search

EP-3956809-B1 - IMAGE PROCESSING METHOD FOR AN IDENTITY DOCUMENT

EP3956809B1EP 3956809 B1EP3956809 B1EP 3956809B1EP-3956809-B1

Inventors

  • PIC, Marc-Michel
  • OUDDAN, Mohammed Amine
  • MAHFOUDI, Gaël
  • PIC, Xavier

Dates

Publication Date
20260506
Application Date
20200420

Claims (12)

  1. Method for processing an image of a candidate identity document comprising a data page containing several glyphs from several fonts, the method comprising a step consisting of - acquiring a digital image of the data page of the candidate identity document, optionally by a communicating object, each digital image being further extractable from a video stream recorded by said communicating object; characterised in that it further comprises the steps of - assigning a class or superclass to the candidate identity document by automatically classifying the digital image using a machine learning algorithm implemented on a set of reference images during a learning phase in which each glyph is learned individually for each font in each class, - extracting a set of glyphs from the digital image and saving each glyph as an individual image, - process each individual image to obtain a set of at least one intermediate image, each intermediate image corresponding to an individual glyph, each intermediate image being obtained by at least one of the following steps: A step of processing each individual image by a neural network generative neural network, a step of processing each individual image by a recurrent neural network, and a step of post-processing each individual image, - discriminate each glyph of each font of said intermediate image by a respective discriminator neural network, each individual glyph being considered likely to be authentic when it corresponds to a glyph learned during a learning phase, and - emitting an output signal by combining the output signals of the discriminator neural networks, the value of which is representative of the probability that the candidate identity document is an authentic identity document or a forgery; the method comprising a prior learning step for each of the glyphs of each of the alphabets of each of the identity documents in a reference set, each glyph being learned individually, for each font of each class, where the class of each authentic identity document is known; the learning being preferably implemented on several authentic identity documents; the authentication of an identity document being performed by the discriminative neural network set, whose input is fed with a set of intermediate images during the learning phase.
  2. Method according to claim 1, wherein the step of assigning a class or superclass is implemented by an unsupervised learning algorithm, by a pre-trained classifier neural network, preferably a convolutional neural network.
  3. Method according to any of the preceding claims, comprising, prior to the output signal transmission step, steps consisting of - extracting a set of at least one area from - an area corresponding to all or part of the machine-readable zone (MRZ) of the candidate identity document, - an area corresponding to the top banner (TOP) of the candidate identity document, and - an area corresponding to the outer part (EXT) of the candidate identity document, each area comprising glyphs, from at least one same font, - individually extracting each glyph from the set of at least one area, by optical glyph recognition, and - comparing each extracted glyph with its corresponding glyph learned during the learning phase; the method optionally further comprising, when said set of at least one area comprises variable data, a step of blurring said variable data during the learning phase.
  4. Method according to any of the preceding claims, wherein The step of processing each individual image by a recurrent neural network produces a set of intermediate images, each of which corresponds to a segmentation of the glyph obtained at the end of the glyph recognition step, by cosegmentation.
  5. Method according to any of the preceding claims, in which the generator neural network is an autoencoder, preferably a convolutional autoencoder.
  6. Method according to any of the preceding claims, wherein the automatic classification step comprises assigning a predetermined class based on at least one of the following characteristics the nature of the identity document; the country or state of origin of the identity document; the type of identity document; the version or generation number of the identity document
  7. Method according to any of the preceding claims, further comprising a data augmentation step during the learning phase.
  8. Method according to any of the preceding claims, wherein the output signal is one of - a majority vote, - a qualified vote, and - a weighted vote output signals from discriminative neural networks.
  9. Method according to any of the preceding claims, further comprising a step of checking optical security features of the identity document.
  10. Method according to any of claims 3 to 9, comprising a step of assigning individual weights to the glyphs according to the area from which they are extracted.
  11. Method according to any of the preceding claims, comprising a step of considering a candidate identity document to be authentic by calculating a ratio of the number of glyphs recognised as valid to the number of glyphs recognised as invalid in said document, or to the total number of recognised characters, possibly followed by a step of thresholding said ratio.
  12. A computer programme comprising programme code instructions for performing the steps of the method according to any of the preceding claims, when said programme is executed on a computer.

Description

DOMAINE DE L'INVENTION La présente invention concerne le domaine du traitement d'image par apprentissage profond, ou « deep-learning » par anglicisme, pour la vérification des documents d'identité. Un document d'identité est attribué à un porteur. Il comprend au moins une page de données, ou datapage par anglicisme pour un document d'identité tel qu'un passeport, qui est une page personnalisée au porteur du document et qui comprend un fond (graphique), le plus souvent une photographie du porteur et des données variables relatives au moins au porteur. Un document d'identité peut être officiel, c'est-à-dire émanant d'un Etat ou d'une autorité administrative ; ou non officiel. La présente invention concerne essentiellement les documents d'identité officiels régaliens, mais peut s'appliquer également à tout document officiel, notamment les titres de propriété. Par concision on appelle ci-après par « document d'identité » tout document officiel ou non officiel, d'identité ou non, comprenant des données invariantes, c'est-à-dire dont le contenu et la position sont communes à au moins deux documents d'identité, indépendamment de l'identité du porteur du document d'identité, par exemple le libellé d'un champ tel que « nationalité » sur un passeport ou bien un élément graphique de sécurité tel qu'une guilloche; et comprenant des données variables, c'est-à-dire spécifiques à un document d'identité, par exemple le nom du porteur du document d'identité. Il existe plusieurs natures de documents d'identité, par exemple les passeports, les cartes d'identité, les cartes de séjour, les permis de conduire, les cartes d'abonnement, etc., qui proviennent de tous les pays émetteurs. Pour une même nature de document Il peut exister différents types de documents d'identité, par exemple un type de passeport « ordinaire », un type de passeport « de service » et un type de passeport « diplomatique ». Certains documents d'identité comprennent des fontes à erreur, qui comprennent des erreurs volontaires et connues, en particulier sur les empattements. Un même type de document d'identité peut comprendre plusieurs modèles. Par exemple un type de passeport « ordinaire » pour un pays donné peut comprendre plusieurs modèles, ou versions, dépendant notamment de leur date de fabrication. On peut catégoriser les documents d'identité dans un ensemble de classes, telles que chaque classe est une combinaison unique notamment d'une nature, d'un type et d'un modèle de document d'identité. Un document d'identité peut être authentique ou bien faux c'est-à-dire contrefait ou falsifié. Un document d'identité contrefait est créé de toutes pièces, par exemple par un Etat ou par un contrefacteur. Selon les moyens investis dans la réalisation de la contrefaçon celle-ci est quasiment indétectable ou plus ou moins grossière. Un document d'identité falsifié est un document d'identité authentique dont un ou plusieurs éléments sont modifiés frauduleusement. Globalement les falsifications correspondent généralement soit à une modification des données variables, c'est-à-dire les données relatives au porteur du document ou au document lui-même, par exemple son patronyme, son âge, la date d'expiration du document etc., soit au remplacement de la photographie du porteur du document d'identité authentique par la photographie d'un tiers. Les documents d'identité comprennant des fontes à erreur sont très difficilement falsifiés car le contrefacteur ne connait pas les erreurs volontaires. Il existe également des documents d'identité vierge, c'est-à-dire non encore personnalisés officiellement, qui sont volés et dont la personnalisation est frauduleuse ; de tels documents sont appelés « volés-vierges ». Or, les documents d'identité authentiques peuvent présenter différentes variations, y compris pour un même type. Par exemple deux modèles distincts d'un même document d'identité peuvent présenter des différences de fabrication sans perdre de leur authenticité ni de leur validité à un même instant. En outre, à l'émission d'un nouveau document d'identité authentique, il n'existe pas de faux document dudit document d'identité. Enfin, il n'existe pas ou très peu de spécimen de documents d'identité, notamment officiels. Et ces spécimens sont remplis avec les mêmes personnalisations, ce qui rend difficile leur exploitation comme base d'apprentissage pour un algorithme de « deep learning. » Pour chacune de ces raisons, et a fortiori pour l'ensemble d'entre elles, la vérification d'un document d'identité est relativement compliquée, d'autant plus que la date de vérification est proche de la date de fabrication dudit document ou du type dudit document. A ce jour, la vérification d'un document d'identité est basée sur une analyse humaine et/ou sur une analyse informatique basée sur un algorithme de vérification impliquant une quantité importante de documents d'identité authentiques et qui nécessite une adaptation à chaque modèle et à chaque version de modèle. Pour pallier à ces pr