Search

EP-4738287-A1 - DOCUMENT AUTHENTICATION BASED ON DETECTION OF MODIFIED FONTS

EP4738287A1EP 4738287 A1EP4738287 A1EP 4738287A1EP-4738287-A1

Abstract

Il est divulgué un procédé d'authentification d'un document (D), le document comprenant une pluralité de champs de texte, un document authentique comprenant, parmi la pluralité de champs de texte, une pluralité de caractères imprimés dans une police de référence, et au moins un caractère, dont la position est déterminée, étant imprimé dans une police qui est modifiée par rapport à la police de référence, le procédé comprenant : - la réception d'une image du document à authentifier, - l'extraction, à partir de l'image, d'une région d'intérêt contenant le caractère ayant la position déterminée, - l'évaluation d'écarts entre le caractère contenu dans la région d'intérêt extraite et un modèle de caractère, et - la détermination de l'authenticité du document sur la base des écarts évalués.

Inventors

  • HSU, REIN-LIEN
  • MARTIN, BRIAN

Assignees

  • Idemia Public Security France

Dates

Publication Date
20260506
Application Date
20250818

Claims (12)

  1. Procédé mis en œuvre par ordinateur pour authentifier un document (D), le document comprenant une pluralité de champs de texte, dans lequel un document authentique comprend, parmi la pluralité de champs de texte, une pluralité de caractères imprimés dans une police de référence, et au moins un caractère, ayant une position déterminée, qui est imprimé dans une police modifiée par rapport à la police de référence, le procédé comprenant : - la réception (110) d'une image du document à authentifier, - l'extraction (200), à partir de l'image, d'une région d'intérêt contenant le caractère ayant la position déterminée, - l'évaluation (300) d'écarts entre le caractère contenu dans la région d'intérêt extraite et un modèle de caractère, et - la détermination (400) de l'authenticité du document sur la base des écarts évalués.
  2. Procédé selon la revendication 1, dans lequel le modèle de caractère est un gabarit de référence du caractère imprimé dans la police de référence ou dans la police modifiée, et l'évaluation d'écarts (300) entre le caractère contenu dans la région d'intérêt extraite et le gabarit de référence comprend le calcul (310) de la différence d'intensités entre les deux caractères.
  3. Procédé selon la revendication 2, dans lequel la détermination (400) de l'authenticité du document est basée sur la détection d'écarts d'intensité ou sur les positions d'écarts d'intensité.
  4. Procédé selon la revendication 2 ou 3, dans lequel le modèle de caractère est un gabarit de référence du caractère imprimé dans la police de référence, et l'évaluation d'écarts entre le caractère contenu dans la région d'intérêt extraite et le gabarit de référence comprend en outre la détermination de positions (320) d'extrema de la différence d'intensité entre les deux caractères, et la comparaison (330) des positions déterminées des extrema à des positions de référence des différences.
  5. Procédé selon la revendication 4, dans lequel il est déterminé (400) que le document est authentique lorsqu'une distance entre les positions déterminées des extrema de différence et les positions de référence est inférieure à un seuil déterminé.
  6. Procédé selon l'une quelconque des revendications précédentes, dans lequel l'extraction d'une région d'intérêt (200, 200') contenant un caractère comprend l'extraction (210, 210') d'une zone de l'image contenant le caractère, la normalisation (220, 220') de l'intensité de la zone, l'extraction et facultativement, le redimensionnement (230, 230') d'une boîte englobante du caractère, la boîte englobante extraite formant la région d'intérêt.
  7. Procédé selon l'une quelconque des revendications précédentes, dans lequel le modèle de caractère est un gabarit de référence du caractère imprimé dans la police de référence.
  8. Procédé selon l'une quelconque des revendications précédentes, dans lequel le document comprend plusieurs champs de texte statiques, et le caractère imprimé dans la police modifiée se trouve dans l'un des champs de texte statiques.
  9. Procédé selon les revendications 7 et 8 en combinaison, dans lequel un document authentique comprend au moins deux occurrences du même caractère, au moins une première occurrence du caractère étant imprimée dans la police modifiée, et au moins une deuxième occurrence du caractère étant imprimée dans une police de référence, et dans lequel le procédé comprend en outre l'acquisition du gabarit de référence à partir du document à authentifier, à une position correspondant à la deuxième occurrence du caractère, et l'acquisition du gabarit de référence à partir de l'image comprend l'extraction (210') d'une zone comprenant le caractère dans la police de référence à partir de l'image, la normalisation (220') de l'intensité de la zone et l'extraction (230') d'une boîte englobante (resserrée autour des contours) du caractère, la boîte englobante extraite formant le gabarit de référence.
  10. Procédé mis en œuvre par ordinateur pour générer (900) une base de données pour l'authentification de documents, comprenant l'ajout (940) à la base de données, pour chacun d'une pluralité de types de documents, de descripteurs de données d'au moins un modèle de caractère et d'au moins un caractère imprimé dans une police modifiée par rapport à une police de référence, comprenant au moins une position déterminée, dans un document authentique, du caractère imprimé dans la police modifiée.
  11. Système d'authentification de documents (1), comprenant au moins un capteur d'images (10), conçu pour acquérir une image d'un document à authentifier, une base de données (30) stockant, pour chacun d'une pluralité de types de documents, des descripteurs de données du modèle de caractère et du caractère imprimé dans la police modifiée, comprenant au moins une position déterminée, dans un document authentique, du caractère dans la police modifiée, et un ordinateur (20), configuré pour recevoir des images acquises par le capteur d'images et pour mettre en œuvre le procédé selon l'une quelconque des revendications 1 à 9.
  12. Système d'authentification de documents (1) selon la revendication précédente, dans lequel les descripteurs de données comprennent en outre au moins l'un des éléments suivants : - un gabarit de référence du caractère imprimé dans la police modifiée ou imprimé dans la police de référence, - une position attendue de chaque écart entre le modèle de caractère et le caractère imprimé dans la police modifiée, - une hauteur, une largeur ou un rapport d'aspect du modèle de caractère, - des positions attendues d'extrema d'écarts d'intensité entre le caractère dans la police modifiée et le caractère dans la police de référence, - des valeurs seuils concernant des écarts d'intensité, ou leurs positions, entre un caractère et un gabarit de référence correspondant.

Description

Domaine technique La présente divulgation concerne le domaine de l'authentification de documents et de la détection de fraudes dans des documents, tels que des documents d'identité. Art antérieur Les documents d'identité sont traditionnellement sécurisés par l'intégration d'une série de caractéristiques de sécurité. Ces caractéristiques visent à garantir l'authenticité, l'intégrité et la protection contre la fraude ou la falsification des documents, et donc à distinguer un document authentique d'un document frauduleux. Lors d'un contrôle d'identité, la présence et l'intégrité des caractéristiques de sécurité sont vérifiées afin d'authentifier le document. Les caractéristiques de sécurité peuvent par exemple être des hologrammes, des filigranes, des micro-impressions, de l'encre UV, etc. Un document, en particulier un document d'identité, comprend généralement à la fois des champs de texte statiques et des champs de texte variables. Les champs de texte statiques comprennent un texte qui ne varie pas en fonction du propriétaire du document, tandis que les champs de texte variables comprennent un texte qui varie en fonction du propriétaire, également appelé Information Personnelle Identifiable. En règle générale, un champ de texte statique ne contient aucune donnée personnelle ou relative à un document, mais peut indiquer le type de données personnelles qui remplissent un champ de texte variable voisin. Dans le cas d'un document d'identité, un champ de texte statique peut contenir des mots tels que « Nom », « Prénom », « Date de naissance », « Date de délivrance », « Signature », etc. Les champs de texte statiques peuvent également comprendre un texte identifiant le type de document et l'autorité émettrice. Certains documents peuvent comprendre des polices dédiées en tant que caractéristique de sécurité, appelées polices modifiées. La police modifiée peut avoir le même style de police que celle utilisée pour les textes statiques environnants - également appelée police de référence, la police modifiée étant différente mais proche de la police de référence (avec, par exemple, une légère modification apportée à la police de référence) ou avoir un style de police différent. Les changements entre la première police et la police modifiée peuvent être subtils et nécessiter un examen minutieux et lent lorsque l'authentification du document est effectuée par un opérateur humain. Il est donc nécessaire de trouver une solution rapide et fiable pour l'examen automatique d'une telle caractéristique de sécurité. Il est connu de [Lu, 2020] un procédé de détection de texte falsifié dans un document qui classe un document comme étant frauduleux ou authentique sur la base d'une Transformée en Cosinus Discrets (DCT) du document suivie d'une DCT inverse appliquée aux coefficients positifs et négatifs de la DCT. Ce procédé ne permet pas de détecter spécifiquement une police altérée, mais vise plutôt à détecter tout changement en général, et non pas spécifiquement un changement de style de police, car il repose sur un changement global de la distribution d'intensité des pixels d'un document qui a été altéré. Résumé de l'invention La présente divulgation vise à améliorer la situation. En particulier, l'un des objectifs de la présente divulgation est de fournir une solution rapide et fiable pour l'authentification automatique d'un document sur la base de la vérification d'une police de caractères modifiée. Un autre objectif de la présente divulgation est de fournir un procédé qui puisse s'adapter à divers types de polices modifiées, comprenant divers caractères et divers types de modifications des polices. En conséquence, un procédé mis en œuvre par ordinateur pour authentifier un document est divulgué, le document comprenant une pluralité de champs de texte, dans lequel un document authentique comprend, parmi la pluralité de champs de texte, une pluralité de caractères imprimés dans une police de référence, et au moins un caractère, ayant une position déterminée, qui est imprimé dans une police qui est modifiée par rapport à la police de référence, le procédé comprenant : la réception d'une image du document à authentifier,l'extraction, à partir de l'image, d'une région d'intérêt contenant le caractère ayant la position déterminée,l'évaluation d'écarts entre le caractère contenu dans la région d'intérêt extraite et un modèle de caractère, etla détermination de l'authenticité du document sur la base des écarts évalués. Dans certains modes de réalisation, le modèle de caractère est un gabarit de référence du caractère imprimé dans la police de référence ou dans la police modifiée, et l'évaluation d'écarts entre le caractère contenu dans la région d'intérêt extraite et le gabarit de référence comprend le calcul de la différence d'intensité entre les deux caractères. Dans certains modes de réalisation, la détermination de l'authenticité du document est basée sur la détection d'écarts d'intensité ou sur les positions des écarts d'intensi