Search

DE-102025143689-A1 - SYSTEME UND VERFAHREN ZUM KONFIGURIEREN EINES BILDGEBUNGSWERKZEUGS UNTER VERWENDUNG VON GENERATIVER KI

DE102025143689A1DE 102025143689 A1DE102025143689 A1DE 102025143689A1DE-102025143689-A1

Abstract

Systeme und Verfahren zum Steuern eines Bildgebungswerkzeugs, das dem Durchführen einer Bildgebungsaufgabe zugeordnet ist, werden offenbart. Ein beispielhaftes Verfahren kann ein Modell beinhalten, das Bilddaten empfängt, die mindestens ein Bild umfassen, das Text beinhaltet, und Steuerdaten, die dem Bildgebungswerkzeug zugeordnet sind, das eine Beschreibung der Bildgebungsaufgabe, eine Vielzahl von Einstellungen des Bildgebungswerkzeugs, das dem Durchführen der Bildgebungsaufgabe zugeordnet ist, und ein Schema von Werkzeugkonfigurationsdaten, das die Vielzahl von Einstellungen konfiguriert, angibt. Das Verfahren kann beinhalten, dass das Modell Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug erzeugt, die einen oder mehrere Werte angeben, die mindestens einem Teil der Vielzahl von Einstellungen entsprechen. Das Verfahren kann das Konfigurieren des Bildgebungswerkzeugs unter Verwendung der Werkzeugkonfigurationsdaten beinhalten.

Inventors

  • Matthew M. Degen

Assignees

  • ZEBRA TECHNOLOGIES CORPORATION

Dates

Publication Date
20260507
Application Date
20251024
Priority Date
20241101

Claims (15)

  1. Verfahren zum Konfigurieren eines Bildgebungswerkzeugs, das einem Durchführen einer Bildgebungsaufgabe zugeordnet ist, wobei das Verfahren umfasst: Empfangen, an einem Modell: von Bilddaten, die mindestens ein Bild umfassen, wobei das mindestens eine Bild Text enthält, und von Steuerdaten, die dem Bildgebungswerkzeug zugeordnet sind, wobei die Steuerdaten angeben: eine Beschreibung der Bildgebungsaufgabe, eine Vielzahl von Einstellungen des Bildgebungswerkzeugs, die dem Durchführen der Bildgebungsaufgabe zugeordnet sind, und ein Schema von Werkzeugkonfigurationsdaten, das die Vielzahl von Einstellungen konfiguriert; Erzeugen der Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug über das Modell, wobei die Werkzeugkonfigurationsdaten einen oder mehrere Werte angeben, die mindestens einem Teil der Vielzahl von Einstellungen entsprechen; und Konfigurieren des Bildgebungswerkzeugs unter Verwendung der Werkzeugkonfigurationsdaten.
  2. Verfahren nach Anspruch 1 , wobei das Erzeugen der Werkzeugkonfigurationsdaten umfasst: Eliminieren mindestens einer Einstellung der Vielzahl von Einstellungen, die durch die Werkzeugkonfigurationsdaten konfiguriert werden, basierend auf den Bilddaten; und/oder Begrenzen eines Bereichs von Werten des einen oder der mehreren Werte, die mindestens dem Teil der Vielzahl von Einstellungen entsprechen, basierend auf den Bilddaten.
  3. Verfahren nach Anspruch 1 , ferner umfassend: Empfangen einer Angabe des Bildgebungswerkzeugs einer Vielzahl von Bildgebungswerkzeugen, wobei das Empfangen mindestens der Steuerdaten an dem Modell als Reaktion auf das Empfangen der Angabe des Bildgebungswerkzeugs erfolgt.
  4. Verfahren nach Anspruch 1 , wobei die Vielzahl von Einstellungen dem Durchführen einer optischen Zeichenerkennung an einem Bild zugeordnet sind und eines oder mehrere umfassen von: einer Konfidenzmetrik, einer durchschnittlichen Zeichenhöhe, einer Farbe des Textes, einer Kontrastschwelle, einer Zeichenbreite, einem Zeichenbereich, einem Bereich von Interesse, einer Zeichenkettenübereinstimmung oder einer Textoptimierung.
  5. Verfahren nach Anspruch 1 , ferner umfassend ein Basismodell, das konfiguriert ist, um eine Vielzahl von Konfigurationsdatensätzen zu erzeugen, die einer Vielzahl von Werkzeugen entsprechen, wobei: die Vielzahl von Konfigurationsdatensätzen die Werkzeugkonfigurationsdaten umfasst, die Vielzahl von Werkzeugen das Bildgebungswerkzeug umfasst, eine Feinabstimmung des Basismodells das Modell erzeugt, die Feinabstimmung das Modell konfiguriert, um die Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug zu erzeugen, und die Feinabstimmung bewirkt, dass das Modell, das die Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug erzeugt, eine bessere Leistung aufweist, im Vergleich zu der Leistung des Basismodells, das die Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug erzeugt.
  6. Verfahren nach Anspruch 1 , wobei das Modell eines oder mehrere von einem neuronalen Netzwerk, einem generativen Modell oder einem Sprachmodell umfasst.
  7. Verfahren nach Anspruch 1 , wobei die Steuerdaten eine oder mehrere Aufforderungen umfassen, die für das Modell konfiguriert sind.
  8. Verfahren nach Anspruch 1 , wobei das Modell konfiguriert ist, um einen Bereich von Interesse (ROI) zu bestimmen und/oder die Werkzeugkonfigurationsdaten basierend auf dem ROI in dem mindestens einen Bild zu erzeugen.
  9. Verfahren nach Anspruch 1 , ferner umfassend: Durchführen der Bildgebungsaufgabe an einem Satz von Testbildern, die Testbilddaten umfassen, unter Verwendung des Bildgebungswerkzeugs, das mit den Werkzeugkonfigurationsdaten konfiguriert ist; Bestimmen, ob die Leistung der Bildgebungsaufgabe eine oder mehrere Metriken erreicht, die der Bildgebungsaufgabe zugeordnet sind; als Reaktion auf das Erreichen der einen oder mehreren Metriken, Erzeugen von Bildgebungskonfigurationsdaten zum Konfigurieren von Betriebsparametern einer Bildgebungsvorrichtung, wobei die Bildgebungskonfigurationsdaten auf den Werkzeugkonfigurationsdaten basieren, und Bereitstellen der Bildgebungskonfigurationsdaten für die Bildgebungsvorrichtung; und als Reaktion auf das Nichterreichen der einen oder mehreren Metriken, Modifizieren der Werkzeugkonfigurationsdaten über das Modell, um die Leistung der Bildgebungsaufgabe an dem Satz von Testbildern unter Verwendung des Bildgebungswerkzeugs zu verbessern.
  10. Verfahren nach Anspruch 9 , wobei das Modell die Werkzeugkonfigurationsdaten iterativ modifiziert, bis die eine oder mehreren Metriken durch das Bildgebungswerkzeug erreicht werden.
  11. System zum Konfigurieren eines Bildgebungswerkzeugs, das dem Durchführen einer Bildgebungsaufgabe zugeordnet ist, wobei das System umfasst: ein Modell, das in einem oder mehreren Speichern gespeichert ist; einen oder mehrere Prozessoren; und wobei der eine oder die mehreren Speicher prozessorausführbare Anweisungen speichern, die, wenn sie durch den einen oder die mehreren Prozessoren ausgeführt werden, das System veranlassen zum: Empfangen, an dem Modell: von Bilddaten, die mindestens ein Bild umfassen, wobei das mindestens eine Bild Text enthält, und von Steuerdaten, die dem Bildgebungswerkzeug zugeordnet sind, wobei die Steuerdaten angeben: eine Beschreibung der Bildgebungsaufgabe, eine Vielzahl von Einstellungen des Bildgebungswerkzeugs, die dem Durchführen der Bildgebungsaufgabe zugeordnet sind, und ein Schema von Werkzeugkonfigurationsdaten, das die Vielzahl von Einstellungen konfiguriert, Erzeugen der Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug über das Modell, wobei die Werkzeugkonfigurationsdaten einen oder mehrere Werte angeben, die mindestens einem Teil der Vielzahl von Einstellungen entsprechen, und Konfigurieren des Bildgebungswerkzeugs unter Verwendung der Werkzeugkonfigurationsdaten.
  12. System nach Anspruch 11 , wobei das Erzeugen der Werkzeugkonfigurationsdaten ferner Anweisungen umfasst, die, wenn sie ausgeführt werden, das System veranlassen zum: Eliminieren mindestens einer Einstellung der Vielzahl von Einstellungen, die durch die Werkzeugkonfigurationsdaten konfiguriert werden, basierend auf den Bilddaten; und/oder Begrenzen eines Bereichs von Werten des einen oder der mehreren Werte, die mindestens dem Teil der Vielzahl von Einstellungen entsprechen, basierend auf den Bilddaten.
  13. System nach Anspruch 11 , ferner umfassend ein Basismodell, das konfiguriert ist, um eine Vielzahl von Konfigurationsdatensätzen zu erzeugen, die einer Vielzahl von Werkzeugen entsprechen, wobei: die Vielzahl von Konfigurationsdatensätzen die Werkzeugkonfigurationsdaten umfasst, die Vielzahl von Werkzeugen das Bildgebungswerkzeug umfasst, eine Feinabstimmung des Basismodells das Modell erzeugt, die Feinabstimmung das Modell konfiguriert, um die Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug zu erzeugen, und die Feinabstimmung bewirkt, dass das Modell, das die Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug erzeugt, eine bessere Leistung aufweist, im Vergleich zu der Leistung des Basismodells, das die Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug erzeugt.
  14. System nach Anspruch 11 , ferner umfassend Anweisungen, die, wenn sie ausgeführt werden, das System veranlassen zum: Durchführen der Bildgebungsaufgabe an einem Satz von Testbildern, die Testbilddaten umfassen, unter Verwendung des Bildgebungswerkzeugs, das mit den Werkzeugkonfigurationsdaten konfiguriert ist; Bestimmen, ob die Leistung der Bildgebungsaufgabe eine oder mehrere Metriken erreicht, die der Bildgebungsaufgabe zugeordnet sind; als Reaktion auf das Erreichen der einen oder mehreren Metriken, Erzeugen von Bildgebungskonfigurationsdaten zum Konfigurieren von Betriebsparametern einer Bildgebungsvorrichtung, wobei die Bildgebungskonfigurationsdaten auf den Werkzeugkonfigurationsdaten basieren, und Bereitstellen der Bildgebungskonfigurationsdaten für die Bildgebungsvorrichtung; und als Reaktion auf das Nichterreichen der einen oder mehreren Metriken, Modifizieren der Werkzeugkonfigurationsdaten über das Modell, um die Leistung der Bildgebungsaufgabe an dem Satz von Testbildern unter Verwendung des Bildgebungswerkzeugs zu verbessern.
  15. Nichttransitorisches computerlesbares Medium, das Anweisungen speichert, die, wenn sie durch einen oder mehrere Prozessoren ausgeführt werden, den einen oder die mehreren Prozessoren veranlassen zum: Empfangen, an einem Modell: von Bilddaten, die mindestens ein Bild umfassen, wobei das mindestens eine Bild Text enthält, und von Steuerdaten, die einem Bildgebungswerkzeug zugeordnet sind, wobei die Steuerdaten angeben: eine Beschreibung einer Bildgebungsaufgabe, eine Vielzahl von Einstellungen des Bildgebungswerkzeugs, die dem Durchführen der Bildgebungsaufgabe zugeordnet sind, und ein Schema von Werkzeugkonfigurationsdaten, das die Vielzahl von Einstellungen konfiguriert; Erzeugen der Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug über das Modell, wobei die Werkzeugkonfigurationsdaten einen oder mehrere Werte angeben, die mindestens einem Teil der Vielzahl von Einstellungen entsprechen; und Konfigurieren des Bildgebungswerkzeugs unter Verwendung der Werkzeugkonfigurationsdaten.

Description

HINTERGRUND Die hierin bereitgestellte Hintergrundbeschreibung dient dem Zweck, den Kontext der Offenbarung allgemein darzustellen. Die Arbeit des vorliegend genannten Erfinders in dem in diesem Hintergrundabschnitt beschriebenen Umfang sowie Aspekte der Beschreibung, die zum Zeitpunkt der Anmeldung ansonsten nicht als Stand der Technik gelten, werden gegenüber der vorliegenden Offenbarung weder ausdrücklich noch implizit als Stand der Technik angesehen. Eine Anwendung zum Durchführen einer Bildgebungsaufgabe an einem Bild, wie etwa ein maschinelles Bildverarbeitungswerkzeug zur optischen Zeichenerkennung oder Strichcodedekodierung, kann viele Einstellungen aufweisen, die die Anwendung zum Durchführen der Bildgebungsaufgabe konfigurieren. Einige Beispiele für die Einstellung können das Bestimmen eines Bereichs von Interesse des Bildes, der zum Durchführen der bestimmten Bildgebungsaufgabe analysiert werden soll, die durchschnittliche Zeichenhöhe des in einem Bild zu erkennenden Textes, den Kontrast des Textes oder einer anderen Symbolik in dem Bild, die Farbe des zu identifizierenden Textes usw. umfassen. Die Werte der Anwendungseinstellungen sind nicht immer selbstverständlich oder leicht zu bestimmen, was für den Anwendungsbenutzer Schwierigkeiten bereitet, während er die Einstellung konfiguriert, und/oder zu Einstellungen führt, die für ein gegebenes Motivbild und/oder eine gegebene Bildgebungsaufgabe möglicherweise nicht geeignet sind. Der Versuchs- und Fehlerprozess, um zu geeigneten Anwendungseinstellungen zu gelangen, kann für den Benutzer frustrierend und zeitaufwändig sein und verbraucht außerdem unnötig Rechenressourcen (z. B. Verarbeitungszyklen, Speicher, Leistung usw.), während er verschiedene Anwendungseinstellungen an Motivbildern testet. Somit besteht eine Möglichkeit zum Konfigurieren einer generativen künstlichen Intelligenz eines Bildgebungswerkzeugs. KURZE BESCHREIBUNG In einem Aspekt kann ein Verfahren zum Konfigurieren eines Bildgebungswerkzeugs, das dem Durchführen einer Bildgebungsaufgabe zugeordnet ist, umfassen: Empfangen, an einem Modell, von Bilddaten, die mindestens ein Bild umfassen, wobei das mindestens eine Bild Text beinhaltet, und Steuerdaten, die dem Bildgebungswerkzeug zugeordnet sind, wobei die Steuerdaten angeben: eine Beschreibung der Bildgebungsaufgabe, eine Vielzahl von Einstellungen des Bildgebungswerkzeugs, das dem Durchführen der Bildgebungsaufgabe zugeordnet ist, und ein Schema von Werkzeugkonfigurationsdaten, das die Vielzahl von Einstellungen konfiguriert; Erzeugen, über das Modell, der Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug, wobei die Werkzeugkonfigurationsdaten einen oder mehrere Werte angeben, die mindestens einem Teil der Vielzahl von Einstellungen entsprechen; und Konfigurieren des Bildgebungswerkzeugs unter Verwendung der Werkzeugkonfigurationsdaten. In einer Variation des Aspekts kann das Erzeugen der Werkzeugkonfigurationsdaten das Eliminieren mindestens einer Einstellung der Vielzahl von Einstellungen, die durch die Werkzeugkonfigurationsdaten konfiguriert werden, basierend auf den Bilddaten; und/oder das Begrenzen eines Bereichs von Werten des einen oder der mehreren Werte, die mindestens dem Teil der Vielzahl von Einstellungen entsprechen, basierend auf den Bilddaten umfassen. In einer anderen Variation des Aspekts kann das Verfahren das Empfangen einer Angabe des Bildgebungswerkzeugs einer Vielzahl von Bildgebungswerkzeugen beinhalten, wobei das Empfangen mindestens der Steuerdaten an dem Modell als Reaktion auf das Empfangen der Angabe des Bildgebungswerkzeugs erfolgt. In noch einer anderen Variation des Aspekts können die Werkzeugkonfigurationsdaten eine JSON-Datei beinhalten. In noch einer anderen Variation des Aspekts kann die Vielzahl von Einstellungen dem Durchführen einer optischen Zeichenerkennung an einem Bild zugeordnet sein. In einer Variation des Aspekts kann die Vielzahl von Einstellungen eines oder mehrere umfassen von: einer Konfidenzmetrik, einer durchschnittlichen Zeichenhöhe, einer Farbe des Textes, einer Kontrastschwelle, einer Zeichenbreite, einem Zeichenbereich, einem Bereich von Interesse, einer Zeichenkettenübereinstimmung oder einer Textoptimierung. In einer anderen Variation des Aspekts kann das Verfahren ein Basismodell beinhalten, das konfiguriert ist, um eine Vielzahl von Konfigurationsdatensätzen zu erzeugen, die einer Vielzahl von Werkzeugen entsprechen, wobei: die Vielzahl von Konfigurationsdatensätzen die Werkzeugkonfigurationsdaten umfasst, die Vielzahl von Werkzeugen das Bildgebungswerkzeug umfasst, eine Feinabstimmung des Basismodells das Modell erzeugt, die Feinabstimmung das Modell konfiguriert, um die Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug zu erzeugen, und die Feinabstimmung bewirkt, dass das Modell, das die Werkzeugkonfigurationsdaten für das Bildgebungswerkzeug erzeugt, eine bessere Leistung aufweist, im Vergleich zu der Leistung des Basismodells, das die Werkzeugkonfiguration