DE-102024132068-A1 - Steuerung eines Kraftfahrzeugs

DE102024132068A1DE 102024132068 A1DE102024132068 A1DE 102024132068A1DE-102024132068-A1

Abstract

Ein Verfahren (200) zum domänenspezifischen Trainieren eines Sprachmodells (140, 170) umfasst Schritte des Erfassens (205) einer Interaktion einer Person (120) mit einem Kraftfahrzeug (105); des Erfassens (210) eines Kontexts des Kraftfahrzeugs (105); wobei der Kontext eine Vielzahl Statusinformationen des Kraftfahrzeugs (105) umfasst; des Bestimmens (215) von sprachlichen Repräsentationen der Interaktion und der Statusinformationen; und des Trainierens (220) eines Sprachmodells (140, 170) auf der Basis der sprachlichen Repräsentationen, um die Interaktion mit dem Kontext zu korrelieren.

Inventors

Istvan Nagy

Assignees

BAYERISCHE MOTOREN WERKE AKTIENGESELLSCHAFT

Dates

Publication Date: 20260507
Application Date: 20241104

Claims (13)

Verfahren (200) zum domänenspezifischen Trainieren eines Sprachmodells (140, 170), wobei das Verfahren folgende Schritte umfasst: - Erfassen (205) einer Interaktion einer Person (120) mit einem Kraftfahrzeug (105); - Erfassen (210) eines Kontexts des Kraftfahrzeugs (105); - wobei der Kontext eine Vielzahl Statusinformationen des Kraftfahrzeugs (105) umfasst; - Bestimmen (215) von sprachlichen Repräsentationen der Interaktion und der Statusinformationen; und - Trainieren (220) eines Sprachmodells (140, 170) auf der Basis der sprachlichen Repräsentationen, um die Interaktion mit dem Kontext zu korrelieren.
Verfahren (200) nach Anspruch 1 , wobei das Sprachmodell (140, 170) dazu trainiert ist, eine sprachliche Eingabe auf der Basis trainierter Wort- oder Satzfolge-Korrelationen weiterzubilden.
Verfahren (200) nach Anspruch 1 oder 2 , wobei das Sprachmodell (140, 170) auf der Basis von Interaktionen und Statusinformationen trainiert (220) wird, die von einer Vielzahl Kraftfahrzeuge (105) stammen.
Verfahren (200) nach einem der vorangehenden Ansprüche, wobei eine zeitliche Abfolge von Interaktionen und Kontexten bestimmt wird; und wobei das Sprachmodell (140, 170) auf der Basis von sprachlichen Repräsentationen der Abfolge trainiert (220) wird.
Verfahren (200) nach einem der vorangehenden Ansprüche, wobei eine Statusinformation eine Eingabe, eine Ausgabe oder einen Zustand einer Steuereinrichtung oder einen Messwert eines Sensors an Bord des Kraftfahrzeugs (105) umfasst.
Verfahren (200) nach einem der vorangehenden Ansprüche, wobei das Sprachmodell (140, 170) zusätzlich auf der Basis eines Bordnetzkatalogs, eines Systemlastenhefts, eines Funktionslastenhefts und/oder einer Bedienungs- oder Serviceanleitung des Kraftfahrzeugs (105) trainiert wird.
Verfahren (300) zum Steuern eines Kraftfahrzeugs (105), wobei das Verfahren folgende Schritte umfasst: - Erfassen (305) eines Kontexts des Kraftfahrzeugs (105); - wobei der Kontext eine Vielzahl Statusinformationen des Kraftfahrzeugs (105) umfasst; - Bestimmen (310) einer sprachlichen Repräsentation der Statusinformationen - Bestimmen (315) einer dem Kontext zugeordneten Interaktion mittels eines Sprachmodells (140, 170); und - Bereitstellen (320) der Interaktion an Bord des Kraftfahrzeugs (105).
Verfahren (300) nach Anspruch 7 , wobei die Interaktion eine Benutzereingabe zur Steuerung einer Funktion des Kraftfahrzeugs (105) umfasst.
Verfahren (300) nach Anspruch 8 , wobei die Funktion auf der Basis der bestimmten Benutzereingabe an Bord des Kraftfahrzeugs (105) gesteuert (320) wird.
Vorrichtung (115) zum domänenspezifischen Trainieren eines Sprachmodells (140, 170); wobei die Vorrichtung (115) folgende Elemente umfasst: - eine Schnittstelle (130, 135) zur Erfassung von Interaktionen mit Kraftfahrzeugen (105) und den Interaktionen jeweils zugeordneten Kontexten der Kraftfahrzeuge (105); - wobei ein Kontext eine Vielzahl Statusinformationen eines Kraftfahrzeugs (105) umfasst; - eine Einrichtung (125, 160) zur Bestimmung sprachlicher Repräsentationen von Interaktionen oder Statusinformationen; - ein Sprachmodell (140, 170); und - eine Verarbeitungseinrichtung (125, 160), die dazu eingerichtet ist, das Sprachmodell (140, 170) auf der Basis der sprachlichen Repräsentationen zu trainieren, um eine Interaktion mit einem Kontext zu korrelieren.
Steuervorrichtung (110) zum Steuern eines Kraftfahrzeugs (105); wobei die Vorrichtung folgende Elemente umfasst: - eine Schnittstelle (135) zur Erfassung eines Kontexts des Kraftfahrzeugs (105); - wobei der Kontext eine Vielzahl Statusinformationen des Kraftfahrzeugs (105) umfasst; und - eine Verarbeitungseinrichtung (125), die dazu eingerichtet ist, eine dem Kontext zugeordnete Interaktion mit dem Kraftfahrzeug (105) auf der Basis eines domänenspezifisch trainierten Sprachmodells (140, 170) zu bestimmen.
Kraftfahrzeug (105), umfassend eine Steuervorrichtung (110) nach Anspruch 11 .
System (100), umfassend ein Kraftfahrzeug (105) nach Anspruch 12 und eine dazu externe Stelle (115); wobei die externe Stelle (115) ein domänenspezifisch trainiertes Sprachmodell (170) umfasst; und die Steuervorrichtung (110) mittels einer drahtlosen Datenverbindung mit der externen Stelle (115) verbunden ist.

Description

Die vorliegende Erfindung betrifft die Steuerung eines Kraftfahrzeugs. Insbesondere betrifft die Erfindung die automatische Steuerung einer durch einen Benutzer steuerbaren Funktion des Kraftfahrzeugs. Ein Kraftfahrzeug realisiert eine Vielzahl von Funktionen, die durch eine Person an Bord gesteuert werden können. Für manche dieser Funktionen sind Automatiken bekannt, um es der Person zu erlauben, eine Vorgabe zu machen, welche die Automatik dann am Kraftfahrzeug steuert. Beispielsweise kann das Kraftfahrzeug eine Klimaanlage umfassen, die lüften, wärmen oder kühlen kann. Eine Klimaautomatik kann ein eingestelltes Klima unabhängig von Störeinflüssen wie einer sich ändernden Sonneneinstrahlung so gesteuert werden, dass eine Person an Bord sich wohlfühlt. Zahlreiche Funktionen können derzeit noch nicht automatisch gesteuert werden, weil unterschiedliche Personen sie unterschiedlich verwenden oder weil nicht im Einzelnen bekannt ist, in welcher Weise, also in Abhängigkeit von welchen Parametern, die Funktion gesteuert werden soll. Eine der vorliegenden Erfindung zu Grunde liegende Aufgabe besteht daher in der Angabe einer verbesserten Technik zur automatischen Steuerung einer Funktion eines Kraftfahrzeugs. Die Erfindung löst diese Aufgabe mittels der Gegenstände der unabhängigen Ansprüche. Unteransprüche geben bevorzugte Ausführungsformen wieder. Nach einem ersten Aspekt der vorliegenden Erfindung umfasst ein erstes Verfahren zum domänenspezifischen Trainieren eines Sprachmodells Schritte des Erfassens einer Interaktion einer Person mit einem Kraftfahrzeug; des Erfassens eines Kontexts des Kraftfahrzeugs, wobei der Kontext eine Vielzahl Statusinformationen des Kraftfahrzeugs umfasst; des Bestimmens von sprachlichen Repräsentationen der Interaktion und der Statusinformationen; und des Trainierens eines Sprachmodells auf der Basis der sprachlichen Repräsentationen, um die Interaktion mit dem Kontext zu korrelieren. Die sprachlichen Repräsentationen von Kontexten und jeweils zugeordneten Interaktionen können als Textkorpus angesehen werden, der zum Trainieren bzw. Feintunen des Sprachmodells verwendet werden kann. Bevorzugt wird von einem Sprachmodell ausgegangen, welches bereits anhand einer Vielzahl unspezifischer Texte trainiert ist. Das Sprachmodell kann insbesondere ein großes Sprachmodell (Large Language Model, LLM) oder ein kleines Sprachmodell (Small Language Model, SLM) umfassen. Ein solches Modell kann beispielsweise ein Mitglied der Sprachmodell-Familie Phi-3 erstellt sein. Das Sprachmodell kann ein gewisses allgemeines Verständnis grundlegender Zusammenhänge nach Art eines Weltwissens umfassen. Dazu kann das Wissen gehören, wie Kraftfahrzeuge grundsätzlich funktionieren und wie Menschen mit ihnen interagieren können. Auch grundsätzliche Kenntnisse über Physik, beispielsweise bezüglich einer Temperatur, einer Geschwindigkeit, einer Beschleunigung oder einer Steigung, können in dem Sprachmodell verankert sein. Das domänenspezifische Trainieren bezüglich des Kraftfahrzeugs kann eine Spezialisierung, ein vertiefendes Wissen oder zusätzliche Kenntnisse bzw. Fähigkeiten des Sprachmodells bereitstellen. Ein solches zusätzliches Trainieren ist bezüglich einer Methode der künstlichen Intelligenz (KI) wie einem Sprachmodell auch als Feintuning (fine tuning) bekannt. Allgemein ist bevorzugt, dass das Sprachmodell bereits vor dem hier geschilderten Training dazu trainiert ist, eine sprachliche Eingabe („Prompt“) auf der Basis trainierter Wort- oder Satzfolge-Korrelationen weiterzubilden. Eine Eingabe bzw. Ausgabe erfolgt üblicherweise in Textform, optional kann das Sprachmodell jedoch auch dazu eingerichtet sein, eine Ein- oder Ausgabe in einem anderen Modus zu akzeptieren, beispielsweise als gesprochene Sprache. Das Sprachmodell kann auch multimodal ausgeführt sein, sodass es verschiedene Modi zur Ein- und/oder Ausgabe unterstützt. Dem Sprachmodell kann der Beginn eines Satzes als Eingabe dargeboten werden, und das Sprachmodell kann den Satz weiterbilden bzw. fertigstellen. Dabei verwendet das Sprachmodell Wörter, Floskeln oder Redewendungen, die bezüglich der Eingabe als wahrscheinlich bestimmt sind. Eine Konversationsfähigkeit des Sprachmodells ist allgemein nicht erforderlich, die Fähigkeit einer Vervollständigung einer Eingabe („Prompt“) kann für die hier beschriebenen Zwecke bereits ausreichen. Durch das Bilden sprachlicher Repräsentationen der Interaktion und der Statusinformationen kann deren Zusammenhang einer Verarbeitung des Sprachmodells zugänglich gemacht werden. So kann ein Spezialwissen über das Kraftfahrzeug mit einem Allgemeinwissen vorteilhaft kombiniert werden. Das domänenspezifische Sprachmodell kann dazu eingesetzt werden, zu einer sprachlichen Repräsentation eines Kontexts eines Kraftfahrzeugs eine mit hoher Wahrscheinlichkeit zugehörige Interaktion einer Person zu bestimmen. Das Sprachmodell kann auf der Basis von Interaktionen und Statusinformationen trainiert werden, die von einer Vielzah