Schlüsselwörter gesucht: Über das Trainieren einer sprachbasierten KI bei Weber Instrumente

© Weber Instrumente GmbH & Co. KG

Wie filtere ich Informationen aus Prüfanweisungen für den Wareneingang? Mit dieser Fragestellung aus dem Bereich Trainieren einer sprachbasierten KI ist die Weber Instrumente GmbH & Co. KG auf unseren Textil vernetzt-Partner Hahn-Schickard zugegangen. Gelöst werden soll die Frage mit einer sprachbasierten KI, die aus einem gegebenen Eingabetext bestimmte Eigenschaften erkennt und diese herausschreibt. Dafür bedarf es sogenannter Labels, mit denen die Daten versehen sein müssen. Für das Labeling bieten sich zwei Möglichkeiten an: ein regelbasierter Abgleich oder die Nutzung regulärer Ausdrücke. Reguläre Ausdrücke, auf Englisch „regular expressions“ bzw. „regex“ sind Muster, die zum Abgleich von Zeichenkombinationen in Zeichenketten verwendet werden. Ziel ist es, drei Schlüsselwörter in den Prüfanweisungen zu erkennen und diese herauszuschreiben.

Die Projektpartner stellten fest, dass die Anweisungen keine wiederkehrenden Muster aufweisen. Da das Abstrahierungslevel von regex gegenüber einem regelbasierten Abgleich deutlich höher ist, wurde sich für regex entschieden. Dann wurden mittels regex die vorhandenen Daten ausgedünnt, um nur mit den Daten zu arbeiten, die die drei Schlüsselworte enthielten. Diese Daten wurden gelabelt. In einem nächsten Schritt wird die Spracherkennungs-KI dahingehend trainiert, die gewünschten Eigenschaften aus den Texten zu identifizieren und herauszuschreiben.

Erfahren Sie mehr zum Projekt "Extraktion von Informationen aus Prüfanweisungen für Wareneingang".

Zurück


Nach oben