Semantische Daten in KI-Projekten: Der unterschätzte Erfolgsfaktor

Die Ebene, die in KI-Projekten unterschätzt wird, bis es kracht. 💥
Viele Unternehmen investieren in KI, Data-Plattformen und Automatisierung.
Es gibt klare Rollen, wie Data Engineer, Data Analysts, KI-Experten etc.
Und dennoch bleibt eine zentrale Ebene oft unbeachtet.
Die Herausforderung liegt nicht nur in der Datenverfügbarkeit, sondern in der Konsistenz und Bedeutung der semantischen Daten, also der Benennungen, der Wörter.
Beispiel: Ein Produkt wird in diversen Applikationen, Dokumenten etc. inkonsistent benannt. Was ist nun genau gemeint?

Ich wiederhole mich auch hier wieder: Für uns Menschen ist das unter Umständen interpretierbar, für KI-Systeme nicht.

Die Folge daraus:
– Modelle arbeiten mit uneinheitlichen Begriffen.
– LLM-Anwendungen werden mit widersprüchlichem Kontext gefüttert und trainiert.
– Ergebnisse wirken plausibel, sind aber fachlich nicht konsistent und führen zu Missverständnissen bis hin zu Fehlern.
Was das im Einzelnen resp. in Ihrem Use Case bedeutet, können Sie sich denken.
Was fehlt, ist eine semantische Herangehensweise, die Begriffe explizit definiert, voneinander abgrenzt und Benennungen eindeutig zuordnet – und das nicht nur in einer Abteilung.
Ziel: Datenbanken, Applikationen und Personen nutzen dieselbe Benennung für denselben Begriff.

Auffällig ist, dass diese Ebene selten klar verankert ist. KI-Verantwortliche sind sich dessen bewusst, wissen aber oft nicht, wie sich das Problem ganzheitlich lösen lässt.
In der Praxis werden im guten Glauben „rohe Wörterlisten“ aus Fachabteilungen übernommen, die das Problem nicht lösen, gerade weil keine durchgängige konzeptorientierte Standardisierung der Terminologie im Hintergrund stattgefunden hat. Schliesslich muss es ja schnell gehen.
Die Verantwortung für Begriffe verteilt sich auf Fachbereiche, IT und Datenmanagement, bleibt jedoch implizit und unkoordiniert.
Damit fehlt nicht nur eine Struktur, sondern auch eine klare Zuständigkeit.
Ontologien und Wissensgraphen sind mögliche Umsetzungsformen. Entscheidend ist jedoch, dass die Bedeutungen dahinter organisationsübergreifend konsistent modelliert und gepflegt werden.

Die KI sieht nicht, was tatsächlich gemeint ist, sondern nur das, was in den Systemen steht, und wenn dort dieselbe Benennung für unterschiedliche Dinge verwendet wird, entstehen zwangsläufig falsche Ergebnisse.

Und was habe ich damit zu tun? Meine Expertise liegt genau darin, dieses Problem der inkonsistenten Daten, Metadaten, Benennungen, Terminologie und Fachsprachen zu lösen, Klarheit und Ordnung in die Begriffswelten zu bringen und damit die Grundlage für konsistente Systeme und verständliche Kommunikation zu schaffen.
Als Wissensmanagerin und Terminologin beschäftige ich mich seit 20 Jahren genau mit diesen Themen.
Gerne unterstütze ich Sie dabei, die semantischen Grundlagen zu schaffen, auf denen Ihre KI-Initiativen zuverlässig funktionieren.

Viele KI-Initiativen in Industrieunternehmen beginnen mit der Entwicklung von Modellen und Algorithmen. In der Praxis entscheidet jedoch meist auch etwas anderes über den Erfolg: die Qualität, die Struktur und semantische Konsistenz der Daten.

Typische Situation: Daten stammen aus ERP, PLM, Dokumentmanagement oder Service-Systemen. Wörter wie Produkt, Material, Artikel oder Baugruppe werden unterschiedlich verwendet. Für Menschen ist das interpretierbar. Für KI-Systeme ist es ein strukturelles Problem.
Der KI reichen nicht nur irgendwelche Daten, sondern sie benötigt semantisch konsistente Daten.

Terminologiestandardisierung und klare Datenmodelle sind deshalb eine zentrale Voraussetzung für viele KI-Anwendungen. Darum spielen hier Ontologien und Wissensgraphen eine wichtige Rolle.
Ontologien visualisieren die Relation zwischen Begriffen, ihren Benennungen und Bedeutungen. Sie bilden ein semantisches Modell einer Domäne, zum Beispiel Produkte, Komponenten, Funktionen, Dokumente oder Prozesse.
Wissensgraphen können dieses Modell mit realen Daten aus unterschiedlichen Systemen verbinden und machen Zusammenhänge maschinell nutzbar.

Für moderne KI-Systeme entstehen dadurch mehrere Vorteile:
– semantische Integration von Daten aus ERP, PLM und weiteren Systemen
– bessere Features und Kontext für Machine-Learning-Modelle
– strukturierter Kontext für LLM-Anwendungen, z. B. über Retrieval-Augmented Generation
– semantische Suche über die Technische Dokumentation, Produktdaten und Spezifikationen etc.
– erklärbare Beziehungen zwischen Objekten, Varianten und Komponenten

Gerade in industriellen Umgebungen mit komplexen Produktstrukturen und verteilten Datenquellen können Ontologien und Wissensgraphen eine gute Grundlage für skalierbare KI-Anwendungen bilden.
Ich beschäftige mich mit Ontologie-Engineering, Wissensgraph-Architekturen und semantischer Datenintegration im industriellen Kontext und deren Nutzung für KI-Anwendungen.

Wenn Sie sich mit der Frage beschäftigen, wie Unternehmensdaten strukturiert werden müssen, damit KI tatsächlich produktiv eingesetzt werden kann, freue ich mich über einen Austausch.