Machine Learning Modell trainieren mit Watson Knowledge Studio

IBM Watson Knowledge Studio (WKS) bietet uns einen intuitiven Weg Expertenwissen vom Menschen auf eine Maschine zu übertragen.

Nach dem die Fachexperten die relevanten Begriffe und Zusammenhänge in den Trainingsdokumenten markiert haben können wir über Watson Knowledge Studio mit diesem Grundwissen ein Modell trainieren (überwachtes maschinelles Lernen / supervised machine learning).

Im diesem Artikel möchte ich beschreiben wie das maschinelle Lernen in WKS funktioniert und wie wir das trainierte Modell überprüfen und verbessern können.

Machine Learning Modell trainieren mit Watson Knowledge Studio weiterlesen

Wissenstransfer vom Mensch zur Maschine mit IBM Watson Knowledge Studio

IBM Watson Knowledge Studio (WKS) bietet uns einen intuitiven Weg Expertenwissen vom Menschen auf eine Maschine zu übertragen.

Dieser Wissenstransfer findet statt in dem die Fachexperten in Beispieldokumenten die wichtigen Begriffe und Zusammenhänge markieren. Ähnlich wie wenn man mit einem Textmarker durch einen Text geht und die wichtigen Stellen farblich hervorhebt. In WKS wird dieser Schritt „Human Annotation“ genannt.

Ergebnis dieser Annotationen ist das sogenannte „Ground Truth“, das Grund- oder Basiswissen für unser System.

Mit diesem Grundwissen wird dann ein Modell trainiert (überwachtes maschinelles Lernen / supervised machine learning). Das System lernt die wichtigen Begriffe und ihre Zusammenhänge im Text zu erkennen und kann dieses gelernte Wissen dann auf neue, unbekannte Texte anwenden.

In diesem Artikel beschreibe ich wie wir in Watson Knowledge Studio dieses Grundwissen für unser System erstellen können.

Wissenstransfer vom Mensch zur Maschine mit IBM Watson Knowledge Studio weiterlesen

Entwurf eines Typsystems in IBM Watson Knowledge Studio

Der erste Schritt in einem Textanalyseprojekt mit IBM Watson Knowledge Studio (WKS) sollte der Entwurf eines Typsystems sein.

Das Typsystem beschreibt welche Begriffe (Entitäten) und welche Zusammenhänge (Relationen) später durch das trainierte Modell aus dem Text extrahiert werden sollen.

Eine der grundlegenden Voraussetzungen um ein Typsystem zu entwerfen ist es  die fachliche Domäne und das Geschäftsproblem des Kunden zu verstehen.

Daher sind am Anfang eines WKS Projektes in Zusammenarbeit mit dem Kunden ein paar grundlegende Fragen zu klären:

  • Welche Informationen sollen aus den Texten extrahiert werden?
  • Können diese Informationen dazu beitragen das Geschäftsproblem des Kunden zu lösen?
  • Sind diese Informationen überhaupt in den zu analysierenden Texten enthalten?
  • Kann eine ausreichende Anzahl von relevanten Beispieltexten für das Training bereitgestellt werden?

Entwurf eines Typsystems in IBM Watson Knowledge Studio weiterlesen

Maschinelles Lernen in der Praxis: IBM Watson Knowledge Studio

Eines der interessanten neuen Werkzeuge die ich in meinem täglichen Arbeitsleben verwende ist das IBM Watson Knowledge Studio.

Mit dem Watson Knowledge Studio (kurz WKS) können wir domänenspezifisches Expertenwissen in eine für lernende Systeme verständliche Form bringen. Auf Basis dieses Wissen trainieren wir dann einen Algorithmus – Maschinelles Lernen – der dieses Wissen auf neuen, unbekannten Texten anwenden kann.

Ich kann damit also der Maschine beibringen welche Begriffe und Zusammenhänge in einem Text wichtig für mich sind. Ausgestattet mit diesem Wissen kann die Maschine dann zum Beispiel in sekundenschnelle tausende von Seiten für mich lesen und analysieren und mir gezielt die für mich relevanten Informationen präsentieren.

Leider gibt es wenig Informationen zum IBM Watson Knowledge Studio in Deutsch. Daher möchte ich in diesem und den folgenden Beiträgen beschreiben wie wir konkret in solchen Projekten vorgehen und auch ein paar Einblicke schaffen wie sich diese neue Vorgehensweise von früheren Textanalyseansätzen unterscheidet.

Maschinelles Lernen in der Praxis: IBM Watson Knowledge Studio weiterlesen

Was ist Maschinelles Lernen?

Maschinelles Lernen bezeichnet die automatische Generierung von Wissen auf Basis von vorgegebenen Lerndaten. Es wird genutzt um ein künstliches neuronales Netz zu trainieren.

Normalerweise wird das neuronale Netz dabei mit bestehenden Daten trainiert. Das nennt sich dann „Überwachtes Lernen“. D.h. ich gebe der KI vor für welche Eingabewerte ich welches Ergebnis erwarte. Das sind die Lerndaten.

Typische Anwendungsfälle für maschinelles Lernen sind Bilderkennung, Spracherkennung, Klassifizierung, Vorhersagemodelle und das Finden von Entitäten in Texten. Für jede dieser Anwendungsfälle benötigt man jeweils unterschiedliche Lerndaten.

Was ist Maschinelles Lernen? weiterlesen

Wie funktioniert künstliche Intelligenz?

Wenn man sich auf Wikipedia über künstliche Inteligenz informieren möchte werden die Dinge sehr schnell absurd mathematisch. Zu mathematisch für mich. Ich muss mir die Dinge erst mal einfach erklären um dann zum komplexeren Teil des Themas vorzudringen. Das möchte ich in diesem Beitrag versuchen.

Aktuelle KI Systeme bestehen meistens aus einem neuronalen Netz das über maschinelles Lernen trainiert wird. Zu beiden Begriffen gleich mehr. Diese Kombination ist meiner Meinung nach die momentan beeindruckendste Methode um eine künstliche Intelligenz zu ermöglichen.

Wie funktioniert künstliche Intelligenz? weiterlesen