Archiv für den Monat: Februar 2017

Wissenstransfer vom Mensch zur Maschine mit IBM Watson Knowledge Studio

IBM Watson Knowledge Studio (WKS) bietet uns einen intuitiven Weg Expertenwissen vom Menschen auf eine Maschine zu übertragen.

Dieser Wissenstransfer findet statt in dem die Fachexperten in Beispieldokumenten die wichtigen Begriffe und Zusammenhänge markieren. Ähnlich wie wenn man mit einem Textmarker durch einen Text geht und die wichtigen Stellen farblich hervorhebt. In WKS wird dieser Schritt „Human Annotation“ genannt.

Ergebnis dieser Annotationen ist das sogenannte „Ground Truth“, das Grund- oder Basiswissen für unser System.

Mit diesem Grundwissen wird dann ein Modell trainiert (überwachtes maschinelles Lernen / supervised machine learning). Das System lernt die wichtigen Begriffe und ihre Zusammenhänge im Text zu erkennen und kann dieses gelernte Wissen dann auf neue, unbekannte Texte anwenden.

In diesem Artikel beschreibe ich wie wir in Watson Knowledge Studio dieses Grundwissen für unser System erstellen können.

Wissenstransfer vom Mensch zur Maschine mit IBM Watson Knowledge Studio weiterlesen

Entwurf eines Typsystems in IBM Watson Knowledge Studio

Der erste Schritt in einem Textanalyseprojekt mit IBM Watson Knowledge Studio (WKS) sollte der Entwurf eines Typsystems sein.

Das Typsystem beschreibt welche Begriffe (Entitäten) und welche Zusammenhänge (Relationen) später durch das trainierte Modell aus dem Text extrahiert werden sollen.

Eine der grundlegenden Voraussetzungen um ein Typsystem zu entwerfen ist es  die fachliche Domäne und das Geschäftsproblem des Kunden zu verstehen.

Daher sind am Anfang eines WKS Projektes in Zusammenarbeit mit dem Kunden ein paar grundlegende Fragen zu klären:

  • Welche Informationen sollen aus den Texten extrahiert werden?
  • Können diese Informationen dazu beitragen das Geschäftsproblem des Kunden zu lösen?
  • Sind diese Informationen überhaupt in den zu analysierenden Texten enthalten?
  • Kann eine ausreichende Anzahl von relevanten Beispieltexten für das Training bereitgestellt werden?

Entwurf eines Typsystems in IBM Watson Knowledge Studio weiterlesen