Semantic Workflow

Semantische Workflows beziehen sich auf eine Reihe von Natural Language Processing-Aufgaben oder -Prozessen, die durchgeführt werden, um Bedeutung oder Wissen aus geschriebenem Text zu extrahieren.

Zu diesen Aufgaben gehören unter anderem Textvorverarbeitung, Tokenisierung, Part-of-Speech-Tagging, Named Entity Recognition, Coreference Resolution und Sentiment Analysis.

Die Schritte eines semantischen Workflows können je nach spezifischem Anwendungsfall variieren, aber im Allgemeinen können die folgenden Schritte befolgt werden:

  1. Vorverarbeitung von Text: Bereinigung und Normalisierung von Textdaten, z. B. Umwandlung in Kleinbuchstaben, Entfernen von Stoppwörtern, Interpunktionen usw.

  2. Tokenisierung: Zerlegung des Textes in kleinere Einheiten, sogenannte Token. z. B. von Absätzen zu Sätzen und von Sätzen zu Wörtern.

  3. Part-of-Speech-Tagging: Zuweisung eines POS-Tags zu jedem Token auf der Grundlage seiner Rolle im Satz (z. B. Substantiv, Verb, Adjektiv usw.).

  4. Erkennung von Entitäten: Identifizierung und Extraktion von Entitäten wie Personen, Organisationen, Orten usw. aus dem Text.

  5. Auflösung von Koreferenzen (Coreference Resolution): Erkennung, wenn sich zwei oder mehr Erwähnungen in einem Text auf dieselbe Entität beziehen.

  6. Stimmungsanalyse (Sentiment Analysis): Bestimmung der im Text ausgedrückten Stimmung, z. B. positiv, negativ oder neutral.

Diese Schritte werden in der Regel nacheinander durchgeführt, wobei die Ergebnisse eines Schrittes als Input für den nächsten dienen.

Das Endergebnis des semantischen Workflows ist eine strukturierte Darstellung des Textes, die eine weitere Analyse und Wissensextraktion ermöglicht.

Zurück
Zurück

Aus unstrukturierten Daten Themen extrahieren

Weiter
Weiter

Der Bund setzt sich Ziele zum Einsatz von Data Science