4
Grundlagen Text Mining Mehrwert durch Mehrsprachigkeit

Text Mining

Embed Size (px)

DESCRIPTION

Mehrwert durch Mehrsprachigkeit

Citation preview

Grundlagen

Text Mining Mehrwert durch Mehrsprachigkeit

Im Zeitalter der digitalen Datenexplosion wird es für Analysten und Entscheider immer wichtiger, den Überblick zu behalten. Was kauft der Kunde? Wie verhält sich der Wettbewerb? Welche Veränderungen durchlaufen die Märkte? Und das natürlich weltweit. Gerade die Kundensicht ist für Entscheider heutzutage von größter Bedeutung. Laut einer 2012 von IBM durchgeführten Umfrage gaben 73 Prozent an, im Jahr 2013 massiv in „Customer Insights“ zu investieren.

Das Web 2.0 hat dazu geführt, dass Kunden und Interessenten weitaus größere Möglichkeiten haben, sich online auszudrücken und wie in nebenstehenden Online-Statistiken zu sehen ist, machen sie davon Gebrauch.

Im Bereich der Competitive Intelligence erleichtert die Digitalisierung von Daten das Aufspüren von Umsatzpotential oder Marktrisiken ebenfalls ungemein. Geschäftsberichte, Analystenmeldungen, Pressemitteilungen oder Interviews stehen in Form von unstrukturierten Texten im Internet zur Auswertung mit Text-Mining-Werkzeugen bereit.

Menge an täglich produzierten Inhalten (Quellen: Wirklichkeit 2.0, Social Skinny, Tumblr, Contently)

TwiTTer 175 MILLIOnEn TWEETS

Facebook 45 MILLIOnEn STATUS-UPDATES

blogs 2 MILLIOnEn BEITräGE

Tumblr68 MILLIOnEn POSTS

webseiTen 60 000 WEBSEITEn

Mehrsprachigkeit in die Dokumentenselektion und -aufbereitung integrierenSoll das Text Mining globale Ergebnisse für alle Märkte bringen, in denen ein Unternehmen aktiv ist, werden zusätzliche Schritte in den Text-Mining-Prozess eingebaut. Bei der Dokumentenselektion muss sichergestellt werden, dass die zu analysierenden Dokumententypen (z. B. E-Mails, Formulare, Berichte) nicht nur aus einem Sprachraum ausgewählt werden, sondern alle relevanten Sprachregionen abdecken.

Das führt zum nächsten Schritt, der Datenaufbereitung. Bevor die eigentlichen Text-Mining-Methoden zum Einsatz kommen, müssen alle Dokumente in eine Arbeitssprache gebracht werden. Zur Unterstützung bieten sich zwei Werkzeuge aus dem Bereich der Sprachtechnologie an: Terminologiemanagement-Software und maschinelle Übersetzung.

Auswirkungen auf Geschäftsentscheidungennach Angaben der Analysten-Gruppe Gartner unterstützen nur 34 Prozent der Werkzeuge im Bereich Text Mining mehrere Sprachen. Innerhalb dieser evaluierten Gruppe bieten die meisten lediglich wenige Fremdsprachen an. Grund genug für Unternehmen, eigene Lösungen zu entwickeln, denn liegen Informationen erst einmal in einer Analysesprache vor, können Text-Mining-Werkzeuge ihr volles Potential entfalten und ermöglichen einen umfassenden Überblick auf die Kunden-, Markt- und Wettbewerbssituation eines Unternehmens.

Was kann Text Mining leisten?Dr. Hajo Hippner und Dipl.-Kfm. rené rentzmann haben sich für die Gesellschaft für Informatik (GI) dem Thema Text Mining angenommen.

„Aufgrund von zwei Faktoren lässt sich dem Text Mining ein großes Potenzial unterstellen: Auf der einen Seite liegt ein Großteil der Informationen in Form von Textdokumenten vor. Schätzungen zufolge sogar über 80% (Gentsch/Hänlein 1999, S. 1646). Auf der anderen Seite wird Wissen über Kunden, Märkte und Wettbewerber ein immer bedeutenderer Erfolgsfaktor für Unternehmen, um im Wettbewerb bestehen zu können. Vor diesem Hintergrund kann eine Erweiterung der Analysebasis um Textdokumente von großem nutzen sein.“

Dabei setzen die beiden Dozenten der Wirtschaftswissenschaftlichen Fakultät der Katholischen Universität Eichstätt-Ingolstadt auf folgenden Prozess.

Terminologie und maschinelle ÜbersetzungMit Terminologiearbeit ist die Planung, Erarbeitung, Bearbeitung, Verarbeitung und Verbreitung eines Fachwortschatzes in einer oder mehreren Sprachen gemeint. Für das Text Mining ist Terminologie dahingehend von Bedeutung, dass bestimmte unternehmens- oder branchenspezifische Benennungen oder Eigennamen erfasst und immer korrekt wiedergegeben werden. Der Faktor Terminologie spielt im Hinblick auf Text Mining im internationalen Umfeld eine entscheidende rolle.

Anders als Humanübersetzung liefert maschinelle Übersetzung keine vollständig sprachlich korrekte Übersetzung, sondern dient dazu, den Inhalt eines Textes sofort grundsätzlich verstehen zu können. Im Fall von Text Mining reicht diese Qualitätsstufe vollkommen aus, um die Vorteile der Analysemethoden nutzen zu können. Damit gewährleistet ist, dass maschinelle Übersetzung für den Anwendungsfall Text Mining genügend präzise Ergebnisse erzeugt, kann die Basis-Technologie um Terminologielisten erweitert werden. So wird erreicht, dass der Maschine keine Irrtümer unterlaufen, wie beispielsweise die Übersetzung des namens des Softwareherstellers Apple.

AUFGABEnDEFInITIOn DOKUMEnTEnSELEKTIOn DOKUMEnTEnAUFBErEITUnG

TExT-MInInG-METHODEn InTErPrETATIOnUnD EVALUATIOn

AnWEnDUnG

SDL ermöglicht es globalen Unternehmen, erfolgreich mit ihren Kunden zu interagieren. Die Technologieund Servicelösungen von SDL umfassen die gesamte Customer Journey über verschiedene Sprachen, Kulturen, Kanäle und Medien hinweg.

SDL hat über 1.500 Firmenkunden, 400 Partner sowie eine globale Infrastruktur mit 70 niederlassungen in 38 Ländern. 42 der 50 Topmarken arbeiten mit SDL.

Für weitere Informationen zu unseren Produkten sprechen Sie uns einfach an: [email protected] oder +49 (0)711 780 60 0

sDl language solutionsWaldburgstraße 21 | 70563 Stuttgart(t) +49 (0)711 780 60 0 | (f) +49 (0)711 780 60 [email protected]/de/language-technology

Copyright © 2013 SDL plc. Alle rechte vorbehalten Alle hier genannten Bezeichnungen von Unternehmensprodukten oder Dienstleistungen sind Eigentum ihrer jeweiligen Inhaber