Titelaufnahme

Titel
Web Content Mining am Fallbeispiel von zwei Produktbewertungsportalen / Ronald Peinsipp
Verfasser/ VerfasserinPeinsipp, Ronald
Begutachter / BegutachterinSchlögl Christian
Erschienen2009
Umfang72 Bl. : Zsfassung ; graph. Darst.
HochschulschriftGraz, Univ., Masterarb., 2009
Anmerkung
Zsfassung in engl. Sprache
SpracheDeutsch
DokumenttypMasterarbeit
Schlagwörter (GND)World Wide Web / Data Mining / World Wide Web / Data Mining / Online-Publikation
URNurn:nbn:at:at-ubg:1-70897 Persistent Identifier (URN)
Zugriffsbeschränkung
 Das Werk ist frei verfügbar
Dateien
Web Content Mining am Fallbeispiel von zwei Produktbewertungsportalen [1.74 mb]
Links
Nachweis
Klassifikation
Zusammenfassung (Deutsch)

Mit der vorliegenden Arbeit soll ein Überblick über die Möglichkeiten von Web Content Mining gegeben und anhand eines Vorgehensmodells deren praktische betriebswirtschaftliche Einsatzmöglichkeiten geprüft werden. Im Bereich der Vorteile konnte gezeigt werden, welches Potenzial in Web Content Mining steckt. Neben großen, frei verfügbaren Datenmengen ist es vor allem die Art der Information, die sich beispielsweise durch soziale Netzwerke ergibt, die enorme Möglichkeiten bietet. Neben internetspezifischen Schwierigkeiten, die sich vor allem durch die Struktur des Webs ergeben, stellen bei textuellen Analysen vor allem semantische Herausforderungen die Hauptschwierigkeiten dar. Anhand einiger Anwendungsbereiche wurde gezeigt, dass durch die Aufbereitung der Daten im Internet enormes Wissen für Unternehmen gewonnen werden kann. Im Kapitel ?Allgemeine Methodik des Web Content Mining? wird ein Vorgehensmodell für das Web Content Mining beschrieben. Es gliedert sich in die Phasen Informationssuche, Lesen der Information, Informationsaufbereitung und Visualisierung der Ergebnisse. Im letzten Abschnitt wird das Vorgehensmodell anhand eines praktischen Beispiels angewandt: Während die Websuche manuell erfolgen musste, war die Extraktion der Webinhalte durch die Unterstützung einer benutzerfreundlichen Software möglich. Im Rahmen der Informationsaufbereitung wurden die Webinhalte einer automatischen Bewertung unterzogen. Diese Bewertungsmethode versucht mit Hilfe von Schlüsselwörtern, einen Text automatisch in positive, negative oder neutrale Meinungen einzuteilen. Nach der Aufbereitung der Daten in Excel erfolgten die Analyse und Präsentation der Ergebnisse. Zusammenfassend kann zum Ergebnis der Analyse gesagt werden, dass durch die automatisierte Bewertung eine durchschnittliche Korrektheitsquote von 73,5 Prozent auf Grundlage der Selbstbeurteilung durch die Verfasser der Produktbewertungen erreicht wurde und positive Meinungen leichter identifiziert werden konnten.

Zusammenfassung (Englisch)

This paper is to give an overview about the possibilities of Web content mining and also analyses a real business case by using a process model. The main benefit of Web content mining is the enormous range of free available data. Additionally, when thinking of social networks, the kind of data provides a lot of new possibilities. Difficulties were identified in the structure of the web and also, when it comes to textual analyses, in semantical problems. How companies could benefit if they prepare and use the data of the internet will be shown by some sample applications. The section which is split into the subsections ?Searching information?, ?Extracting information?, ?Information processing? and ?Visualization?, describes a process model. In the last part of the paper, the process model is tested by using a concrete example. While searching information was done manually, the extraction of the web content was fully support by a very user-friendly software. Afterwards the web content was evaluated automatically. This automatic evaluation uses defined keywords in order to categorize reviews into positive, negative or neutral. Finally results were analyzed and displayed. Summering up the results of the analyse it can be said, that using the automatic keyword evaluation in comparison to the evaluation of the reports author himself, we could received an average correctness quote of 73.5 percent and furthermore that it is easier to identify positive options than negative or neutral ones.