Bibliographic Metadata

Title
Web Content Mining am Fallbeispiel von zwei Produktbewertungsportalen / Ronald Peinsipp
Additional Titles
Web content mining at the case of two product evaluation portals
AuthorPeinsipp, Ronald
CensorSchlögl Christian
Published2009
Description72 Bl. : Zsfassung ; graph. Darst.
Institutional NoteGraz, Univ., Masterarb., 2009
Annotation
Abweichender Titel laut Übersetzung der Verfasserin/des Verfassers
Zsfassung in engl. Sprache
LanguageGerman
Document typeMaster Thesis
Keywords (GND)World Wide Web / Data Mining / World Wide Web / Data Mining / Online-Publikation
URNurn:nbn:at:at-ubg:1-70897 Persistent Identifier (URN)
Restriction-Information
 The work is publicly available
Files
Web Content Mining am Fallbeispiel von zwei Produktbewertungsportalen [1.74 mb]
Links
Reference
Classification
Abstract (German)

Mit der vorliegenden Arbeit soll ein Überblick über die Möglichkeiten von Web Content Mining gegeben und anhand eines Vorgehensmodells deren praktische betriebswirtschaftliche Einsatzmöglichkeiten geprüft werden. Im Bereich der Vorteile konnte gezeigt werden, welches Potenzial in Web Content Mining steckt. Neben großen, frei verfügbaren Datenmengen ist es vor allem die Art der Information, die sich beispielsweise durch soziale Netzwerke ergibt, die enorme Möglichkeiten bietet. Neben internetspezifischen Schwierigkeiten, die sich vor allem durch die Struktur des Webs ergeben, stellen bei textuellen Analysen vor allem semantische Herausforderungen die Hauptschwierigkeiten dar. Anhand einiger Anwendungsbereiche wurde gezeigt, dass durch die Aufbereitung der Daten im Internet enormes Wissen für Unternehmen gewonnen werden kann. Im Kapitel ?Allgemeine Methodik des Web Content Mining? wird ein Vorgehensmodell für das Web Content Mining beschrieben. Es gliedert sich in die Phasen Informationssuche, Lesen der Information, Informationsaufbereitung und Visualisierung der Ergebnisse. Im letzten Abschnitt wird das Vorgehensmodell anhand eines praktischen Beispiels angewandt: Während die Websuche manuell erfolgen musste, war die Extraktion der Webinhalte durch die Unterstützung einer benutzerfreundlichen Software möglich. Im Rahmen der Informationsaufbereitung wurden die Webinhalte einer automatischen Bewertung unterzogen. Diese Bewertungsmethode versucht mit Hilfe von Schlüsselwörtern, einen Text automatisch in positive, negative oder neutrale Meinungen einzuteilen. Nach der Aufbereitung der Daten in Excel erfolgten die Analyse und Präsentation der Ergebnisse. Zusammenfassend kann zum Ergebnis der Analyse gesagt werden, dass durch die automatisierte Bewertung eine durchschnittliche Korrektheitsquote von 73,5 Prozent auf Grundlage der Selbstbeurteilung durch die Verfasser der Produktbewertungen erreicht wurde und positive Meinungen leichter identifiziert werden konnten.

Abstract (English)

This paper is to give an overview about the possibilities of Web content mining and also analyses a real business case by using a process model. The main benefit of Web content mining is the enormous range of free available data. Additionally, when thinking of social networks, the kind of data provides a lot of new possibilities. Difficulties were identified in the structure of the web and also, when it comes to textual analyses, in semantical problems. How companies could benefit if they prepare and use the data of the internet will be shown by some sample applications. The section which is split into the subsections ?Searching information?, ?Extracting information?, ?Information processing? and ?Visualization?, describes a process model. In the last part of the paper, the process model is tested by using a concrete example. While searching information was done manually, the extraction of the web content was fully support by a very user-friendly software. Afterwards the web content was evaluated automatically. This automatic evaluation uses defined keywords in order to categorize reviews into positive, negative or neutral. Finally results were analyzed and displayed. Summering up the results of the analyse it can be said, that using the automatic keyword evaluation in comparison to the evaluation of the reports author himself, we could received an average correctness quote of 73.5 percent and furthermore that it is easier to identify positive options than negative or neutral ones.

Stats
The PDF-Document has been downloaded 116 times.