mirror of
https://github.com/fhswf/aki_prj23_transparenzregister.git
synced 2025-04-24 23:52:34 +02:00
56 lines
2.6 KiB
Markdown
56 lines
2.6 KiB
Markdown
# Abstract/Planung der Seminararbeit zu "Text Mining
|
|
|
|
**Sascha Zhu**
|
|
|
|
**10.05.2023**
|
|
|
|
## Gliederung
|
|
|
|
1. Einleitung und Begriffsbestimmung
|
|
|
|
2. Text Mining Prozess
|
|
|
|
3. Verwendung von NLP-Methoden für das Text-Mining
|
|
|
|
3.1 Morphologische Textanalyse
|
|
|
|
3.2 Syntaktische Textanalyse
|
|
|
|
3.3 Semantische Textanalyse
|
|
|
|
4. Ontologien und Text Mining
|
|
|
|
4.1 Verwendung von Ontologien als Grundlage der Textanalyse
|
|
|
|
4.2 Generierung von Ontologien mittels Text Mining ("ontology generation"/"ontology learning" )
|
|
|
|
5. Sentiment-Analyse als Teilgebiet des Text-Minings
|
|
|
|
6. Zusammenfassung und Ausblick
|
|
|
|
Die Seminararbeit zu "Text Mining" soll in die oben genannten sechs Abschnitte gegliedert werden.
|
|
|
|
Nach einer Einleitung, in der der Begriff "Text Mining" näher definiert wird und gegenüber "Data-Mining" und
|
|
"Computational Linguistics" abgegrenzt wird, folgt der zweite Abschnitt zum Text Mining Prozess, der nach Hippner u.
|
|
Rentzmann (2006) in die folgenden sechs Schritte eingeteilt wird: (a) Aufgabendefinition; (b) Dokumentenselektion; (c)
|
|
Dokumentenaufbereitung; (d) Untersuchung mit Text-Mining-Methoden; (e) Interpretation und Evaluation; (f) Anwendung der
|
|
Ergebnisse.
|
|
|
|
Im darauffolgenden dritten Abschnitt zur Verwendung von NLP-Methoden für das Text-Mining werden die drei Phasen des
|
|
Natural Language Processing (NLP), d.h. die morphologische, syntaktische und semantische Textanalyse, näher
|
|
dargestellt, wobei der Schwerpunkt auf den semantischen Analysetechniken wie z.B. "Word Sense Disambiguation" (WSD) und
|
|
"Named Entity Recognition" (NED) liegen soll.
|
|
|
|
Der vierte Abschnitt soll sich dem Thema "Ontologien und Text Mining" widmen. Einerseits können Ontologien, die
|
|
domänenspezifisches Wissen abbilden, als Grundlage für NLP-Methoden dienen, um etwa die semantische Textanalyse zu
|
|
verbessern. Andererseits können mittels Text Mining automatisch bzw. semi-automatisch Ontologien als Repräsentation der
|
|
Text-Mining-Ergebnisse erstellt werden ("ontology generation"/"ontology learning").
|
|
|
|
Im vorletzten, fünften Analyse soll die Sentiment-Analyse als Teilgebiet des Texts Mining durchleuchtet werden. Dieser
|
|
Abschnitt soll den Schwerpunkt der gesamten Seminararbeit darstellen. Die Methodik, Funktionsweise, Varianten und Use
|
|
Cases der Sentiment Analyse sollen anhand ausgewählter Beispiele erläutert werden. Zudem sollen auch bekannte
|
|
Sentiment-Analyse-Tools wie z.B. FinBERT, VADER, SentiWS etc. näher beschrieben werden.
|
|
|
|
Am Ende der Seminararbeit soll der sechste Abschnitt eine Zusammenfassung liefern und einen Ausblick darüber geben, in
|
|
welche Richtung die zukünftige Entwicklung auf dem Gebiet des Text-Minings gehen wird.
|