refactor: Initialiased target docs structure

2026-02-13 22:17:38 +01:00 · 2023-09-30 11:13:45 +02:00
parent 0d779db1e8
commit dd55b5184c
25 changed files with 165 additions and 3 deletions
@@ -0,0 +1,46 @@
+---
+title: "Automatisierte Daten Extraktion aus Internetquellen als Grundlage für die Analyse von Kapitalgesellschaften"
+author: "Nolde, Tristan Norbert"
+date: "2023-05-06"
+---
+
+# Abstract: Automatisierte Daten Extraktion aus Internetquellen als Grundlage für die Analyse von Kapitalgesellschaften
+
+## Gliederung
+
+1. Einleitung (Zielsetzung/Problemstellung, Vorgehen)
+2. Web Scraping/Crawling
+   2.1. Definition und Theorie
+   2.2. Technologien
+   2.3. Umsetzung
+3. RSS-Feeds
+   3.1. Definition und Theorie
+   3.2. Technologien
+   3.3. Umsetzung
+4. APIs
+   4.1. Definition und Theorie
+   4.2. Technologien
+   4.3. Umsetzung
+5. Rechtliche Rahmenbedingungen
+6. Vergleich der Lösungsansätze
+7. Zusammenfassung
+
+## Inhalt
+
+In Zeiten von Big Data und AI stellen Daten und ihre Verfügbarkeit zunehmend eines der wichtigsten Wirtschaftsgüter dar.
+Als solches können sie auch eingesetzt werden, um Kapitalgesellschaften (eine Subklasse von Unternehmen) anhand
+verschiedener Kennzahlen wie der Mitarbeiterzahl oder dem Jahresgewinn zu analysieren. Obwohl solche Daten zu Genüge in
+Zeitungsartikeln, Newslettern oder dedizierten Aktienanalysen zu finden sind, so gestaltet sich eine automatisierte
+Extraktion dieser Daten aufgrund verschiedener Formate sowie weiterer Restriktionen schwierig.
+
+Daher sollen im Rahmen dieser Seminararbeit verschiedene Wege betrachtet werden, die eben diese Daten erheben und zur
+Verfügung stellen können. Zu den nennenswerten Quellen gehören: Der Bundesanzeiger, RSS-Feeds, Nachrichten APIs. Ziel
+ist es, aus diesen Quellen wertvolle Informationen bezogen auf den wirtschaftlichen Erfolg einer Kapitalgesellschaft
+sowie aktueller Nachrichten zu extrahieren und in ein einheitliches Format zu überführen.
+
+Neben des technischen Einsatzes von Web Scraping/Crawling, um Informationen aus Webseiten zu gewinnen, sowie des
+Abfragens verfügbarer APIs soll auch der rechtliche Aspekt dieser Vorgehens Berücksichtigung finden, um die
+Rechtmäßigkeit zu bewerten.
+
+Abschließend wird der Einsatz der verschiedenen Technologien an den Faktoren: Flexibilität, Simplizität, Verfügbarkeit
+und Rechtmäßigkeit, ein Fazit gezogen sowie ein Ausblick des weiteren Einsatzes gegeben.