deploy: c2952ce52edd40580d7e7f3eadd53392e3140498

2026-02-13 22:17:38 +01:00 · 2023-06-20 13:48:13 +00:00
commit de85615e74
124 changed files with 12372 additions and 0 deletions
@@ -0,0 +1,62 @@
+# Weekly *1*: 30.03.2023
+
+## Teilnehmer
+- Prof. Arinir
+- Tristan Nolde
+- Tim Ronneburg
+- Philipp Horstenkamp
+- Kim Mesewinkel-Risse
+- Sascha Zhu
+- Sebastian Zeleny (Protokollant)
+
+## Themen
+- **Inhalt des Project Proposals:** 
+	- Mit welchen Metriken können Unternehmen bewertet werden?
+	- Was sind Kennzahlen von Kapitalgesellschaften?
+	- Welche Daten werden benötigt?
+	- Woher erhält man benötigte Daten? (Amtsgerichte --> Insolvenzen, Börsenkurse, Aktienkurse, RSS-Feeds von/zu Unternehmen)
+	- Wie werden die Daten verarbeitet?
+	- Wie können die Daten bzw. Ergebnisse präsentiert werden?
+  - Verflechtungen zwischen Unternehmen: Geschäftsführer, Wirtschaftsprüfer
+    
+- **Anforderungen an Projektdurchführung:**
+  - Backlog für Ideen und Aufgaben
+	- Meeting-Notes mit besprochenen Themen, Entscheidungen, Terminen und Action-List (Wer arbeitet an welcher Aufgabe?)
+	- Projektdurchführung so formal wie möglich, d.h. 
+	  - Beschreibung des Systemkontexts: Interaktion mit der Umgebung
+		- Datenmodell: schematische Darstellung der Datenflüsse
+		- Lasten- / Pflichtenheft mit Kategorisierung
+  - Vorschlag Frontend von Prof. Arinir: D3.js
+
+- **Bewertung des Projekts:** 
+	- Es muss erkennbar sein, wer welche Aufgabe bearbeitet hat
+	- Jeder Teilnehmer soll die Aufgaben der anderen Teilnehmer kennen und ein Verständnis für diese haben (kein tiefes Domänenwissen!)
+  - Gesamtplanung und Dokumentation sind Teil das Ergebnis, nicht nur die technische Umsetzung
+  - Bewertungsschlüssel:
+
+| Gewichtung   | Aufgabe                                     |
+|--------------|---------------------------------------------|
+| 20%          | Vortrag Seminararbeit                       |
+| 20%          | Präsentation                                |
+| 30%          | Implementierung                             |
+| 20%          | Finaler Bericht (~15 Seiten pro Teilnehmer) |
+| 10%          | Abschlusspräsentation                       |
+
+- **Organisatorisches:**
+	- Regeltermin alle 14 Tage mit allen Projektteilnehmern, beginnend am 30.03.2023: Dieser Termin soll für Sprint Planning und Review mit Prof. Arinir genutzt werden. 
+    - Was ist die Erwartungshaltung des Product Owners?
+		- Welche Themen/Aufgaben werden bearbeitet?
+		- Was ist das Ziel für das nächste Review? 
+	- Projektbearbeitung/Dokumentation mit Github
+  - Bereitstellung des Github-Repos über FH
+
+## Abgeleitete Action Items
+
+| Action Item                                                                             | Verantwortlicher   | Deadline                         |
+|-----------------------------------------------------------------------------------------|--------------------|----------------------------------|
+| Welche Anforderungen / Erwartungen stellen wir inhaltlich und technisch an das Projekt? | alle               | nächstes Weekly/work in progress |
+| Erarbeiten von Arbeitspaketen/Aufgaben aus Anforderungen                                | alle               | nächstes Weekly/work in progress |
+| Welche Metriken sind notwendig?                                                         | alle               | nächstes Weekly/work in progress |
+| Recherche zu Datenquellen                                                               | alle               | nächstes Weekly/work in progress |
+| Definition von Meilensteinen                                                            | alle               | nächstes Weekly                  |
+| Erstellung eines (groben) Zeitplans                                                     | alle               | nächstes Weekly                  |
@@ -0,0 +1,57 @@
+# Weekly *2*: 13.04.2023
+
+## Teilnehmer
+- Prof. Arinir
+- Tristan Nolde
+- Tim Ronneburg (Protokollant)
+- Philipp Horstenkamp
+- Kim Mesewinkel-Risse
+- Sascha Zhu
+- Sebastian Zeleny
+
+## Themen
+
+- **Seminarthemen:**
+  - Themen die im Zuge der Implementierung erarbeitet werden
+  - Themen:
+    - Textmining (Ontologien) 
+    - Semantische Suche
+  - Anmeldungsformular:
+    - Jeder sendet das Formular selbst an Herrn Arinir
+    - Projektauftakt: 30.03.2023
+    - Enddatum: 15.02.2024
+    - Titel: Transparanzregister Kapitalgeselschaften
+- **Vorstellung der Ergebnisse des letzten Sprints:**
+  - Erstellung des GitHubs Projekts
+  - Anlegen eines Protokolltemplates
+  - Interne Meetings jeden Donnerstag
+  - Timeline erstellt mit Mermaid.js in Markdown (Sebastian)
+  - Recherche zum Datenschutz / Urheberrecht: Welche Daten aus den Datenbanken dürfen offline oder online benutzt werden. (Sascha)
+    - Für die eigene Forschung: 75 % der Daten dürfen genutzt werden
+      - 15 % Wenn es an Dritte weitergeleitet werden
+    - Wenn wir die Ergebnisse veröffentlichen müssen die Vorgaben der Datenbanken beachten
+    - Hinweis von Herrn Arinir: Das ist als Vorschungsprojekt zu sehen
+      - Die Ergebnisse werden nicht veröffentlicht
+      - nur die Vorgehensweise wird als Paper veröffentlicht
+  - Recherche zu Unternehmenskennzahlen (Kim)
+    - Hinweis: Für Tendenzanalysen sollen zeitliche Veränderungen erfasst werden (Timescale Datenbank)
+    - Vierteljährliche Daten reichen aus
+  - Recherche zu den verfügbaren Datengrundlagen (Phillip und Tristan)
+  - Anlegen eines Pflichtenhefts mit den Anforderungen an das Projekt (Tim)
+- **Organisatorisches:**
+  - Es muss noch ein Projekt angelegt werden für das GitHub Repository mit einem Board zur Projektorganisation
+    - Im Meeting erledigt
+- **Recherche:**
+  - Nicht nur auf Kennzahlen eingehen, sondern auch auf die Berichterstattung eingehen
+  - Dazu sollen die Technologieauswahl recherchiert werden (Trendanalyse von Nachrichten, Finanztreff, Twitter etc.)
+
+## Abgeleitete Action Items
+
+| Action Item | Verantwortlicher | Deadline        |
+|-------------|------------------|-----------------|
+| Rechechieren welche Nachrichtenquellen (Aktuelle und "Alte" Nachrichten) genutzt werden können    |  Sascha und Tim  | 27.04.2023 |
+| Recherchieren welche Technologien zur Auswertung der Nachrichtenqullen genutzt werden können (z.b. Sentiment Analyse)   |  Philipp und Kim  | 27.04.2023 |
+| Beschäftigen mit Historien (Timescale Datenbank)   |  Tristan und Sebastian  | 27.04.2023 |
+| Festlegen von Kriterien wann ein Artikel positiv oder negativ zu bewerten ist   |  Sascha  | Ende offen |
+| Abgabe des Anmeldeformulars zum Projekt   |  alle  | 20.04.2023 |
+| Liste mit geeignetetn Metriken   |  Herr Arinir  | 27.04.2023 |
@@ -0,0 +1,54 @@
+# Weekly *3*: 04.05.2023
+
+## Teilnehmer
+- Prof. Arinir
+- Tristan Nolde
+- Tim Ronneburg
+- Phillip Horstenkamp
+- Kim Mesewinkel-Risse
+- Sascha Zhu
+- Sebastian Zeleny
+
+## Themen
+
+### Organisatorische Absprachen:
+
+Gelten die Seminarthemen als Zwischenprüfung? In welcher Form?
+- Herr Giefers hat Seminarthemen im Vorfeld definiert, in unserer Gruppe gab es eine offene Einarbeitung in die Forschungs- und Entwicklungsarbeit
+- Geplanter Umfang: Seminararbeit 15-20 Seiten (Rücksprache mit Herrn Giefers und Herrn Gawron durch Herrn Arinir, Feedback beim nächsten Termin) und Vortrag mit Folien oder anderen Quellen (z.B. Quellcode) ca. 15-20 Minuten im Rahmen eines JF Termins (keine Vorstellung im Plenum)
+- Die Seminararbeiten werden benotet (20% der Endnote), die Ausarbeitung und der Vortrag zählen dabei zu jeweils 50%
+
+
+Wie lautet der zeitliche Rahmen?
+- Keine feste Deadline vorgegeben, Absprache innerhalb der Projektgruppe ausreichend
+- Vortrag: Einigung auf zwei Termine Ende Juni/Anfang Juli -> Thema 1-3 am 22.06.2023 und Thema 4-6 am 06.07.2023
+- Seminararbeit: Abgabe voraussichtlich Ende des Sommersemesters, potentiell auch zu einem späteren Zeitpunkt möglich
+
+
+Welche Themenbereiche sollen behandelt werden?
+- Die erste kurze Beschreibung der 6 Themenbereiche/Domänen wurde durch Herrn Arinir als positiv befunden
+- Zur Eingrenzung der Themen und für ein konkreteres Feedback soll für jeden Themenbereich beim nächsten JF am 11.05.2023 ein Abstract vorgestellt werden
+- Grundsätzlich sollen die Themen nicht zu oberflächlich behandelt werden, sondern explizit auf Techniken zur Umsetzung eingegangen werden
+
+
+Einigung auf Änderungen im Bereich Projektorganisation:
+- Aufnahme des zeitlichen Ablaufs der Tickets in die Meeting Notes -> Screenshot des Projects in Protokoll mit aufnehmen
+- Start-, Enddaten und Labels der Tickets besser pflegen
+
+
+Sonstiges:
+- Urlaubszeiten Herr Prof. Arinir: 17.07.-01.08.2023
+
+
+
+## Abgeleitete Action Items
+
+| Action Item | Verantwortlicher | Deadline        |
+|-------------|------------------|-----------------|
+| Abstract pro Thema    | Alle   | nächstes Weekly |
+| Folienvorlage für den Seminarvortrag  | Alle   | nächstes Weekly |
+| Rückmeldung zum Umfang der Seminararbeit | Prof. Arinir   | nächstes Weekly |
+
+
+## Aktueller Projektstand
+![alt text](https://github.com/fhswf/aki_prj23_transparenzregister/blob/meeting_notes_2023-05-04/documentations/meeting-notes/images/Project_2023-05-04.PNG)
@@ -0,0 +1,117 @@
+# Weekly *4*: 11.05.2023
+
+## Teilnehmer
+- Prof. Arinir
+- Tristan Nolde
+- Tim Ronneburg
+- Phillip Horstenkamp
+- Kim Mesewinkel-Risse
+- Sascha Zhu
+- Sebastian Zeleny
+
+## Themen
+
+### Organisatorische Absprachen zum Umfang und Inhalt der Seminararbeit:
+
+- Herr Arinir wird sich nochmal wegen des Umfangs der Seminararbeit bei unserer Gruppe melden
+- In der Seminarbeit sollen Anforderungen und Lösungsskizzen für das Projekt "Transparenzregister" dargestellt werden.
+- Die Seminarabeit soll aus einem theoretischen Teil und einem praktischen Teil, in dem der praktische Nutzen für das Projekt "Transparenzregister" erörtert wird, bestehen; ob das Verhältnis zwischen dem theoretischen und praktischen Teil bei 50:50 oder 40:60 liegt, darüber können die Verfaser der Seminararbeit selbst entscheiden
+- Der Fokus der Seminarbeit soll stets danach ausgerichtet werden, wie die entsprechenden Aspekte bzw. die entsprechenden Technologien für das Projekt "Transparenzregister" genutzt werden können.
+
+
+
+### Vorstellung des Abstracts der Seminararbeit zu "Dev Ops" (Philipp Horstenkamp):
+
+Abstract siehe Datei in github.
+
+Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
+
+- Eine sehr straffe Pipeline, die für Seriensoftware in Ordnung wäre, könnte uns für unser Projekt zu sehr „fesseln“ bzw. einschränken.
+- Es wäre zu überlegen, ob die Software-Entwicklung, wie diese früher ablief, mit der Software-Entwicklung von heute (u.a. mit den Automatisierungsmöglichkeiten von heute) gegenübergestellt werden soll, um daraus zunächst eine Strategie für unser Projekt zu entwickeln, bevor man sich vertieft mit DevOps beschäftigt
+- Die Verwendung von CI/CD (Continuous Integration/Continuous Delivery)-Pipelines für KI-Projekte wäre ein interessantes Thema.
+
+
+
+### Vorstellung des Abstracts der Seminararbeit zu "Automatisierte Datenextraktion aus Internetquellen als Grundlage für die Analyse von Kapitalgesellschaften" (Tristan Nolde):
+
+Abstract siehe Datei in github.
+
+Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
+
+- Pros und Cons von WebScraping gegenüber RSS-Feeds und gegenüber der API-Lösung sollen dargestellt werden
+- Die Quelle E-Mail-Newsletter (z.B. vom Handelsblatt) könnte ebenfalls interessant sein, jedoch muss hierfür möglicherweise ein separater E-Mail-Account erstellt werden, was eher aufwändig ist
+- Es wäre eventuell zu prüfen, ob auch Daten aus LinkedIn API, XING oder Facebook extrahiert werden könnten.
+
+
+
+### Vorstellung des Abstracts der Seminararbeit zu "Datenspeicherung" (Sebastian Zeleny):
+
+Abstract siehe Datei in github.
+
+Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
+
+- Bei der Wahl der Datenbank müssen verschiedene Anforderungen berücksichtigt werden, mit hohem Abstimmungsbedarf zwischen den Topics "Datenextraktion" und "Datenvisualisierung"
+
+- Herr Prof. Arinir fragte noch, ob wir das Thema "relationale Datenbanken" als Modul behandelt haben. Dies wurde bejaht, insbesondere SQL Datenbanken und SQL queries waren Gegenstand des Moduls "Datenbankprogrammierung"
+
+
+
+### Vorstellung des Abstracts der Seminararbeit zu "Verpflechtungsanalyse" (Tim Ronneburg):
+
+Abstract siehe Datei in github.
+
+Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
+
+- Beim Social Graph wäre zu überlegen, nicht nur Beziehungen zwischen Unternehmen via Personen (z.B. Wirtschaftsprüfer), sondern auch Beziehungen zwischen Unternehmen via Kooperationspartner (Stiftungen, Unis, Forschungsinstitute) bzw. Eigentums-, Kunden- und Lieferbeziehungen darzustellen
+
+- Beim Social Graph wäre zu überlegen, ob man nach Art der Beziehung filtern könnte
+
+
+
+### Vorstellung des Abstracts der Seminararbeit zu "Text Mining" (Sascha Zhu):
+
+Abstract siehe Datei in github.
+
+Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
+
+- Bei den Sentiment-Analyse-Tools wie FinBERT oder VADER wäre stets eine maschinelle Übersetzung der deutschen Nachrichtentexte ins Englische erforderlich, da FinBERT oder VADER keine deutschen Texte erkennen können
+- Die Generierung von Ontologien ist zu komplex und soll nicht Gegenstand der Projektarbeit sein
+- Bei der semantischen Textanalyse wäre empfehlenswert, dass dies über "Einzel-Personen" ausgeführt wird (das wäre dann ein Punkt im Graphen)
+- Das Thema "Named Entity Recognition" wird für die Projektarbeit eine hohe Bedeutung haben
+
+
+
+### Vorstellung des Abstracts der Seminararbeit zu "Datenvisualisierung" (Kim Mesewinkel-Risse):
+
+Abstract siehe Datei in github.
+
+Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
+
+- Bei der Datenvisualisierung wäre zu überlegen, dass man sich nur auf Python-Bibliotheken beschränkt
+- Die Datenabfrage könnte über SQL oder Spark laufen, eine Schnittstelle zwischen dem Speicher und dem Front-End wird benötigt
+- Zwischen Daten und der Datenvisualisierung werden eventuell Zwischen-Caches benötigt
+- Bezüglich der Frage nach der „Middleware“: Wenn Plotly oder Plotly Dash verwendet wird, wird keine Middleware benötigt, da dies schon eingebaut ist.
+
+
+
+### Feedback von Herrn Prof. Arinir:
+
+- Es scheint noch kein Gesamtkonzept für das Gewerk vorzuliegen.
+- Wir sollten uns die Frage stellen: Was soll am Ende für "ein brauchbares Stück Software" herauskommen, damit der Anwender mit der Vielzahl von Informationen und Funktionen zurechtkommt.
+- Eine Lösungsskizze muss definiert werden, wobei ein Pflichtenheft jetzt noch nicht erforderlich ist
+- Es sollen zunächst einige GUI-Designs (mit einem Muster-Datensatz) entwickelt werden.
+- Pros und Cons zwischen einem Wasserfallmodell (Pflichtenheft mit bis zu 1000 Seiten) und der agilen Modellierung sollen berücksichtigt werden.
+- Wie sollen die Verflechtungen eingebaut werden?
+- Wie sollen die Daten persistiert werden?
+- Es wäre empfehlenswert, mit irgendetwas (d.h. einer kleinen Lösung) anzufangen, dann das Ergebnis anzuschauen, und diese kontinuierlich zu verbessern.
+
+
+
+## Abgeleitete Action Items
+
+| Action Item                                | Verantwortlicher | Deadline          |
+|--------------------------------------------|------------------|-------------------|
+| GUI Designs                                | Alle             | nächstes Weekly   |
+| Rückmeldung zum Umfang der Seminararbeit   | Prof. Arinir     | nächstes Weekly   |
+
+## Aktueller Projektstand
@@ -0,0 +1,33 @@
+# Weekly *5*: 25.05.2023
+
+## Teilnehmer
+- Prof. Arinir
+- Tristan Nolde
+- Tim Ronneburg
+- Philipp Horstenkamp
+- Kim Mesewinkel-Risse
+- Sascha Zhu
+- Sebastian Zeleny
+
+## Themen
+
+- Nächster Termin am 08.06.2023 ist Fronleichnam => Verschoben auf 09.06.2023 09:00
+- Sebastian präsentiert das Miro Bord mit den Wireframediagrammen. [Siehe Anlage]()
+- Philipp präsentiert den Sozial graph
+- Sebastian präsentiert die Unternehmensdetails in sicht auf die Kennzahlen
+- Sebastian dankt Kim für das Überarbeiten der Graphen im Farbschema
+- Sebastian zeigt die anderen Übersichten
+  - Sascha weist darauf hin das zusätzlich noch das Quellmaterial für die Stimmungen mit angezeigt werden sollen.
+  - Die Form ist bisher noch unklar.
+
+- Arinir: Auch indirekte verpflächtungen für N sprünge sollen bei den Details angezeigt werden und einen wert für den Einfluss von personen und Firmen sein.
+  - Zähle die Personenverbindungen juristisch/Natürlich getrennt nach den schichten der Indirektion. Interessant wäre eine auftrennung der natürlichen und Jiristischen personen in der Zählung
+  - Ranking der Personen nach Anzahl der Verbindungen
+
+- Die Frage wie wir zeitliche veränderungen im sozial graph bewerten sollen kam auf. Wurde aber noch nicht abschließend beantwortet.
+
+## Abgeleitete Action Items
+
+| Action Item                              | Verantwortlicher | Deadline        |
+|------------------------------------------|------------------|-----------------|
+| Erster entwurf der Seminarpräsentationen | Alle             | nächstes Weekly |