mirror of
https://github.com/fhswf/aki_prj23_transparenzregister.git
synced 2025-06-22 04:53:54 +02:00
Spellchecking with PyCharm (#133)
Co-authored-by: KM-R <129882581+KM-R@users.noreply.github.com>
This commit is contained in:
@ -1,6 +1,7 @@
|
||||
# Weekly *1*: 30.03.2023
|
||||
|
||||
## Teilnehmer
|
||||
|
||||
- Prof. Arinir
|
||||
- Tristan Nolde
|
||||
- Tim Ronneburg
|
||||
@ -10,53 +11,58 @@
|
||||
- Sebastian Zeleny (Protokollant)
|
||||
|
||||
## Themen
|
||||
- **Inhalt des Project Proposals:**
|
||||
- Mit welchen Metriken können Unternehmen bewertet werden?
|
||||
- Was sind Kennzahlen von Kapitalgesellschaften?
|
||||
- Welche Daten werden benötigt?
|
||||
- Woher erhält man benötigte Daten? (Amtsgerichte --> Insolvenzen, Börsenkurse, Aktienkurse, RSS-Feeds von/zu Unternehmen)
|
||||
- Wie werden die Daten verarbeitet?
|
||||
- Wie können die Daten bzw. Ergebnisse präsentiert werden?
|
||||
- Verflechtungen zwischen Unternehmen: Geschäftsführer, Wirtschaftsprüfer
|
||||
|
||||
|
||||
- **Inhalt des Project Proposals:**
|
||||
- Mit welchen Metriken können Unternehmen bewertet werden?
|
||||
- Was sind Kennzahlen von Kapitalgesellschaften?
|
||||
- Welche Daten werden benötigt?
|
||||
- Woher erhält man benötigte Daten? (Amtsgerichte --> Insolvenzen, Börsenkurse, Aktienkurse, RSS-Feeds von/zu
|
||||
Unternehmen)
|
||||
- Wie werden die Daten verarbeitet?
|
||||
- Wie können die Daten bzw. Ergebnisse präsentiert werden?
|
||||
- Verflechtungen zwischen Unternehmen: Geschäftsführer, Wirtschaftsprüfer
|
||||
|
||||
- **Anforderungen an Projektdurchführung:**
|
||||
- Backlog für Ideen und Aufgaben
|
||||
- Meeting-Notes mit besprochenen Themen, Entscheidungen, Terminen und Action-List (Wer arbeitet an welcher Aufgabe?)
|
||||
- Projektdurchführung so formal wie möglich, d.h.
|
||||
- Beschreibung des Systemkontexts: Interaktion mit der Umgebung
|
||||
- Datenmodell: schematische Darstellung der Datenflüsse
|
||||
- Lasten- / Pflichtenheft mit Kategorisierung
|
||||
- Vorschlag Frontend von Prof. Arinir: D3.js
|
||||
- Backlog für Ideen und Aufgaben
|
||||
- Meeting-Notes mit besprochenen Themen, Entscheidungen, Terminen und Action-List (Wer arbeitet an welcher
|
||||
Aufgabe?)
|
||||
- Projektdurchführung so formal wie möglich, d.h.
|
||||
- Beschreibung des Systemkontexts: Interaktion mit der Umgebung
|
||||
- Datenmodell: schematische Darstellung der Datenflüsse
|
||||
- Lasten- / Pflichtenheft mit Kategorisierung
|
||||
- Vorschlag Frontend von Prof. Arinir: D3.js
|
||||
|
||||
- **Bewertung des Projekts:**
|
||||
- Es muss erkennbar sein, wer welche Aufgabe bearbeitet hat
|
||||
- Jeder Teilnehmer soll die Aufgaben der anderen Teilnehmer kennen und ein Verständnis für diese haben (kein tiefes Domänenwissen!)
|
||||
- Gesamtplanung und Dokumentation sind Teil das Ergebnis, nicht nur die technische Umsetzung
|
||||
- Bewertungsschlüssel:
|
||||
- **Bewertung des Projekts:**
|
||||
- Es muss erkennbar sein, wer welche Aufgabe bearbeitet hat
|
||||
- Jeder Teilnehmer soll die Aufgaben der anderen Teilnehmer kennen und ein Verständnis für diese haben (kein tiefes
|
||||
Domänenwissen!)
|
||||
- Gesamtplanung und Dokumentation sind Teil das Ergebnis, nicht nur die technische Umsetzung
|
||||
- Bewertungsschlüssel:
|
||||
|
||||
| Gewichtung | Aufgabe |
|
||||
|--------------|---------------------------------------------|
|
||||
| 20% | Vortrag Seminararbeit |
|
||||
| 20% | Präsentation |
|
||||
| 30% | Implementierung |
|
||||
| 20% | Finaler Bericht (~15 Seiten pro Teilnehmer) |
|
||||
| 10% | Abschlusspräsentation |
|
||||
| Gewichtung | Aufgabe |
|
||||
|------------|---------------------------------------------|
|
||||
| 20% | Vortrag Seminararbeit |
|
||||
| 20% | Präsentation |
|
||||
| 30% | Implementierung |
|
||||
| 20% | Finaler Bericht (~15 Seiten pro Teilnehmer) |
|
||||
| 10% | Abschlusspräsentation |
|
||||
|
||||
- **Organisatorisches:**
|
||||
- Regeltermin alle 14 Tage mit allen Projektteilnehmern, beginnend am 30.03.2023: Dieser Termin soll für Sprint Planning und Review mit Prof. Arinir genutzt werden.
|
||||
- Regeltermin alle 14 Tage mit allen Projektteilnehmern, beginnend am 30.03.2023: Dieser Termin soll für Sprint
|
||||
Planning und Review mit Prof. Arinir genutzt werden.
|
||||
- Was ist die Erwartungshaltung des Product Owners?
|
||||
- Welche Themen/Aufgaben werden bearbeitet?
|
||||
- Was ist das Ziel für das nächste Review?
|
||||
- Projektbearbeitung/Dokumentation mit Github
|
||||
- Bereitstellung des Github-Repos über FH
|
||||
- Welche Themen/Aufgaben werden bearbeitet?
|
||||
- Was ist das Ziel für das nächste Review?
|
||||
- Projektbearbeitung/Dokumentation mit Github
|
||||
- Bereitstellung des Github-Repos über FH
|
||||
|
||||
## Abgeleitete Action Items
|
||||
|
||||
| Action Item | Verantwortlicher | Deadline |
|
||||
|-----------------------------------------------------------------------------------------|--------------------|----------------------------------|
|
||||
| Welche Anforderungen / Erwartungen stellen wir inhaltlich und technisch an das Projekt? | alle | nächstes Weekly/work in progress |
|
||||
| Erarbeiten von Arbeitspaketen/Aufgaben aus Anforderungen | alle | nächstes Weekly/work in progress |
|
||||
| Welche Metriken sind notwendig? | alle | nächstes Weekly/work in progress |
|
||||
| Recherche zu Datenquellen | alle | nächstes Weekly/work in progress |
|
||||
| Definition von Meilensteinen | alle | nächstes Weekly |
|
||||
| Erstellung eines (groben) Zeitplans | alle | nächstes Weekly |
|
||||
| Action Item | Verantwortlicher | Deadline |
|
||||
|-----------------------------------------------------------------------------------------|------------------|----------------------------------|
|
||||
| Welche Anforderungen / Erwartungen stellen wir inhaltlich und technisch an das Projekt? | alle | nächstes Weekly/work in progress |
|
||||
| Erarbeiten von Arbeitspaketen/Aufgaben aus Anforderungen | alle | nächstes Weekly/work in progress |
|
||||
| Welche Metriken sind notwendig? | alle | nächstes Weekly/work in progress |
|
||||
| Recherche zu Datenquellen | alle | nächstes Weekly/work in progress |
|
||||
| Definition von Meilensteinen | alle | nächstes Weekly |
|
||||
| Erstellung eines (groben) Zeitplans | alle | nächstes Weekly |
|
||||
|
@ -1,6 +1,7 @@
|
||||
# Weekly *2*: 13.04.2023
|
||||
|
||||
## Teilnehmer
|
||||
|
||||
- Prof. Arinir
|
||||
- Tristan Nolde
|
||||
- Tim Ronneburg (Protokollant)
|
||||
@ -12,46 +13,47 @@
|
||||
## Themen
|
||||
|
||||
- **Seminarthemen:**
|
||||
- Themen die im Zuge der Implementierung erarbeitet werden
|
||||
- Themen:
|
||||
- Textmining (Ontologien)
|
||||
- Semantische Suche
|
||||
- Anmeldungsformular:
|
||||
- Jeder sendet das Formular selbst an Herrn Arinir
|
||||
- Projektauftakt: 30.03.2023
|
||||
- Enddatum: 15.02.2024
|
||||
- Titel: Transparanzregister Kapitalgeselschaften
|
||||
- Themen die im Zuge der Implementierung erarbeitet werden
|
||||
- Themen:
|
||||
- Textmining (Ontologien)
|
||||
- Semantische Suche
|
||||
- Anmeldungsformular:
|
||||
- Jeder sendet das Formular selbst an Herrn Arinir
|
||||
- Projektauftakt: 30.03.2023
|
||||
- Enddatum: 15.02.2024
|
||||
- Titel: Transparenzregister Kapitalgesellschaften
|
||||
- **Vorstellung der Ergebnisse des letzten Sprints:**
|
||||
- Erstellung des GitHubs Projekts
|
||||
- Anlegen eines Protokolltemplates
|
||||
- Interne Meetings jeden Donnerstag
|
||||
- Timeline erstellt mit Mermaid.js in Markdown (Sebastian)
|
||||
- Recherche zum Datenschutz / Urheberrecht: Welche Daten aus den Datenbanken dürfen offline oder online benutzt werden. (Sascha)
|
||||
- Für die eigene Forschung: 75 % der Daten dürfen genutzt werden
|
||||
- 15 % Wenn es an Dritte weitergeleitet werden
|
||||
- Wenn wir die Ergebnisse veröffentlichen müssen die Vorgaben der Datenbanken beachten
|
||||
- Hinweis von Herrn Arinir: Das ist als Vorschungsprojekt zu sehen
|
||||
- Die Ergebnisse werden nicht veröffentlicht
|
||||
- nur die Vorgehensweise wird als Paper veröffentlicht
|
||||
- Recherche zu Unternehmenskennzahlen (Kim)
|
||||
- Hinweis: Für Tendenzanalysen sollen zeitliche Veränderungen erfasst werden (Timescale Datenbank)
|
||||
- Vierteljährliche Daten reichen aus
|
||||
- Recherche zu den verfügbaren Datengrundlagen (Phillip und Tristan)
|
||||
- Anlegen eines Pflichtenhefts mit den Anforderungen an das Projekt (Tim)
|
||||
- Erstellung des GitHubs Projekts
|
||||
- Anlegen eines Protokolltemplates
|
||||
- Interne Meetings jeden Donnerstag
|
||||
- Timeline erstellt mit Mermaid.js in Markdown (Sebastian)
|
||||
- Recherche zum Datenschutz / Urheberrecht: Welche Daten aus den Datenbanken dürfen offline oder online benutzt
|
||||
werden. (Sascha)
|
||||
- Für die eigene Forschung: 75 % der Daten dürfen genutzt werden
|
||||
- 15 % wenn es an Dritte weitergeleitet werden
|
||||
- Wenn wir die Ergebnisse veröffentlichen müssen die Vorgaben der Datenbanken beachten
|
||||
- Hinweis von Herrn Arinir: Das ist als Forschungsprojekt zu sehen
|
||||
- Die Ergebnisse werden nicht veröffentlicht
|
||||
- nur die Vorgehensweise wird als Paper veröffentlicht
|
||||
- Recherche zu Unternehmenskennzahlen (Kim)
|
||||
- Hinweis: Für Tendenzanalysen sollen zeitliche Veränderungen erfasst werden (Timescale Datenbank)
|
||||
- Vierteljährliche Daten reichen aus
|
||||
- Recherche zu den verfügbaren Datengrundlagen (Phillip und Tristan)
|
||||
- Anlegen eines Pflichtenhefts mit den Anforderungen an das Projekt (Tim)
|
||||
- **Organisatorisches:**
|
||||
- Es muss noch ein Projekt angelegt werden für das GitHub Repository mit einem Board zur Projektorganisation
|
||||
- Im Meeting erledigt
|
||||
- Es muss noch ein Projekt angelegt werden für das GitHub Repository mit einem Board zur Projektorganisation
|
||||
- Im Meeting erledigt
|
||||
- **Recherche:**
|
||||
- Nicht nur auf Kennzahlen eingehen, sondern auch auf die Berichterstattung eingehen
|
||||
- Dazu sollen die Technologieauswahl recherchiert werden (Trendanalyse von Nachrichten, Finanztreff, Twitter etc.)
|
||||
- Nicht nur auf Kennzahlen eingehen, sondern auch auf die Berichterstattung eingehen
|
||||
- Dazu soll die Technologieauswahl recherchiert werden (Trendanalyse von Nachrichten, Finanztreff, Twitter etc.)
|
||||
|
||||
## Abgeleitete Action Items
|
||||
|
||||
| Action Item | Verantwortlicher | Deadline |
|
||||
|-------------|------------------|-----------------|
|
||||
| Rechechieren welche Nachrichtenquellen (Aktuelle und "Alte" Nachrichten) genutzt werden können | Sascha und Tim | 27.04.2023 |
|
||||
| Recherchieren welche Technologien zur Auswertung der Nachrichtenqullen genutzt werden können (z.b. Sentiment Analyse) | Philipp und Kim | 27.04.2023 |
|
||||
| Beschäftigen mit Historien (Timescale Datenbank) | Tristan und Sebastian | 27.04.2023 |
|
||||
| Festlegen von Kriterien wann ein Artikel positiv oder negativ zu bewerten ist | Sascha | Ende offen |
|
||||
| Abgabe des Anmeldeformulars zum Projekt | alle | 20.04.2023 |
|
||||
| Liste mit geeignetetn Metriken | Herr Arinir | 27.04.2023 |
|
||||
| Action Item | Verantwortlicher | Deadline |
|
||||
|------------------------------------------------------------------------------------------------------------------------|-----------------------|------------|
|
||||
| Recherchieren welche Nachrichtenquellen (Aktuelle und "Alte" Nachrichten) genutzt werden können | Sascha und Tim | 27.04.2023 |
|
||||
| Recherchieren welche Technologien zur Auswertung der Nachrichtenquellen genutzt werden können (z.b. Sentiment Analyse) | Philipp und Kim | 27.04.2023 |
|
||||
| Beschäftigen mit Historien (Timescale Datenbank) | Tristan und Sebastian | 27.04.2023 |
|
||||
| Festlegen von Kriterien wann ein Artikel positiv oder negativ zu bewerten ist | Sascha | Ende offen |
|
||||
| Abgabe des Anmeldeformulars zum Projekt | alle | 20.04.2023 |
|
||||
| Liste mit geeigneten Metriken | Herr Arinir | 27.04.2023 |
|
||||
|
@ -1,6 +1,7 @@
|
||||
# Weekly *3*: 04.05.2023
|
||||
|
||||
## Teilnehmer
|
||||
|
||||
- Prof. Arinir
|
||||
- Tristan Nolde
|
||||
- Tim Ronneburg
|
||||
@ -14,41 +15,45 @@
|
||||
### Organisatorische Absprachen:
|
||||
|
||||
Gelten die Seminarthemen als Zwischenprüfung? In welcher Form?
|
||||
- Herr Giefers hat Seminarthemen im Vorfeld definiert, in unserer Gruppe gab es eine offene Einarbeitung in die Forschungs- und Entwicklungsarbeit
|
||||
- Geplanter Umfang: Seminararbeit 15-20 Seiten (Rücksprache mit Herrn Giefers und Herrn Gawron durch Herrn Arinir, Feedback beim nächsten Termin) und Vortrag mit Folien oder anderen Quellen (z.B. Quellcode) ca. 15-20 Minuten im Rahmen eines JF Termins (keine Vorstellung im Plenum)
|
||||
|
||||
- Herr Giefers hat Seminarthemen im Vorfeld definiert, in unserer Gruppe gab es eine offene Einarbeitung in die
|
||||
Forschungs- und Entwicklungsarbeit
|
||||
- Geplanter Umfang: Seminararbeit 15-20 Seiten (Rücksprache mit Herrn Giefers und Herrn Gawron durch Herrn Arinir,
|
||||
Feedback beim nächsten Termin) und Vortrag mit Folien oder anderen Quellen (z.B. Quellcode) ca. 15-20 Minuten im
|
||||
Rahmen eines JF Termins (keine Vorstellung im Plenum)
|
||||
- Die Seminararbeiten werden benotet (20% der Endnote), die Ausarbeitung und der Vortrag zählen dabei zu jeweils 50%
|
||||
|
||||
|
||||
Wie lautet der zeitliche Rahmen?
|
||||
- Keine feste Deadline vorgegeben, Absprache innerhalb der Projektgruppe ausreichend
|
||||
- Vortrag: Einigung auf zwei Termine Ende Juni/Anfang Juli -> Thema 1-3 am 22.06.2023 und Thema 4-6 am 06.07.2023
|
||||
- Seminararbeit: Abgabe voraussichtlich Ende des Sommersemesters, potentiell auch zu einem späteren Zeitpunkt möglich
|
||||
|
||||
- Keine feste Deadline vorgegeben, Absprache innerhalb der Projektgruppe ausreichend
|
||||
- Vortrag: Einigung auf zwei Termine Ende Juni/Anfang Juli → Thema 1-3 am 22.06.2023 und Thema 4-6 am 06.07.2023
|
||||
- Seminararbeit: Abgabe voraussichtlich Ende des Sommersemesters, potenziell auch zu einem späteren Zeitpunkt möglich
|
||||
|
||||
Welche Themenbereiche sollen behandelt werden?
|
||||
- Die erste kurze Beschreibung der 6 Themenbereiche/Domänen wurde durch Herrn Arinir als positiv befunden
|
||||
- Zur Eingrenzung der Themen und für ein konkreteres Feedback soll für jeden Themenbereich beim nächsten JF am 11.05.2023 ein Abstract vorgestellt werden
|
||||
- Grundsätzlich sollen die Themen nicht zu oberflächlich behandelt werden, sondern explizit auf Techniken zur Umsetzung eingegangen werden
|
||||
|
||||
- Die erste kurze Beschreibung der 6 Themenbereiche/Domänen wurde durch Herrn Arinir als positiv befunden
|
||||
- Zur Eingrenzung der Themen und für ein konkreteres Feedback soll für jeden Themenbereich beim nächsten JF am
|
||||
11.05.2023 ein Abstract vorgestellt werden
|
||||
- Grundsätzlich sollen die Themen nicht zu oberflächlich behandelt werden, sondern explizit auf Techniken zur Umsetzung
|
||||
eingegangen werden
|
||||
|
||||
Einigung auf Änderungen im Bereich Projektorganisation:
|
||||
- Aufnahme des zeitlichen Ablaufs der Tickets in die Meeting Notes -> Screenshot des Projects in Protokoll mit aufnehmen
|
||||
|
||||
- Aufnahme des zeitlichen Ablaufs der Tickets in die Meeting Notes → Screenshot des Projects in Protokoll mit aufnehmen
|
||||
- Start-, Enddaten und Labels der Tickets besser pflegen
|
||||
|
||||
|
||||
Sonstiges:
|
||||
|
||||
- Urlaubszeiten Herr Prof. Arinir: 17.07.-01.08.2023
|
||||
|
||||
|
||||
|
||||
## Abgeleitete Action Items
|
||||
|
||||
| Action Item | Verantwortlicher | Deadline |
|
||||
|-------------|------------------|-----------------|
|
||||
| Abstract pro Thema | Alle | nächstes Weekly |
|
||||
| Folienvorlage für den Seminarvortrag | Alle | nächstes Weekly |
|
||||
| Rückmeldung zum Umfang der Seminararbeit | Prof. Arinir | nächstes Weekly |
|
||||
|
||||
| Action Item | Verantwortlicher | Deadline |
|
||||
|------------------------------------------|------------------|-----------------|
|
||||
| Abstract pro Thema | Alle | nächstes Weekly |
|
||||
| Folienvorlage für den Seminarvortrag | Alle | nächstes Weekly |
|
||||
| Rückmeldung zum Umfang der Seminararbeit | Prof. Arinir | nächstes Weekly |
|
||||
|
||||
## Aktueller Projektstand
|
||||
|
||||

|
||||
|
@ -1,6 +1,7 @@
|
||||
# Weekly *4*: 11.05.2023
|
||||
|
||||
## Teilnehmer
|
||||
|
||||
- Prof. Arinir
|
||||
- Tristan Nolde
|
||||
- Tim Ronneburg
|
||||
@ -14,11 +15,12 @@
|
||||
### Organisatorische Absprachen zum Umfang und Inhalt der Seminararbeit:
|
||||
|
||||
- Herr Arinir wird sich nochmal wegen des Umfangs der Seminararbeit bei unserer Gruppe melden
|
||||
- In der Seminarbeit sollen Anforderungen und Lösungsskizzen für das Projekt "Transparenzregister" dargestellt werden.
|
||||
- Die Seminarabeit soll aus einem theoretischen Teil und einem praktischen Teil, in dem der praktische Nutzen für das Projekt "Transparenzregister" erörtert wird, bestehen; ob das Verhältnis zwischen dem theoretischen und praktischen Teil bei 50:50 oder 40:60 liegt, darüber können die Verfaser der Seminararbeit selbst entscheiden
|
||||
- Der Fokus der Seminarbeit soll stets danach ausgerichtet werden, wie die entsprechenden Aspekte bzw. die entsprechenden Technologien für das Projekt "Transparenzregister" genutzt werden können.
|
||||
|
||||
|
||||
- In der Seminararbeit sollen Anforderungen und Lösungsskizzen für das Projekt "Transparenzregister" dargestellt werden.
|
||||
- Die Seminararbeit soll aus einem theoretischen Teil und einem praktischen Teil, in dem der praktische Nutzen für das
|
||||
Projekt "Transparenzregister" erörtert wird, bestehen; ob das Verhältnis zwischen dem theoretischen und praktischen
|
||||
Teil bei 50:50 oder 40:60 liegt, darüber können die Verfasser der Seminararbeit selbst entscheiden
|
||||
- Der Fokus der Seminararbeit soll stets danach ausgerichtet werden, wie die entsprechenden Aspekte bzw. die
|
||||
entsprechenden Technologien für das Projekt "Transparenzregister" genutzt werden können.
|
||||
|
||||
### Vorstellung des Abstracts der Seminararbeit zu "Dev Ops" (Philipp Horstenkamp):
|
||||
|
||||
@ -26,11 +28,13 @@ Abstract siehe Datei in github.
|
||||
|
||||
Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
|
||||
|
||||
- Eine sehr straffe Pipeline, die für Seriensoftware in Ordnung wäre, könnte uns für unser Projekt zu sehr „fesseln“ bzw. einschränken.
|
||||
- Es wäre zu überlegen, ob die Software-Entwicklung, wie diese früher ablief, mit der Software-Entwicklung von heute (u.a. mit den Automatisierungsmöglichkeiten von heute) gegenübergestellt werden soll, um daraus zunächst eine Strategie für unser Projekt zu entwickeln, bevor man sich vertieft mit DevOps beschäftigt
|
||||
- Die Verwendung von CI/CD (Continuous Integration/Continuous Delivery)-Pipelines für KI-Projekte wäre ein interessantes Thema.
|
||||
|
||||
|
||||
- Eine sehr straffe Pipeline, die für Seriensoftware in Ordnung wäre, könnte uns für unser Projekt zu sehr „fesseln“
|
||||
bzw. einschränken.
|
||||
- Es wäre zu überlegen, ob die Software-Entwicklung, wie diese früher ablief, mit der Software-Entwicklung von heute (
|
||||
u.a. mit den Automatisierungsmöglichkeiten von heute) gegenübergestellt werden soll, um daraus zunächst eine Strategie
|
||||
für unser Projekt zu entwickeln, bevor man sich vertieft mit DevOps beschäftigt
|
||||
- Die Verwendung von CI/CD (Continuous Integration/Continuous Delivery)-Pipelines für KI-Projekte wäre ein interessantes
|
||||
Thema.
|
||||
|
||||
### Vorstellung des Abstracts der Seminararbeit zu "Automatisierte Datenextraktion aus Internetquellen als Grundlage für die Analyse von Kapitalgesellschaften" (Tristan Nolde):
|
||||
|
||||
@ -39,48 +43,47 @@ Abstract siehe Datei in github.
|
||||
Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
|
||||
|
||||
- Pros und Cons von WebScraping gegenüber RSS-Feeds und gegenüber der API-Lösung sollen dargestellt werden
|
||||
- Die Quelle E-Mail-Newsletter (z.B. vom Handelsblatt) könnte ebenfalls interessant sein, jedoch muss hierfür möglicherweise ein separater E-Mail-Account erstellt werden, was eher aufwändig ist
|
||||
- Die Quelle E-Mail-Newsletter (z.B. vom Handelsblatt) könnte ebenfalls interessant sein, jedoch muss hierfür
|
||||
möglicherweise ein separater E-Mail-Account erstellt werden, was eher aufwändig ist
|
||||
- Es wäre eventuell zu prüfen, ob auch Daten aus LinkedIn API, XING oder Facebook extrahiert werden könnten.
|
||||
|
||||
|
||||
|
||||
### Vorstellung des Abstracts der Seminararbeit zu "Datenspeicherung" (Sebastian Zeleny):
|
||||
|
||||
Abstract siehe Datei in github.
|
||||
|
||||
Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
|
||||
|
||||
- Bei der Wahl der Datenbank müssen verschiedene Anforderungen berücksichtigt werden, mit hohem Abstimmungsbedarf zwischen den Topics "Datenextraktion" und "Datenvisualisierung"
|
||||
- Bei der Wahl der Datenbank müssen verschiedene Anforderungen berücksichtigt werden, mit hohem Abstimmungsbedarf
|
||||
zwischen den Topics "Datenextraktion" und "Datenvisualisierung"
|
||||
|
||||
- Herr Prof. Arinir fragte noch, ob wir das Thema "relationale Datenbanken" als Modul behandelt haben. Dies wurde bejaht, insbesondere SQL Datenbanken und SQL queries waren Gegenstand des Moduls "Datenbankprogrammierung"
|
||||
- Herr Prof. Arinir fragte noch, ob wir das Thema "relationale Datenbanken" als Modul behandelt haben. Dies wurde
|
||||
bejaht, insbesondere SQL Datenbanken und SQL queries waren Gegenstand des Moduls "Datenbankprogrammierung"
|
||||
|
||||
|
||||
|
||||
### Vorstellung des Abstracts der Seminararbeit zu "Verpflechtungsanalyse" (Tim Ronneburg):
|
||||
### Vorstellung des Abstracts der Seminararbeit zu "Verflechtungsanalyse" (Tim Ronneburg):
|
||||
|
||||
Abstract siehe Datei in github.
|
||||
|
||||
Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
|
||||
|
||||
- Beim Social Graph wäre zu überlegen, nicht nur Beziehungen zwischen Unternehmen via Personen (z.B. Wirtschaftsprüfer), sondern auch Beziehungen zwischen Unternehmen via Kooperationspartner (Stiftungen, Unis, Forschungsinstitute) bzw. Eigentums-, Kunden- und Lieferbeziehungen darzustellen
|
||||
- Beim Social Graph wäre zu überlegen, nicht nur Beziehungen zwischen Unternehmen via Personen (z.B. Wirtschaftsprüfer),
|
||||
sondern auch Beziehungen zwischen Unternehmen via Kooperationspartner (Stiftungen, Unis, Forschungsinstitute) bzw.
|
||||
Eigentums-, Kunden- und Lieferbeziehungen darzustellen
|
||||
|
||||
- Beim Social Graph wäre zu überlegen, ob man nach Art der Beziehung filtern könnte
|
||||
|
||||
|
||||
|
||||
### Vorstellung des Abstracts der Seminararbeit zu "Text Mining" (Sascha Zhu):
|
||||
|
||||
Abstract siehe Datei in github.
|
||||
|
||||
Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
|
||||
|
||||
- Bei den Sentiment-Analyse-Tools wie FinBERT oder VADER wäre stets eine maschinelle Übersetzung der deutschen Nachrichtentexte ins Englische erforderlich, da FinBERT oder VADER keine deutschen Texte erkennen können
|
||||
- Bei den Sentiment-Analyse-Tools wie FinBERT oder VADER wäre stets eine maschinelle Übersetzung der deutschen
|
||||
Nachrichtentexte ins Englische erforderlich, da FinBERT oder VADER keine deutschen Texte erkennen können
|
||||
- Die Generierung von Ontologien ist zu komplex und soll nicht Gegenstand der Projektarbeit sein
|
||||
- Bei der semantischen Textanalyse wäre empfehlenswert, dass dies über "Einzel-Personen" ausgeführt wird (das wäre dann ein Punkt im Graphen)
|
||||
- Bei der semantischen Textanalyse wäre empfehlenswert, dass dies über "Einzel-Personen" ausgeführt wird (das wäre dann
|
||||
ein Punkt im Graphen)
|
||||
- Das Thema "Named Entity Recognition" wird für die Projektarbeit eine hohe Bedeutung haben
|
||||
|
||||
|
||||
|
||||
### Vorstellung des Abstracts der Seminararbeit zu "Datenvisualisierung" (Kim Mesewinkel-Risse):
|
||||
|
||||
Abstract siehe Datei in github.
|
||||
@ -88,30 +91,31 @@ Abstract siehe Datei in github.
|
||||
Folgende Punkte wurden bei bzw. nach der Vorstellung des Abstracts diskutiert:
|
||||
|
||||
- Bei der Datenvisualisierung wäre zu überlegen, dass man sich nur auf Python-Bibliotheken beschränkt
|
||||
- Die Datenabfrage könnte über SQL oder Spark laufen, eine Schnittstelle zwischen dem Speicher und dem Front-End wird benötigt
|
||||
- Die Datenabfrage könnte über SQL oder Spark laufen, eine Schnittstelle zwischen dem Speicher und dem Front-End wird
|
||||
benötigt
|
||||
- Zwischen Daten und der Datenvisualisierung werden eventuell Zwischen-Caches benötigt
|
||||
- Bezüglich der Frage nach der „Middleware“: Wenn Plotly oder Plotly Dash verwendet wird, wird keine Middleware benötigt, da dies schon eingebaut ist.
|
||||
|
||||
|
||||
- Bezüglich der Frage nach der „Middleware“: Wenn Plotly oder Plotly Dash verwendet wird, wird keine Middleware
|
||||
benötigt, da dies schon eingebaut ist.
|
||||
|
||||
### Feedback von Herrn Prof. Arinir:
|
||||
|
||||
- Es scheint noch kein Gesamtkonzept für das Gewerk vorzuliegen.
|
||||
- Wir sollten uns die Frage stellen: Was soll am Ende für "ein brauchbares Stück Software" herauskommen, damit der Anwender mit der Vielzahl von Informationen und Funktionen zurechtkommt.
|
||||
- Wir sollten uns die Frage stellen: Was soll am Ende für "ein brauchbares Stück Software" herauskommen, damit der
|
||||
Anwender mit der Vielzahl von Informationen und Funktionen zurechtkommt.
|
||||
- Eine Lösungsskizze muss definiert werden, wobei ein Pflichtenheft jetzt noch nicht erforderlich ist
|
||||
- Es sollen zunächst einige GUI-Designs (mit einem Muster-Datensatz) entwickelt werden.
|
||||
- Pros und Cons zwischen einem Wasserfallmodell (Pflichtenheft mit bis zu 1000 Seiten) und der agilen Modellierung sollen berücksichtigt werden.
|
||||
- Pros und Cons zwischen einem Wasserfallmodell (Pflichtenheft mit bis zu 1000 Seiten) und der agilen Modellierung
|
||||
sollen berücksichtigt werden.
|
||||
- Wie sollen die Verflechtungen eingebaut werden?
|
||||
- Wie sollen die Daten persistiert werden?
|
||||
- Es wäre empfehlenswert, mit irgendetwas (d.h. einer kleinen Lösung) anzufangen, dann das Ergebnis anzuschauen, und diese kontinuierlich zu verbessern.
|
||||
|
||||
|
||||
- Es wäre empfehlenswert, mit irgendetwas (d.h. einer kleinen Lösung) anzufangen, dann das Ergebnis anzuschauen, und
|
||||
diese kontinuierlich zu verbessern.
|
||||
|
||||
## Abgeleitete Action Items
|
||||
|
||||
| Action Item | Verantwortlicher | Deadline |
|
||||
|--------------------------------------------|------------------|-------------------|
|
||||
| GUI Designs | Alle | nächstes Weekly |
|
||||
| Rückmeldung zum Umfang der Seminararbeit | Prof. Arinir | nächstes Weekly |
|
||||
| Action Item | Verantwortlicher | Deadline |
|
||||
|------------------------------------------|------------------|-----------------|
|
||||
| GUI Designs | Alle | nächstes Weekly |
|
||||
| Rückmeldung zum Umfang der Seminararbeit | Prof. Arinir | nächstes Weekly |
|
||||
|
||||
## Aktueller Projektstand
|
||||
|
@ -1,6 +1,7 @@
|
||||
# Weekly *5*: 25.05.2023
|
||||
|
||||
## Teilnehmer
|
||||
|
||||
- Prof. Arinir
|
||||
- Tristan Nolde
|
||||
- Tim Ronneburg
|
||||
@ -11,20 +12,23 @@
|
||||
|
||||
## Themen
|
||||
|
||||
- Nächster Termin am 08.06.2023 ist Fronleichnam => Verschoben auf 09.06.2023 09:00
|
||||
- Nächster Termin am 08.06.2023 ist Fronleichnam ⇒ Verschoben auf 09.06.2023 09:00
|
||||
- Sebastian präsentiert das Miro Bord mit den Wireframediagrammen. [Siehe Anlage]()
|
||||
- Philipp präsentiert den Sozial graph
|
||||
- Philipp präsentiert den social graph
|
||||
- Sebastian präsentiert die Unternehmensdetails in sicht auf die Kennzahlen
|
||||
- Sebastian dankt Kim für das Überarbeiten der Graphen im Farbschema
|
||||
- Sebastian zeigt die anderen Übersichten
|
||||
- Sascha weist darauf hin das zusätzlich noch das Quellmaterial für die Stimmungen mit angezeigt werden sollen.
|
||||
- Die Form ist bisher noch unklar.
|
||||
- Sascha weist darauf hin das zusätzlich noch das Quellmaterial für die Stimmungen mit angezeigt werden sollen.
|
||||
- Die Form ist bisher noch unklar.
|
||||
|
||||
- Arinir: Auch indirekte verpflächtungen für N sprünge sollen bei den Details angezeigt werden und einen wert für den Einfluss von personen und Firmen sein.
|
||||
- Zähle die Personenverbindungen juristisch/Natürlich getrennt nach den schichten der Indirektion. Interessant wäre eine auftrennung der natürlichen und Jiristischen personen in der Zählung
|
||||
- Ranking der Personen nach Anzahl der Verbindungen
|
||||
- Arinir: Auch indirekte Verflechtungen für N sprünge sollen bei den Details angezeigt werden und einen wert für den
|
||||
Einfluss von personen und Firmen sein.
|
||||
- Zähle die Personenverbindungen juristisch/Natürlich getrennt nach den schichten der Indirektion. Interessant wäre
|
||||
eine auftrennung der natürlichen und Jiristischen personen in der Zählung
|
||||
- Ranking der Personen nach Anzahl der Verbindungen
|
||||
|
||||
- Die Frage wie wir zeitliche veränderungen im sozial graph bewerten sollen kam auf. Wurde aber noch nicht abschließend beantwortet.
|
||||
- Die Frage wie wir zeitliche veränderungen im social graph bewerten sollen kam auf. Wurde aber noch nicht abschließend
|
||||
beantwortet.
|
||||
|
||||
## Abgeleitete Action Items
|
||||
|
||||
|
@ -14,7 +14,7 @@
|
||||
|
||||
- Stepstone Projekt:
|
||||
- Gewünscht wird ein initialer Austausch mit Stepstone
|
||||
- Befürchtung ist, dass es zu einem Hinderniss wird
|
||||
- Befürchtung ist, dass es zu einem Hindernis wird
|
||||
- Entscheidung liegt daher beim Projekt-Team
|
||||
- Weitere Informationen sind nicht aktuell nicht vorhanden
|
||||
- Vorschlag Prof. Arinir: Sollte das Thema nochmal zum Team getragen werden, wird der aktuelle Stand vorgestellt und
|
||||
@ -24,7 +24,7 @@
|
||||
- Ändert sich der Scope - Nein
|
||||
- NDA - Nein
|
||||
- Veröffentlichung - maximal Impressionen
|
||||
- Was muss geleistet werden - nicht direkt an Stepstone sondern über FH als Mediator
|
||||
- Was muss geleistet werden - nicht direkt an Stepstone, sondern über FH als Mediator
|
||||
- Sollen Präsentationen vorab zur Verfügung gestellt werden?
|
||||
- Einige Tage vorher in das Git Repo. hochladen und Prof. Arinir benachrichtigen
|
||||
- Rücksprache Seminarpräsentationen
|
||||
@ -35,7 +35,7 @@
|
||||
- Fokus auf Anwendung und Mehrwert, weniger genauer mathematischer Lösung
|
||||
- Feedback:
|
||||
- Präsentation scheint sehr umfangreich; Wunsch nach Reduzierung der Folienanzahl
|
||||
- Formeln hinter den Analysen spannend, ggf. doch drauf eingehen, um Kennzahl in Kontext zu setzen
|
||||
- Formeln hinter den Analysen spannend, ggf. doch darauf eingehen, um Kennzahl in Kontext zu setzen
|
||||
- Visualiserung:
|
||||
- Prinzipien
|
||||
- Vorteile
|
||||
@ -43,7 +43,7 @@
|
||||
- Effekt von Farbwahl
|
||||
- Erste Umsetzung im Jupyter Notebook
|
||||
- Feedback:
|
||||
- Es werden extem viele Datenpunkte angezeigt werden müssen, wie wird dies in den Bibliotheken umgesetzt?
|
||||
- Es werden extrem viele Datenpunkte angezeigt werden müssen, wie wird dies in den Bibliotheken umgesetzt?
|
||||
Kann dort gefiltert werden?
|
||||
- Wenn nicht direkt am Graphen (der Darstellung) gefiltert werden kann, dann frühzeitig filtern, bevor
|
||||
der Graph gebaut wird
|
||||
@ -55,15 +55,15 @@
|
||||
- Social Graph
|
||||
- Zeitseriendaten
|
||||
- Relationales DB Modell
|
||||
- Fokus ebenfalls auf Abfrage der Daten für Folge-Projekte wie Visualiserung und Mehrwert fürs Team, weniger
|
||||
- Fokus ebenfalls auf Abfrage der Daten für Folge-Projekte wie Visualisierung und Mehrwert fürs Team, weniger
|
||||
Theorie
|
||||
- Feedback:
|
||||
- Es müssen Erfahrungen mit der Library und Darstellung gesammelt werden, um den Mehrwert der Lösung
|
||||
hervorzuheben
|
||||
- Modellierung der Finzanz-Kennzahlen
|
||||
- Modellierung der Finanz-Kennzahlen
|
||||
- Spaltennamen sollen sprechend sein, z.B. "value" statt "sum"
|
||||
- Präferenz zum Modell mit einzelnem Eintrag mit mehren Kennzahl Spalten stallt generischer Lösung über
|
||||
Enum
|
||||
- Präferenz zum Modell mit einzelnem Eintrag mit mehreren Kennzahlen pro Spalten statt generischer
|
||||
Lösung über Enum
|
||||
- Text Mining
|
||||
- Fokus auf Sentiment Analyse
|
||||
- Vergleich verschiedener Lösungen und ML Modelle
|
||||
|
@ -16,7 +16,7 @@
|
||||
- Datenspeicherung auf dem Cluster
|
||||
- Weitere Vorgehensweise:
|
||||
- Idee: Kleine Workshops/Teams
|
||||
- In 2er Teams die einzelnen Funktionen über Feature Branches erstellen
|
||||
- In 2er-Teams die einzelnen Funktionen über Feature Branches erstellen
|
||||
|
||||
## Abgeleitete Action Items
|
||||
|
||||
|
@ -26,8 +26,8 @@
|
||||
- UI:
|
||||
- Vorstellung der ersten Visualisierung mit Plotly und Anbindung an ProductionDB
|
||||
- Dash startet im Hintergrund einen http-Server, welcher über den Port 8050 erreichbar ist
|
||||
- Dash wird für das Dashboarding verwendet und wird (bei Bedarf) durch weitere Komponenten erweitert
|
||||
- Abschluß des PoC und Umsetzung der bestehenden Architektur
|
||||
- Dash wird für das Dashboard verwendet und wird (bei Bedarf) durch weitere Komponenten erweitert
|
||||
- Abschluss des PoC und Umsetzung der bestehenden Architektur
|
||||
|
||||
## Abgeleitete Action Items
|
||||
|
||||
|
@ -15,13 +15,14 @@
|
||||
- Rückfrage von Herrn Arinir bezüglich Aufbau der Software und Architektur
|
||||
- Gerade werden einzelne Funktionen erstellt, Daten werden ungefiltert in die Mongo DB geschrieben, anschließend
|
||||
Bereinigung und Übertragung in die Postgres
|
||||
- Vorstellung aktueller Repo-Struktur durch Tristan, relevanter Code befindet sich im src-Ordner
|
||||
- Vorstellung aktueller Repo-Struktur durch Tristan
|
||||
- Relevanter Code befindet sich im src-Ordner
|
||||
|
||||
- Wie kann sichergestellt werden, dass unsere Ziele erreicht werden?
|
||||
- Zeitplan/Meilensteinplan gewünscht
|
||||
- Wann soll was erreicht werden?
|
||||
- Burndown-Diagramm
|
||||
-> Umsetzung durch Team beim Präsenzmeeting am 09.09.2023
|
||||
- Burn-down-Diagramm
|
||||
⇒ Umsetzung durch Team beim Präsenzmeeting am 09.09.2023
|
||||
|
||||
- Kurze Vorstellung der bearbeiteten Themen: NER + Sentiment (Sebastian), Finanzdaten (Tristan), UI (Kim),
|
||||
Datentransfer (Philipp)
|
||||
|
Reference in New Issue
Block a user