mirror of
https://github.com/fhswf/aki_prj23_transparenzregister.git
synced 2025-04-23 13:22:35 +02:00
5.2 KiB
5.2 KiB
Weekly 14: 09.11.2023
Teilnehmer
- Prof. Arinir
- Tristan Nolde
- Tim Ronneburg
- Phillip Horstenkamp
- Kim Mesewinkel-Risse
- Sascha Zhu
- Sebastian Zeleny
Themen
Zum Thema Allgemeines
- Sebastian und Tristan haben sich mit den anderen Projektgruppen ausgetauscht
- Es gab daraus Erkenntnisse, u.a. zur Strukturierung der Dokumentation
Zum Thema Dokumentation und Allgemeines:
- Die Projektgruppe hat die Dokumentation strukturiert.
- Die Architektur ist an den drei Docker-Containern „data ingest“, „data processing“ und „visualization“ angelehnt, in diesen drei Containern werden die entsprechenden Domain-Experten ihr Wissen und ihre Umsetzung dokumentieren.
- Für ca. Mitte November ist feature freeze geplant, um dann ausreichend Zeit für die Dokumentation anzufertigen.
- Es ist geplant, das System auch lokal lauffähig zu machen, sodass die Container bzw. der Datenbank-Dump Prof. Arinir für eine eventuelle spätere Weiterführung des Projekts zur Verfügung gestellt werden können.
- In dem Nachrichten-Archiv sind aktuell 30.000 Tagesschau-Artikel und 175000 Artikel aus der Süddeutschen Zeitung enthalten, es wird vorgeschlagen, für die weitere Verarbeitung wird vorgeschlagen, bestimmte Nachrichten vorzufiltern.
Zum Thema Visualisierung:
-
Kim hat die aktuelle Visualisierung gezeigt.
-
Im Reiter "Kennzahlen" werden die Unternehmenskennzahlen jetzt grafisch angezeigt.
-
Der Reiter "Beteiligte Personen" (z.B. Kommanditist, Prokurist) ist nun gefüllt.
-
Im Reiter "Stimmung" werden nun die Nachrichtentitel mit Datums- und Quellenangabe gezeigt, der Stimmungsbarometer wird angezeigt, es soll noch ein Verlaufsplot zu den Stimmungen eingefügt werden.
-
Umsatzdaten stehen nicht für alle Unternehmen zur Verfügung, da diese in den Ursprungsdatenbanken bzw. -datenquellen in unterschiedlichen Formaten dargestellt werden und daher schwierig extrahiert werden können.
Zum Thema Verflechtungsanalyse:
- Tim hat die aktuelle Verflechtungsanalyse gezeigt.
- Für die Abschlusspräsentation soll laut Vorschlag von Prof. Arinir eine schöne "Choreografie" des Systems (insbesondere im Hinblick auf die Verflechtungen) gezeigt werden.
- In dem System kann die Verflechtung nach unterschiedlichen Relations-Typen (z.B. Inhaber, sonstiger Vertreter, Prokuristen, Kommanditisten) angezeigt werden.
- Personen werden in Rot gezeigt, Companies in Blau gezeigt, Verbindungen zwischen blau und blau sind in der Regel Tochter- und Muttergesellschaften.
- Wenn eine Firma viele Verflechtungen haben, wird die Node als große Kugel angezeigt, bei wenigen Verflechtungen als kleinere Kugel.
- Für Prof. Arinir ist die Frage, was der Erkenntnisgewinn aus der Verflechtungsanalyse ist; Prof. Arinir hatte die Idee zu dem Projekt aus der Zusammenarbeit mit einer Corporate-Intelligence-Firma; Bekannte Analysefirmen wie Creditreform und Palturai seien laut Prof. Arinir in der Lage, aus Unternehmensdaten verschiedene Zusammenhänge zu erkennen, ohne die Unternehmen bzw. die unternehmensnahe Personen selbst detaillierter zu kennen.
- An dem Beispiel "01024 Telefondienste GmbH" konnte man laut Tristan interessante Cluster bzw. Muster in dem Unternehmensnetzwerk sehen, bei dem A Prokurist von der Firma 1 und die andere Person B Geschäftsführer von der Firma 2 war und umgekehrt (gegenseitige Referenzierung), aktuell wird jedoch diese Verflechtung aufgrund bestimmter Probleme nicht mehr angezeigt.
- Prof. Arinir schlägt vor, die Gesamtmenge an Daten einschränken und einen Vorfilter setzen; Prof. Arinir ist beispielsweise an der Frage interessiert, ob es zwischen BASF und Siemens irgendeine Verflechtung gibt (z.B. über Vorstände, Aufsichtsräte, Wirtschaftsprüfer), wobei man hier über die Gesamtmenge der Nodes vorfiltern kann.
- Beim Thema Aufsichtsrat gibt es aktuell ein Problem mit Name Matching, da keine Geburtsdaten verfügbar sind und man nicht sicher ist, ob der eine Max Mustermann die richtige Person ist (teilweise kennt man nur die Nachnamen der Aufsichtsräte).
- Netzwerkkennwerte (z.B. Centrality) werden jedes Mal neu ausgerechnet.
- Konzentrierte Kreismuster sieht man u.a. bei Unternehmen (z.B. AASP Filmproduktionsgesellschaft mbH & Co. Leonie KG), die extrem viele (ca. 100) Kommanditisten haben.
- Für Prof. Arinir sind Querbezüge zwischen einzelnen Kreismustern (Clustern) sehr interessant, z.B. zwischen der Aurelius KG und der Aurelius Verwaltungs GmbH; es ist auffällig, dass die Personen, die mit diesen beiden Firmen gleichzeitig verknüpft sind, denselben Nachnamen (Esser) haben; daraus kann man bestimmte Zusammenhänge ableiten.
- Die Ladegeschwindigkeit bei der Verflechtungsanalyse ist extrem langsam, allein das HTML noch einmal aufzurufen, dauert zwei Minuten, obwohl schon Vorberechnungen stattfinden; die HTML hat 233 KB und hat einen Lib-Ordner mit ca. 240 KB.
- Das Code-Deployment läuft automatisch, ca. 20 Minuten nach dem Mergen in "main" ist es deployt.
Abgeleitete Action Items
Action Item | Verantwortlicher | Deadline |
---|---|---|
Weitere Bearbeitung des Projekts (keine konkreten Action Items) | Alle | - |