4.3 KiB

Weekly 6: 09.06.2023

Teilnehmer

  • Prof. Arinir
  • Tristan Nolde
  • Tim Ronneburg
  • Phillip Horstenkamp
  • Kim Mesewinkel-Risse
  • Sascha Zhu
  • Sebastian Zeleny

Themen

  • Stepstone Projekt:
    • Gewünscht wird ein initialer Austausch mit Stepstone
    • Befürchtung ist, dass es zu einem Hinderniss wird
    • Entscheidung liegt daher beim Projekt-Team
    • Weitere Informationen sind nicht aktuell nicht vorhanden
    • Vorschlag Prof. Arinir: Sollte das Thema nochmal zum Team getragen werden, wird der aktuelle Stand vorgestellt und der Link zum Repo wird geteilt. Darüber hinaus werden keine Ressourcen zugesprochen.
    • Vorstellung vorheriger Absprache und Feedback:
      • Ändert sich der Scope - Nein
      • NDA - Nein
      • Veröffentlichung - maximal Impressionen
      • Was muss geleistet werden - nicht direkt an Stepstone sondern über FH als Mediator
  • Sollen Präsentationen vorab zur Verfügung gestellt werden?
    • Einige Tage vorher in das Git Repo. hochladen und Prof. Arinir benachrichtigen
  • Rücksprache Seminarpräsentationen
    • Verflechtungsanalyse:
      • Graphen Theorie
      • Social Network Analyse
      • Erweiterung über Graphen Theorie hinaus
      • Fokus auf Anwendung und Mehrwert, weniger genauer mathematischer Lösung
      • Feedback:
        • Präsentation scheint sehr umfangreich; Wunsch nach Reduzierung der Folienanzahl
        • Formeln hinter den Analysen spannend, ggf. doch drauf eingehen, um Kennzahl in Kontext zu setzen
    • Visualiserung:
      • Prinzipien
      • Vorteile
      • Bibliotheken für Umsetzung (Network X, PyViz, ...)
      • Effekt von Farbwahl
      • Erste Umsetzung im Jupyter Notebook
      • Feedback:
        • Es werden extem viele Datenpunkte angezeigt werden müssen, wie wird dies in den Bibliotheken umgesetzt? Kann dort gefiltert werden?
          • Wenn nicht direkt am Graphen (der Darstellung) gefiltert werden kann, dann frühzeitig filtern, bevor der Graph gebaut wird
    • Datenspeicherung
      • Erste Integration von Visualisierung mit Datenspeicherung
      • Vorstellung der "Datencluster"
        • Stammdaten
        • Stimmungsdaten
        • Social Graph
        • Zeitseriendaten
      • Relationales DB Modell
      • Fokus ebenfalls auf Abfrage der Daten für Folge-Projekte wie Visualiserung und Mehrwert fürs Team, weniger Theorie
      • Feedback:
        • Es müssen Erfahrungen mit der Library und Darstellung gesammelt werden, um den Mehrwert der Lösung hervorzuheben
        • Modellierung der Finzanz-Kennzahlen
          • Spaltennamen sollen sprechend sein, z.B. "value" statt "sum"
          • Präferenz zum Modell mit einzelnem Eintrag mit mehren Kennzahl Spalten stallt generischer Lösung über Enum
    • Text Mining
      • Fokus auf Sentiment Analyse
      • Vergleich verschiedener Lösungen und ML Modelle
      • Abschließendes Fazit, welches Tool am besten geeignet ist
    • Daten Extraktion
      • Fokus auf Web Mining/Scraping im Rahmen des Transparenzregisters
      • Datenquellen
        • API
        • Websites (HTML)
        • PDF
      • Datenextraktion aus diesen Quellen
      • Orchestrierung mit Airflow
    • DevOps
      • Dependency Management in Python
        • Standard requirements.txt
        • pip-tools
        • poetry
      • Vorteile von Lintern
      • GitHub
        • Actions
        • Security
        • etc.
      • Feedback:
        • Git wird als State-of-the-Art angesehen und muss nicht näher erläutert werden

Abgeleitete Action Items

Action Item Verantwortlicher Deadline
Folien hochladen Projekt Team vor Präsentationstermin
Absprache Abgrenzung von Verflechtungsanalyse und Visualisierung Tim und Kim nächster Abgleich
Deployment Plan aufstellen Projekt Team nach Seminararbeiten