# Aufgabe: Inhaltliche Skizze für die Seminararbeit zur Thematik Datenspeicherung # 1. Allgemeine Anforderungen an Datenbank - **Speicherung** von strukturierten Daten, wie Kennzahlen, Stammdaten - **Skalierbarkeit:** Datenbank sollte skalierbar sein, um zukünftige Daten weiterhin zu speichern und weitere Unternehmen hinzuzufügen - **Sicherheit:** Die Datenbank muss Funktionen unterstützen, um die Datenvor unbefugtem Zugriff zu schützen. - **Datensicherung- und Wiederherstellung: ** Die Datenbank muss Funktionen zur Sicherung und Wiederherstellung unterstützen. - **Leistung:** Die Performance der Datenbank ist eher zweitrangig, da die Abfrage nicht hochdynamisch sein muss. Ausserdem werden nicht viele Anfragen erwartet. - **Integration:** Die Datenbank muss sich in ein Python Framework einbinden lassen und mit dem bevorzugten Frontend Daten austauschen können. # 2. Datenarten Welche Daten erwarten wir im Projekt? \ Cluster, wie z.B. Stammdaten, Stimmungsdaten, Social Graph, Zeitseriendaten/Historien > Abstimmung mit den Bereichen Textmining und Datenbeschaffung über verwendete Daten und Formulierung von Anforderungen an Daten. ## 2.1 strukturierte Daten Was sind strukturierte Daten? ## 2.2 unstrukturierte Daten Was sind unstrukturierte Daten? > Definiere eine Anforderung an die Struktur der Daten. # 3. Arten von Datenbanken ## 3.1 Relational Was ist eine reltionale Datenbank? Wie werden Daten gespeichert? Beispiel für relationale Datenbank ## 3.2 Graph Was ist eine Graph Datenbank? Wie werden Daten gespeichert? Beispiel für Graph Datenbank ## 3.3 Zeitserien Was ist eine Zeitserien Datenbank? Wie werden Daten gespeichert? Beispiel für Zeitserien Datenbank > Kurzvorstellung von Datenbanksystemen # 4. DBS Transparenzregister ## 4.1 relationales Datenbankmodell > Modell zur Abbildung der Relationen im Projekt Transparenzregister ## 4.2 verteilte Datenbank oder ein System Ein DBS: Wenn nur ein Datenbanksystem verwendet wird, muss nur ein System gepflegt und integriert werden. - Vorteil: einfache Verwaltung und schnelle Abfrage von Datenbeziehungen verteiltes System: spezialisierte Datenbank für jeden Datenytp, wie z.B. Zeitseriendaten oder Graph Daten > Definiere eine Empfehlung/Anforderung für das Projekt Transparenzregister. ## 4.3 Analyse zur Auswahl eines Datenbanksystems Was sollte bei der Auswahl eines Datenbanksystems beachtet werden? > Empfehlungen für DBS-Auswahl ## 4.4 Anbindung an Front- und Backend Wie kann das DBS an das Front- und Backend angebunden werden? > Jupyter Notebook mit Beispiel ## 4.5 Abfragen in der Datenbank Wie können Unternehmensdaten abgefragt werden? Wie können Verflechtungen abgefragt werden? > Jupyter Notebook mit Beispiel