docs/dockerfile (#529)

Co-authored-by: Philipp Horstenkamp <philipp@horstenkamp.de>
2026-02-13 22:17:38 +01:00 · 2024-01-07 12:23:54 +01:00
parent f72d24916f
commit 824e9e48ca
2 changed files with 15 additions and 3 deletions
@@ -143,7 +143,7 @@ dennoch relevante Daten von der Seite zu scrapen. [3]

 Im Unternehmensregister werden veröffentlichungspflichtige Daten
 deutscher Unternehmen wie etwa die Firmengründung oder Liquidation in
-elektronischer Art zur Verfügung gestellt. [@unternehmensregister]
+elektronischer Art zur Verfügung gestellt. [4]

 Besonders relevant, um überhaupt ein Inventar an Unternehmen aufstellen
 zu können, sind die dort zu findenden Registerinformationen. In diesen
@@ -165,7 +165,7 @@ AG\" auch Einträge wie die Bayer Gastronomie GmbH zu Tage:
 <img src="Abbildungen/suche_bayer.PNG" height=450 />

 Auch eine Anpassung des Suchbegriffes durch die Verwendung regulärer
-Ausdrücke (z.B. \^̈Bayer AG\$)̈ kann die Qualität der Ergebnisse nicht
+Ausdrücke (z.B. `^̈Bayer AG$`)̈kann die Qualität der Ergebnisse nicht
 verbessern. Da es sich bei diesen ähnlichen Unternehmen jedoch auch
 tatsächlich um Tochtergesellschaften handeln könnte, die für die
 Verflechtsungsanalyse besonders interessant sind, werden nicht passende
@@ -295,6 +295,7 @@ class News:

    def to_dict(self) -> dict:
        return asdict(self)
+```

 Neben dem Inhalt des Artikels in Form des Titels, sowie dem Text werden
 wertvolle Meta-Informationen wie das Veröffentlichungsdatum sowie der
@@ -391,6 +392,7 @@ class HandelsblattRSS:
        return " ".join(
            [elem.text.replace("\n", " ") for elem in soup.find_all("p")][:]
 	)
+```

 Die eigentlichen Inhalte des Artikels weisen kein Standard Format mehr
 auf, auch wenn diese HTML basiert sind, und müssen daher mit einer
@@ -739,6 +741,7 @@ print(f"Number of inserted entries: {inserted_entries}")
 return inserted_entries

 news_dag = main()
+```

 ### Literaturverzeichnis