mirror of
https://github.com/fhswf/aki_prj23_transparenzregister.git
synced 2025-06-22 20:43:56 +02:00
docs/dockerfile (#529)
Co-authored-by: Philipp Horstenkamp <philipp@horstenkamp.de>
This commit is contained in:
@ -143,7 +143,7 @@ dennoch relevante Daten von der Seite zu scrapen. [3]
|
||||
|
||||
Im Unternehmensregister werden veröffentlichungspflichtige Daten
|
||||
deutscher Unternehmen wie etwa die Firmengründung oder Liquidation in
|
||||
elektronischer Art zur Verfügung gestellt. [@unternehmensregister]
|
||||
elektronischer Art zur Verfügung gestellt. [4]
|
||||
|
||||
Besonders relevant, um überhaupt ein Inventar an Unternehmen aufstellen
|
||||
zu können, sind die dort zu findenden Registerinformationen. In diesen
|
||||
@ -165,7 +165,7 @@ AG\" auch Einträge wie die Bayer Gastronomie GmbH zu Tage:
|
||||
<img src="Abbildungen/suche_bayer.PNG" height=450 />
|
||||
|
||||
Auch eine Anpassung des Suchbegriffes durch die Verwendung regulärer
|
||||
Ausdrücke (z.B. \^̈Bayer AG\$)̈ kann die Qualität der Ergebnisse nicht
|
||||
Ausdrücke (z.B. `^̈Bayer AG$`)̈kann die Qualität der Ergebnisse nicht
|
||||
verbessern. Da es sich bei diesen ähnlichen Unternehmen jedoch auch
|
||||
tatsächlich um Tochtergesellschaften handeln könnte, die für die
|
||||
Verflechtsungsanalyse besonders interessant sind, werden nicht passende
|
||||
@ -295,6 +295,7 @@ class News:
|
||||
|
||||
def to_dict(self) -> dict:
|
||||
return asdict(self)
|
||||
```
|
||||
|
||||
Neben dem Inhalt des Artikels in Form des Titels, sowie dem Text werden
|
||||
wertvolle Meta-Informationen wie das Veröffentlichungsdatum sowie der
|
||||
@ -391,6 +392,7 @@ class HandelsblattRSS:
|
||||
return " ".join(
|
||||
[elem.text.replace("\n", " ") for elem in soup.find_all("p")][:]
|
||||
)
|
||||
```
|
||||
|
||||
Die eigentlichen Inhalte des Artikels weisen kein Standard Format mehr
|
||||
auf, auch wenn diese HTML basiert sind, und müssen daher mit einer
|
||||
@ -739,6 +741,7 @@ print(f"Number of inserted entries: {inserted_entries}")
|
||||
return inserted_entries
|
||||
|
||||
news_dag = main()
|
||||
```
|
||||
|
||||
### Literaturverzeichnis
|
||||
|
||||
|
Reference in New Issue
Block a user