# Unternehmensregister

## Fetch Auszug

In [1]:
import os
import glob

In [2]:
def wait_for_download_condition(
    path: str, num_files: int, pattern: str = "*.xml"
) -> bool:
    return len(glob.glob1(path, pattern)) > num_files


def get_num_files(path: str, pattern: str = "*.xml") -> int:
    return len(glob.glob1(path, pattern))


def rename_latest_file(path: str, filename: str, pattern: str = "*.xml"):
    list_of_files = [os.path.join(path, file) for file in glob.glob1(path, pattern)]
    latest_download = max(list_of_files, key=os.path.getctime)
    os.rename(latest_download, os.path.join(path, filename))

In [3]:
import os
from pathlib import Path

from selenium import webdriver


def configure_webdriver(
    headless: bool = True, download_dir: list[str] = ["data", "Unternehmensregister"]
) -> webdriver:
    options = webdriver.ChromeOptions()

    download_path = os.path.join(str(Path.cwd()), *download_dir)
    print(download_path)

    preferences = {
        "profile.default_content_settings.popups": 0,
        "safebrowsing.enabled": True,
        "download": {
            "directory_upgrade": True,
            "prompt_for_download": False,
            "extensions_to_open": "",
            "default_directory": download_path,
        },
    }
    if headless:
        options.add_argument("--headless=new")
    options.add_experimental_option("prefs", preferences)

    return webdriver.Chrome(options=options)

In [4]:
from tqdm import tqdm
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC


def scrape(driver, query: str, dir: str):
    driver.get("https://www.unternehmensregister.de/ureg/")
    # Accept Cookies
    driver.find_elements(
        By.XPATH, '//button[text()="Nur technisch notwendige Cookies akzeptieren"]'
    )[0].click()
    # Enter search query
    driver.find_elements(By.ID, "globalSearchForm:extendedResearchCompanyName")[
        0
    ].send_keys(query)
    # Trigger search
    driver.find_elements(By.ID, "globalSearchForm:btnExecuteSearchOld")[0].click()
    # Wait for results
    wait = WebDriverWait(driver, 5)
    wait.until(
        lambda driver: driver.current_url != "https://www.unternehmensregister.de/ureg/"
    )

    num_pages = int(
        driver.find_element(By.XPATH, '//*[@class="page_count"]').text.split(" ")[0]
    )

    processed_companies = []

    for page_index in tqdm(range(num_pages)):
        # Find all "Registerinformationen"
        companies_tab = driver.find_elements(
            By.LINK_TEXT, "Registerinformationen des Registergerichts"
        )
        company_names = [
            elem.text
            for elem in driver.find_elements(
                By.XPATH, '//div[@class="company_result"]/span/b'
            )
        ]
        for index, company_link in enumerate(companies_tab):
            company_name = company_names[index]
            if company_name in processed_companies:
                continue
            # Go to intermediary page
            company_link.click()
            # Trigger next redirect
            driver.find_element(By.LINK_TEXT, "Registerinformationen anzeigen").click()
            # Trigger SI download
            driver.find_element(By.LINK_TEXT, "SI").click()
            # Show shopping cart - TODO evaluate restructuring behaviour by filling cart first and then bulk downloading
            wait.until(
                EC.visibility_of_element_located(
                    (By.LINK_TEXT, "Dokumentenkorb ansehen")
                )
            )
            driver.find_element(By.LINK_TEXT, "Dokumentenkorb ansehen").click()
            # Get document
            xpath = "//input[@type='submit']"
            elems = driver.find_elements(By.TAG_NAME, "input")
            elems[-2].click()

            wait.until(
                EC.visibility_of_element_located((By.ID, "paymentFormOverview:btnNext"))
            )
            driver.find_element(By.ID, "paymentFormOverview:btnNext").click()

            wait.until(
                EC.visibility_of_element_located((By.LINK_TEXT, "Zum Dokumentenkorb"))
            )
            driver.find_element(By.LINK_TEXT, "Zum Dokumentenkorb").click()

            num_files = get_num_files(dir)
            driver.find_element(By.CLASS_NAME, "download-wrapper").click()

            try:
                wait.until(lambda x: wait_for_download_condition(dir, num_files))
                rename_latest_file(
                    dir,
                    f"{company_name.replace(' ', '_').replace('/','_')}.xml",
                )
                processed_companies.append(company_name)
            except:
                print(f"Could not process {company_name}")
            for i in range(6):
                driver.back()
        driver.find_element(By.XPATH, '//*[@class="fas fa-angle-right"]').click()
    driver.close()
    print(processed_companies)

In [5]:
import pandas as pd

df = pd.read_excel(
    "./data/study_id42887_top-100-unternehmen-deutschland.xlsx",
    sheet_name="Toplist",
    skiprows=1,
)
df.head()

Unnamed: 0.1,Unnamed: 0,Name,IPO Status,Exchange,Listing ID,Founding Year,ISIC,Headquarters,Street,City,Postal Code,Phone,Website,Email,End of fiscal year,2019,2020,2021,CAGR*,Employees*
0,1,Volkswagen,PUBLIC,XETR,VOW3,1984.0,2910 - Motor Vehicles,Germany,Berliner Ring 2,Wolfsburg,38440,+49-536190,www.volkswagenag.com,,12/31,282839.18,254299.32,296086.81,0.020497,672800.0
1,2,Mercedes-Benz Group,PUBLIC,XMUN,DAI,1987.0,2910 - Motor Vehicles,Germany,Mercedes Street 120,Stuttgart,70372,+49-7111795256,www.group.mercedes-benz.com,,12/31,193400.1,138942.51,158449.05,-0.071117,172425.0
2,3,Deutsche Telekom,PUBLIC,XFRA,DTE,1990.0,61 - Telecommunications,Germany,Friedrich-Ebert-Allee 140,Bonn,53113,+49-2281814949,www.telekom.com,,12/31,90125.38,115235.87,128753.98,0.110871,216528.0
3,4,Bmw,PUBLIC,XDUS,BMW3,1984.0,2910 - Motor Vehicles,Germany,Petuelring 130,Munich,80788,+49-8938224272,www.bmwgroup.com,,12/31,117613.06,113581.49,133364.51,0.048403,118909.0
4,5,Deutsche Post,PUBLIC,XMUN,DPW,1989.0,5320 - Courier Services,Germany,Charles-De-Gaulle-Straße 20,Bonn,53113,+49-22818263636,www.deutschepost.de,,12/31,70914.68,76119.57,96739.44,0.091205,592263.0


In [9]:
processes = []
for x in df.Name:
    search_query = x

    driver = configure_webdriver(
        download_dir=["data", "Unternehmensregister", search_query.strip()]
    )
    process = Process(
        target=scrape_process,
        args=(
            driver,
            search_query,
            f"./data/Unternehmensregister/{search_query.strip()}",
        ),
    )
    process.start()
    processes.append(process)

c:\Users\trist\Documents\Code\M.Sc\aki_prj23_transparenzregister\Jupyter\API-tests\Unternehmensregister\data\Unternehmensregister\Volkswagen


AttributeError: Can't pickle local object '_createenviron.<locals>.encodekey'

## Analyze Auszug

In [2]:
import os

num_files = 0
for folder in os.listdir("./data/Unternehmensregister/scraping/"):
    files = os.listdir("./data/Unternehmensregister/scraping/" + folder)
    num_files += len(files)
num_files

3405

In [1]:
import json
import glob
import xmltodict

In [3]:
def transform_xml_to_json(source_dir: str, target_dir: str):
    for source_path in [
        os.path.normpath(i) for i in glob.glob(source_dir + "**/*.xml", recursive=True)
    ]:
        print(source_path)
        target_path = os.path.join(
            target_dir, source_path.split("\\")[-1].replace(".xml", ".json")
        )

        with open(source_path, "r", encoding="utf-8") as source_file:
            try:
                data = xmltodict.parse(source_file.read().encode())
                with open(target_path, "w", encoding="utf-8") as json_file:
                    json_file.write(json.dumps(data))
            except:
                """"""


transform_xml_to_json(
    "./data/Unternehmensregister/scraping/", "./data/Unternehmensregister/export/"
)

data\Unternehmensregister\scraping\1&1\123fliegenfreiGmbH.xml
data\Unternehmensregister\scraping\1&1\1AAutenriethKunststofftechnikGmbHCoKG.xml
data\Unternehmensregister\scraping\1&1\1ABlumenGriesbaumInhPhilippZähringereK.xml
data\Unternehmensregister\scraping\1&1\1AlfdorferSolarbetriebsGmbHCoKG.xml
data\Unternehmensregister\scraping\1&1\1FreiburgerSolarfondsBeteiligungsKG.xml
data\Unternehmensregister\scraping\1&1\1GussMaulburgGmbH.xml
data\Unternehmensregister\scraping\1&1\1ServicesGmbH.xml
data\Unternehmensregister\scraping\1&1\1StaigerGrundstücksverwaltungGmbHCoKG.xml
data\Unternehmensregister\scraping\1&1\1stClassMarketingGmbH.xml
data\Unternehmensregister\scraping\1&1\1WeinheimerBestattungsunternehmeneGVereinigteWeinheimerHemsbacherSchreinermeister.xml
data\Unternehmensregister\scraping\Adidas\adidasAG.xml
data\Unternehmensregister\scraping\Adidas\adidasBeteiligungsgesellschaftmbH.xml
data\Unternehmensregister\scraping\Adidas\adidasCDCImmobilieninvestGmbH.xml
data\Unternehmensregi

In [4]:
from tqdm import tqdm

for file in tqdm(glob.glob1("./data/Unternehmensregister/", "*.json")):
    path = os.path.join("./data/Unternehmensregister/", file)
    with open(path, "r", encoding="utf-8") as file_object:
        data = json.loads(file_object.read())

0it [00:00, ?it/s]


In [52]:
import re
from aki_prj23_transparenzregister.models.company import Company


def parse_stakeholder(data: dict) -> list:
    if "Natuerliche_Person" in data["Beteiligter"]:
        return {
            "name": {
                "firstname": data["Beteiligter"]["Natuerliche_Person"]["Voller_Name"][
                    "Vorname"
                ],
                "lastname": data["Beteiligter"]["Natuerliche_Person"]["Voller_Name"][
                    "Nachname"
                ],
            },
            "date_of_birth": data["Beteiligter"]["Natuerliche_Person"]["Geburt"][
                "Geburtsdatum"
            ]
            if "Geburt" in data["Beteiligter"]["Natuerliche_Person"]
            else None,
            "location": {
                "city": data["Beteiligter"]["Natuerliche_Person"]["Anschrift"][-1][
                    "Ort"
                ]
                if type(data["Beteiligter"]["Natuerliche_Person"]["Anschrift"]) == list
                else data["Beteiligter"]["Natuerliche_Person"]["Anschrift"]["Ort"]
            },
            "role": data["Rolle"]["Rollenbezeichnung"]["content"],
        }
    if "Organisation" in data["Beteiligter"]:
        return {
            "role": "Organisation",
            "description": data["Beteiligter"]["Organisation"]["Bezeichnung"][
                "Bezeichnung_Aktuell"
            ],
            "location": {
                "city": data["Beteiligter"]["Organisation"]["Anschrift"]["Ort"],
                "street": data["Beteiligter"]["Organisation"]["Anschrift"]["Strasse"]
                if "Strasse" in data["Beteiligter"]["Organisation"]["Anschrift"]
                else None,
                "house_number": data["Beteiligter"]["Organisation"]["Anschrift"][
                    "Hausnummer"
                ]
                if "Hausnummer" in data["Beteiligter"]["Organisation"]["Anschrift"]
                else None,
                "zip_code": data["Beteiligter"]["Organisation"]["Anschrift"][
                    "Postleitzahl"
                ],
            },
        }


def loc_from_rechtstraeger(data: dict) -> dict:
    return {
        "city": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]["Ort"],
        "zip_code": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]["Postleitzahl"],
        "street": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]["Strasse"]
        if "Strasse"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]
        else None,
        "house_number": data["XJustiz_Daten"]["Fachdaten_Register"][
            "Basisdaten_Register"
        ]["Rechtstraeger"]["Anschrift"]["Hausnummer"]
        if "Hausnummer"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]
        else None,
    }


def loc_from_organisation(data: dict) -> dict:
    return {
        "city": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]["Ort"],
        "zip_code": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]["Postleitzahl"],
        "street": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]["Strasse"]
        if "Strasse"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]
        else None,
        "house_number": data["XJustiz_Daten"]["Fachdaten_Register"][
            "Basisdaten_Register"
        ]["Organisation"]["Anschrift"]["Hausnummer"]
        if "Hausnummer"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]
        else None,
    }


def loc_from_beteiligung(data: dict) -> dict:
    return {
        "city": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][
            0
        ]["Beteiligter"]["Organisation"]["Anschrift"]["Ort"],
        "zip_code": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
            "Beteiligung"
        ][0]["Beteiligter"]["Organisation"]["Anschrift"]["Postleitzahl"],
        "street": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][
            0
        ]["Beteiligter"]["Organisation"]["Anschrift"]["Strasse"]
        if "Strasse"
        in data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][0][
            "Beteiligter"
        ]["Organisation"]["Anschrift"]
        else None,
        "house_number": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
            "Beteiligung"
        ][0]["Beteiligter"]["Organisation"]["Anschrift"]["Hausnummer"]
        if "Hausnummer"
        in data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][0][
            "Beteiligter"
        ]["Organisation"]["Anschrift"]
        else None,
    }


def name_from_rechtstraeger(data: dict) -> str:
    return data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
        "Rechtstraeger"
    ]["Bezeichnung"]["Bezeichnung_Aktuell"]


def name_from_organisation(data: dict) -> str:
    return data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
        "Organisation"
    ]["Bezeichnung"]["Bezeichnung_Aktuell"]


def name_from_beteiligung(data: dict) -> str:
    return data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][0][
        "Beteiligter"
    ]["Organisation"]["Bezeichnung"]["Bezeichnung_Aktuell"]


# TODO Not present in all companies - possibly map using name of company ...
def map_rechtsform(company_name: str, data: dict) -> str:
    try:
        return data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Rechtsform"]["content"]
    except:
        if (
            company_name.endswith("GmbH")
            or company_name.endswith("UG")
            or company_name.endswith("UG (haftungsbeschränkt)")
        ):
            return "Gesellschaft mit beschränkter Haftung"
        elif company_name.endswith("SE"):
            return "Europäische Aktiengesellschaft (SE)"
        elif company_name.endswith("KG"):
            return "Kommanditgesellschaft"
        return None


def map_stammkapital(data: dict, company_type: str) -> str:
    capital = {"Zahl": 0, "Waehrung": ""}
    if company_type == "Kommanditgesellschaft":
        if "Zusatzangaben" not in data["XJustiz_Daten"]["Fachdaten_Register"]:
            return None
        capital_type = "Hafteinlage"
        base = data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
            "Personengesellschaft"
        ]["Zusatz_KG"]["Daten_Kommanditist"]
        if type(base) == "list":
            for entry in base:
                # TODO link to persons using Ref_Rollennummer then extract ["Hafteinlage"] as below
                capital["Zahl"] = capital["Zahl"] + entry["Zahl"]
                # TODO Improve multi assignment
                capital["Waehrung"] = entry["Waehrung"]
        elif type(base) == "dict":
            capital = base["Hafteinlage"]
    elif company_type in [
        "Gesellschaft mit beschränkter Haftung",
        "Europäische Aktiengesellschaft (SE)",
        "Aktiengesellschaft",
        "Kommanditgesellschaft auf Aktien",
        "Rechtsform ausländischen Rechts HRB",
    ]:
        if "Zusatzangaben" not in data["XJustiz_Daten"]["Fachdaten_Register"]:
            return None
        if (
            "Zusatz_GmbH"
            in data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
                "Kapitalgesellschaft"
            ]
        ):
            capital_type = "Stammkapital"
            capital = data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
                "Kapitalgesellschaft"
            ]["Zusatz_GmbH"]["Stammkapital"]
        elif (
            "Zusatz_Aktiengesellschaft"
            in data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
                "Kapitalgesellschaft"
            ]
        ):
            capital_type = "Grundkapital"
            capital = data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
                "Kapitalgesellschaft"
            ]["Zusatz_Aktiengesellschaft"]["Grundkapital"]["Hoehe"]
    elif company_type in [
        "Einzelkaufmann",
        "Einzelkauffrau",
        "eingetragene Genossenschaft",
        "Partnerschaft",
        "Einzelkaufmann / Einzelkauffrau",
        "Offene Handelsgesellschaft",
        "Partnerschaftsgesellschaft",
        None,
    ]:
        return None
    else:
        return None
    return {
        "value": capital["Zahl"],
        "currency": capital["Waehrung"],
        "type": capital_type,
    }


def map_geschaeftszweck(data: dict) -> str:
    try:
        return data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Gegenstand_oder_Geschaeftszweck"
        ]
    except:
        return None


def map_founding_date(data: dict) -> str:
    text = str(data)
    entry_date = re.findall(
        r".Tag der ersten Eintragung:(\\n| )?(\d{1,2}\.\d{1,2}\.\d{2,4})", text
    )
    if len(entry_date) == 1:
        return entry_date[0][1]

    entry_date = re.findall(
        r".Gesellschaftsvertrag vom (\d{1,2}\.\d{1,2}\.\d{2,4})", text
    )
    if len(entry_date) == 1:
        return entry_date[0]

    if "Eintragungstext" in data["XJustiz_Daten"]["Fachdaten_Register"]["Auszug"]:
        if (
            type(
                data["XJustiz_Daten"]["Fachdaten_Register"]["Auszug"]["Eintragungstext"]
            )
            == "list"
        ):
            temp = data["XJustiz_Daten"]["Fachdaten_Register"]["Auszug"][
                "Eintragungstext"
            ][0]["Text"]
            results = re.findall(r"\d{1,2}\.\d{1,2}\.\d{2,4}", temp)
            if len(temp) == 1:
                return results[0]
    if (
        "Gruendungsmetadaten"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"]
    ):
        temp = data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Gruendungsmetadaten"
        ]["Gruendungsdatum"]
        return ".".join(reversed(temp.split("-")))
    # No reliable answer
    # raise ValueError()
    return None


def map_unternehmensregister_json(data: dict) -> dict:
    result = {"relationships": []}

    # TODO Refactor mapping - this is a nightmare...
    result["id"] = {
        "hr_number": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
            "Instanzdaten"
        ]["Aktenzeichen"],
        "district_court": {
            "name": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
                "Beteiligung"
            ][1]["Beteiligter"]["Organisation"]["Bezeichnung"]["Bezeichnung_Aktuell"]
            if "Organisation"
            in data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][1][
                "Beteiligter"
            ]
            else data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][
                1
            ]["Beteiligter"]["Natuerliche_Person"]["Voller_Name"]["Nachname"],
            "city": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
                "Beteiligung"
            ][1]["Beteiligter"]["Organisation"]["Sitz"]["Ort"]
            if "Organisation"
            in data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][1][
                "Beteiligter"
            ]
            else data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][
                1
            ]["Beteiligter"]["Natuerliche_Person"]["Anschrift"]["Ort"],
        },
    }
    result["name"] = name_from_beteiligung(data)

    result["location"] = loc_from_beteiligung(data)
    result["last_update"] = data["XJustiz_Daten"]["Fachdaten_Register"]["Auszug"][
        "letzte_Eintragung"
    ]
    # TODO New features --> to be tested
    result["company_type"] = map_rechtsform(result["name"], data)
    result["share_capital"] = map_stammkapital(data, result["company_type"])
    result["business_purpose"] = map_geschaeftszweck(data)
    result["founding_date"] = map_founding_date(data)

    for i in range(
        2, len(data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"])
    ):
        people = parse_stakeholder(
            data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][i]
        )
        result["relationships"].append(people)
    return Company(**result)

In [4]:
import os
import json
import dataclasses
from tqdm import tqdm

In [53]:
for file in tqdm(glob.glob1("./data/Unternehmensregister/export", "*.json")):
    path = os.path.join("./data/Unternehmensregister/export", file)
    with open(path, "r", encoding="utf-8") as file_object:
        print(path)
        data = json.loads(file_object.read())
        company: Company = map_unternehmensregister_json(data)

        name = "".join(e for e in company.name if e.isalnum())[:50]

        with open(
            f"./data/Unternehmensregister/transformed/{name}.json",
            "w+",
            encoding="utf-8",
        ) as export_file:
            json.dump(dataclasses.asdict(company), export_file, ensure_ascii=False)

  0%|          | 0/3381 [00:00<?, ?it/s]

  3%|▎         | 106/3381 [00:00<00:06, 536.79it/s]

./data/Unternehmensregister/export\01019TelefondiensteGmbH.json
./data/Unternehmensregister/export\01024TelefondiensteGmbH.json
./data/Unternehmensregister/export\01050comGmbH.json
./data/Unternehmensregister/export\11DeMailGmbH.json
./data/Unternehmensregister/export\11EnergyGmbH.json
./data/Unternehmensregister/export\11LogistikGmbH.json
./data/Unternehmensregister/export\11MailMediaApplicationsSE.json
./data/Unternehmensregister/export\11MailMediaDevelopmentTechnologyGmbH.json
./data/Unternehmensregister/export\11MailMediaGmbH.json
./data/Unternehmensregister/export\11MailMediaServiceGmbH.json
./data/Unternehmensregister/export\11TelecomGmbH.json
./data/Unternehmensregister/export\11TelecomHoldingGmbH.json
./data/Unternehmensregister/export\11TelecommunicationSE.json
./data/Unternehmensregister/export\11TelecomSalesGmbH.json
./data/Unternehmensregister/export\11TelecomServiceMontabaurGmbH.json
./data/Unternehmensregister/export\11TelecomServiceZweibrückenGmbH.json
./data/Unternehmen

  8%|▊         | 261/3381 [00:00<00:04, 691.25it/s]

./data/Unternehmensregister/export\audiodigitalNRWGmbH.json
./data/Unternehmensregister/export\AufwindBBGmbHCoZweiundzwanzigsteBiogasKG.json
./data/Unternehmensregister/export\AufzugTechnikGrammGmbH.json
./data/Unternehmensregister/export\AugustSchäfflerGmbHCoKG.json
./data/Unternehmensregister/export\AugustSchäfflerVerwaltungsGmbH.json
./data/Unternehmensregister/export\AURELIUSActiveManagementGmbH.json
./data/Unternehmensregister/export\AURELIUSActiveManagementHoldingGmbH.json
./data/Unternehmensregister/export\AURELIUSAdvisoryAG.json
./data/Unternehmensregister/export\AURELIUSAlphaInternationalGmbH.json
./data/Unternehmensregister/export\AURELIUSAlphaInvestGmbH.json
./data/Unternehmensregister/export\AURELIUSAlphaInvestNewGmbH.json
./data/Unternehmensregister/export\AURELIUSAPARTMENTSUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\AURELIUSBetaInternationalGmbH.json
./data/Unternehmensregister/export\AureliusBeteiligungsberatungsAG.json
./data/Unternehmensregister/export

 10%|▉         | 331/3381 [00:00<00:05, 608.66it/s]

./data/Unternehmensregister/export\BASFJobmarktGmbH.json
./data/Unternehmensregister/export\BASFLampertheimGmbH.json
./data/Unternehmensregister/export\BASFLeunaGmbH.json
./data/Unternehmensregister/export\BASFLizenzGmbH.json
./data/Unternehmensregister/export\BASFLogisticsGmbH.json
./data/Unternehmensregister/export\BASFLudwigshafenGrundbesitzSECoKG.json
./data/Unternehmensregister/export\BASFMetabolomeSolutionsGmbH.json
./data/Unternehmensregister/export\BASFMobilienleasingGmbHCoKG.json
./data/Unternehmensregister/export\BASFNiedersächsischeGrundbesitzGmbH.json
./data/Unternehmensregister/export\BASFPensionskasseVVaG.json
./data/Unternehmensregister/export\BASFPerformancePolymersGmbH.json
./data/Unternehmensregister/export\BASFPersonalCareandNutritionGmbH.json
./data/Unternehmensregister/export\BASFPlantScienceCompanyGmbH.json
./data/Unternehmensregister/export\BASFPlantScienceGmbH.json
./data/Unternehmensregister/export\BASFPolyurethanesGmbH.json
./data/Unternehmensregister/export\B

 14%|█▍        | 485/3381 [00:00<00:04, 691.39it/s]

./data/Unternehmensregister/export\BayernMarktVeranstaltungsGmbH.json
./data/Unternehmensregister/export\BayernOsteuropaOHGTravelConsultingMarketing.json
./data/Unternehmensregister/export\BayernParkFreizeitparadiesGmbH.json
./data/Unternehmensregister/export\BayernParkKG.json
./data/Unternehmensregister/export\BayernPVGmbH.json
./data/Unternehmensregister/export\BAYERNRALLYEKarussellbetriebOHG.json
./data/Unternehmensregister/export\BayernTeleGmbHFernsehproduktionBayerischerZeitschriftenverlage.json
./data/Unternehmensregister/export\BayernTourismusMarketinggesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\BayernTouristGmbHBTGGesellschaftfürtouristischesundgastgewerblichesMarketinginBayern.json
./data/Unternehmensregister/export\BayernTreuhandAktiengesellschaftWirtschaftsprüfungsgesellschaft.json
./data/Unternehmensregister/export\BayernTreuhandInternationalAuditingAssuranceGmbHWirtschaftsprüfungsgesellschaft.json
./data/Unternehmensregister/export\BayernTreuh

 19%|█▊        | 626/3381 [00:00<00:04, 670.34it/s]

./data/Unternehmensregister/export\BizLinkSpecialCablesGermanyGmbH.json
./data/Unternehmensregister/export\BlackForxxGmbH.json
./data/Unternehmensregister/export\BMVVBaumaschinenVermietungsundVertriebsGmbH.json
./data/Unternehmensregister/export\BMWAnlagenVerwaltungsGmbH.json
./data/Unternehmensregister/export\BMWBankGmbH.json
./data/Unternehmensregister/export\BMWBeteiligungsGmbHCoKG.json
./data/Unternehmensregister/export\BMWCarITGmbH.json
./data/Unternehmensregister/export\BMWFahrzeugtechnikGmbH.json
./data/Unternehmensregister/export\BMWFinanzVerwaltungsGmbH.json
./data/Unternehmensregister/export\BMWHighPowerChargingBeteiligungsGmbH.json
./data/Unternehmensregister/export\BMWINTECBeteiligungsGmbH.json
./data/Unternehmensregister/export\BMWiVenturesGmbH.json
./data/Unternehmensregister/export\BMWMGmbHGesellschaftfürindividuelleAutomobile.json
./data/Unternehmensregister/export\BMWServiceMoserGmbHCoKG.json
./data/Unternehmensregister/export\BMWVermögensverwaltungsGmbH.json
./data/Un

 23%|██▎       | 761/3381 [00:01<00:04, 606.25it/s]

./data/Unternehmensregister/export\DematicHoldingsGmbH.json
./data/Unternehmensregister/export\DEMMerckHoldingUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\DerneueStöckachGmbHCoKG.json
./data/Unternehmensregister/export\DERReisecenterTUIGmbH.json
./data/Unternehmensregister/export\DessauerSchaltschrankundGehäusetechnikGmbH.json
./data/Unternehmensregister/export\deSterGmbH.json
./data/Unternehmensregister/export\detailMGmbH.json
./data/Unternehmensregister/export\DeutscheAnningtonHoldingsFünfGmbH.json
./data/Unternehmensregister/export\DeutscheBaumanagementGmbH.json
./data/Unternehmensregister/export\DeutscheBauundSiedlungsGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\DeutscheibwWohnundHausbaugesellschaftmbH.json
./data/Unternehmensregister/export\DeutscheLufthansaAktiengesellschaft.json
./data/Unternehmensregister/export\DeutscheLufthansaUnterstützungswerkGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\DeutschePost

 26%|██▌       | 887/3381 [00:01<00:04, 615.85it/s]

./data/Unternehmensregister/export\DHLHomeDeliveryGmbH.json
./data/Unternehmensregister/export\DHLHubLeipzigGmbH.json
./data/Unternehmensregister/export\DHLInternationalGmbH.json
./data/Unternehmensregister/export\DHLPaketGmbH.json
./data/Unternehmensregister/export\DHLSolutionsGmbH.json
./data/Unternehmensregister/export\DHLSortingCenterGmbH.json
./data/Unternehmensregister/export\DHLSupplyChainLeipzigGmbH.json
./data/Unternehmensregister/export\DHLSupplyChainManagementGmbH.json
./data/Unternehmensregister/export\DHLSupplyChainOperationsGmbH.json
./data/Unternehmensregister/export\DHLSupplyChainVASGmbH.json
./data/Unternehmensregister/export\DIAGRAMMATICDESIGNSGmbH.json
./data/Unternehmensregister/export\DiermeierEnergieGmbH.json
./data/Unternehmensregister/export\DMGMORIAcademyGmbH.json
./data/Unternehmensregister/export\DMGMORIAKTIENGESELLSCHAFT.json
./data/Unternehmensregister/export\DMGMORIBielefeldHildenGmbH.json
./data/Unternehmensregister/export\DMGMORIDeutschlandGmbH.json
./da

 31%|███▏      | 1058/3381 [00:01<00:03, 723.32it/s]

./data/Unternehmensregister/export\EnBWSolarparkBirkenfeldGmbH.json
./data/Unternehmensregister/export\EnBWSolarparkEmmingenLiptingenGmbHCoKG.json
./data/Unternehmensregister/export\EnBWSolarparkGickelfeldGmbHCoKG.json
./data/Unternehmensregister/export\EnBWSolarparkGottesgabeGmbH.json
./data/Unternehmensregister/export\EnBWSolarparkGroßLübbenauGmbHCoKG.json
./data/Unternehmensregister/export\EnBWSolarparkGöritzGmbHCoKG.json
./data/Unternehmensregister/export\EnBWSolarparkGückelhirnGmbHCoKG.json
./data/Unternehmensregister/export\EnBWSolarparkIngoldingenGmbH.json
./data/Unternehmensregister/export\EnBWSolarparkKroppenGmbHCoKG.json
./data/Unternehmensregister/export\EnBWSolarparkLauenhagenGmbH.json
./data/Unternehmensregister/export\EnBWSolarparkLindenauGmbHCoKG.json
./data/Unternehmensregister/export\EnBWSolarparkRotanderRotGmbHCoKG.json
./data/Unternehmensregister/export\EnBWSolarparkSonnewaldeGmbHCoKG.json
./data/Unternehmensregister/export\EnBWSolarparkTuningenGmbH.json
./data/Unter

 33%|███▎      | 1131/3381 [00:01<00:03, 668.02it/s]

./data/Unternehmensregister/export\EvonikIPGmbH.json
./data/Unternehmensregister/export\EvonikLogisticsServicesGmbH.json
./data/Unternehmensregister/export\EvonikMaterialsGmbH.json
./data/Unternehmensregister/export\EvonikOperationsGmbH.json
./data/Unternehmensregister/export\EvonikRealEstateGmbHCoKG.json
./data/Unternehmensregister/export\EvonikRiskandInsuranceServicesGmbH.json
./data/Unternehmensregister/export\EvonikVentureCapitalGmbH.json
./data/Unternehmensregister/export\EWDiscoverGmbH.json
./data/Unternehmensregister/export\EWEGoHOCHTIEFLadepartnerGmbHCoKG.json
./data/Unternehmensregister/export\EWEHOCHTIEFLadepartnerVerwaltungsGmbH.json
./data/Unternehmensregister/export\EWIEEINFACHGmbH.json
./data/Unternehmensregister/export\ExnerWäschereiReinigungeK.json
./data/Unternehmensregister/export\FachklinikfürAnästhesieundIntensivmedizinVahrenwaldGmbH.json
./data/Unternehmensregister/export\FacilmaGrundbesitzmanagementundserviceGmbHCoBesitzKG.json
./data/Unternehmensregister/export\F

 38%|███▊      | 1295/3381 [00:01<00:03, 679.94it/s]

./data/Unternehmensregister/export\FraSecFlughafensicherheitGmbH.json
./data/Unternehmensregister/export\FraSecFraportSecurityServicesGmbH.json
./data/Unternehmensregister/export\FraSecServicesGmbH.json
./data/Unternehmensregister/export\FRAVorfeldkontrolleGmbH.json
./data/Unternehmensregister/export\freenetAG.json
./data/Unternehmensregister/export\freenetCitylineGmbH.json
./data/Unternehmensregister/export\freenetDatenkommunikationsGmbH.json
./data/Unternehmensregister/export\freenetdeGmbH.json
./data/Unternehmensregister/export\freenetDirektGmbH.json
./data/Unternehmensregister/export\freenetDLSGmbH.json
./data/Unternehmensregister/export\freenetEnergyGmbH.json
./data/Unternehmensregister/export\freenetLogistikGmbH.json
./data/Unternehmensregister/export\freenetShopGmbH.json
./data/Unternehmensregister/export\freenetShoppingGmbH.json
./data/Unternehmensregister/export\FreibergerHoldingGmbH.json
./data/Unternehmensregister/export\FreibergerInternationaleBeteiligungsGmbH.json
./data/U

 42%|████▏     | 1435/3381 [00:02<00:02, 671.58it/s]

./data/Unternehmensregister/export\GRAMMERImmobilienVerwaltungGmbH.json
./data/Unternehmensregister/export\GRAMMERInteriorComponentsGmbH.json
./data/Unternehmensregister/export\GrammerRailwayInteriorGmbH.json
./data/Unternehmensregister/export\GRAMMERSolarGmbH.json
./data/Unternehmensregister/export\GrammerSolarPhotovoltaikGmbH.json
./data/Unternehmensregister/export\GrammersSUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\GRAMMERSystemGmbH.json
./data/Unternehmensregister/export\GrammerVerwaltungsGmbH.json
./data/Unternehmensregister/export\GrammFertigungstechnikGmbH.json
./data/Unternehmensregister/export\grammgenauGmbH.json
./data/Unternehmensregister/export\GrammGeschäftsführungGmbH.json
./data/Unternehmensregister/export\GrammGmbH.json
./data/Unternehmensregister/export\GrammGmbHCoKG.json
./data/Unternehmensregister/export\GRAMMHoldingUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\GrammImmoGmbHCoKG.json
./data/Unternehmensregister/export\GrammImmoVerwalt

 47%|████▋     | 1597/3381 [00:02<00:02, 740.85it/s]

./data/Unternehmensregister/export\HenkelGmbHFormularVerlag.json
./data/Unternehmensregister/export\HenkelHausundGrundstücksverwaltungGmbHCoKG.json
./data/Unternehmensregister/export\HenkelHenkelGmbHCoKG.json
./data/Unternehmensregister/export\HenkelHenkelVerwaltungsGmbH.json
./data/Unternehmensregister/export\HenkelHoldingKGaACoKG.json
./data/Unternehmensregister/export\HenkelHolzundMassivbauGmbH.json
./data/Unternehmensregister/export\HenkelImmoGmbH.json
./data/Unternehmensregister/export\HenkelIndustrialServicesGmbH.json
./data/Unternehmensregister/export\HenkelIndustrieconsultingUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\HenkelInnovationInvestmentsGmbH.json
./data/Unternehmensregister/export\HenkelInvestmentGmbH.json
./data/Unternehmensregister/export\HenkelIPHoldingGmbH.json
./data/Unternehmensregister/export\HenkelIPHoldingVerwaltungsGmbH.json
./data/Unternehmensregister/export\HenkelIPManagementandICServicesGmbH.json
./data/Unternehmensregister/export\HenkelIta

 52%|█████▏    | 1745/3381 [00:02<00:02, 717.05it/s]

./data/Unternehmensregister/export\InfineonTechnologies3VermögensverwaltungsgesellschaftmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesAG.json
./data/Unternehmensregister/export\InfineonTechnologiesBipolarGmbHCoKG.json
./data/Unternehmensregister/export\InfineonTechnologiesBipolarVerwaltungsGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesCampeonVerwaltungsgesellschaftmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesDeltaGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesDresdenGmbHCoKG.json
./data/Unternehmensregister/export\InfineonTechnologiesDresdenVerwaltungsGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesGammaGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesHoldingGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesMantel26AG.json
./data/Unternehmensregister/export\InfineonTechnologiesMantel27GmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesMantel29GmbH.json

 57%|█████▋    | 1912/3381 [00:02<00:01, 771.26it/s]

./data/Unternehmensregister/export\KSBINTAXvBismarckRechtsanwälteWirtschaftsprüferSteuerberaterPartGmbB.json
./data/Unternehmensregister/export\KSBINTAXVersicherungsschadenmanagementGmbH.json
./data/Unternehmensregister/export\KSBInternationalTradingGmbH.json
./data/Unternehmensregister/export\KSBKabelSignalbauGmbH.json
./data/Unternehmensregister/export\KSBKFZServiceBochumUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\KSBKiesundSandwerkeBoddinGmbH.json
./data/Unternehmensregister/export\KSBKitaSodenmattBremenGmbH.json
./data/Unternehmensregister/export\KSBKlinglerSchaumbetonGmbH.json
./data/Unternehmensregister/export\KSBKlinikberatungGmbH.json
./data/Unternehmensregister/export\KSBKlinikServiceBetriebeGmbH.json
./data/Unternehmensregister/export\KSBKontaktSchaltanlagenBauGmbH.json
./data/Unternehmensregister/export\KSBKrankentransportServiceBerlinGmbH.json
./data/Unternehmensregister/export\KSBKreyenbrückerServicegesellschaftBreeWatermbH.json
./data/Unternehmensregister

 61%|██████    | 2068/3381 [00:03<00:01, 741.50it/s]

./data/Unternehmensregister/export\LEONIKabelsystemeGmbH.json
./data/Unternehmensregister/export\LEONIKerpenGmbH.json
./data/Unternehmensregister/export\LeoniSolutionUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\LeoniWernerUGhaftungsbeschränktCoKG.json
./data/Unternehmensregister/export\LesezirkelAusAllerWeltTelseMoellereK.json
./data/Unternehmensregister/export\LiftEquipGmbHElevatorComponents.json
./data/Unternehmensregister/export\LindeMaterialHandlingGmbH.json
./data/Unternehmensregister/export\LindeMaterialHandlingRentalServicesGmbH.json
./data/Unternehmensregister/export\LindeMaterialHandlingRheinRuhrGmbHCoKG.json
./data/Unternehmensregister/export\LitarionGmbH.json
./data/Unternehmensregister/export\LitecLLLGmbH.json
./data/Unternehmensregister/export\LLPlantEngineeringAG.json
./data/Unternehmensregister/export\LMHImmobilienGmbHCoKG.json
./data/Unternehmensregister/export\LMHImmobilienHoldingGmbHCoKG.json
./data/Unternehmensregister/export\LODUREnergieanlagenGmbH.j

 65%|██████▌   | 2211/3381 [00:03<00:01, 665.33it/s]

./data/Unternehmensregister/export\Merck21AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck24AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck25AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck26AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck27AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck28AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck29AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck37AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck38AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck39AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck40AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck41AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Merck42AllgemeineBeteiligungsGmbH.json
./data/Unternehmensregister/export\Mer

 67%|██████▋   | 2279/3381 [00:03<00:02, 476.94it/s]

./data/Unternehmensregister/export\MetroPolVerwaltungsGmbH.json
./data/Unternehmensregister/export\metropresspresseagenturgesellschaftmitbeschränkterhaftung.json
./data/Unternehmensregister/export\metropresspresseagenturGmbHCoKGAgenturfürKommunikation.json
./data/Unternehmensregister/export\METROPROPERTIESGmbHCoKG.json
./data/Unternehmensregister/export\METROPROPERTIESHoldingGmbH.json
./data/Unternehmensregister/export\METROPROPERTIESManagementGmbH.json
./data/Unternehmensregister/export\METROReAG.json
./data/Unternehmensregister/export\METRORetailRealEstateGmbH.json
./data/Unternehmensregister/export\MetroSBGroßmärkteGmbHCoKommanditgesellschaft.json
./data/Unternehmensregister/export\METROSechsteVerwaltungsGmbH.json
./data/Unternehmensregister/export\METROSiebteVerwaltungsGmbH.json
./data/Unternehmensregister/export\METROSourcingGmbH.json
./data/Unternehmensregister/export\metrotekGmbH.json
./data/Unternehmensregister/export\METROVierteVerwaltungsGmbH.json
./data/Unternehmensregister/

 76%|███████▌  | 2563/3381 [00:03<00:01, 758.53it/s]

./data/Unternehmensregister/export\PaulHartmannAGCoLogistikzentrumSüdoHG.json
./data/Unternehmensregister/export\PaulHartmannCoGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\PaulHartmannSpenglereiundInstallationsGmbHCoKG.json
./data/Unternehmensregister/export\PCIAugsburgGmbH.json
./data/Unternehmensregister/export\PeiselerGmbHCoKG.json
./data/Unternehmensregister/export\PeiselerHoldingGmbH.json
./data/Unternehmensregister/export\PellogGmbH.json
./data/Unternehmensregister/export\PerlonMonofilGmbH.json
./data/Unternehmensregister/export\PeterFreyGmbH.json
./data/Unternehmensregister/export\PETERGOHGMenWomen.json
./data/Unternehmensregister/export\PetitRUNGISexpressGmbH.json
./data/Unternehmensregister/export\PHOENIXHoldingsVerwaltungsGmbH.json
./data/Unternehmensregister/export\PhotoDrogerieHellaPeterHellendahlFarbengroßhandelInhKätheHellendahl.json
./data/Unternehmensregister/export\PierburgGmbH.json
./data/Unternehmensregister/export\PierburgPumpTechnology

 78%|███████▊  | 2647/3381 [00:03<00:00, 747.08it/s]

./data/Unternehmensregister/export\registerdocument-2023-06-23-20-08-24.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-08-32.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-08-40.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-08-54.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-09-01.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-09-11.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-09-25.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-09-33.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-09-57.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-10-01.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-10-09.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-10-20.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-10-27.json

 81%|████████  | 2728/3381 [00:04<00:01, 574.26it/s]

./data/Unternehmensregister/export\RheinmetallLandsystemeGmbH.json
./data/Unternehmensregister/export\RheinmetallMANMilitaryVehiclesGmbH.json
./data/Unternehmensregister/export\RheinmetallMaschinenbauGmbH.json
./data/Unternehmensregister/export\RheinmetallPolyChargeGmbH.json
./data/Unternehmensregister/export\RheinmetallProjectSolutionsGmbH.json
./data/Unternehmensregister/export\RheinmetallProtectionSystemsGmbH.json
./data/Unternehmensregister/export\RheinmetallSoldierElectronicsGmbH.json
./data/Unternehmensregister/export\RheinmetallTechnicalAssistanceGmbH.json
./data/Unternehmensregister/export\RheinmetallTechnicalPublicationsGmbH.json
./data/Unternehmensregister/export\RheinmetallTechnologyCenterGmbH.json
./data/Unternehmensregister/export\RheinmetallVerwaltungsgesellschaftmbH.json
./data/Unternehmensregister/export\RheinmetallWaffeMunitionGmbH.json
./data/Unternehmensregister/export\RheinMoselWohnenGmbH.json
./data/Unternehmensregister/export\RheinPfalzWohnenGmbH.json
./data/Unter

 85%|████████▌ | 2883/3381 [00:04<00:00, 657.53it/s]

./data/Unternehmensregister/export\SartoriusStedimCellcaGmbH.json
./data/Unternehmensregister/export\SartoriusStedimNorthAmericaHoldingGmbH.json
./data/Unternehmensregister/export\SartoriusStedimPlasticsGmbH.json
./data/Unternehmensregister/export\SartoriusStedimSystemsGmbH.json
./data/Unternehmensregister/export\SartoriusVenturesGmbH.json
./data/Unternehmensregister/export\SartoriusVerwaltungsGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\SARTORIUSVerwaltungsGmbH.json
./data/Unternehmensregister/export\SartoriusVerwaltungsUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\SartoriusWeighingTechnologyGmbH.json
./data/Unternehmensregister/export\SARTORIUSWerkzeugeBeteiligungsGmbH.json
./data/Unternehmensregister/export\SARTORIUSWerkzeugeGmbHCoKG.json
./data/Unternehmensregister/export\SartoriusXellGmbH.json
./data/Unternehmensregister/export\SasseBeteiligungsgesellschaftmbH.json
./data/Unternehmensregister/export\SBBSolarGmbH.json
./data/Unternehmens

 87%|████████▋ | 2956/3381 [00:04<00:00, 480.15it/s]

./data/Unternehmensregister/export\SiemensGmbHCoKG.json
./data/Unternehmensregister/export\SiemensHealthcareDiagnosticsProductsGmbH.json
./data/Unternehmensregister/export\SiemensHealthineersAG.json
./data/Unternehmensregister/export\SiemensHealthineersBeteiligungenGmbHCoKG.json
./data/Unternehmensregister/export\SiemensHealthineersBeteiligungenVerwaltungsGmbH.json
./data/Unternehmensregister/export\SiemensHealthineersHoldingIGmbH.json
./data/Unternehmensregister/export\SiemensHealthineersHoldingIIIGmbH.json
./data/Unternehmensregister/export\SiemensHealthineersInnovationGmbHCoKG.json
./data/Unternehmensregister/export\SiemensHealthineersInnovationVerwaltungsGmbH.json
./data/Unternehmensregister/export\SiemerBeteiligungsgesellschaftmbH.json
./data/Unternehmensregister/export\SiemerElektroGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\SiemerGmbHCoKG.json
./data/Unternehmensregister/export\SiemerJachtserviceHunteEmsGmbH.json
./data/Unternehmensregister/export\

 91%|█████████ | 3066/3381 [00:04<00:00, 381.77it/s]

./data/Unternehmensregister/export\STILLFinancialServicesGmbH.json
./data/Unternehmensregister/export\STILLGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\STKNBMarketingSalesSolutionsGmbH.json
./data/Unternehmensregister/export\STOCKGmbH.json
./data/Unternehmensregister/export\STOKfzMeisterbetriebeK.json
./data/Unternehmensregister/export\STRATOAG.json
./data/Unternehmensregister/export\STRATOCustomerServiceGmbH.json
./data/Unternehmensregister/export\StreetScooterGmbH.json
./data/Unternehmensregister/export\StromamAntoniusbergGmbHCoKG.json
./data/Unternehmensregister/export\StromnetzgesellschaftAlbershausenVerwaltungsGmbH.json
./data/Unternehmensregister/export\StromnetzgesellschaftEbersbachVerwaltungsGmbH.json
./data/Unternehmensregister/export\StromnetzgesellschaftHeilbronnVerwaltungsGmbH.json
./data/Unternehmensregister/export\STronicseK.json
./data/Unternehmensregister/export\StröerAussenwerbungGmbHCoKG.json
./data/Unternehmensregister/export\StröerBegrü

 92%|█████████▏| 3111/3381 [00:05<00:00, 360.97it/s]

./data/Unternehmensregister/export\SüdzuckerInternationalFinanceBV.json
./data/Unternehmensregister/export\SüdzuckerVersicherungsVermittlungsGmbH.json
./data/Unternehmensregister/export\SüdzuckerVerwaltungsGmbH.json
./data/Unternehmensregister/export\TARONAVerwaltungGmbHCoAlphaKG.json
./data/Unternehmensregister/export\TatinGmbH.json
./data/Unternehmensregister/export\TaubernetzeVerwaltungsGmbH.json
./data/Unternehmensregister/export\TaunusBeteiligungsGmbH.json
./data/Unternehmensregister/export\TBDigitalServicesGmbH.json
./data/Unternehmensregister/export\TECALEMITGmbHCoKG.json
./data/Unternehmensregister/export\TECHoldingGmbHCoKG.json
./data/Unternehmensregister/export\TectarealAssetServicesGmbH.json
./data/Unternehmensregister/export\TectarealPropertyManagementGmbH.json
./data/Unternehmensregister/export\TelefónicaDeutschlandHoldingAG.json
./data/Unternehmensregister/export\TelefónicaGermanyGmbHCoOHG.json
./data/Unternehmensregister/export\TESSOLKraftstoffeMineralöleundTankanlagenGe

 94%|█████████▍| 3192/3381 [00:05<00:00, 361.10it/s]

./data/Unternehmensregister/export\UISUnitedInternetServiceInhaberinJacquelineZielkeeKff.json
./data/Unternehmensregister/export\UlrikeTheophileAlbrechtundHellaAlbrechtGrundstücksverwaltungsGmbHCoKG.json
./data/Unternehmensregister/export\UmspannwerkKleinBünsdorfGmbHCoKG.json
./data/Unternehmensregister/export\UnionBauzentrumHornbachGmbH.json
./data/Unternehmensregister/export\UniperAnlagenserviceGmbH.json
./data/Unternehmensregister/export\UnitedInternetAG.json
./data/Unternehmensregister/export\UnitedInternetCorporateHoldingSE.json
./data/Unternehmensregister/export\UnitedInternetCorporateServicesGmbH.json
./data/Unternehmensregister/export\UnitedInternetInvestmentsHoldingAGCoKG.json
./data/Unternehmensregister/export\UnitedInternetManagementHoldingSE.json
./data/Unternehmensregister/export\UnitedInternetMediaGmbH.json
./data/Unternehmensregister/export\UnitedInternetServiceSE.json
./data/Unternehmensregister/export\UnitedInternetSourcingApprenticeshipGmbH.json
./data/Unternehmensreg

 96%|█████████▌| 3231/3381 [00:05<00:00, 357.20it/s]

./data/Unternehmensregister/export\VolkswagenVersicherungsdienstGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\VolkswagenVierteLeasingobjektGmbH.json
./data/Unternehmensregister/export\VolkswagenZentrumAachenJacobsAutomobileGmbH.json
./data/Unternehmensregister/export\VolkswagenZentrumKarlsruheGmbH.json
./data/Unternehmensregister/export\VolkswagenZentrumNürnbergMarienbergGmbH.json
./data/Unternehmensregister/export\VolkswagenZentrumOldenburgGmbH.json
./data/Unternehmensregister/export\VolkswagenZentrumOsnabrückGmbHCoKG.json
./data/Unternehmensregister/export\VolkswagenZubehörGmbH.json
./data/Unternehmensregister/export\VolkswagenZweiteLeasingobjektGmbH.json
./data/Unternehmensregister/export\VollkornbäckereiSartoriusInhaberStraußundKaleskeOHG.json
./data/Unternehmensregister/export\VonoviaDritteBerlinGmbH.json
./data/Unternehmensregister/export\VonoviaEigentumsserviceGmbH.json
./data/Unternehmensregister/export\VonoviaEigentumsverwaltungsGmbH.json
./data/Un

 99%|█████████▉| 3358/3381 [00:05<00:00, 367.03it/s]

./data/Unternehmensregister/export\VWRInternationalImmobilienGmbH.json
./data/Unternehmensregister/export\WackerBiotechGmbH.json
./data/Unternehmensregister/export\WackerChemieAchteVentureGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\WackerChemieAG.json
./data/Unternehmensregister/export\WackerChemieElfteVentureGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\WackerChemieVersicherungsvermittlungGmbH.json
./data/Unternehmensregister/export\WackerChemieZwölfteVentureGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\WackerNeusonAftermarketServicesGmbH.json
./data/Unternehmensregister/export\WackerNeusonImmobilienGmbH.json
./data/Unternehmensregister/export\WackerNeusonPGMVerwaltungsGmbH.json
./data/Unternehmensregister/export\WackerNeusonProduktionGmbHCoKG.json
./data/Unternehmensregister/export\WackerNeusonSE.json
./data/Unternehmensregister/export\WackerNeusonSGMVerwaltungsGmbH.json
./data/Unternehmensregist

100%|██████████| 3381/3381 [00:05<00:00, 574.25it/s]

./data/Unternehmensregister/export\ZalandoLogisticsSüdSECoKG.json
./data/Unternehmensregister/export\ZalandoLoungeContentSolutionsSECoKG.json
./data/Unternehmensregister/export\ZalandoLoungeLogisticsSECoKG.json
./data/Unternehmensregister/export\ZalandoLoungeServiceGmbH.json
./data/Unternehmensregister/export\ZalandoMarketingServicesGmbH.json
./data/Unternehmensregister/export\ZalandoOperationsGmbH.json
./data/Unternehmensregister/export\ZalandoOutletsGmbH.json
./data/Unternehmensregister/export\ZalandoPaymentsGmbH.json
./data/Unternehmensregister/export\ZalandoSE.json
./data/Unternehmensregister/export\ZalandoStoresGmbHCoKG.json
./data/Unternehmensregister/export\ZalandoStudiosBerlinGmbH.json
./data/Unternehmensregister/export\zebotecGmbH.json
./data/Unternehmensregister/export\ZentraVerwaltungsGmbH.json
./data/Unternehmensregister/export\zLabelsCreationSalesGmbHCoKG.json
./data/Unternehmensregister/export\zLabelsGmbH.json
./data/Unternehmensregister/export\zLabelsPlatformServicesGmbH




In [2]:
import os
import sys

module_path = os.path.abspath(os.path.join(".."))
if module_path not in sys.path:
    sys.path.append(module_path)

In [17]:
from aki_prj23_transparenzregister.utils.mongo.connector import (
    MongoConnector,
    MongoConnection,
)
from aki_prj23_transparenzregister.utils.mongo.company_mongo_service import (
    CompanyMongoService,
)

conn_string = MongoConnection(
    hostname="localhost",
    database="transparenzregister",
    username="username",
    password="password",
    port=27017,
)

connector = MongoConnector(conn_string)

service = CompanyMongoService(connector)

In [54]:
from tqdm import tqdm
import glob
import os
import json
from aki_prj23_transparenzregister.models.company import Company

num_inserted = 0
for file in tqdm(glob.glob1("./data/Unternehmensregister/transformed", "*.json")):
    path = os.path.join("./data/Unternehmensregister/transformed", file)
    with open(path, "r", encoding="utf-8") as file_object:
        data = json.loads(file_object.read())
        company: Company = Company(**data)

        company_db = service.get_by_id(company.id)
        if company_db is None:
            service.insert(company)
            num_inserted += 1
print(f"Inserted documents: {num_inserted}")

  0%|          | 15/3147 [00:00<01:02, 49.99it/s]

100%|██████████| 3147/3147 [00:34<00:00, 89.93it/s] 

Inserted documents: 3147



