# Unternehmensregister

## Fetch Auszug

In [1]:
import os
import glob

In [2]:
def wait_for_download_condition(
    path: str, num_files: int, pattern: str = "*.xml"
) -> bool:
    return len(glob.glob1(path, pattern)) > num_files


def get_num_files(path: str, pattern: str = "*.xml") -> int:
    return len(glob.glob1(path, pattern))


def rename_latest_file(path: str, filename: str, pattern: str = "*.xml"):
    list_of_files = [os.path.join(path, file) for file in glob.glob1(path, pattern)]
    latest_download = max(list_of_files, key=os.path.getctime)
    os.rename(latest_download, os.path.join(path, filename))

In [3]:
import os
from pathlib import Path

from selenium import webdriver


def configure_webdriver(
    headless: bool = True, download_dir: list[str] = ["data", "Unternehmensregister"]
) -> webdriver:
    options = webdriver.ChromeOptions()

    download_path = os.path.join(str(Path.cwd()), *download_dir)
    print(download_path)

    preferences = {
        "profile.default_content_settings.popups": 0,
        "safebrowsing.enabled": True,
        "download": {
            "directory_upgrade": True,
            "prompt_for_download": False,
            "extensions_to_open": "",
            "default_directory": download_path,
        },
    }
    if headless:
        options.add_argument("--headless=new")
    options.add_experimental_option("prefs", preferences)

    return webdriver.Chrome(options=options)

In [4]:
from tqdm import tqdm
from selenium.webdriver.common.by import By
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC


def scrape(driver, query: str, dir: str):
    driver.get("https://www.unternehmensregister.de/ureg/")
    # Accept Cookies
    driver.find_elements(
        By.XPATH, '//button[text()="Nur technisch notwendige Cookies akzeptieren"]'
    )[0].click()
    # Enter search query
    driver.find_elements(By.ID, "globalSearchForm:extendedResearchCompanyName")[
        0
    ].send_keys(query)
    # Trigger search
    driver.find_elements(By.ID, "globalSearchForm:btnExecuteSearchOld")[0].click()
    # Wait for results
    wait = WebDriverWait(driver, 5)
    wait.until(
        lambda driver: driver.current_url != "https://www.unternehmensregister.de/ureg/"
    )

    num_pages = int(
        driver.find_element(By.XPATH, '//*[@class="page_count"]').text.split(" ")[0]
    )

    processed_companies = []

    for page_index in tqdm(range(num_pages)):
        # Find all "Registerinformationen"
        companies_tab = driver.find_elements(
            By.LINK_TEXT, "Registerinformationen des Registergerichts"
        )
        company_names = [
            elem.text
            for elem in driver.find_elements(
                By.XPATH, '//div[@class="company_result"]/span/b'
            )
        ]
        for index, company_link in enumerate(companies_tab):
            company_name = company_names[index]
            if company_name in processed_companies:
                continue
            # Go to intermediary page
            company_link.click()
            # Trigger next redirect
            driver.find_element(By.LINK_TEXT, "Registerinformationen anzeigen").click()
            # Trigger SI download
            driver.find_element(By.LINK_TEXT, "SI").click()
            # Show shopping cart - TODO evaluate restructuring behaviour by filling cart first and then bulk downloading
            wait.until(
                EC.visibility_of_element_located(
                    (By.LINK_TEXT, "Dokumentenkorb ansehen")
                )
            )
            driver.find_element(By.LINK_TEXT, "Dokumentenkorb ansehen").click()
            # Get document
            xpath = "//input[@type='submit']"
            elems = driver.find_elements(By.TAG_NAME, "input")
            elems[-2].click()

            wait.until(
                EC.visibility_of_element_located((By.ID, "paymentFormOverview:btnNext"))
            )
            driver.find_element(By.ID, "paymentFormOverview:btnNext").click()

            wait.until(
                EC.visibility_of_element_located((By.LINK_TEXT, "Zum Dokumentenkorb"))
            )
            driver.find_element(By.LINK_TEXT, "Zum Dokumentenkorb").click()

            num_files = get_num_files(dir)
            driver.find_element(By.CLASS_NAME, "download-wrapper").click()

            try:
                wait.until(lambda x: wait_for_download_condition(dir, num_files))
                rename_latest_file(
                    dir,
                    f"{company_name.replace(' ', '_').replace('/','_')}.xml",
                )
                processed_companies.append(company_name)
            except:
                print(f"Could not process {company_name}")
            for i in range(6):
                driver.back()
        driver.find_element(By.XPATH, '//*[@class="fas fa-angle-right"]').click()
    driver.close()
    print(processed_companies)

In [5]:
import pandas as pd

df = pd.read_excel(
    "./data/study_id42887_top-100-unternehmen-deutschland.xlsx",
    sheet_name="Toplist",
    skiprows=1,
)
df.head()

Unnamed: 0.1,Unnamed: 0,Name,IPO Status,Exchange,Listing ID,Founding Year,ISIC,Headquarters,Street,City,Postal Code,Phone,Website,Email,End of fiscal year,2019,2020,2021,CAGR*,Employees*
0,1,Volkswagen,PUBLIC,XETR,VOW3,1984.0,2910 - Motor Vehicles,Germany,Berliner Ring 2,Wolfsburg,38440,+49-536190,www.volkswagenag.com,,12/31,282839.18,254299.32,296086.81,0.020497,672800.0
1,2,Mercedes-Benz Group,PUBLIC,XMUN,DAI,1987.0,2910 - Motor Vehicles,Germany,Mercedes Street 120,Stuttgart,70372,+49-7111795256,www.group.mercedes-benz.com,,12/31,193400.1,138942.51,158449.05,-0.071117,172425.0
2,3,Deutsche Telekom,PUBLIC,XFRA,DTE,1990.0,61 - Telecommunications,Germany,Friedrich-Ebert-Allee 140,Bonn,53113,+49-2281814949,www.telekom.com,,12/31,90125.38,115235.87,128753.98,0.110871,216528.0
3,4,Bmw,PUBLIC,XDUS,BMW3,1984.0,2910 - Motor Vehicles,Germany,Petuelring 130,Munich,80788,+49-8938224272,www.bmwgroup.com,,12/31,117613.06,113581.49,133364.51,0.048403,118909.0
4,5,Deutsche Post,PUBLIC,XMUN,DPW,1989.0,5320 - Courier Services,Germany,Charles-De-Gaulle-Straße 20,Bonn,53113,+49-22818263636,www.deutschepost.de,,12/31,70914.68,76119.57,96739.44,0.091205,592263.0


In [9]:
processes = []
for x in df.Name:
    search_query = x

    driver = configure_webdriver(
        download_dir=["data", "Unternehmensregister", search_query.strip()]
    )
    process = Process(
        target=scrape_process,
        args=(
            driver,
            search_query,
            f"./data/Unternehmensregister/{search_query.strip()}",
        ),
    )
    process.start()
    processes.append(process)

c:\Users\trist\Documents\Code\M.Sc\aki_prj23_transparenzregister\Jupyter\API-tests\Unternehmensregister\data\Unternehmensregister\Volkswagen


AttributeError: Can't pickle local object '_createenviron.<locals>.encodekey'

## Analyze Auszug

In [2]:
import os

num_files = 0
for folder in os.listdir("./data/Unternehmensregister/scraping/"):
    files = os.listdir("./data/Unternehmensregister/scraping/" + folder)
    num_files += len(files)
num_files

3405

In [1]:
import json
import glob
import xmltodict

In [3]:
def transform_xml_to_json(source_dir: str, target_dir: str):
    for source_path in [
        os.path.normpath(i) for i in glob.glob(source_dir + "**/*.xml", recursive=True)
    ]:
        print(source_path)
        target_path = os.path.join(
            target_dir, source_path.split("\\")[-1].replace(".xml", ".json")
        )

        with open(source_path, "r", encoding="utf-8") as source_file:
            try:
                data = xmltodict.parse(source_file.read().encode())
                with open(target_path, "w", encoding="utf-8") as json_file:
                    json_file.write(json.dumps(data))
            except:
                """"""


transform_xml_to_json(
    "./data/Unternehmensregister/scraping/", "./data/Unternehmensregister/export/"
)

data\Unternehmensregister\scraping\1&1\123fliegenfreiGmbH.xml
data\Unternehmensregister\scraping\1&1\1AAutenriethKunststofftechnikGmbHCoKG.xml
data\Unternehmensregister\scraping\1&1\1ABlumenGriesbaumInhPhilippZähringereK.xml
data\Unternehmensregister\scraping\1&1\1AlfdorferSolarbetriebsGmbHCoKG.xml
data\Unternehmensregister\scraping\1&1\1FreiburgerSolarfondsBeteiligungsKG.xml
data\Unternehmensregister\scraping\1&1\1GussMaulburgGmbH.xml
data\Unternehmensregister\scraping\1&1\1ServicesGmbH.xml
data\Unternehmensregister\scraping\1&1\1StaigerGrundstücksverwaltungGmbHCoKG.xml
data\Unternehmensregister\scraping\1&1\1stClassMarketingGmbH.xml
data\Unternehmensregister\scraping\1&1\1WeinheimerBestattungsunternehmeneGVereinigteWeinheimerHemsbacherSchreinermeister.xml
data\Unternehmensregister\scraping\Adidas\adidasAG.xml
data\Unternehmensregister\scraping\Adidas\adidasBeteiligungsgesellschaftmbH.xml
data\Unternehmensregister\scraping\Adidas\adidasCDCImmobilieninvestGmbH.xml
data\Unternehmensregi

In [4]:
from tqdm import tqdm

for file in tqdm(glob.glob1("./data/Unternehmensregister/", "*.json")):
    path = os.path.join("./data/Unternehmensregister/", file)
    with open(path, "r", encoding="utf-8") as file_object:
        data = json.loads(file_object.read())

0it [00:00, ?it/s]


In [1]:
import re
from aki_prj23_transparenzregister.models.company import Company


def parse_stakeholder(data: dict) -> list:
    if "Natuerliche_Person" in data["Beteiligter"]:
        return {
            "name": {
                "firstname": data["Beteiligter"]["Natuerliche_Person"]["Voller_Name"][
                    "Vorname"
                ],
                "lastname": data["Beteiligter"]["Natuerliche_Person"]["Voller_Name"][
                    "Nachname"
                ],
            },
            "date_of_birth": data["Beteiligter"]["Natuerliche_Person"]["Geburt"][
                "Geburtsdatum"
            ]
            if "Geburt" in data["Beteiligter"]["Natuerliche_Person"]
            else None,
            "location": {
                "city": data["Beteiligter"]["Natuerliche_Person"]["Anschrift"][-1][
                    "Ort"
                ]
                if type(data["Beteiligter"]["Natuerliche_Person"]["Anschrift"]) == list
                else data["Beteiligter"]["Natuerliche_Person"]["Anschrift"]["Ort"]
            },
            "role": data["Rolle"]["Rollenbezeichnung"]["content"],
        }
    if "Organisation" in data["Beteiligter"]:
        return {
            "role": "Organisation",
            "description": data["Beteiligter"]["Organisation"]["Bezeichnung"][
                "Bezeichnung_Aktuell"
            ],
            "location": {
                "city": data["Beteiligter"]["Organisation"]["Anschrift"]["Ort"],
                "street": data["Beteiligter"]["Organisation"]["Anschrift"]["Strasse"]
                if "Strasse" in data["Beteiligter"]["Organisation"]["Anschrift"]
                else None,
                "house_number": data["Beteiligter"]["Organisation"]["Anschrift"][
                    "Hausnummer"
                ]
                if "Hausnummer" in data["Beteiligter"]["Organisation"]["Anschrift"]
                else None,
                "zip_code": data["Beteiligter"]["Organisation"]["Anschrift"][
                    "Postleitzahl"
                ],
            },
        }


def loc_from_rechtstraeger(data: dict) -> dict:
    return {
        "city": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]["Ort"],
        "zip_code": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]["Postleitzahl"],
        "street": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]["Strasse"]
        if "Strasse"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]
        else None,
        "house_number": data["XJustiz_Daten"]["Fachdaten_Register"][
            "Basisdaten_Register"
        ]["Rechtstraeger"]["Anschrift"]["Hausnummer"]
        if "Hausnummer"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Anschrift"]
        else None,
    }


def loc_from_organisation(data: dict) -> dict:
    return {
        "city": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]["Ort"],
        "zip_code": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]["Postleitzahl"],
        "street": data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]["Strasse"]
        if "Strasse"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]
        else None,
        "house_number": data["XJustiz_Daten"]["Fachdaten_Register"][
            "Basisdaten_Register"
        ]["Organisation"]["Anschrift"]["Hausnummer"]
        if "Hausnummer"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Organisation"
        ]["Anschrift"]
        else None,
    }


def loc_from_beteiligung(data: dict) -> dict:
    return {
        "city": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][
            0
        ]["Beteiligter"]["Organisation"]["Anschrift"]["Ort"],
        "zip_code": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
            "Beteiligung"
        ][0]["Beteiligter"]["Organisation"]["Anschrift"]["Postleitzahl"],
        "street": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][
            0
        ]["Beteiligter"]["Organisation"]["Anschrift"]["Strasse"]
        if "Strasse"
        in data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][0][
            "Beteiligter"
        ]["Organisation"]["Anschrift"]
        else None,
        "house_number": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
            "Beteiligung"
        ][0]["Beteiligter"]["Organisation"]["Anschrift"]["Hausnummer"]
        if "Hausnummer"
        in data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][0][
            "Beteiligter"
        ]["Organisation"]["Anschrift"]
        else None,
    }


def name_from_rechtstraeger(data: dict) -> str:
    return data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
        "Rechtstraeger"
    ]["Bezeichnung"]["Bezeichnung_Aktuell"]


def name_from_organisation(data: dict) -> str:
    return data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
        "Organisation"
    ]["Bezeichnung"]["Bezeichnung_Aktuell"]


def name_from_beteiligung(data: dict) -> str:
    return data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][0][
        "Beteiligter"
    ]["Organisation"]["Bezeichnung"]["Bezeichnung_Aktuell"]


# TODO Not present in all companies - possibly map using name of company ...
def map_rechtsform(company_name: str, data: dict) -> str:
    try:
        return data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Rechtstraeger"
        ]["Rechtsform"]["content"]
    except:
        if (
            company_name.endswith("GmbH")
            or company_name.endswith("UG")
            or company_name.endswith("UG (haftungsbeschränkt)")
        ):
            return "Gesellschaft mit beschränkter Haftung"
        elif company_name.endswith("SE"):
            return "Europäische Aktiengesellschaft (SE)"
        elif company_name.endswith("KG"):
            return "Kommanditgesellschaft"
        return None


def map_stammkapital(data: dict, company_type: str) -> str:
    capital = {"Zahl": 0, "Waehrung": ""}
    if company_type == "Kommanditgesellschaft":
        if "Zusatzangaben" not in data["XJustiz_Daten"]["Fachdaten_Register"]:
            return None
        capital_type = "Hafteinlage"
        base = data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
            "Personengesellschaft"
        ]["Zusatz_KG"]["Daten_Kommanditist"]
        if type(base) == "list":
            for entry in base:
                # TODO link to persons using Ref_Rollennummer then extract ["Hafteinlage"] as below
                capital["Zahl"] = capital["Zahl"] + entry["Zahl"]
                # TODO Improve multi assignment
                capital["Waehrung"] = entry["Waehrung"]
        elif type(base) == "dict":
            capital = base["Hafteinlage"]
    elif company_type in [
        "Gesellschaft mit beschränkter Haftung",
        "Europäische Aktiengesellschaft (SE)",
        "Aktiengesellschaft",
        "Kommanditgesellschaft auf Aktien",
        "Rechtsform ausländischen Rechts HRB",
    ]:
        if "Zusatzangaben" not in data["XJustiz_Daten"]["Fachdaten_Register"]:
            return None
        if (
            "Zusatz_GmbH"
            in data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
                "Kapitalgesellschaft"
            ]
        ):
            capital_type = "Stammkapital"
            capital = data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
                "Kapitalgesellschaft"
            ]["Zusatz_GmbH"]["Stammkapital"]
        elif (
            "Zusatz_Aktiengesellschaft"
            in data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
                "Kapitalgesellschaft"
            ]
        ):
            capital_type = "Grundkapital"
            capital = data["XJustiz_Daten"]["Fachdaten_Register"]["Zusatzangaben"][
                "Kapitalgesellschaft"
            ]["Zusatz_Aktiengesellschaft"]["Grundkapital"]["Hoehe"]
    elif company_type in [
        "Einzelkaufmann",
        "Einzelkauffrau",
        "eingetragene Genossenschaft",
        "Partnerschaft",
        "Einzelkaufmann / Einzelkauffrau",
        "Offene Handelsgesellschaft",
        "Partnerschaftsgesellschaft",
        None,
    ]:
        return None
    else:
        return None
    return {
        "value": capital["Zahl"],
        "currency": capital["Waehrung"],
        "type": capital_type,
    }


def map_geschaeftszweck(data: dict) -> str:
    try:
        return data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Gegenstand_oder_Geschaeftszweck"
        ]
    except:
        return None


from datetime import datetime


def transform_date_to_iso(date: str) -> str:
    regex_yy = r"^\d{1,2}\.\d{1,2}\.\d{2}$"

    if re.match(regex_yy, date):
        input_format = "%d.%m.%y"
    else:
        input_format = "%d.%m.%Y"
    date_temp = datetime.strptime(date, input_format)
    return date_temp.strftime("%Y-%m-%d")


# TODO transform date to iso format (YYYY-MM-DD)
def map_founding_date(data: dict) -> str:
    text = str(data)
    entry_date = re.findall(
        r".Tag der ersten Eintragung:(\\n| )?(\d{1,2}\.\d{1,2}\.\d{2,4})", text
    )
    if len(entry_date) == 1:
        return transform_date_to_iso(entry_date[0][1])

    entry_date = re.findall(
        r".Gesellschaftsvertrag vom (\d{1,2}\.\d{1,2}\.\d{2,4})", text
    )
    if len(entry_date) == 1:
        return transform_date_to_iso(entry_date[0])

    if "Eintragungstext" in data["XJustiz_Daten"]["Fachdaten_Register"]["Auszug"]:
        if (
            type(
                data["XJustiz_Daten"]["Fachdaten_Register"]["Auszug"]["Eintragungstext"]
            )
            == "list"
        ):
            temp = data["XJustiz_Daten"]["Fachdaten_Register"]["Auszug"][
                "Eintragungstext"
            ][0]["Text"]
            results = re.findall(r"\d{1,2}\.\d{1,2}\.\d{2,4}", temp)
            if len(temp) == 1:
                return transform_date_to_iso(results[0])
    if (
        "Gruendungsmetadaten"
        in data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"]
    ):
        temp = data["XJustiz_Daten"]["Fachdaten_Register"]["Basisdaten_Register"][
            "Gruendungsmetadaten"
        ]["Gruendungsdatum"]
        return temp
    # No reliable answer
    # raise ValueError()
    return None


def map_unternehmensregister_json(data: dict) -> dict:
    result = {"relationships": []}

    # TODO Refactor mapping - this is a nightmare...
    result["id"] = {
        "hr_number": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
            "Instanzdaten"
        ]["Aktenzeichen"],
        "district_court": {
            "name": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
                "Beteiligung"
            ][1]["Beteiligter"]["Organisation"]["Bezeichnung"]["Bezeichnung_Aktuell"]
            if "Organisation"
            in data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][1][
                "Beteiligter"
            ]
            else data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][
                1
            ]["Beteiligter"]["Natuerliche_Person"]["Voller_Name"]["Nachname"],
            "city": data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"][
                "Beteiligung"
            ][1]["Beteiligter"]["Organisation"]["Sitz"]["Ort"]
            if "Organisation"
            in data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][1][
                "Beteiligter"
            ]
            else data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][
                1
            ]["Beteiligter"]["Natuerliche_Person"]["Anschrift"]["Ort"],
        },
    }
    result["name"] = name_from_beteiligung(data)

    result["location"] = loc_from_beteiligung(data)
    result["last_update"] = data["XJustiz_Daten"]["Fachdaten_Register"]["Auszug"][
        "letzte_Eintragung"
    ]
    # TODO New features --> to be tested
    result["company_type"] = map_rechtsform(result["name"], data)
    result["capital"] = map_stammkapital(data, result["company_type"])
    result["business_purpose"] = map_geschaeftszweck(data)
    result["founding_date"] = map_founding_date(data)

    for i in range(
        2, len(data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"])
    ):
        people = parse_stakeholder(
            data["XJustiz_Daten"]["Grunddaten"]["Verfahrensdaten"]["Beteiligung"][i]
        )
        result["relationships"].append(people)
    return Company(**result)

In [2]:
import os
import json
import glob
import dataclasses
from tqdm import tqdm

In [3]:
for file in tqdm(glob.glob1("./data/Unternehmensregister/export", "*.json")):
    path = os.path.join("./data/Unternehmensregister/export", file)
    with open(path, "r", encoding="utf-8") as file_object:
        print(path)
        data = json.loads(file_object.read())
        company: Company = map_unternehmensregister_json(data)

        name = "".join(e for e in company.name if e.isalnum())[:50]

        with open(
            f"./data/Unternehmensregister/transformed/{name}.json",
            "w+",
            encoding="utf-8",
        ) as export_file:
            json.dump(dataclasses.asdict(company), export_file, ensure_ascii=False)

  0%|          | 0/3381 [00:00<?, ?it/s]

  5%|▍         | 155/3381 [00:00<00:04, 805.91it/s]

./data/Unternehmensregister/export\01019TelefondiensteGmbH.json
./data/Unternehmensregister/export\01024TelefondiensteGmbH.json
./data/Unternehmensregister/export\01050comGmbH.json
./data/Unternehmensregister/export\11DeMailGmbH.json
./data/Unternehmensregister/export\11EnergyGmbH.json
./data/Unternehmensregister/export\11LogistikGmbH.json
./data/Unternehmensregister/export\11MailMediaApplicationsSE.json
./data/Unternehmensregister/export\11MailMediaDevelopmentTechnologyGmbH.json
./data/Unternehmensregister/export\11MailMediaGmbH.json
./data/Unternehmensregister/export\11MailMediaServiceGmbH.json
./data/Unternehmensregister/export\11TelecomGmbH.json
./data/Unternehmensregister/export\11TelecomHoldingGmbH.json
./data/Unternehmensregister/export\11TelecommunicationSE.json
./data/Unternehmensregister/export\11TelecomSalesGmbH.json
./data/Unternehmensregister/export\11TelecomServiceMontabaurGmbH.json
./data/Unternehmensregister/export\11TelecomServiceZweibrückenGmbH.json
./data/Unternehmen

  7%|▋         | 251/3381 [00:00<00:03, 874.31it/s]

./data/Unternehmensregister/export\AureliusDigitalVenturesUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\AURELIUSEpsilonInternationalGmbH.json
./data/Unternehmensregister/export\AURELIUSEpsilonInvestGmbH.json
./data/Unternehmensregister/export\AURELIUSEquityOpportunitiesSECoKGaA.json
./data/Unternehmensregister/export\AURELIUSGammaInternationalGmbH.json
./data/Unternehmensregister/export\AURELIUSGammaInvestGmbH.json
./data/Unternehmensregister/export\AureliusGmbH.json
./data/Unternehmensregister/export\AureliusHofMainhausenGmbH.json
./data/Unternehmensregister/export\AureliusHoldingUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\AureliusHorizonUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\AureliusImmobiliengesellschaftAmFannyMendelssohnPlatzGmbHCoKG.json
./data/Unternehmensregister/export\AureliusImmobiliengesellschaftamUdoLindenbergPlatzGmbH.json
./data/Unternehmensregister/export\AureliusImmobilienGmbH.json
./data/Unternehmensregister/export\

 10%|█         | 339/3381 [00:00<00:05, 602.32it/s]

./data/Unternehmensregister/export\BauvereinGlückaufGmbH.json
./data/Unternehmensregister/export\BayAnlagenbauGmbH.json
./data/Unternehmensregister/export\BayBeteiligungsGmbH.json
./data/Unternehmensregister/export\BayCityTextilhandelsGmbH.json
./data/Unternehmensregister/export\Bayer04ImmobilienGmbH.json
./data/Unternehmensregister/export\Bayer04LeverkusenFußballGmbH.json
./data/Unternehmensregister/export\Bayer04LeverkusenSportförderunggGmbH.json
./data/Unternehmensregister/export\Bayer04physioteamGmbH.json
./data/Unternehmensregister/export\BayerAktiengesellschaft.json
./data/Unternehmensregister/export\BayerAltersversorgungGmbH.json
./data/Unternehmensregister/export\BayerAluminiumbauGmbH.json
./data/Unternehmensregister/export\BayerAutomatenGmbH.json
./data/Unternehmensregister/export\BayerBauphysikIngenieurgesellschaftmbH.json
./data/Unternehmensregister/export\BayerBauunternehmenGmbH.json
./data/Unternehmensregister/export\BayerBeistandskasseVVaG.json
./data/Unternehmensregister

 17%|█▋        | 580/3381 [00:00<00:03, 702.19it/s]

./data/Unternehmensregister/export\BayerUnternehmensberatungGmbH.json
./data/Unternehmensregister/export\BayerUnterstützungskasseGmbH.json
./data/Unternehmensregister/export\BayerUphuesGmbH.json
./data/Unternehmensregister/export\BayerUSIPGmbH.json
./data/Unternehmensregister/export\BayeruSohnSpeditionsGmbH.json
./data/Unternehmensregister/export\BayeruSohnVerwaltungsGmbH.json
./data/Unternehmensregister/export\BayerVermögensverwaltungGmbH.json
./data/Unternehmensregister/export\BayerVersicherungsmaklerGmbH.json
./data/Unternehmensregister/export\BayerVerwaltungsGmbH.json
./data/Unternehmensregister/export\BayerVerwaltungUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\BayerVitalGmbH.json
./data/Unternehmensregister/export\BayerVitrotechnicGmbH.json
./data/Unternehmensregister/export\BayerWaldGranitwerkeKAThieleGmbHCoKG.json
./data/Unternehmensregister/export\bayeurokesselGmbH.json
./data/Unternehmensregister/export\BAYGmbH.json
./data/Unternehmensregister/export\BayGmbHAut

 19%|█▉        | 654/3381 [00:00<00:04, 669.65it/s]

./data/Unternehmensregister/export\BrenntagRealEstateGmbH.json
./data/Unternehmensregister/export\BrenntagSE.json
./data/Unternehmensregister/export\BrenntagVermögensmanagementGmbH.json
./data/Unternehmensregister/export\BrentwoodEuropeGmbH.json
./data/Unternehmensregister/export\BRIONMusikVerlagInhaberinBrittaOnneneK.json
./data/Unternehmensregister/export\BroadNetDeutschlandGmbH.json
./data/Unternehmensregister/export\brüderlProjektAmalienstraßeGmbHCoKG.json
./data/Unternehmensregister/export\BrüderlProjektBadEndorfGmbHCoKG.json
./data/Unternehmensregister/export\BrüderlProjektGmbHCoKG.json
./data/Unternehmensregister/export\BrüderlProjektKunigundenstraßeGmbHCoKG.json
./data/Unternehmensregister/export\brüderlProjektLerchenwegGmbHCoKG.json
./data/Unternehmensregister/export\BrüderlProjektTraunstorferStraßeGmbHCoKG.json
./data/Unternehmensregister/export\BSIZECHHOCHTIEFGmbHCooHG.json
./data/Unternehmensregister/export\BSPBernerSchaefflerPartnersGmbHSteuerberatungsgesellschaft.json
./d

 23%|██▎       | 792/3381 [00:01<00:04, 620.67it/s]

./data/Unternehmensregister/export\DeutschePostDHLRealEstateDeutschlandGmbH.json
./data/Unternehmensregister/export\DeutschePostDHLResearchandInnovationGmbH.json
./data/Unternehmensregister/export\DeutschePostDialogSolutionsGmbH.json
./data/Unternehmensregister/export\DeutschePostDirektGmbH.json
./data/Unternehmensregister/export\DeutschePostEPOSTSolutionsGmbH.json
./data/Unternehmensregister/export\DeutschePostExpansionGmbH.json
./data/Unternehmensregister/export\DeutschePostFinanceBV.json
./data/Unternehmensregister/export\DeutschePostFleetGmbH.json
./data/Unternehmensregister/export\DeutschePostGrundstücksVermietungsgesellschaftbetambH.json
./data/Unternehmensregister/export\DeutschePostGrundstücksVermietungsgesellschaftbetambHCoObjektLeipzigKG.json
./data/Unternehmensregister/export\DeutschePostImmobilienGmbH.json
./data/Unternehmensregister/export\DeutschePostInHausServicesGmbH.json
./data/Unternehmensregister/export\DeutschePostInvestmentsGmbH.json
./data/Unternehmensregister/exp

 29%|██▊       | 964/3381 [00:01<00:03, 731.85it/s]

./data/Unternehmensregister/export\DörenhagenWindenergieanlagenGmbHCoKG.json
./data/Unternehmensregister/export\EAInternationaleExplorationsundProduktionsGmbH.json
./data/Unternehmensregister/export\EASartoriusVerwaltungsGmbH.json
./data/Unternehmensregister/export\EBBHochTiefUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\eBoDGmbH.json
./data/Unternehmensregister/export\EBVGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\ecowoGmbH.json
./data/Unternehmensregister/export\EDGITALGmbH.json
./data/Unternehmensregister/export\EDISAG.json
./data/Unternehmensregister/export\EDITIONMETROeK.json
./data/Unternehmensregister/export\EEADrSchäfflerGermanyGmbH.json
./data/Unternehmensregister/export\EinhornApothekeHellaDierking.json
./data/Unternehmensregister/export\EisengießereiDinklageGmbH.json
./data/Unternehmensregister/export\EisenwerkWeilbachGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\ElektroGrammerGmbH.json
./data/Unterne

 33%|███▎      | 1125/3381 [00:01<00:02, 763.99it/s]

./data/Unternehmensregister/export\EONEnergieDeutschlandGmbH.json
./data/Unternehmensregister/export\EONEnergieDeutschlandHoldingGmbH.json
./data/Unternehmensregister/export\EONEnergieDialogGmbH.json
./data/Unternehmensregister/export\EONEnergyMarketsGmbH.json
./data/Unternehmensregister/export\EONEnergyProjectsGmbH.json
./data/Unternehmensregister/export\EONEnergySolutionsGmbH.json
./data/Unternehmensregister/export\EONFinanzanlagenGmbH.json
./data/Unternehmensregister/export\EONFinanzholdingBeteiligungsGmbH.json
./data/Unternehmensregister/export\EONFinanzholdingSECoKG.json
./data/Unternehmensregister/export\EONFünfundzwanzigsteVerwaltungsGmbH.json
./data/Unternehmensregister/export\EONGasMobilGmbH.json
./data/Unternehmensregister/export\EONGastronomieGmbH.json
./data/Unternehmensregister/export\EONGridSolutionsGmbH.json
./data/Unternehmensregister/export\EONGroupInnovationGmbH.json
./data/Unternehmensregister/export\EONGrugaGeschäftsführungsgesellschaftmbH.json
./data/Unternehmensre

 36%|███▌      | 1223/3381 [00:01<00:02, 823.94it/s]

./data/Unternehmensregister/export\FielmannAGCoWattenscheidKG.json
./data/Unternehmensregister/export\FielmannAGCoWestlicheKaiserstraßeKG.json
./data/Unternehmensregister/export\FielmannAGCoZentrumKG.json
./data/Unternehmensregister/export\FielmannAktiengesellschaft.json
./data/Unternehmensregister/export\FielmannAugenoptikAGCo.json
./data/Unternehmensregister/export\FielmannAugenoptikAGCooHG.json
./data/Unternehmensregister/export\FielmannAugenoptikAGCooHGHarburgCity.json
./data/Unternehmensregister/export\FielmannAugenoptikGmbHCoLuxemburgKG.json
./data/Unternehmensregister/export\fielmannFarmsenFielmannGmbHCo.json
./data/Unternehmensregister/export\fielmannFielmannGmbH.json
./data/Unternehmensregister/export\FielmannFinanzserviceGmbH.json
./data/Unternehmensregister/export\fielmannINTEROPTIKGmbHCo.json
./data/Unternehmensregister/export\fielmannopticFielmannGmbHCo.json
./data/Unternehmensregister/export\FIMMUSGrundstücksVermietungsgesellschaftmbH.json
./data/Unternehmensregister/expo

 44%|████▎     | 1475/3381 [00:02<00:02, 792.79it/s]

./data/Unternehmensregister/export\GELSENWASSERStadtwerkedienstleistungsGmbH.json
./data/Unternehmensregister/export\GELSENWASSERStiftunggGmbH.json
./data/Unternehmensregister/export\GemeindewerkeBrühlVerwaltungsGmbH.json
./data/Unternehmensregister/export\GemeindewerkeSchermbeckVerwaltungsgesellschaftmbH.json
./data/Unternehmensregister/export\GemeinnützigeEisenbahnWohnungsbauGesellschaftmitbeschränkterHaftungWuppertal.json
./data/Unternehmensregister/export\GemeinnützigeGesellschaftzurFörderungdesEONEnergyResearchCentermbH.json
./data/Unternehmensregister/export\GeorgSchäfflerGmbH.json
./data/Unternehmensregister/export\GeragonVVGmbH.json
./data/Unternehmensregister/export\GerhardBechtholdGmbH.json
./data/Unternehmensregister/export\GerlachZolldiensteGmbH.json
./data/Unternehmensregister/export\GermanwingsGmbH.json
./data/Unternehmensregister/export\GerresheimerWertheimGmbH.json
./data/Unternehmensregister/export\GerresheimFestausstattungGmbH.json
./data/Unternehmensregister/export\G

 49%|████▉     | 1655/3381 [00:02<00:02, 840.64it/s]

./data/Unternehmensregister/export\HenkelEntsorgungGmbH.json
./data/Unternehmensregister/export\HenkelErsteHoldingGmbH.json
./data/Unternehmensregister/export\HenkelFamilienKG.json
./data/Unternehmensregister/export\HenkelGasarmaturenGmbH.json
./data/Unternehmensregister/export\HenkelGeflitterGmbH.json
./data/Unternehmensregister/export\HenkelGerlachGmbHCo.json
./data/Unternehmensregister/export\HenkelGerlachRügenElektroHandelGmbH.json
./data/Unternehmensregister/export\HenkelGerlachRügenElektroHandelGmbHCoKommanditgesellschaft.json
./data/Unternehmensregister/export\HenkelGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\HenkelGmbH.json
./data/Unternehmensregister/export\HenkelGmbHCo.json
./data/Unternehmensregister/export\HenkelGmbHCoKG.json
./data/Unternehmensregister/export\HenkelGmbHFormularVerlag.json
./data/Unternehmensregister/export\HenkelHausundGrundstücksverwaltungGmbHCoKG.json
./data/Unternehmensregister/export\HenkelHenkelGmbHCoKG.json
./data/Unter

 54%|█████▍    | 1836/3381 [00:02<00:01, 868.18it/s]

./data/Unternehmensregister/export\InfineonTechnologiesBipolarGmbHCoKG.json
./data/Unternehmensregister/export\InfineonTechnologiesBipolarVerwaltungsGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesCampeonVerwaltungsgesellschaftmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesDeltaGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesDresdenGmbHCoKG.json
./data/Unternehmensregister/export\InfineonTechnologiesDresdenVerwaltungsGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesGammaGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesHoldingGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesMantel26AG.json
./data/Unternehmensregister/export\InfineonTechnologiesMantel27GmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesMantel29GmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesMemorySolutionsGermanyGmbH.json
./data/Unternehmensregister/export\InfineonTechnologiesSemiconductorGmbH

 57%|█████▋    | 1931/3381 [00:02<00:01, 886.87it/s]

./data/Unternehmensregister/export\KSBServiceGmbH.json
./data/Unternehmensregister/export\KSBSolarfeldTelligZweiGmbHCoKG.json
./data/Unternehmensregister/export\KSBSolarprojekteGmbHCoKG.json
./data/Unternehmensregister/export\KSBStahlbauBerlinGmbH.json
./data/Unternehmensregister/export\KSBTransferNETUGhaftungsbeschränkt.json
./data/Unternehmensregister/export\KSBVertriebsgesellschaftmbHCoKG.json
./data/Unternehmensregister/export\KSBVerwaltungsGmbH.json
./data/Unternehmensregister/export\KSBWaschundReinigungsmittelGmbH.json
./data/Unternehmensregister/export\KSBWindfeldBrehnaZweiGmbHCoKG.json
./data/Unternehmensregister/export\KSBWindfeldOstGmbHCoKG.json
./data/Unternehmensregister/export\KSBWindfeldParsteinGmbHCoKG.json
./data/Unternehmensregister/export\KSBWindfeldSüderlandIIIGmbHCoKG.json
./data/Unternehmensregister/export\KSBWindGmbHCoKG.json
./data/Unternehmensregister/export\KSBWohnbauGmbHCoKG.json
./data/Unternehmensregister/export\KSCitystoreOHG.json
./data/Unternehmensregiste

 62%|██████▏   | 2101/3381 [00:02<00:01, 734.39it/s]

./data/Unternehmensregister/export\LMHImmobilienGmbHCoKG.json
./data/Unternehmensregister/export\LMHImmobilienHoldingGmbHCoKG.json
./data/Unternehmensregister/export\LODUREnergieanlagenGmbH.json
./data/Unternehmensregister/export\LRIntralogistikGmbH.json
./data/Unternehmensregister/export\LSGAsiaGmbH.json
./data/Unternehmensregister/export\LSGLufthansaServiceEuropaAfrikaGmbH.json
./data/Unternehmensregister/export\LSGLufthansaServiceHoldingAG.json
./data/Unternehmensregister/export\LSGSouthAmericaGmbH.json
./data/Unternehmensregister/export\LSYGmbH.json
./data/Unternehmensregister/export\lturGmbH.json
./data/Unternehmensregister/export\LudwigHenkeleK.json
./data/Unternehmensregister/export\LufthansaAirPlusServicekartenGmbH.json
./data/Unternehmensregister/export\LufthansaAssetManagementGmbH.json
./data/Unternehmensregister/export\LufthansaAssetManagementLeasingGmbH.json
./data/Unternehmensregister/export\LufthansaAviationTrainingGermanyGmbH.json
./data/Unternehmensregister/export\Lufth

 64%|██████▍   | 2177/3381 [00:02<00:01, 700.37it/s]

./data/Unternehmensregister/export\MerckExportGmbH.json
./data/Unternehmensregister/export\MerckFamilyFoundationgGmbH.json
./data/Unternehmensregister/export\MerckFinancialServicesGmbH.json
./data/Unternehmensregister/export\MerckFinancialTradingGmbH.json
./data/Unternehmensregister/export\MerckFinckaQuintetPrivateBankEuropeSAbranch.json
./data/Unternehmensregister/export\MerckFinckPrivatbankiersUnterstützungskasseGmbH.json
./data/Unternehmensregister/export\MerckFoundationgGmbH.json
./data/Unternehmensregister/export\MerckGernsheimHoldingGmbH.json
./data/Unternehmensregister/export\MerckGmbH.json
./data/Unternehmensregister/export\MerckHealthcareGermanyGmbH.json
./data/Unternehmensregister/export\MerckHealthcareHoldingGmbH.json
./data/Unternehmensregister/export\MerckHealthcareKGaA.json
./data/Unternehmensregister/export\MerckHoldingGmbH.json
./data/Unternehmensregister/export\MerckInternationaleBeteiligungenGmbH.json
./data/Unternehmensregister/export\MerckInternationalGmbH.json
./da

 69%|██████▊   | 2317/3381 [00:03<00:01, 649.42it/s]

./data/Unternehmensregister/export\MIPMETROGroupIntellectualPropertyGmbHCoKG.json
./data/Unternehmensregister/export\MIPMETROGroupIntellectualPropertyManagementGmbH.json
./data/Unternehmensregister/export\MIPMETROHoldingManagementGmbH.json
./data/Unternehmensregister/export\MIRAGmbH.json
./data/Unternehmensregister/export\MMSRetailInternationalGmbH.json
./data/Unternehmensregister/export\MNMünsterlandNetzgesellschaftmbHCoKG.json
./data/Unternehmensregister/export\MNVMünsterlandNetzVerwaltungsgesellschaftmbH.json
./data/Unternehmensregister/export\MobilComMultimediaGmbH.json
./data/Unternehmensregister/export\ModellbauHenkelGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\MODMediaOnDemandHansKleinereKfm.json
./data/Unternehmensregister/export\MOLSTANDAVermietungsgesellschaftmbH.json
./data/Unternehmensregister/export\MORCARGrundstücksgesellschaftmbHCooHG.json
./data/Unternehmensregister/export\MOTEONGmbH.json
./data/Unternehmensregister/export\MSEMobileSchlamme

 73%|███████▎  | 2479/3381 [00:03<00:01, 728.98it/s]

./data/Unternehmensregister/export\Prinz5GmbH.json
./data/Unternehmensregister/export\PrivatkinderheimHellaDollGmbH.json
./data/Unternehmensregister/export\ProGrammaInformationssystemeGmbH.json
./data/Unternehmensregister/export\ProgroupPower1GmbH.json
./data/Unternehmensregister/export\ProjektAichachS7GmbHCoKG.json
./data/Unternehmensregister/export\ProjektentwicklungsGmbHFriesenheimerInsel.json
./data/Unternehmensregister/export\ProjektgesellschaftKonradAdenauerUferKölnGmbHCoKG.json
./data/Unternehmensregister/export\ProTelGesellschaftfürKommunikationmbH.json
./data/Unternehmensregister/export\PROTEXiONeK.json
./data/Unternehmensregister/export\ProVerMaGmbH.json
./data/Unternehmensregister/export\PROVISSteuerungstechnikGmbH.json
./data/Unternehmensregister/export\pumaArchitektenPundtMardersteigPartnerschaftsgesellschaftmbB.json
./data/Unternehmensregister/export\PUMABlueSeaGmbH.json
./data/Unternehmensregister/export\pumabärGmbH.json
./data/Unternehmensregister/export\PUMAEuropeGmbH.

 80%|███████▉  | 2694/3381 [00:03<00:00, 891.07it/s]

./data/Unternehmensregister/export\registerdocument-2023-06-23-20-12-19.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-13-06.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-13-11.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-13-18.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-13-23.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-13-30.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-13-35.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-13-43.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-13-53.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-14-01.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-14-05.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-14-14.json
./data/Unternehmensregister/export\registerdocument-2023-06-23-20-14-18.json

 85%|████████▍ | 2869/3381 [00:03<00:00, 814.26it/s]

./data/Unternehmensregister/export\SartoriusHerbstBeteiligungenIIGmbH.json
./data/Unternehmensregister/export\SartoriusHerbstVerwaltungsGmbH.json
./data/Unternehmensregister/export\SartoriusImmobilienUGhaftungsbeschränktCoKG.json
./data/Unternehmensregister/export\SARTORIUSInvestGmbHCoKG.json
./data/Unternehmensregister/export\SartoriusKG.json
./data/Unternehmensregister/export\SartoriusLabHoldingGmbH.json
./data/Unternehmensregister/export\SartoriusLabInstrumentsGmbHCoKG.json
./data/Unternehmensregister/export\SartoriusMetalltechnikGmbH.json
./data/Unternehmensregister/export\SARTORIUSNOVASIGNALGmbH.json
./data/Unternehmensregister/export\SartoriusStedimBiotechGmbH.json
./data/Unternehmensregister/export\SartoriusStedimCellcaGmbH.json
./data/Unternehmensregister/export\SartoriusStedimNorthAmericaHoldingGmbH.json
./data/Unternehmensregister/export\SartoriusStedimPlasticsGmbH.json
./data/Unternehmensregister/export\SartoriusStedimSystemsGmbH.json
./data/Unternehmensregister/export\Sarto

 90%|█████████ | 3046/3381 [00:04<00:00, 843.39it/s]

./data/Unternehmensregister/export\SKIImmobilienBirgitSalzeK.json
./data/Unternehmensregister/export\SKInternationalBeteiligungenGmbH.json
./data/Unternehmensregister/export\SKIPDatentechnikGmbHSystemKonzepteFürInnovativeProdukte.json
./data/Unternehmensregister/export\SKIVerwaltungsGmbHSkikonstruktionsinstitut.json
./data/Unternehmensregister/export\SKManagementGmbH.json
./data/Unternehmensregister/export\SKManagementundBeteiligungsGmbH.json
./data/Unternehmensregister/export\SKMarineSuppliesGmbH.json
./data/Unternehmensregister/export\SKMetallverarbeitungVerwaltungsGmbH.json
./data/Unternehmensregister/export\SKMInformatikGmbH.json
./data/Unternehmensregister/export\SKPhysioServiceGmbHMeuselwitz.json
./data/Unternehmensregister/export\SKRetailGmbH.json
./data/Unternehmensregister/export\SKRobotertechnikGmbH.json
./data/Unternehmensregister/export\SKSauerundKrewettGmbH.json
./data/Unternehmensregister/export\SKSAutozubehörProdukteVertriebsGmbH.json
./data/Unternehmensregister/export\S

 95%|█████████▌| 3214/3381 [00:04<00:00, 766.50it/s]

./data/Unternehmensregister/export\TUIBeteiligungsGmbH.json
./data/Unternehmensregister/export\TUIBKK.json
./data/Unternehmensregister/export\TUIBLUEDEGmbH.json
./data/Unternehmensregister/export\TUIBusinessServicesGmbH.json
./data/Unternehmensregister/export\TUICruisesGmbH.json
./data/Unternehmensregister/export\TUICustomerOperationsGmbH.json
./data/Unternehmensregister/export\TUIDeutschlandGmbH.json
./data/Unternehmensregister/export\TUIflyGmbH.json
./data/Unternehmensregister/export\TUIflyVermarktungsGmbH.json
./data/Unternehmensregister/export\TUIGroupServicesGmbH.json
./data/Unternehmensregister/export\TUIHotelBetriebsgesellschaftmbH.json
./data/Unternehmensregister/export\TUIImmobilienServicesGmbH.json
./data/Unternehmensregister/export\TUIInfoTecGmbH.json
./data/Unternehmensregister/export\TUIInsuranceFinancialGmbH.json
./data/Unternehmensregister/export\TUILeisureTravelServiceGmbH.json
./data/Unternehmensregister/export\TUIReiseCenterJürgenJehleeK.json
./data/Unternehmensregist

100%|██████████| 3381/3381 [00:04<00:00, 750.57it/s]

./data/Unternehmensregister/export\VonoviaTechnischerServiceNordGmbH.json
./data/Unternehmensregister/export\VonoviaTechnischerServiceSüdGmbH.json
./data/Unternehmensregister/export\VonoviaWohnumfeldServiceGmbH.json
./data/Unternehmensregister/export\VULKANINOXGmbH.json
./data/Unternehmensregister/export\VWRInternationalGmbH.json
./data/Unternehmensregister/export\VWRInternationalImmobilienGmbH.json
./data/Unternehmensregister/export\WackerBiotechGmbH.json
./data/Unternehmensregister/export\WackerChemieAchteVentureGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\WackerChemieAG.json
./data/Unternehmensregister/export\WackerChemieElfteVentureGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\WackerChemieVersicherungsvermittlungGmbH.json
./data/Unternehmensregister/export\WackerChemieZwölfteVentureGesellschaftmitbeschränkterHaftung.json
./data/Unternehmensregister/export\WackerNeusonAftermarketServicesGmbH.json
./data/Unternehmensregister/




In [4]:
from aki_prj23_transparenzregister.utils.mongo.connector import (
    MongoConnector,
    MongoConnection,
)
from aki_prj23_transparenzregister.utils.mongo.company_mongo_service import (
    CompanyMongoService,
)

conn_string = MongoConnection(
    hostname="localhost",
    database="transparenzregister",
    username="username",
    password="password",
    port=27017,
)

connector = MongoConnector(conn_string)

service = CompanyMongoService(connector)

In [5]:
from tqdm import tqdm
import glob
import os
import json
from aki_prj23_transparenzregister.models.company import Company

num_inserted = 0
for file in tqdm(glob.glob1("./data/Unternehmensregister/transformed", "*.json")):
    path = os.path.join("./data/Unternehmensregister/transformed", file)
    with open(path, "r", encoding="utf-8") as file_object:
        data = json.loads(file_object.read())
        company: Company = Company(**data)

        company_db = service.get_by_id(company.id)
        if company_db is None:
            service.insert(company)
            num_inserted += 1
print(f"Inserted documents: {num_inserted}")

  0%|          | 0/3147 [00:00<?, ?it/s]

100%|██████████| 3147/3147 [00:32<00:00, 96.11it/s] 

Inserted documents: 3147



