From 3cd8860312e3001b767322b3071e97922e4d525b Mon Sep 17 00:00:00 2001 From: TrisNol Date: Tue, 27 Jun 2023 19:49:23 +0200 Subject: [PATCH] adding distric court location to export --- .../Unternehmensregister/notebook.ipynb | 60 +++++++++++++------ 1 file changed, 41 insertions(+), 19 deletions(-) diff --git a/Jupyter/API-tests/Unternehmensregister/notebook.ipynb b/Jupyter/API-tests/Unternehmensregister/notebook.ipynb index 905c9c1..950c0f7 100644 --- a/Jupyter/API-tests/Unternehmensregister/notebook.ipynb +++ b/Jupyter/API-tests/Unternehmensregister/notebook.ipynb @@ -463,7 +463,7 @@ }, { "cell_type": "code", - "execution_count": 1, + "execution_count": 2, "metadata": {}, "outputs": [ { @@ -472,7 +472,7 @@ "3405" ] }, - "execution_count": 1, + "execution_count": 2, "metadata": {}, "output_type": "execute_result" } @@ -489,7 +489,7 @@ }, { "cell_type": "code", - "execution_count": 2, + "execution_count": 3, "metadata": {}, "outputs": [ { @@ -3935,11 +3935,21 @@ }, { "cell_type": "code", - "execution_count": null, + "execution_count": 10, "metadata": {}, - "outputs": [], + "outputs": [ + { + "name": "stderr", + "output_type": "stream", + "text": [ + "0it [00:00, ?it/s]\n" + ] + } + ], "source": [ - "for file in glob.glob1(\"./data/Unternehmensregister/\", \"*.json\"):\n", + "from tqdm import tqdm\n", + "\n", + "for file in tqdm(glob.glob1(\"./data/Unternehmensregister/\", \"*.json\")):\n", " path = os.path.join(\"./data/Unternehmensregister/\", file)\n", " with open(path, \"r\", encoding=\"utf-8\") as file_object:\n", " data = json.loads(file_object.read())" @@ -3947,7 +3957,7 @@ }, { "cell_type": "code", - "execution_count": 27, + "execution_count": 8, "metadata": {}, "outputs": [], "source": [ @@ -4109,16 +4119,28 @@ " \"hr_number\": data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\n", " \"Instanzdaten\"\n", " ][\"Aktenzeichen\"],\n", - " \"district_court\": data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\n", - " \"Beteiligung\"\n", - " ][1][\"Beteiligter\"][\"Organisation\"][\"Bezeichnung\"][\"Bezeichnung_Aktuell\"]\n", - " if \"Organisation\"\n", - " in data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\"Beteiligung\"][1][\n", - " \"Beteiligter\"\n", - " ]\n", - " else data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\"Beteiligung\"][1][\n", - " \"Beteiligter\"\n", - " ][\"Natuerliche_Person\"][\"Voller_Name\"][\"Nachname\"],\n", + " \"district_court\": {\n", + " \"name\": data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\n", + " \"Beteiligung\"\n", + " ][1][\"Beteiligter\"][\"Organisation\"][\"Bezeichnung\"][\"Bezeichnung_Aktuell\"]\n", + " if \"Organisation\"\n", + " in data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\"Beteiligung\"][1][\n", + " \"Beteiligter\"\n", + " ]\n", + " else data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\"Beteiligung\"][\n", + " 1\n", + " ][\"Beteiligter\"][\"Natuerliche_Person\"][\"Voller_Name\"][\"Nachname\"],\n", + " \"city\": data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\n", + " \"Beteiligung\"\n", + " ][1][\"Beteiligter\"][\"Organisation\"][\"Sitz\"][\"Ort\"]\n", + " if \"Organisation\"\n", + " in data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\"Beteiligung\"][1][\n", + " \"Beteiligter\"\n", + " ]\n", + " else data[\"XJustiz_Daten\"][\"Grunddaten\"][\"Verfahrensdaten\"][\"Beteiligung\"][\n", + " 1\n", + " ][\"Beteiligter\"][\"Natuerliche_Person\"][\"Anschrift\"][\"Ort\"],\n", + " },\n", " }\n", " result[\"name\"] = name_from_beteiligung(data)\n", "\n", @@ -4139,7 +4161,7 @@ }, { "cell_type": "code", - "execution_count": 29, + "execution_count": 11, "metadata": {}, "outputs": [ { @@ -4153,7 +4175,7 @@ "name": "stderr", "output_type": "stream", "text": [ - "100%|██████████| 3381/3381 [00:03<00:00, 1048.99it/s]\n" + "100%|██████████| 3381/3381 [00:06<00:00, 514.81it/s]\n" ] } ],