# Ziel: Überführung der DPH-Daten aus Excel in ein CSV-Format für den Import in GeODin

In [1]:
import pandas as pd
import os
from DPH_Excel_to_CSV import parse_excel, stack_columns, write_csv, vorschachtung

## Erste Excel lesen

In [2]:
df = parse_excel('DPH_Excel/DPH-153.xlsx')
df

Unnamed: 0,Tiefe,Schläge,Tiefe.1,Schläge.1,Tiefe.2,Schläge.2
2,0.1,,3.1,4,6.1,
3,0.2,,3.2,5,6.2,
4,0.3,,3.3,5,6.3,
5,0.4,,3.4,4,6.4,
6,0.5,,3.5,5,6.5,
7,0.6,,3.6,5,6.6,
8,0.7,,3.7,5,6.7,
9,0.8,,3.8,4,6.8,
10,0.9,,3.9,4,6.9,
11,1.0,,4.0,5,7.0,


## Für CSV-Export vorbereiten

-> Stapeln, sodass alle Tiefen und alle Schläge in je einer Spalte sind

In [7]:
df_stacked = stack_columns(df)

df_bis_6 = df_stacked[df_stacked['Tiefe'] <= 6]

df_vorschachtung = vorschachtung(df_bis_6)

df_vorschachtung.head(20)

Vorschachtung bis  2.0 m.


Unnamed: 0,Tiefe,Schläge
0,0.1,
1,0.2,
2,0.3,
3,0.4,
4,0.5,
5,0.6,
6,0.7,
7,0.8,
8,0.9,
9,1.0,


## Loop über alle Excels im Ordner

In [2]:
for file in os.listdir('DPH_Excel'):
    if file.endswith('.xlsx'):
        # aktuelle Datei
        print('----', file, '----')
        
        # Excel lesen
        df = parse_excel(f"DPH_Excel/{file}")
        
        # Stapeln
        df_stacked = stack_columns(df)
        
        # DPHs nur bis 6 Meter
        df_bis_6 = df_stacked[df_stacked['Tiefe'] <= 6]
        
        # Vorschachtung
        df_vorschachtung = vorschachtung(df_bis_6)
        
        # CSV exportieren
        filename = file.replace('xlsx', 'csv')
        path = f"DPH_CSV/{filename}"
        write_csv(df_vorschachtung, path)
        print(filename, 'gespeichert.')

---- DPH-116.xlsx ----
Vorschachtung bis  2.0 m.
DPH-116.csv gespeichert.
---- DPH-117.xlsx ----
Vorschachtung bis  2.0 m.
DPH-117.csv gespeichert.
---- DPH-118.xlsx ----
DPH-118.csv gespeichert.
---- DPH-119.xlsx ----
DPH-119.csv gespeichert.
---- DPH-122.xlsx ----
DPH-122.csv gespeichert.
---- DPH-123.xlsx ----
DPH-123.csv gespeichert.
---- DPH-124.xlsx ----
DPH-124.csv gespeichert.
---- DPH-125.xlsx ----
DPH-125.csv gespeichert.
---- DPH-126.xlsx ----
DPH-126.csv gespeichert.
---- DPH-127.xlsx ----
DPH-127.csv gespeichert.
---- DPH-132.xlsx ----
DPH-132.csv gespeichert.
---- DPH-133.xlsx ----
DPH-133.csv gespeichert.
---- DPH-140.xlsx ----
DPH-140.csv gespeichert.
---- DPH-145.xlsx ----
DPH-145.csv gespeichert.
---- DPH-147.xlsx ----
DPH-147.csv gespeichert.
---- DPH-149.xlsx ----
DPH-149.csv gespeichert.
---- DPH-150.xlsx ----
Vorschachtung bis  1.2 m.
DPH-150.csv gespeichert.
---- DPH-151.xlsx ----
Vorschachtung bis  1.2 m.
DPH-151.csv gespeichert.
---- DPH-152.xlsx ----
Vorschach

## Debug: Zählen, wie viele DPHs bis 6 Meter gehen

In [61]:
count = 0

for file in os.listdir('DPH_Excel'):
    if file.endswith('.xlsx'):
        df = parse_excel(f"DPH_Excel/{file}")
        df_stacked = stack_columns(df)

        if not pd.isnull(df_stacked.loc[6.0, 'Schläge']):
            count += 1
        else:
            print(file)
print(count)

DPH-125.xlsx
97


## Testen der Funktionen

In [3]:
file = 'DPH-116.xlsx'

df = parse_excel(f"DPH_Excel/{file}")
df_stacked = stack_columns(df)
df_bis_6 = df_stacked[df_stacked['Tiefe'] <= 6]
df_vorschachtung = vorschachtung(df_bis_6)
filename = file.replace('xlsx', 'csv')
path = f"DPH_CSV/{filename}"
write_csv(df_vorschachtung, path)

Vorschachtung bis  2.0 m.
