In [1]:
import matplotlib.pyplot as plt
import pandas as pd
import re

In [24]:
def open_and_process_file(name: str) -> dict:
    '''
    dokumentacja napisana na podstawie: https://realpython.com/documenting-python-code/
    
    input -> plik wejściowy, format str
    output -> słownik z danymi 
    
    funkcja bierze jako input string, następnie go otwiera
    w lines zawarta jest informacja o długości pliku - ilość wierszy
    pętla for korzysta z enumerate(..) - jednoczesne iterowanie z numeracją
    w pętli for wycinam nagłówek oraz koniec pliku - linia 17
    następnie tworzę kolejne listy, które w zależności od długości poddaję operacjom:
    len(splitted) == 3 -> appenduję jako X = 0 oraz wartość Y uzyskaną z funkcji procces_single_point
    len(splitted) == 4 -> korzystam z funkcji unkcji procces_single_point
    len(splitted) > 5 świadczy o nowej serii pomiarów, stąd też jeśli X nie jest puste dodaję do słownika całą serię
    na początku gdy len(..)>5 X = [] co odnosi nas do tego, że iterujemy przez całą serię, a następnie ją zapisujemy
    
    '''
    series, data_name, data,  X, Y = 0, '', {}, [], []
    with open(str(name)+'.fet', 'r') as f:
        lines = f.readlines()
        
        for i, line in enumerate(lines[2:-12]):
            splitted = line.split()
            if len(splitted) == 3:
                X.append(0)
                Y.append(procces_single_point(splitted[1]))
            elif len(splitted) == 4:
                X.append(procces_single_point(splitted[1]))
                Y.append(procces_single_point(splitted[2]))
            elif len(splitted) > 5:
                if len(X) > 1:
                    data[data_name] = {'X': X, 'Y': Y}
                    X, Y = [], []
                series += 1
                data_name = 'series ' + str(series)
                
        data[data_name] = {'X': X, 'Y': Y} #uwzględniam ostatnią serię pomiarową, pętla kończy się na przedostatniej

    return data


def procces_single_point(data):
    """
    input -> dict
    output -> wartości X lub Y 'obrane' z tekstu
    
    re.search() odpowiada za znalezienie wyrażenia w zadanym patternie - w tym przypadku "float"
    .group(1) odpowiada za wycięcie "" ze znalezionych wartości
    """
    return re.search('"(.*)"', data).group(1) 


def process_data_to_dataframe(data):
    """
    input ->  dict
    output -> DataFrame
    """
    return pd.DataFrame.from_dict(data)
    
    
def plot_plots(key, dataframe):
    """
    Funkcja przyjmuje klucz oraz wartości DataFrame, a następnie wykorzystuje je do wyrysowania i zapisania wykresów
    Funkcja odpowiada również za zapisanie DataFrame'u do pliku tekstowego
    """
    dataframe['Y'] = pd.to_numeric(dataframe['Y'], downcast="float")
    dataframe.columns=['U' + key[-1] + ' [V]','I' + key[-1] + ' [A]']
    
    dataframe.to_csv(f'{name}_{key}', sep='\t', index=False)

    fig = plt.figure()
    plt.scatter(dataframe[dataframe.columns[0]], dataframe[dataframe.columns[1]], s = 10) 
    plt.title(f'{name}, {key}')
    plt.xlabel('U [V]')
    plt.ylabel('I [mA]')
    plt.savefig(f'{name}_{key}.jpg', dpi=300, format='jpg', transparent=False)
    plt.close()
    

def export_dataframe_to_csv(key,dataframe):
    """
    Funkcja, która umożliwia eksport samych danych, na tej samej zasadzie co plot_plots()
    """
    dataframe['Y'] = pd.to_numeric(dataframe['Y'], downcast="float")
    dataframe.columns=['U' + key[-1] + ' [V]','I' + key[-1] + ' [A]']
    
    dataframe.to_csv(f'{name}_{key}', sep='\t', index=False)

In [25]:
#ustalam nazwę pliku wejściowego
name = 'P3HT_P4VP_PMMA'
#definiuję, że data jest outputem funckji open_and_process_file(name)
data = open_and_process_file(name)
# print(data)

#iteruję po wartościach w słowniku w celu stworzenia data frame'u oraz wywołania funkcji plot_plots dla każdej serii
for key, value in data.items():
    dataframe = process_data_to_dataframe(value)
    data[key]['dataframe'] = dataframe
#     export_dataframe_to_csv(key,dataframe)
    plot_plots(key, dataframe)
    
#tak jak we wcześniejszej wersji programu, szukam wartości maksymalnych i minimalnych
    print(f'\033[1m{key.upper()} \033[0m')
    print(f'Dla {key} minimalna wartość prądu to {min(value["Y"])} [mA]')
    print(f'Dla {key} maksymalna wartość prądu to {max(value["Y"])} [mA]')
    print()

[1mSERIES 1 [0m
Dla series 1 minimalna wartość prądu to -0.0007273284 [mA]
Dla series 1 maksymalna wartość prądu to 0.008976373 [mA]

[1mSERIES 2 [0m
Dla series 2 minimalna wartość prądu to -0.001793686 [mA]
Dla series 2 maksymalna wartość prądu to 0.02185157 [mA]

[1mSERIES 3 [0m
Dla series 3 minimalna wartość prądu to -0.000207254 [mA]
Dla series 3 maksymalna wartość prądu to 0.002351784 [mA]

[1mSERIES 4 [0m
Dla series 4 minimalna wartość prądu to -0.001096689 [mA]
Dla series 4 maksymalna wartość prądu to -8.969168 [mA]

[1mSERIES 5 [0m
Dla series 5 minimalna wartość prądu to -0.001394367 [mA]
Dla series 5 maksymalna wartość prądu to 0.01604709 [mA]



In [226]:
help(open_and_process_file)

Help on function open_and_process_file in module __main__:

open_and_process_file(name: str) -> dict
    dokumentacja napisana na podstawie: https://realpython.com/documenting-python-code/
    
    input -> nazwa pliku wejściowego
    output -> słownik z danymi 
    
    funkcja bierze jako input string, następnie go otwiera
    w lines zawarta jest informacja o długości pliku - ilość wierszy
    pętla for korzysta z enumerate(..) - jednoczesne iterowanie z numeracją
    w pętli for wycinam nagłówek oraz koniec pliku - linia 17
    następnie tworzę kolejne listy, które w zależności od długości poddaję operacjom:
    len(splitted) == 3 -> appenduję jako X = 0 oraz wartość Y uzyskaną z funkcji procces_single_point
    len(splitted) == 4 -> korzystam z funkcji unkcji procces_single_point
    len(splitted) > 5 świadczy o nowej serii pomiarów, stąd też jeśli X nie jest puste dodaję do słownika całą serię
    na początku gdy len(..)>5 X = [] co odnosi nas do tego, że iterujemy przez całą ser