In [14]:
import pandas as pd

In [15]:
file_path = 'Farma_db.xlsx'
df = pd.read_excel(file_path)
df = df[df['Основний КВЕД (номер)'] == 47.73]

In [16]:
def calculate_statistics(group, column):
    stats = {
        'mean': group[column].mean(),
        'median': group[column].median(),
        'min': group[column].min(),
        'max': group[column].max(),
        '25_percentile': group[column].quantile(0.25),
        '75_percentile': group[column].quantile(0.75)
    }
    return stats

### Оборотність активів (Total Assets Turnover) = Виручка / Активи (середньорічні) +

In [20]:
grouped = df.groupby('Тип компанії за формою подачі фінансової звітності 2023')

def calculate_tat_stats(group):
    filtered_group = group.dropna(subset=[
        'Виручка 2021', 'Активи 2021',
        'Виручка 2022', 'Активи 2022',
        'Виручка 2023', 'Активи 2023'
    ])
    if filtered_group.empty:
        return pd.DataFrame(columns=['Year', 'Max', 'Min', 'Mean', 'Median', '25th Percentile', '75th Percentile'])

    roa_2021 = filtered_group['Виручка 2021'] / filtered_group['Активи 2021']
    roa_2022 = filtered_group['Виручка 2022'] / filtered_group['Активи 2022']
    roa_2023 = filtered_group['Виручка 2023'] / filtered_group['Активи 2023']

    stats_2021 = roa_2021.describe(percentiles=[.25, .5, .75])
    stats_2022 = roa_2022.describe(percentiles=[.25, .5, .75])
    stats_2023 = roa_2023.describe(percentiles=[.25, .5, .75])

    return pd.DataFrame({
        'Year': ['2021', '2022', '2023'],
        'Max': [stats_2021['max'], stats_2022['max'], stats_2023['max']],
        'Min': [stats_2021['min'], stats_2022['min'], stats_2023['min']],
        'Mean': [stats_2021['mean'], stats_2022['mean'], stats_2023['mean']],
        'Median': [stats_2021['50%'], stats_2022['50%'], stats_2023['50%']],
        '25th Percentile': [stats_2021['25%'], stats_2022['25%'], stats_2023['25%']],
        '75th Percentile': [stats_2021['75%'], stats_2022['75%'], stats_2023['75%']]
    })

tat_stats_by_group = grouped.apply(calculate_tat_stats).reset_index(level=1, drop=True).reset_index()

output_file_path = 'statistics_results.xlsx'  
tat_stats_by_group.to_excel(output_file_path, index=False)

print(tat_stats_by_group)

  Тип компанії за формою подачі фінансової звітності 2023  Year          Max  \
0                     Велике та середнє підприємство       2021    11.903727   
1                     Велике та середнє підприємство       2022    13.101203   
2                     Велике та середнє підприємство       2023    11.555538   
3                                  Мале підприємство       2021   249.539683   
4                                  Мале підприємство       2022    72.210938   
5                                  Мале підприємство       2023   179.834742   
6                                  Мікропідприємство       2021    27.969419   
7                                  Мікропідприємство       2022    50.333333   
8                                  Мікропідприємство       2023  2309.909091   

        Min       Mean    Median  25th Percentile  75th Percentile  
0  0.088346   4.689657  4.535523         3.370355         6.011475  
1  0.057321   4.803089  4.403434         3.176765         6.2

In [35]:
grouped = df.groupby('Тип компанії за формою подачі фінансової звітності 2023')

def calculate_roa(group):
    filtered_group = group.dropna(subset=[
        'Виручка 2021', 'Активи 2021', 
        'Виручка 2022', 'Активи 2022',
        'Виручка 2023', 'Активи 2023', 
    ])
    
    if filtered_group.empty:
        return pd.DataFrame(columns=['Year', 'ROA'])

    # Calculate sums
    sum_debt_2021 = filtered_group['Виручка 2021'].sum()
    sum_assets_2021 = filtered_group['Активи 2021'].sum()

    sum_debt_2022 = filtered_group['Виручка 2022'].sum()
    sum_assets_2022 = filtered_group['Активи 2022'].sum()

    sum_debt_2023 = filtered_group['Виручка 2023'].sum()
    sum_assets_2023 = filtered_group['Активи 2023'].sum()

    roa_2021 = (sum_debt_2021) / sum_assets_2021 if sum_assets_2021 != 0 else 0
    roa_2022 = (sum_debt_2022 ) / sum_assets_2022 if sum_assets_2022 != 0 else 0
    roa_2023 = (sum_debt_2023 ) / sum_assets_2023 if sum_assets_2023 != 0 else 0

    return pd.DataFrame({
        'Year': ['2021', '2022', '2023'],
        'Total Assets Turnover': [roa_2021, roa_2022, roa_2023]
    })

roa_stats_by_group = grouped.apply(calculate_roa).reset_index(level=1, drop=True).reset_index()


print(roa_stats_by_group)


  Тип компанії за формою подачі фінансової звітності 2023  Year  \
0                     Велике та середнє підприємство       2021   
1                     Велике та середнє підприємство       2022   
2                     Велике та середнє підприємство       2023   
3                                  Мале підприємство       2021   
4                                  Мале підприємство       2022   
5                                  Мале підприємство       2023   
6                                  Мікропідприємство       2021   
7                                  Мікропідприємство       2022   
8                                  Мікропідприємство       2023   

   Total Assets Turnover  
0               4.012874  
1               3.807431  
2               3.725326  
3               3.821100  
4               3.706935  
5               3.526569  
6               3.277608  
7               3.022410  
8               3.070304  


### Частка грошових коштів в активах (Cash to Assets Ratio) = Грошові кошти та еквіваленти / Активи.

In [None]:
grouped = df.groupby('Тип компанії за формою подачі фінансової звітності 2023')

def calculate_tat_stats(group):
    filtered_group = group.dropna(subset=[
        'Гроші та їх еквіваленти 2021', 'Активи 2021',
        'Гроші та їх еквіваленти 2022', 'Активи 2022',
        'Гроші та їх еквіваленти 2023', 'Активи 2023'
    ])
    if filtered_group.empty:
        return pd.DataFrame(columns=['Year', 'Max', 'Min', 'Mean', 'Median', '25th Percentile', '75th Percentile'])

    roa_2021 = filtered_group['Гроші та їх еквіваленти 2021'] / filtered_group['Активи 2021']
    roa_2022 = filtered_group['Гроші та їх еквіваленти 2022'] / filtered_group['Активи 2022']
    roa_2023 = filtered_group['Гроші та їх еквіваленти 2023'] / filtered_group['Активи 2023']

    stats_2021 = roa_2021.describe(percentiles=[.25, .5, .75])
    stats_2022 = roa_2022.describe(percentiles=[.25, .5, .75])
    stats_2023 = roa_2023.describe(percentiles=[.25, .5, .75])

    return pd.DataFrame({
        'Year': ['2021', '2022', '2023'],
        'Max': [stats_2021['max'], stats_2022['max'], stats_2023['max']],
        'Min': [stats_2021['min'], stats_2022['min'], stats_2023['min']],
        'Mean': [stats_2021['mean'], stats_2022['mean'], stats_2023['mean']],
        'Median': [stats_2021['50%'], stats_2022['50%'], stats_2023['50%']],
        '25th Percentile': [stats_2021['25%'], stats_2022['25%'], stats_2023['25%']],
        '75th Percentile': [stats_2021['75%'], stats_2022['75%'], stats_2023['75%']]
    })

tat_stats_by_group = grouped.apply(calculate_tat_stats).reset_index(level=1, drop=True).reset_index()

output_file_path = 'statistics_results.xlsx'  
tat_stats_by_group.to_excel(output_file_path, index=False)

print(tat_stats_by_group)

In [34]:
grouped = df.groupby('Тип компанії за формою подачі фінансової звітності 2023')

def calculate_roa(group):
    filtered_group = group.dropna(subset=[
        'Гроші та їх еквіваленти 2021', 'Активи 2021', 
        'Гроші та їх еквіваленти 2022', 'Активи 2022', 
        'Гроші та їх еквіваленти 2023', 'Активи 2023', 
    ])
    
    if filtered_group.empty:
        return pd.DataFrame(columns=['Year', 'ROA'])

    sum_debt_2021 = filtered_group['Гроші та їх еквіваленти 2021'].sum()
    sum_assets_2021 = filtered_group['Виручка 2021'].sum()

    sum_debt_2022 = filtered_group['Гроші та їх еквіваленти 2022'].sum()
    sum_assets_2022 = filtered_group['Виручка 2022'].sum()

    sum_debt_2023 = filtered_group['Гроші та їх еквіваленти 2023'].sum()
    sum_assets_2023 = filtered_group['Виручка 2023'].sum()

    roa_2021 = (sum_debt_2021 ) / sum_assets_2021 if sum_assets_2021 != 0 else 0
    roa_2022 = (sum_debt_2022 ) / sum_assets_2022 if sum_assets_2022 != 0 else 0
    roa_2023 = (sum_debt_2023) / sum_assets_2023 if sum_assets_2023 != 0 else 0

    return pd.DataFrame({
        'Year': ['2021', '2022', '2023'],
        'Cash to Assets Ratio': [roa_2021, roa_2022, roa_2023]
    })

roa_stats_by_group = grouped.apply(calculate_roa).reset_index(level=1, drop=True).reset_index()
print(roa_stats_by_group)


  Тип компанії за формою подачі фінансової звітності 2023  Year  \
0                     Велике та середнє підприємство       2021   
1                     Велике та середнє підприємство       2022   
2                     Велике та середнє підприємство       2023   
3                                  Мале підприємство       2021   
4                                  Мале підприємство       2022   
5                                  Мале підприємство       2023   
6                                  Мікропідприємство       2021   
7                                  Мікропідприємство       2022   
8                                  Мікропідприємство       2023   

   Cash to Assets Ratio  
0              0.013511  
1              0.022317  
2              0.030678  
3              0.025459  
4              0.026652  
5              0.032050  
6              0.039883  
7              0.032893  
8              0.036464  


### Net Profit Margin

In [25]:
grouped = df.groupby('Тип компанії за формою подачі фінансової звітності 2023')

def calculate_tat_stats(group):
    filtered_group = group.dropna(subset=[
        'Чистий прибуток 2021', 'Виручка 2021',
        'Чистий прибуток 2022', 'Виручка 2022',
        'Чистий прибуток 2023', 'Виручка 2023'
    ])
    if filtered_group.empty:
        return pd.DataFrame(columns=['Year', 'Max', 'Min', 'Mean', 'Median', '25th Percentile', '75th Percentile'])

    roa_2021 = filtered_group['Чистий прибуток 2021'] / filtered_group['Виручка 2021']
    roa_2022 = filtered_group['Чистий прибуток 2022'] / filtered_group['Виручка 2022']
    roa_2023 = filtered_group['Чистий прибуток 2023'] / filtered_group['Виручка 2023']

    stats_2021 = roa_2021.describe(percentiles=[.25, .5, .75])
    stats_2022 = roa_2022.describe(percentiles=[.25, .5, .75])
    stats_2023 = roa_2023.describe(percentiles=[.25, .5, .75])

    return pd.DataFrame({
        'Year': ['2021', '2022', '2023'],
        'Max': [stats_2021['max'], stats_2022['max'], stats_2023['max']],
        'Min': [stats_2021['min'], stats_2022['min'], stats_2023['min']],
        'Mean': [stats_2021['mean'], stats_2022['mean'], stats_2023['mean']],
        'Median': [stats_2021['50%'], stats_2022['50%'], stats_2023['50%']],
        '25th Percentile': [stats_2021['25%'], stats_2022['25%'], stats_2023['25%']],
        '75th Percentile': [stats_2021['75%'], stats_2022['75%'], stats_2023['75%']]
    })

tat_stats_by_group = grouped.apply(calculate_tat_stats).reset_index(level=1, drop=True).reset_index()

output_file_path = 'statistics_results.xlsx'  
tat_stats_by_group.to_excel(output_file_path, index=False)

print(tat_stats_by_group)

  Тип компанії за формою подачі фінансової звітності 2023  Year       Max  \
0                     Велике та середнє підприємство       2021  0.107347   
1                     Велике та середнє підприємство       2022  0.113933   
2                     Велике та середнє підприємство       2023  0.076497   
3                                  Мале підприємство       2021  0.975510   
4                                  Мале підприємство       2022  1.277639   
5                                  Мале підприємство       2023  1.673659   
6                                  Мікропідприємство       2021  0.850328   
7                                  Мікропідприємство       2022  0.849878   
8                                  Мікропідприємство       2023  0.865320   

         Min      Mean    Median  25th Percentile  75th Percentile  
0  -0.842520 -0.001828  0.004295         0.000004         0.011879  
1  -0.486486  0.003157  0.005237         0.001288         0.012322  
2  -1.303279 -0.010506

In [33]:
grouped = df.groupby('Тип компанії за формою подачі фінансової звітності 2023')

def calculate_roa(group):
    filtered_group = group.dropna(subset=[
        'Чистий борг 2021', 'Активи 2021',  'Гроші та їх еквіваленти 2021',
        'Чистий борг 2022', 'Активи 2022', 'Гроші та їх еквіваленти 2022',
        'Чистий борг 2023', 'Активи 2023', 'Гроші та їх еквіваленти 2023'
    ])
    
    if filtered_group.empty:
        return pd.DataFrame(columns=['Year', 'ROA'])

    # Calculate sums
    sum_debt_2021 = filtered_group['Чистий прибуток 2021'].sum()
    sum_assets_2021 = filtered_group['Виручка 2021'].sum()

    sum_debt_2022 = filtered_group['Чистий прибуток 2022'].sum()
    sum_assets_2022 = filtered_group['Виручка 2022'].sum()

    sum_debt_2023 = filtered_group['Чистий прибуток 2023'].sum()
    sum_assets_2023 = filtered_group['Виручка 2023'].sum()

    # Calculate ROA
    roa_2021 = (sum_debt_2021 ) / sum_assets_2021 if sum_assets_2021 != 0 else 0
    roa_2022 = (sum_debt_2022 ) / sum_assets_2022 if sum_assets_2022 != 0 else 0
    roa_2023 = (sum_debt_2023) / sum_assets_2023 if sum_assets_2023 != 0 else 0

    return pd.DataFrame({
        'Year': ['2021', '2022', '2023'],
        'Net Profit Margin': [roa_2021, roa_2022, roa_2023]
    })
roa_stats_by_group = grouped.apply(calculate_roa).reset_index(level=1, drop=True).reset_index()


print(roa_stats_by_group)


  Тип компанії за формою подачі фінансової звітності 2023  Year  \
0                     Велике та середнє підприємство       2021   
1                     Велике та середнє підприємство       2022   
2                     Велике та середнє підприємство       2023   
3                                  Мале підприємство       2021   
4                                  Мале підприємство       2022   
5                                  Мале підприємство       2023   
6                                  Мікропідприємство       2021   
7                                  Мікропідприємство       2022   
8                                  Мікропідприємство       2023   

   Net Profit Margin  
0           0.007099  
1           0.011175  
2           0.006735  
3           0.004646  
4           0.010159  
5           0.004795  
6           0.005710  
7           0.012627  
8           0.014832  


### Коефіцієнт заборгованості (Debt ratio) = Зобов’язання / Активи (або Борг / Активи)

In [29]:
grouped = df.groupby('Тип компанії за формою подачі фінансової звітності 2023')

def calculate_tat_stats(group):
    filtered_group = group.dropna(subset=[
        'Чистий борг 2021', 'Активи 2021',  'Гроші та їх еквіваленти 2021',
        'Чистий борг 2022', 'Активи 2022', 'Гроші та їх еквіваленти 2022',
        'Чистий борг 2023', 'Активи 2023', 'Гроші та їх еквіваленти 2023'
    ])
    if filtered_group.empty:
        return pd.DataFrame(columns=['Year', 'Max', 'Min', 'Mean', 'Median', '25th Percentile', '75th Percentile'])

    roa_2021 = (filtered_group['Чистий борг 2021'] + filtered_group['Гроші та їх еквіваленти 2021']) / filtered_group['Активи 2021']
    roa_2022 = (filtered_group['Чистий борг 2022'] + filtered_group['Гроші та їх еквіваленти 2022']) / filtered_group['Активи 2022']
    roa_2023 = (filtered_group['Чистий борг 2023'] + filtered_group['Гроші та їх еквіваленти 2023']) / filtered_group['Активи 2023']

    stats_2021 = roa_2021.describe(percentiles=[.25, .5, .75])
    stats_2022 = roa_2022.describe(percentiles=[.25, .5, .75])
    stats_2023 = roa_2023.describe(percentiles=[.25, .5, .75])

    return pd.DataFrame({
        'Year': ['2021', '2022', '2023'],
        'Max': [stats_2021['max'], stats_2022['max'], stats_2023['max']],
        'Min': [stats_2021['min'], stats_2022['min'], stats_2023['min']],
        'Mean': [stats_2021['mean'], stats_2022['mean'], stats_2023['mean']],
        'Median': [stats_2021['50%'], stats_2022['50%'], stats_2023['50%']],
        '25th Percentile': [stats_2021['25%'], stats_2022['25%'], stats_2023['25%']],
        '75th Percentile': [stats_2021['75%'], stats_2022['75%'], stats_2023['75%']]
    })

tat_stats_by_group = grouped.apply(calculate_tat_stats).reset_index(level=1, drop=True).reset_index()

output_file_path = 'statistics_results.xlsx'  
tat_stats_by_group.to_excel(output_file_path, index=False)

print(tat_stats_by_group)

  Тип компанії за формою подачі фінансової звітності 2023  Year         Max  \
0                     Велике та середнє підприємство       2021   11.798054   
1                     Велике та середнє підприємство       2022   13.538562   
2                     Велике та середнє підприємство       2023   12.304143   
3                                  Мале підприємство       2021  106.793651   
4                                  Мале підприємство       2022   11.761240   
5                                  Мале підприємство       2023   36.108247   
6                                  Мікропідприємство       2021   24.404369   
7                                  Мікропідприємство       2022   24.889296   
8                                  Мікропідприємство       2023  249.000000   

   Min      Mean    Median  25th Percentile  75th Percentile  
0  0.0  0.958705  0.959196         0.782751         1.006979  
1  0.0  0.960587  0.930473         0.718020         0.994626  
2  0.0  0.989898  0.

In [32]:
grouped = df.groupby('Тип компанії за формою подачі фінансової звітності 2023')

def calculate_roa(group):
    filtered_group = group.dropna(subset=[
        'Чистий борг 2021', 'Активи 2021',  'Гроші та їх еквіваленти 2021',
        'Чистий борг 2022', 'Активи 2022', 'Гроші та їх еквіваленти 2022',
        'Чистий борг 2023', 'Активи 2023', 'Гроші та їх еквіваленти 2023'
    ])
    
    if filtered_group.empty:
        return pd.DataFrame(columns=['Year', 'ROA'])

    sum_debt_2021 = filtered_group['Чистий борг 2021'].sum()
    sum_cash_2021 = filtered_group['Гроші та їх еквіваленти 2021'].sum()
    sum_assets_2021 = filtered_group['Активи 2021'].sum()

    sum_debt_2022 = filtered_group['Чистий борг 2022'].sum()
    sum_cash_2022 = filtered_group['Гроші та їх еквіваленти 2022'].sum()
    sum_assets_2022 = filtered_group['Активи 2022'].sum()

    sum_debt_2023 = filtered_group['Чистий борг 2023'].sum()
    sum_cash_2023 = filtered_group['Гроші та їх еквіваленти 2023'].sum()
    sum_assets_2023 = filtered_group['Активи 2023'].sum()

    roa_2021 = (sum_debt_2021 + sum_cash_2021) / sum_assets_2021 if sum_assets_2021 != 0 else 0
    roa_2022 = (sum_debt_2022 + sum_cash_2022) / sum_assets_2022 if sum_assets_2022 != 0 else 0
    roa_2023 = (sum_debt_2023 + sum_cash_2023) / sum_assets_2023 if sum_assets_2023 != 0 else 0

    return pd.DataFrame({
        'Year': ['2021', '2022', '2023'],
        'Debt Ratio': [roa_2021, roa_2022, roa_2023]
    })

roa_stats_by_group = grouped.apply(calculate_roa).reset_index(level=1, drop=True).reset_index()


print(roa_stats_by_group)


  Тип компанії за формою подачі фінансової звітності 2023  Year  Debt Ratio
0                     Велике та середнє підприємство       2021    0.882321
1                     Велике та середнє підприємство       2022    0.876227
2                     Велике та середнє підприємство       2023    0.898256
3                                  Мале підприємство       2021    0.832146
4                                  Мале підприємство       2022    0.823103
5                                  Мале підприємство       2023    0.849560
6                                  Мікропідприємство       2021    0.818750
7                                  Мікропідприємство       2022    0.816922
8                                  Мікропідприємство       2023    0.705396
