## Projekt Symulacja Komputerowa - Symulacja wzrostu roślin
## Przemysław Postrach
## Informatyka - Studia Niestacjonarne 2022
## Wydział Elektrotechniki, Automatyki i Informatyki

Celem projektu jest opracowanie oprogramowania mającego na celu symulację wzrostu roślin. Oprogramowanie zrealizowano przy użyciu języka Python i notatnika Jupyter.

Używane biblioteki
- Faker - Generowanie losowych danych
- Pandas - Obsługa CSV oraz elementów statystycznych
- Altair - Rysowanie wykresów na podstawie wygenerowanych danych

Projekt został przedstawiony w formie notatnika Jupyter, dzięki temu zaprezentowano cały jego działający kod, który zamieszczono poniżej. W symulacji wygenerowano dane dla stu tysięcy roślin.

In [43]:
# Ustalanie prawdopodobieństw wag dla zdarzeń związanych ze wzrostem roślin

## Gleba
Waga 0.1 najbardziej niekorzystna gleba - 10%\
Waga 0.4 niekorzystna gleba - 20%\
Waga 0.7 niekorzystna gleba - 40%\
Waga 1.0 gleba normalna - 20%\
Waga 1.3 gleba sprzyjająca rozwojowi rośliny - 10%

In [44]:
soil = [(0.1, 0.1), (0.4, 0.2), (0.7, 0.4), (1.0, 0.2), (1.3, 0.1)]

## Wilgotność
Waga 0.0 roślina umiera z powodu przelania - 5%\
Waga 0.2 roślina ma zdecydowanie za dużo wody - 10%\
Waga 0.4 roślina ma o wiele za dużo wody - 15%\
Waga 0.6 roślina ma za dużo wody - 25%\
Waga 0.8 roślina ma trochę za dużo wody - 25%\
Waga 1.0 roślina ma dobrą ilość wody - 10%\
Waga 1.2 roślina ma idealną ilość wody - 10%

In [45]:
humidity = [(0.0, 0.05), (0.2, 0.1), (0.4, 0.15), (0.6, 0.25), (0.8, 0.25), (1.0, 0.1), (1.2, 0.1)]

## Słońce
Waga 0.6 roślina cierpi na duży brak słońca - 10%\
Waga 0.8 roślina cierpi na niewielki brak słońca - 25%\
Waga 1.0 roślina posiada normalną ilość światła słonecznego - 30%\
Waga 1.2 roślina posiada bardzo dobrą ilość światła słonecznego - 25%\
Waga 1.4 roślina posiada idealną ilość światła słonecznego - 10%

In [46]:
sun = [(0.6, 0.1), (0.8, 0.25), (1.0, 0.3), (1.2, 0.25), (1.4, 0.1)]

## Zdarzenia losowe
Waga 0.0 roślina umiera z powodu zdarzeń losowych np. stała się pożywieniem dla ptactwa - 1%\
Waga 0.5 roślina ma utrudniony rozwój ze względu na zdarzenia losowe np. porywisty wiatr - 19%\
Waga 1.0 roślina nie cierpi ze względu na żadne zdarzenia losowe - 80%

In [47]:
random_events = [(0.0, 0.01), (0.5, 0.19), (1.0, 0.8)]

In [48]:
# import biblioteki Faker potrzebnej do generowania losowych danych na
# podstawie wcześniej ustalonych wag
from faker import Faker
# import biblioteki pandas która posłuży jako moduł statystyczny
import pandas as pd

class Plant:
    '''Klasa reprezentująca roślinę'''
    def __init__(self, fake: Faker, plant_id: int):
        self.id = plant_id
        # Losowanie gleby dla rośliny
        self.soil = fake.random_choices(elements=soil, length=1)[0][0]
        # Losowanie wilgotności dla rośliny
        self.humidity = fake.random_choices(elements=humidity, length=1)[0][0]
        # Losowanie wartości nasłonecznienia dla rośliny
        self.sun = fake.random_choices(elements=sun, length=1)[0][0]
        # Losowanie wartości zdarzeń losowych dla rośliny
        self.random_events = fake.random_choices(elements=random_events, length=1)[0][0]
        # Obliczenie wyniku symulacji poprzez przemnożenie wszystkich elementów
        self.result = self.soil * self.humidity * self.sun * self.random_events

def generate_plants(fake: Faker, count=100_000):
    '''Funkcja generująca dane na temat roślin'''
    for i in range(count):
        yield Plant(fake, i)

In [49]:
# Tworzenie instancji Faker
fake = Faker(['pl-PL'])
# Wczytywanie wygenerowanych danych do ramki danych biblioteki pandas
df = pd.DataFrame(map(lambda x: x.__dict__, generate_plants(fake)))

In [50]:
# Wyświetlenie kolumn w ramce danych
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 100000 entries, 0 to 99999
Data columns (total 6 columns):
 #   Column         Non-Null Count   Dtype  
---  ------         --------------   -----  
 0   id             100000 non-null  int64  
 1   soil           100000 non-null  float64
 2   humidity       100000 non-null  float64
 3   sun            100000 non-null  float64
 4   random_events  100000 non-null  float64
 5   result         100000 non-null  float64
dtypes: float64(5), int64(1)
memory usage: 4.6 MB


In [51]:
# Wyświetlanie pierwszych pięciu wyników symulacji
df.head()

Unnamed: 0,id,soil,humidity,sun,random_events,result
0,0,0.4,0.0,1.2,1.0,0.0
1,1,1.3,0.2,1.2,0.0,0.0
2,2,0.4,0.8,1.4,1.0,0.448
3,3,0.4,0.4,1.4,1.0,0.224
4,4,0.1,0.8,1.4,0.5,0.056


In [52]:
# Obliczenie podstawowych parametrów statystycznych dla zbioru danych
df.describe()

Unnamed: 0,id,soil,humidity,sun,random_events,result
count,100000.0,100000.0,100000.0,100000.0,100000.0,100000.0
mean,49999.5,0.701449,0.597558,0.999458,0.500165,0.209859
std,28867.657797,0.423974,0.399615,0.283182,0.408184,0.33579
min,0.0,0.1,0.0,0.6,0.0,0.0
25%,24999.75,0.4,0.2,0.8,0.0,0.0
50%,49999.5,0.7,0.6,1.0,0.5,0.048
75%,74999.25,1.0,1.0,1.2,1.0,0.3
max,99999.0,1.3,1.2,1.4,1.0,2.184


## Wyniki w zbiorze danych można interpretować następująco
- result<0.1 Roślina umarła
- result>=0.1 and result<0.5 Roślina z mocno zaburzonym rozwojem
- result>=0.5 and result<1.0 Roślina z zaburzonym rozwojem
- result>=1.0 and result<1.3 Roślina normalnie rozwinięta
- result>=1.3 and result<1.9 Roślina bardzo dobrze rozwinięta
- result>=1.9 Roślina idealnie rozwinięta

Symulację przeprowadzono dla 100.000 roślin, poniżej przedstawiono wyniki w formie tekstowej oraz wykresu kołowego.

In [53]:
# Ilośc roślin które umarły
df[df.result < 0.1].result.count()

58054

In [54]:
# Ilość roślin z mocno zaburzonym rozwojem
df[(df.result >= 0.1) & (df.result < 0.5)].result.count()

27185

In [55]:
# Ilość roślin z zaburzonym rozwojem
df[(df.result >= 0.5) & (df.result < 1.0)].result.count()

10601

In [56]:
# Ilość roślin normalnie rozwiniętych
df[(df.result >= 1.0) & (df.result < 1.3)].result.count()

2242

In [57]:
# Ilość roślin bardzo dobrze rozwiniętych
df[(df.result >= 1.3) & (df.result < 1.9)].result.count()

1719

In [58]:
# Ilość roślin idealnie rozwiniętych
df[df.result >= 1.9].result.count()

199

In [59]:
def get_label(row):
    '''Funkcja do pobierania tekstowego wyniku symulacji na podstawie rezultatu'''
    if row.result < 0.1:
        return "Roślina umarła"
    if 0.1 <= row.result < 0.5:
        return "Roślina z mocno zaburzonym rozwojem"
    if 0.5 <= row.result < 1.0:
        return "Roślina z zaburzonym rozwojem"
    if 1.0 <= row.result < 1.3:
        return "Roślina normalnie rozwinięta"
    if 1.3 <= row.result < 1.9:
        return "Roślina bardzo dobrze rozwinięta"
    if row.result >= 1.9:
        return "Roślina idealnie rozwinięta"

df["result_label"] = df.apply(lambda row: get_label(row), axis=1)

In [60]:
# Import biblioteki altair do rysowania wykresów
import altair as alt

In [61]:
# Wykres radialny rozwoju roślin przy użyciu altair
df2 = pd.DataFrame(df, columns=['id', 'result_label'])
df2 = df2.groupby(['result_label']).count()
df2 = df2.rename(columns={'id': 'counts'})
df2["counts"] = df2["counts"].astype('int32')
df2 = df2.reset_index(level=0)
alt.Chart(df2).mark_arc().encode(
    color='result_label', theta='counts', tooltip='counts'
)

  for col_name, dtype in df.dtypes.iteritems():


In [62]:
# Ilość roślin które się rozwinęły
alive_count = df[df.result >= 1.9].result.count() + df[(df.result >= 1.3) & (df.result < 1.9)].result.count() + df[(df.result >= 1.0) & (df.result < 1.3)].result.count()
alive_count

4160

In [63]:
# Procent roślin które się rozwinęły
alive_count / df.result.count()

0.0416

## Wnioski
Powyżej przedstawiono ilość roślin które się rozwinęły jako wartość liczbowa i procentowa w zbiorze danych. Wartość jest mniejsza niż 5% co oznacza, że jedynie niewielka ilość roślin miała odpowiednie warunki do rozwoju.
