# Практика
Используемые библиотеки

In [None]:
import pandas as pd
import numpy as np
import requests # for web-download
import io # for web-download
import re # for data processing


## Загрузка DataFrame
### Задача 1
На основании данных портала "Открытые данные России" о результатах Химического анализа родника в Нескучном саду https://data.gov.ru/opendata/7708660670-rodnik-neskuchniy-sad
средствами библиотеки __Pandas__ сформируйте поле выводов по каждому анализирумомому параметру.
Например, по показателю _pH_ получен результат _8.4 единицы pH_ при нормативе от _6 до 9 единиц pH_. Т.о. по данному показателю результат анализа в норме.
Для решения задачи необходимо программно "прочитать и понять" значение столбца "Норматив" и выделенное численное значение сравнить с нормативом согласно логике норматива. Например, __6 >= pH >= 9__.
В итоговом DataFrame столбец "Показатель" сделайте индексным.


Загзрузка DataFrame выполняется непосредственно c сайта "Открытые данные России" https://data.gov.ru/opendata/7708660670-rodnik-neskuchniy-sad/data-20160608T1215-structure-20160608T1215.csv (см. код ниже).


In [None]:
df=pd.read_csv("Химический анализ родника в Нескучном саду.csv", sep=';')
display(df)

Unnamed: 0,Показатель,Единица измерений,Результат анализа,Норматив
0,pH,единицы pH,8.4,в пределах 6-9
1,Запах,баллы,1,не более 2-3
2,Цветность,градусы,б/цвета,не более 30
3,Жёсткость,мг-эквл/дм3,9.199999999999999,в пределах 7-10
4,Аммиак и аммоний-ион (по азоту),мг/дм3,0.42,"не более 1,5"
5,Нитриты (по NO2),мг/дм3,0.017,"не более 3,3"
6,Нитраты (по NO3),мг/дм3,24,не более 45
7,Фосфаты (P),мг/дм3,0.36,"не более 3,5"
8,Хлориды (Cl),мг/дм3,200,не более 350
9,Сульфаты (SO4),мг/дм3,189.5,не более 500


In [None]:
# Делаем столбец показатель индексным
df.set_index("Показатель", inplace=True)

# Добавляем новый столбец в конец таблицы с булевыми значениями
df.insert(loc=len(df.columns), column='В норме', value=False)
display(df)

Unnamed: 0_level_0,Единица измерений,Результат анализа,Норматив,В норме
Показатель,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
pH,единицы pH,8.4,в пределах 6-9,False
Запах,баллы,1,не более 2-3,False
Цветность,градусы,б/цвета,не более 30,False
Жёсткость,мг-эквл/дм3,9.199999999999999,в пределах 7-10,False
Аммиак и аммоний-ион (по азоту),мг/дм3,0.42,"не более 1,5",False
Нитриты (по NO2),мг/дм3,0.017,"не более 3,3",False
Нитраты (по NO3),мг/дм3,24,не более 45,False
Фосфаты (P),мг/дм3,0.36,"не более 3,5",False
Хлориды (Cl),мг/дм3,200,не более 350,False
Сульфаты (SO4),мг/дм3,189.5,не более 500,False


In [None]:
# Из стоблца норматив убираем слова и заменяем запятые на точки, чтобы можно было преобразовать во float
df['Норматив'] = df['Норматив'].str.replace("не более 2-3", "2").str.replace("в пределах", "").str.replace(",",".").str.replace("не более",'')

In [None]:
df['Норматив']

Показатель
pH                                         6-9
Запах                                        2
Цветность                                   30
Жёсткость                                 7-10
Аммиак и аммоний-ион (по азоту)            1.5
Нитриты (по NO2)                           3.3
Нитраты (по NO3)                            45
Фосфаты (P)                                3.5
Хлориды (Cl)                               350
Сульфаты (SO4)                             500
Железо (включая хлорное железо) по Fe      0.3
Нефть                                      0.3
Общая минерализация (сухой остаток)       1000
Окисляемость перманганатная                0.5
Name: Норматив, dtype: object

In [None]:
#В столбце есть строковое значение, которое пу сути значит 0, меняем его, чтобы можно было сравнивать
df['Результат анализа'] = df['Результат анализа'].replace('б/цвета', 0)
display(df)

Unnamed: 0_level_0,Единица измерений,Результат анализа,Норматив,В норме
Показатель,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
pH,единицы pH,8.4,6-9,False
Запах,баллы,1.0,2,False
Цветность,градусы,0.0,30,False
Жёсткость,мг-эквл/дм3,9.2,7-10,False
Аммиак и аммоний-ион (по азоту),мг/дм3,0.42,1.5,False
Нитриты (по NO2),мг/дм3,0.017,3.3,False
Нитраты (по NO3),мг/дм3,24.0,45,False
Фосфаты (P),мг/дм3,0.36,3.5,False
Хлориды (Cl),мг/дм3,200.0,350,False
Сульфаты (SO4),мг/дм3,189.5,500,False


In [None]:
# Получаем значения всех строк таблицы, выделяем нужные строки
for i, row in df.iterrows():
    result = row['Результат анализа']
    norm = row['Норматив']

    # Проверяем тип норматива: числовой диапазон или просто число
    if '-' in norm:
        min_val, max_val = norm.split('-')
        if float(min_val) <= float(result) <= float(max_val):
          #Если значение результата анализа внутри диапазона возвращаем True в столбец "В норме"
            df.at[i, 'В норме'] = True
    else:
        if float(result) < float(norm):
          #Если значение результата анализа не превышает норму возвращаем True в столбец "В норме"
            df.at[i, 'В норме'] = True

In [None]:
print(df[['Результат анализа','Норматив','В норме']])

                                       Результат анализа Норматив  В норме
Показатель                                                                
pH                                                   8.4      6-9     True
Запах                                                  1        2     True
Цветность                                              0       30     True
Жёсткость                              9.199999999999999     7-10     True
Аммиак и аммоний-ион (по азоту)                     0.42      1.5     True
Нитриты (по NO2)                                   0.017      3.3     True
Нитраты (по NO3)                                      24       45     True
Фосфаты (P)                                         0.36      3.5     True
Хлориды (Cl)                                         200      350     True
Сульфаты (SO4)                                     189.5      500     True
Железо (включая хлорное железо) по Fe              0.019      0.3     True
Нефть                    

## Теория вероятности. События

Требуется сгенерировать необходимые выборки и произвести по ним расчеты

### Задача 2
В ящике 5 апельсинов и 4 яблока. Наудачу выбираются 3 фрукта. Какова вероятность, что все три фрукта – апельсины?

В интернете полученный аналитически ответ 0.119. Подтверждается ли он эксперементально?


In [None]:
# Ваше решение
import random

def simulate_experiment(num_simulations):
    num_success = 0 # счетчик успешных случаев, все три фрукта - апельсины

    for _ in range(num_simulations):
        fruits = ['orange'] * 5 + ['apple'] *4
        chosen_fruits = random.sample(fruits, 3) # случайно выбираем три фрукта из ящика

        if all(fruit == 'orange' for fruit in chosen_fruits): # проверяем, что все три фрукта апельсины
            num_success += 1

    probability = num_success / num_simulations # вероятность = количество успешных случаев / количество симуляций
    return probability

num_simulations = 1000000 # количество симуляций
probability = simulate_experiment(num_simulations)

print(f"The experimental probability is: {probability}")

The experimental probability is: 0.119847


### Задача 3
Мастер, имея 10 деталей, из которых 3 – нестандартных, проверяет детали одну за другой, пока ему не попадется стандартная. Какова вероятность, что он проверит ровно две детали?


В интернете полученный аналитически ответ 7/30 или 0.23333. Подтверждается ли он эксперементально?

In [None]:
# Ваше решение

def simulate_experiment2(num_simulations2):
    num_success2 = 0 # счетчик успешных случаев

    for _ in range(num_simulations2):
        details = ['Стандартная'] * 7 + ['Нестандартная'] * 3
        chosen_details = random.sample(details, 2) # случайно выбираем две детали

        if (chosen_details[0] == 'Нестандартная' and chosen_details[1] == 'Стандартная'): # проверяем, что
            num_success2 += 1

    probability2 = num_success2 / num_simulations2 # вероятность = количество успешных случаев / количество симуляций
    return probability2

num_simulations2 = 1000000 # количество симуляций
probability2 = simulate_experiment2(num_simulations2)

print(f"The experimental probability is: {probability2}")

The experimental probability is: 0.233654


In [None]:
a= ['Стандартная'] * 7 +['Нестандартная'] * 3
print(a)

['orange', 'orange', 'orange', 'orange', 'orange', 'apple', 'apple', 'apple', 'apple']
