# 1. Эксперимент #

Цель работы - освоение алгоритмов классификации на наборе данных, полученных методом Монте Карло. Набор данных представляет собой 3 класса. Каждый класс имеет два признака - время замедления нейтрона и число столкновений.

## Блок нейтронной физики ##

In [1]:
import pandas as pd
import random as rd
import math as math
import scipy.constants as const # Модуль физико-математических констант

# отключим предупреждения Anaconda
import warnings
warnings.simplefilter('ignore')

N_A = const.Avogadro

### Функция жизни нейтрона: ###

In [2]:
# Для одинаковой генерации данных
rd.seed(42)

def life_of_neutron(Ein, Eout, dens, A1, A2, Mol_m, Sigma, alpha_1, alpha_2, sigma_1, sigma_2, x1, x2):
    
    Energy = Ein
    colision = 0 # Число столкновений
    time = 0 # Время полета
    a = 0 # Угол полета
    b = 0 # Изменение угла полета
    l = 0 # Длина пролета
    V = 0 # Скорость
    elder = 0 #Возраст
    while Energy > Eout: #Пока энергия нейтрона лежит в области > ... ЭВ
        l = -1*math.log(rd.random())/Sigma/100 # В метрах
        V = (2*Energy*1.6*(10**(-19))/(1.6749*10**(-27)))**0.5 # В м/с
        time += l/V
        colision += 1
        
        #Разыгрывание на каком ядре произошло рассеяние
        x = rd.random()
        if x < (x1*sigma_1/(x1*sigma_1 + x2*sigma_2)):# Рассеяние на первом ядре
            E1 = Energy
            E2 = Energy*alpha_1
            Energy = rd.uniform(E1, E2)
            b = math.acos

            
        else:# Рассеяние на втором ядре
            E1 = Energy
            E2 = Energy*alpha_2
            Energy = rd.uniform(E1, E2)

    return colision, time

### Входные данные по материалам: ###

In [3]:
df = pd.DataFrame({'Material': ['Water', 'Heavy Plexiglass', 'Heavy Water'],
                   'Density g/cm^3': [1.0, 1.6, 1.1],
                    'A_1' : [1, 12, 2],
                    'A_2' : [16, 2, 16],
                    'Molar mass g/mol' : [18, 28, 20],
                    'Chemical formula' : ['H2O', 'C2D2', 'D2O'],
                    'sigma_1 b' : [30.0, 4.9, 3.5],
                    'sigma_2 b' : [4.0, 3.5, 4.0],
                    'x1' : [2, 2, 2],
                    'x2' : [1, 2, 1],
                    
              })

df

Unnamed: 0,Material,Density g/cm^3,A_1,A_2,Molar mass g/mol,Chemical formula,sigma_1 b,sigma_2 b,x1,x2
0,Water,1.0,1,16,18,H2O,30.0,4.0,2,1
1,Heavy Plexiglass,1.6,12,2,28,C2D2,4.9,3.5,2,2
2,Heavy Water,1.1,2,16,20,D2O,3.5,4.0,2,1


### Расчет макросечения: ###

In [4]:
df['\u03A3, 1/cm'] = 0.0
for k in df.index:
    df['Σ, 1/cm'][k] = (df['x1'][k]*df['sigma_1 b'][k]+df['x2'][k]*df['sigma_2 b'][k]
                       )*N_A*df['Density g/cm^3'][k]/df['Molar mass g/mol'][k]/10**(24)
display(df)

Unnamed: 0,Material,Density g/cm^3,A_1,A_2,Molar mass g/mol,Chemical formula,sigma_1 b,sigma_2 b,x1,x2,"Σ, 1/cm"
0,Water,1.0,1,16,18,H2O,30.0,4.0,2,1,2.141206
1,Heavy Plexiglass,1.6,12,2,28,C2D2,4.9,3.5,2,2,0.578126
2,Heavy Water,1.1,2,16,20,D2O,3.5,4.0,2,1,0.36434


### Расчет ступеньки замедления: ###

In [5]:
df['\u0251_1'] = 0.0
df['\u0251_2'] = 0.0
for k in df.index:
    df['\u0251_1'][k] = ((df['A_1'][k]-1)/(df['A_1'][k]+1))**2
    df['\u0251_2'][k] = ((df['A_2'][k]-1)/(df['A_2'][k]+1))**2
display(df)

Unnamed: 0,Material,Density g/cm^3,A_1,A_2,Molar mass g/mol,Chemical formula,sigma_1 b,sigma_2 b,x1,x2,"Σ, 1/cm",ɑ_1,ɑ_2
0,Water,1.0,1,16,18,H2O,30.0,4.0,2,1,2.141206,0.0,0.778547
1,Heavy Plexiglass,1.6,12,2,28,C2D2,4.9,3.5,2,2,0.578126,0.715976,0.111111
2,Heavy Water,1.1,2,16,20,D2O,3.5,4.0,2,1,0.36434,0.111111,0.778547


### Создание DataFrame для записи данных ###

In [6]:
df1 = pd.DataFrame({'time, 10^(-5) c': [],
                   'colisions': [],
                    'Material' : [],
                    'target' : [] 
              })
df1

Unnamed: 0,"time, 10^(-5) c",colisions,Material,target


### Эксперимент методом Монте-Карло ###

In [None]:
Estart = 1_000_000 #1Мэв
Eend = 1 #1 Эв
Colision = [0, 0, 0, 0]
Time = [0, 0, 0, 0]
number_of_event = 300
counter = 0 # Счетчик для записи в DataFrame
for k in df.index: #Цикл по материалам
    for i in range(0, number_of_event*(k+1)): #Колличество событий для каждого материала
        colision, time = life_of_neutron(Estart, Eend, df['Density g/cm^3'][k],
                                          df['A_1'][k], df['A_2'][k],
                                          df['Molar mass g/mol'][k], df['Σ, 1/cm'][k],
                                          df['ɑ_1'][k], df['ɑ_2'][k],
                                          df['sigma_1 b'][k], df['sigma_2 b'][k],
                                          df['x1'][k], df['x2'][k],)
        df1.loc[counter] = {'Material': df['Material'][k], 'time, 10^(-5) c': time*100_000, 'colisions': colision, 'target': k}
        Colision[k]+=colision
        Time[k]+=time
        counter+=1


for k in df.index:
    Colision[k] = Colision[k]/number_of_event/(k+1)
    Time[k] = Time[k]/number_of_event/(k+1)
    
for k in df.index:
    print(df['Material'][k])
    print(Colision[k])
    print(Time[k])

# 2. SQL vs Pandas

## 2.1 Create a Table

Посмотрим, что представляют собой полученные данные

In [None]:
df1.head()

Еще раз взглянем на входные данные

In [None]:
df.head()

Создадим базу данных из этих двух data frames

In [None]:
import sqlite3

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')
c = conn.cursor()

In [None]:
df.to_sql('Input_data', conn, if_exists='replace', index = False)

In [None]:
df1.to_sql('Output_data', conn, if_exists='replace', index = False)

Создадим пустую таблицу для тренировки не из DF и затем её удалим

In [None]:
c.execute('CREATE TABLE CARS (Brand text, Price number)')
conn.commit()

In [None]:
c.execute('DROP TABLE IF EXISTS CARS')
conn.commit()

Создадим df из полученной базы данных

In [None]:
df1 = pd.read_sql("SELECT * from Output_data", conn)
df1.head()

In [None]:
df = pd.read_sql("SELECT * from Input_data", conn)
df.head()

## 2.2 INSERT Operation

Добавление через pandas

In [None]:
data = [{"Material": 'Carbon', "Chemical formula": 'C'}]
data

In [None]:
data = pd.DataFrame(data)
data

In [None]:
df = pd.concat([df, data], ignore_index=True)

In [None]:
df

## 2.3 DELETE Operatioin

Удаление через pandas

In [None]:
df.info()

In [None]:
df.isnull().sum()

In [None]:
df = df.dropna()
df

Добавление данных через SQL

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')
c = conn.cursor()

In [None]:
def sql_insert(conn, entities):

    cursorObj = conn.cursor()

    cursorObj.execute('INSERT INTO Input_data (Material, x1) VALUES(?, ?)', entities)

    conn.commit()

In [None]:
entities = ('Carbon', 1)
sql_insert(conn, entities)

Удаление данных через SQL, где конкретный столбец равен нулю

In [None]:
c.execute('DELETE FROM Input_data WHERE (x2 IS NULL)')
conn.commit()

## 2.4 SELECT Operation, WHERE, DISTINCT, LIMIT

Получим список столбцов через Pandas

In [None]:
c = list(df)
c

Получим список столбцов через SQL

In [None]:
row_names = []

def sql_fetch(conn):

    cursorObj = conn.cursor()

    cursorObj.execute('select * from Input_data')
    
    colnames = cursorObj.description
    for row in colnames:
        row_names.append(row[0])

sql_fetch(conn)

print(row_names)

Вывод конкретных столбцов через Pandas

In [None]:
names = ["Material", "A_1", "A_2"]
df[names]

Вывод конкретных столбцов через SQL

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')

cursor = conn.execute("SELECT Material, A_1, A_2 from Input_data")
for row in cursor:
    print("Material = ", row[0])
    print("A_1 = ", row[1])
    print("A_2 = ", row[2], "\n")

conn.close()

Вывод ограниченного числа строк через Pandas

In [None]:
df1.head(3)

Вывод ограниченного числа строк через SQL

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')

cursor = conn.execute("SELECT * FROM Input_data limit 2")

for row in cursor:
    print(row)
    print()

conn.close()

Select c сножественными условиями Pandas

In [None]:
df[(df.Material != 'Water') & (df.A_1 == 2)]

Select с множественными условиями SQL

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')

cursor = conn.execute("SELECT * FROM Input_data where Material = 'Heavy Water' and  A_1 = 2.0")

for row in cursor:
    print(row)
    print()

conn.close()

Вывод уникальных значений Pandas

In [None]:
df1['Material'].value_counts(normalize=True)

Вывод уникальных значений SQL

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')

cursor = conn.execute("SELECT DISTINCT Material FROM Output_data")

for row in cursor:
    print(row)
    print()

conn.close()

## 2.5 UPDATE Operation

Изменение данных через Pandas

In [None]:
df

In [None]:
df.loc[df['Chemical formula'] == 'C2D2', 'Material'] = 'Unknow'
df

In [None]:
df.loc[df['Chemical formula'] == 'C2D2', 'Material'] = 'Heavy Plexiglass'
df

Изменение данных через SQL

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')

cursor = conn.execute("UPDATE Input_data set Material = 'Unknow' where Material = 'Water'")
conn.commit()

for row in cursor.execute('SELECT * FROM Input_data'):
    print(row)
    print()

conn.close()

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')

cursor = conn.execute("UPDATE Input_data set Material = 'Water' where Material = 'Unknow'")
conn.commit()

for row in cursor.execute('SELECT * FROM Input_data'):
    print(row)
    print()

conn.close()

## 2.6 ORDER BY

Сортировка в Pandas по возрастанию с условием

In [None]:
df1[df1.Material == 'Water'].sort_values('colisions')

Сортировка в Pandas по убыванию с условием

In [None]:
df1[df1.Material == 'Water'].sort_values('colisions', ascending = False)

Сортировка SQL по возрастанию с условием

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')

cursor = conn.execute(
    "SELECT * FROM Output_data where Material = 'Water' order by colisions limit 10")

for row in cursor:
    print(row)
    print()

conn.close()

In [None]:
conn = sqlite3.connect('data/neutron_moderation.db')

cursor = conn.execute(
    "SELECT * FROM Output_data where Material = 'Water' order by colisions desc limit 5")

for row in cursor:
    print(row)
    print()

conn.close()

## 2.7 IN и NOT IN