In [1]:
import math
import numpy

import matplotlib.mlab as mlab
import matplotlib.pyplot as plt

import scipy
import scipy.stats as pystats
from scipy.stats import norm as pynorm
from scipy.stats import uniform as pyuni

from docx import Document

In [2]:
def strm(a):
    n = len(a)
    b = a[0]
    m = len(b)
    for i in range(n):
        for k in range(m):
            if type(a[i][k]) == int:
                a[i][k] = str(a[i][k])
            elif type(a[i][k]) != str:
                a[i][k] = str('%.5f'% a[i][k])

In [3]:
def onetablein(docname, n):
    document = Document(docname)
    table = document.tables[n]
    array = []
    for i in range(0, len(table.rows)):
        row = table.rows[i]
        for cell in row.cells:
            array.append(float(cell.text.replace(',','.')))
    return array

In [4]:
krit_tbl = {
    '4' : 9.5,
    '5' : 11.1,
    '6' : 12.6,
    '7' : 14.1,
    '8' : 15.5}

In [5]:
ln = onetablein('Data/tables_9.docx', 0)

lu = onetablein('Data/tables_9.docx', 1)

alfa = 0.05
a = 0.1
b = 6.1

In [6]:
class stat(object):
    def __init__(self, array, m, ao = None, am = None):
        self.m = m
        if ao == None:
            self.ao = min(array)
        else:
            self.ao = ao
        if am == None:
            self.am = max(array)
        else:
            self.am = am
        self.h = (self.am - self.ao)/self.m
        self.num = [self.ao + (i + 0.5)*self.h  for i in range(m)]
        self.interval = [self.ao + i*self.h for i in range(m+1)]
        self.cnt = [0 for i in range(m)]
        for i in array:
            for k in range(m):
                if i <= self.interval[k+1]:
                    break
            self.cnt[k] = self.cnt[k] + 1
        self.war = [i/len(array) for i in self.cnt]

In [7]:
class NormSample(object):
    def __init__(self, array):
        self.array = [i for i in array]
        self.n = len(array)
        self.m = 1 + int(math.log2(self.n))
        self.stats = stat(array, self.m)
    
    def mean(self):
        s = 0
        for i in range(self.m):
            s = s + self.stats.war[i]*self.stats.num[i]
        return s
    
    def disp(self):
        s = 0
        for i in range(self.m):
            s = s + self.stats.war[i]*(self.stats.num[i]**2)
        return s - (self.stats.h**2)/12 - self.mean()**2
    
    def devi(self):
        return self.disp()**0.5
    
    def graf(self, hist = True, theory = True, filename = 'Data/graf_norm.png'):
        dx = 0.005
        xmin = self.stats.ao - self.stats.h
        xmax = self.stats.am + self.stats.h
        if hist:
            plt.bar(
                [i for i in self.stats.num],
                [i/self.stats.h for i in self.stats.war],
                color = 'blue', edgecolor = 'black', 
                linewidth = 1, alpha = 0.75, width = self.stats.h
            )
        if theory:
            xlist = numpy.arange(xmin, xmax, dx) # mlab.frange(xmin, xmax, dx)
            ylist = [pystats.norm.pdf(xz, loc = self.mean(), scale = self.devi()) for xz in xlist]
            plt.plot(xlist, ylist, color = 'red', linewidth = 2)
        plt.savefig(filename)
        plt.clf()
    
    def out_1(self):
        l = []
        for k in range(len(self.stats.interval)):
            q = []
            ak = self.stats.interval[k]
            q.append(k)
            q.append(ak)
            q.append((ak - self.mean())/self.devi())
            q.append(pynorm.pdf(q[2])/self.devi())
            q.append(pynorm.cdf(q[2]))
            if k == 0:
                q.append('-')
            elif k == 1:
                q.append(q[4])
            elif k == self.m:
                q.append(1 - l[k-1][4])
            else:
                q.append(q[4] - l[k-1][4])
            l.append(q)
        return l
    
    def out_2(self):
        out_1 = self.out_1()
        l = []
        f4 = 0
        f5 = 0
        for k in range(self.m):
            q = []
            q.append(k+1)
            s = ''
            if k == 0:
                s = s + '['
            else:
                s = s + '('
            s = s + str('%.5f'% out_1[k][1]) + '; ' + str('%.5f'% out_1[k+1][1]) + ']'
            q.append(s)
            q.append(self.stats.war[k])
            q.append(out_1[k+1][5])
            q.append(abs(q[2]-q[3]))
            q.append(self.n*(q[4]**2)/q[3])
            if q[4] > f4:
                f4 = q[4]
            f5 = f5 + q[5]
            l.append(q)
        l.append(['','','','',f4,f5])
        return l
        
        
    def hi2(self):
        s = 0
        n = [k for k in self.stats.cnt]
        p = [k[3] for k in self.out_2()]
        for k in range(self.m):
            s = s + ((n[k]-self.n*p[k])**2)/(self.n*p[k])
        return s
    
    def krit(self, tbl):
        l = self.m - 3
        if self.hi2() > tbl[str(l)]:
            return False
        else:
            return True

In [8]:
sn = NormSample(ln)
print(sn.mean())
print(sn.disp())
print(sn.devi(), '\n')
for i in sn.out_1():
    print(i)
print()
for i in sn.out_2():
    print(i)
print()
print(sn.hi2())
print(sn.krit(krit_tbl))
sn.graf()

0.25278349999999955
4.69831186120275
2.167558963719961 

[0, -5.69638, -2.7446374468125456, 0.004257566511762162, 0.0030288890524895673, '-']
[1, -4.051450000000001, -1.9857515168182935, 0.02562607965989696, 0.023530460807672765, 0.023530460807672765]
[2, -2.4065200000000004, -1.226865586824041, 0.08671401575947627, 0.10993655737323693, 0.08640609656556417]
[3, -0.7615900000000009, -0.4679796568297891, 0.16496158577491696, 0.31989956880337056, 0.20996301143013363]
[4, 0.8833399999999996, 0.2909062731644633, 0.17642606316550213, 0.6144384982910227, 0.29453892948765215]
[5, 2.52827, 1.0497922031587157, 0.10607891285203772, 0.8530931696301108, 0.23865467133908813]
[6, 4.173199999999999, 1.8086781331529673, 0.03585764587054814, 0.9647494889657917, 0.11165631933568088]
[7, 5.818129999999999, 2.56756406314722, 0.006814294265481755, 0.9948792068442234, 0.03012971787843166]
[8, 7.46306, 3.326449993141472, 0.0007280251639465265, 0.9995602009946667, 0.005120793155776626]

[1, '[-5.69638; -4.0514

<Figure size 432x288 with 0 Axes>

In [9]:
class UniSample(object):
    def __init__(self, array, a, b):
        self.array = [i for i in array]
        self.n = len(array)
        self.a = a
        self.b = b
        self.m = 1 + int(math.log2(self.n))
        self.stats = stat(array, self.m, ao = a, am = b)
    
    
    def mean(self):
        s = 0
        for i in range(self.m):
            s = s + self.stats.war[i]*self.stats.num[i]
        return s
    
    def disp(self):
        s = 0
        for i in range(self.m):
            s = s + self.stats.war[i]*(self.stats.num[i]**2)
        return s - (self.stats.h**2)/12 - self.mean()**2
    
    def devi(self):
        return self.disp()**0.5
    
    def graf(self, hist = True, theory = True, filename = 'Data/graf_uni.png'):
        dx = 0.005
        xmin = self.stats.ao - self.stats.h
        xmax = self.stats.am + self.stats.h
        
        if hist:
            plt.bar(
                [i for i in self.stats.num],
                [i/self.stats.h for i in self.stats.war],
                color = 'blue', edgecolor = 'black', 
                linewidth = 1, alpha = 0.75, width = self.stats.h
            )
        if theory:
            xlist = numpy.arange(xmin, xmax, dx) # mlab.frange(xmin, xmax, dx)
            ylist = [pystats.uniform.pdf(xz, loc = self.a, scale = self.b - self.a) for xz in xlist]
            plt.plot(xlist, ylist, color = 'red', linewidth = 2)
        plt.savefig(filename)
        plt.clf()
        
    def out_3(self):
        l = []
        f4 = 0
        f5 = 0
        for k in range(self.m):
            q = []
            q.append(k+1)
            s = ''
            if k == 0:
                s = s + '['
            else:
                s = s + '('
            s = s + str('%.5f'% self.stats.interval[k]) + '; ' + str('%.5f'% self.stats.interval[k+1]) + ']'
            q.append(s)
            q.append(self.stats.war[k])
            q.append(1/self.m)
            q.append(abs(q[2]-q[3]))
            q.append(self.n*(q[4]**2)/q[3])
            l.append(q)
            if q[4] > f4:
                f4 = q[4]
            f5 = f5 + q[5]
        l.append(['','','','',f4,f5])
        return l
    
    def hi2(self):
        s = 0
        n = [k for k in self.stats.cnt]
        p = [k[3] for k in self.out_3()]
        for k in range(self.m):
            s = s + ((n[k]-self.n*p[k])**2)/(self.n*p[k])
        return s
    
    def krit(self, tbl):
        l = self.m - 3
        if self.hi2() > tbl[str(l)]:
            return False
        else:
            return True

In [10]:
su = UniSample(lu,a,b)
print(su.mean())
print(su.disp())
print(su.devi())
print()
for k in su.out_3():
    print(k)
print()
print(su.hi2())
print(su.krit(krit_tbl))
su.graf()

2.91875
2.906210937499999
1.7047612552788731

[1, '[0.10000; 0.85000]', 0.12083333333333333, 0.125, 0.004166666666666666, 0.03333333333333332]
[2, '(0.85000; 1.60000]', 0.1875, 0.125, 0.0625, 7.5]
[3, '(1.60000; 2.35000]', 0.125, 0.125, 0.0, 0.0]
[4, '(2.35000; 3.10000]', 0.10833333333333334, 0.125, 0.016666666666666663, 0.5333333333333331]
[5, '(3.10000; 3.85000]', 0.125, 0.125, 0.0, 0.0]
[6, '(3.85000; 4.60000]', 0.12916666666666668, 0.125, 0.00416666666666668, 0.03333333333333354]
[7, '(4.60000; 5.35000]', 0.07916666666666666, 0.125, 0.04583333333333334, 4.033333333333334]
[8, '(5.35000; 6.10000]', 0.125, 0.125, 0.0, 0.0]
['', '', '', '', 0.0625, 12.133333333333333]

12.133333333333333
False


<Figure size 432x288 with 0 Axes>

In [11]:
head_1_str = [
    'k',
    'ak',
    '(ak-a)/s',
    '1/s*f((ak-a)/s)',
    'F((ak-a)/s)',
    'pk'
]
head_2_str = [
    'k',
    'Интервал',
    'wk',
    'pk',
    '|wk-pk|',
    'N(wk-pk)^2/pk'
]

In [12]:
def tabler(document, out, head = None):
    tl = []
    if head != None:
        tl.append(head)
    for i in out:
        tl.append(i)
    strm(tl)
    
    table = document.add_table(rows = len(tl),cols = len(tl[0]))
    for i in range(len(tl)):
        hdr_cells = table.rows[i].cells
        for k in range(len(tl[0])):
            if type(tl[i][k]) == str:
                hdr_cells[k].text = tl[i][k]
            else:
                pass #LaTeh
    

In [13]:
def doc_task_1(document, sn):
    document.add_paragraph('Задание 1)')
    
    document.add_paragraph('Полученная выборка:')
    l = [i for i in sn.array]
    tbl = []
    q = []
    for i in range(len(l)):
        q.append(l[i])
        if (len(q) == 10) or (i+1 == len(l)):
            while(len(q) != 10):
                q.append('')
            tbl.append(q)
            q = []
    tabler(document, tbl)
    
    document.add_paragraph('')
    document.add_paragraph('Упорядоченная выборка:')
    l.sort()
    tbl = []
    q = []
    for i in range(len(l)):
        q.append(l[i])
        if (len(q) == 10) or (i+1 == len(l)):
            while(len(q) != 10):
                q.append('')
            tbl.append(q)
            q = []
    tabler(document, tbl)
    
    document.add_paragraph('')
    document.add_paragraph('Группированная выборка (интервальный вариационный ряд):')
    tbl = [['(ai-1,ai]'],['ni'],['wi']]
    tbl[0].extend([i[1] for i in sn.out_2() if i[1] != ''])
    tbl[1].extend(sn.stats.cnt)
    tbl[2].extend(sn.stats.war)
    tabler(document, tbl)
    document.add_paragraph('<math>\sum_{i=0}^\{N}\w_i</math> = ' + str('%.5f'% sum(sn.stats.war)))
    
    document.add_paragraph('Математическое ожидание: \tilde{a} = ' + str('%.5f'% sn.mean()))
    document.add_paragraph('Дисперсия: \tilde{\sigma}^2 = '+ str('%.5f'% sn.disp()))
    document.add_paragraph('Среднеквадратическое отклонение: \tilde{\sigma} = ' + str('%.5f'% sn.devi()))
    document.add_paragraph('')
    
    
    tabler(document, sn.out_1(), head_1_str)    
    document.add_paragraph('График плотности нормального распределения, наложенный на гистограмму относительных частот:')
    sn.graf(filename = 'tsk1_graf.png')
    document.add_picture('tsk1_graf.png')
    
    tabler(document, sn.out_2(), head_2_str)
    document.add_paragraph('')
    document.add_paragraph('\chi_B^2 = '+ str('%.5f'% sn.hi2()))
    document.add_paragraph('')


In [14]:
def doc_task_2(document, sn):
    document.add_paragraph('Задание 2)')
    document.add_paragraph('')
    document.add_paragraph('a = ' + str(sn.a))
    document.add_paragraph('b = ' + str(sn.b))
    document.add_paragraph('')

    
    document.add_paragraph('Полученная выборка:')
    l = [i for i in sn.array]
    tbl = []
    q = []
    for i in range(len(l)):
        q.append(l[i])
        if (len(q) == 10) or (i+1 == len(l)):
            while(len(q) != 10):
                q.append('')
            tbl.append(q)
            q = []
    tabler(document, tbl)
    
    document.add_paragraph('')
    document.add_paragraph('Упорядоченная выборка:')
    l.sort()
    tbl = []
    q = []
    for i in range(len(l)):
        q.append(l[i])
        if (len(q) == 10) or (i+1 == len(l)):
            while(len(q) != 10):
                q.append('')
            tbl.append(q)
            q = []
    tabler(document, tbl)
    
    document.add_paragraph('')
    document.add_paragraph('Группированная выборка (интервальный вариационный ряд):')
    tbl = [['(ai-1,ai]'],['ni'],['wi']]
    tbl[0].extend([i[1] for i in sn.out_3() if i[1] != ''])
    tbl[1].extend(sn.stats.cnt)
    tbl[2].extend(sn.stats.war)
    tabler(document, tbl)
    document.add_paragraph('<math>\sum_{i=0}^\{N}\w_i</math> = ' + str('%.5f'% sum(sn.stats.war)))
    
    document.add_paragraph('Математическое ожидание: \tilde{a} = ' + str('%.5f'% sn.mean()))
    document.add_paragraph('Дисперсия: \tilde{\sigma}^2 = '+ str('%.5f'% sn.disp()))
    document.add_paragraph('Среднеквадратическое отклонение: \tilde{\sigma} = ' + str('%.5f'% sn.devi()))
    document.add_paragraph('')
    
    document.add_paragraph('График плотности равномерного распределения, наложенный на гистограмму относительных частот:')
    sn.graf(filename = 'tsk2_graf.png')
    document.add_picture('tsk2_graf.png')
    
    
    tabler(document, sn.out_3(), head_2_str)
    document.add_paragraph('')
    document.add_paragraph('\chi_B^2 = '+ str('%.5f'% sn.hi2()))
    document.add_paragraph('')

In [15]:
def doc_anal(document, sn, su, krit_table):
    NormResult = {
        True : 'Гипотеза о соответствии выборки нормальному распределению не противоречит экспериментальным данным (т.е. может быть принята) при уровне значимости alpha = 0,05. ',
        False : 'Гипотеза о соответствии выборки нормальному распределению противоречит экспериментальным данным (т.е. не может быть принята) при уровне значимости alpha = 0,05. '
    }
    UniResult = {
        True: 'Гипотеза о соответствии выборки равномерному распределению на отрезке [a, b] не противоречит экспериментальным данным (т.е. может быть принята) при уровне значимости alpha = 0,05. ',
        False: 'Гипотеза о соответствии выборки равномерному распределению на отрезке [a, b] противоречит экспериментальным данным (т.е. не может быть принята) при уровне значимости alpha = 0,05. '
    }
    
    document.add_paragraph('Анализ результатов и выводы')    
    document.add_paragraph('')
    document.add_paragraph('Таблица критических значений:')# \chi_{кр,\alpha}^2 (l) 
    tbl = [['l'],['chi']]#'\chi_{кр,\alpha}^2 (l)'
    tbl[0].extend([i for i in krit_table])
    tbl[1].extend([str(krit_table[i]) for i in krit_table])
    tabler(document,tbl)
    document.add_paragraph('')    
    document.add_paragraph('1) Нормальное распределение')
    document.add_paragraph('\chi_B^2 = ' + str('%.5f'% sn.hi2()))
    document.add_paragraph('chi(' + str(sn.m-3) + ') = ' + str(krit_table[str(sn.m-3)]) )#'\chi_{кр,\alpha}^2 (l)'
    document.add_paragraph(NormResult[sn.krit(krit_table)])    

    document.add_paragraph('')    
    document.add_paragraph('2) Равномерное распределение')
    document.add_paragraph('\chi_B^2 = ' + str('%.5f'% su.hi2()))
    document.add_paragraph('chi(' + str(su.m-3) + ') = ' + str(krit_table[str(su.m-3)]) )#'\chi_{кр,\alpha}^2 (l)'
    document.add_paragraph(NormResult[su.krit(krit_table)])    


In [16]:
def doccreator(sn, su, krit_tbl, filename = 'final_doc.docx'):
    document = Document()
    doc_task_1(document, sn)
    document.add_paragraph('')
    doc_task_2(document, su)
    document.add_paragraph('')
    doc_anal(document, sn, su, krit_tbl)
    document.save(filename)
    print('Done!')

In [17]:
doccreator(sn, su, krit_tbl, filename = 'Data/final_doc.docx')

Done!


<Figure size 432x288 with 0 Axes>