In [4]:
import numpy as np
import re

In [5]:
date_string = '''totwrk                       -0.169***         
                              (0.018)          
                                               
age                           2.689*           
                              (1.469)          
                                               
south                        101.568**         
                             (41.837)          
                                               
male                         87.669**          
                             (35.104)          
                                               
smsa                         -54.748*          
                             (33.123)          
                                               
yngkid                        -13.962          
                             (50.341)          
                                               
marr                          31.211           
                             (42.233)          
                                               
Constant                    3450.913***        
                             (80.726)'''

In [6]:
# Выделим числа из строки с помощью регулярных выражений и составим из них список
digital_date = re.findall(r'([-+]?\d+.\d+)',date_string)
digital_date

['-0.169',
 '0.018',
 '2.689',
 '1.469',
 '101.568',
 '41.837',
 '87.669',
 '35.104',
 '-54.748',
 '33.123',
 '-13.962',
 '50.341',
 '31.211',
 '42.233',
 '3450.913',
 '80.726']

In [7]:
# Из одномерного списка сделаем двумерный список типа размерности (8,2)
# 8 --- количество коэффицентов, включая константу
# 2 --- потому что строка содержит оценку коэффицента и его ошибку
# так как исходны список содержит оценки коэффицентов и их ошибки
coeff_mxt = np.reshape(digital_date,(8,2))
coeff_mxt

array([['-0.169', '0.018'],
       ['2.689', '1.469'],
       ['101.568', '41.837'],
       ['87.669', '35.104'],
       ['-54.748', '33.123'],
       ['-13.962', '50.341'],
       ['31.211', '42.233'],
       ['3450.913', '80.726']], dtype='<U8')

In [8]:
ppl_string = '''totwrk age south male smsa yngkid marr
----------------------------------------
1  2150  37    0    1    1     0     1  
2  1950  28    1    1    0     1     0  
3  2240  26    0    0    1     0     0 '''

In [9]:
# Создадим список из чисел, содержащихся в строке
ppl_lst = re.findall(r'([-+]?\d+)', ppl_string)
ppl_lst

['1',
 '2150',
 '37',
 '0',
 '1',
 '1',
 '0',
 '1',
 '2',
 '1950',
 '28',
 '1',
 '1',
 '0',
 '1',
 '0',
 '3',
 '2240',
 '26',
 '0',
 '0',
 '1',
 '0',
 '0']

In [10]:
# Преобразуем список в двумерный массив: 3 строки, 8 столбцов.
# 3 -- количество измерений, для которых нам необходим найти предсказанное значение
# 8 столбцов в исходной таблице, включая столбец с нумерацией строк
ppl_mxt = np.reshape(ppl_lst,(3,8))
ppl_mxt

array([['1', '2150', '37', '0', '1', '1', '0', '1'],
       ['2', '1950', '28', '1', '1', '0', '1', '0'],
       ['3', '2240', '26', '0', '0', '1', '0', '0']], dtype='<U4')

In [11]:
# Необходимо удалить первый столбец, так как это нумерация строк
ppl_mxt = np.delete(ppl_mxt,0,1)
ppl_mxt

array([['2150', '37', '0', '1', '1', '0', '1'],
       ['1950', '28', '1', '1', '0', '1', '0'],
       ['2240', '26', '0', '0', '1', '0', '0']], dtype='<U4')

In [12]:
# Теперь необходимо добавить столбец из единиц для того,
#  чтобы совпадало количество столбцов в матрице с количестом элементов 
ppl_mxt = np.c_[ppl_mxt,np.ones(3)]
ppl_mxt

array([['2150', '37', '0', '1', '1', '0', '1', '1.0'],
       ['1950', '28', '1', '1', '0', '1', '0', '1.0'],
       ['2240', '26', '0', '0', '1', '0', '0', '1.0']], dtype='<U32')

In [14]:
ppl_mxt.shape

(3, 8)

In [15]:
coeff_mxt.shape

(8, 2)

In [16]:
#Неообходимо преобразование типов данных
coeff_mxt = coeff_mxt.astype(float)
ppl_mxt = ppl_mxt.astype(float)

In [17]:
# результатом произведения двух матриц будут два столбца
# 1й равен произведению значений измерений и коэффициентов
# 2й равен произведению значений измерений и ошибок коэффициентов
print(np.matmul(ppl_mxt,coeff_mxt))

[[3251.188  284.239]
 [3371.93   284.24 ]
 [3087.519  192.363]]
