# Структуровані масиви даних

In [1]:
def homework(message):
    print("\n>>>>>", message, "\n")
import numpy as np

# Визначення однорідного масиву

In [2]:
lst = [[3.4, 8.7, 9.9], 
       [1.1, -7.8, -0.7],
       [4.1, 12.3, 4.8]]

A = np.array(lst, dtype=np.int8)
print(f"Отриманий масив A (int8) має вигляд:\n{repr(A)}")

B = np.array(lst, dtype=np.float16)
print(f"Отриманий масив B (float16) має вигляд:\n{repr(B)}")

print("Функція repr повертає строкове представлення об’єкта, яке допомагає бачити його внутрішню структуру та точні значення. Це особливо корисно для діагностики.")

print("Різниця між масивами A і B полягає в типах даних. У масиві A значення округлені до цілих чисел і зберігаються як int8, що економить пам’ять, але втрачає точність дробових чисел. Масив B має тип float16, тому зберігає дробові значення з деякою кількістю значущих цифр.")


Отриманий масив A (int8) має вигляд:
array([[ 3,  8,  9],
       [ 1, -7,  0],
       [ 4, 12,  4]], dtype=int8)
Отриманий масив B (float16) має вигляд:
array([[ 3.4,  8.7,  9.9],
       [ 1.1, -7.8, -0.7],
       [ 4.1, 12.3,  4.8]], dtype=float16)
Функція repr повертає строкове представлення об’єкта, яке допомагає бачити його внутрішню структуру та точні значення. Це особливо корисно для діагностики.
Різниця між масивами A і B полягає в типах даних. У масиві A значення округлені до цілих чисел і зберігаються як int8, що економить пам’ять, але втрачає точність дробових чисел. Масив B має тип float16, тому зберігає дробові значення з деякою кількістю значущих цифр.


# Задаємо свій тип даних

In [3]:
import numpy as np

dt = np.dtype([('name', str, 20), ('mark', np.int8)])

arr = [
    ("Bohdan", 4), 
    ("Marta", 5),
    ("Noname", 0)
]

C = np.array(arr, dtype=dt)
print(f"Отриманий масив має вигляд:\n{C}")

print(f"Доступитись до певної колонки тепер можна за її іменем: {C['mark']}")

print("Для виведення всіх імен, що є в даному масиві, можна використати індекс 'name':")
print(C['name'])


Отриманий масив має вигляд:
[('Bohdan', 4) ('Marta', 5) ('Noname', 0)]
Доступитись до певної колонки тепер можна за її іменем: [4 5 0]
Для виведення всіх імен, що є в даному масиві, можна використати індекс 'name':
['Bohdan' 'Marta' 'Noname']


# Запис та зчитування з файлу, формат CSV

In [4]:
import numpy as np
import os

dt = np.dtype([('name', str, 20), ('mark', np.int8)])
arr = [
    ("Bohdan", 4), 
    ("Marta", 5),
    ("Noname", 0)
]
C = np.array(arr, dtype=dt)
print("Вихідний масив: ", C)

np.savez("my_mass.npz", my_mass=C)
D = np.load("my_mass.npz")
print("Прочитаний з файлу: ", D["my_mass"])

filename = "temp.csv"
print(f"Записуємо у CSV файл {filename} значення: {C}")
np.savetxt(filename, C, fmt="%s,%d", header="name,mark", delimiter=",")

print(f"Перевіряємо чи файл {filename} створився: {os.listdir()}")

print("Читаємо файл за допомогою оператора with та методу readlines")
with open(filename) as f:
    D = f.readlines()

print(f"Прочитаний файл:\n{D}\n- як бачимо - {len(D)} елементи є стрічками {type(D[0])}.")

D = np.genfromtxt(filename, dtype=dt, delimiter=",")
print(f"Зчитане значення з файла:\n{D}, як бачимо - {D.size} елементи це {type(D[0])}\n- вбудований клас бібліотеки numpy.")
print(f"Доступитись до певного елемента можна наступним чином, наприклад, ім'я першого елементу: {D[0]['name']}")

dt = np.dtype([('name', str, 20), ('mark', np.int8), ('group', str, 10)])
C = np.array([
    ("Bohdan", 4, "KN-41"), 
    ("Marta", 5, "KN-41"), 
    ("Noname", 0, "KN-41"),
    ("Vika", 5, "KN-41")
], dtype=dt)

filename = "temp_with_group.csv"
np.savetxt(filename, C, fmt="%s,%d,%s", header="name,mark,group", delimiter=",")
D = np.genfromtxt(filename, dtype=dt, delimiter=",")
print("Прочитаний масив з додатковим полем 'group':", D)
print(f"Моє ім'я з масиву: {D[-1]['name']}")


Вихідний масив:  [('Bohdan', 4) ('Marta', 5) ('Noname', 0)]
Прочитаний з файлу:  [('Bohdan', 4) ('Marta', 5) ('Noname', 0)]
Записуємо у CSV файл temp.csv значення: [('Bohdan', 4) ('Marta', 5) ('Noname', 0)]
Перевіряємо чи файл temp.csv створився: ['2_numpy_types.ipynb', '3_numpy_operations.ipynb', '4_numpy_statistic.ipynb', 'my_mass.npz', 'README.md', 'temp.csv', 'temp_with_group.csv']
Читаємо файл за допомогою оператора with та методу readlines
Прочитаний файл:
['# name,mark\n', 'Bohdan,4\n', 'Marta,5\n', 'Noname,0\n']
- як бачимо - 4 елементи є стрічками <class 'str'>.
Зчитане значення з файла:
[('Bohdan', 4) ('Marta', 5) ('Noname', 0)], як бачимо - 3 елементи це <class 'numpy.void'>
- вбудований клас бібліотеки numpy.
Доступитись до певного елемента можна наступним чином, наприклад, ім'я першого елементу: Bohdan
Прочитаний масив з додатковим полем 'group': [('Bohdan', 4, 'KN-41') ('Marta', 5, 'KN-41') ('Noname', 0, 'KN-41')
 ('Vika', 5, 'KN-41')]
Моє ім'я з масиву: Vika
