# 7. Сбор и хранение данных

## 7.1. Работа с файлами формата csv и excel

In [None]:
# Подключение библиотеки pandas
import pandas as pd

# Применение метода read_csv
df = pd.read_csv('iris.csv')
# Сводная информация о таблице данных
print(df.info())

In [None]:
import pandas as pd
# Загрузка определённых столбцов из таблицы, id – индексный столбец

df = pd.read_csv('iris.csv', usecols = ['id', 'sepal_len', 'sepal_wd'], index_col = ['id'], skiprows = 0, nrows = 50)

# Срез данных: первые 6 строк и 3 столбца
df_reject = df.loc[:5, :]
print(df_reject)

# Сохранение нового файла iris_rej.csv, разделитель ','
df_reject.to_csv('iris_rej.csv', sep = ',')

In [None]:
import pandas as pd
# Подключение библиотеки для работы с xlsx
import openpyxl
# Загрузка определённых столбцов из таблицы
df = pd.read_csv('iris.csv', usecols = ['id', 'sepal_len', 'sepal_wd'])

# Срез данных: первые 6 строк и 3 столбца
df_reject = df.loc[:5, :]
print(df_reject)

df_reject.to_excel('iris.xlsx', startrow=0, startcol=0, sheet_name = 'Книга1)


## 7.2. Работа с файлами формата txt

In [None]:
import pandas as pd

df = pd.read_csv('iris.txt', sep = ',')
# df = pd.read_table('iris.txt', sep = ',')

# Срез данных: первые 6 строк и все столбцы
df_reject = df.loc[:5, :]
print(df_reject)

df.to_csv('iris_rej.txt', sep='\t', encoding='utf-8')

## 7.3. Чтение и запись JSON-файлов

In [None]:
import pandas as pd
import json

df = pd.read_csv('iris.txt', sep = ',')

# Срез данных: первые 6 строк и все столбцы
df_reject = df.loc[:5, :]
print(df_reject)

df.to_json('iris.json')

## 7.4. Чтение html-файлов из интернета, парсинг данных, API

In [None]:
import requests
# Адрес запрашиваемой страницы
URL = 'https://elteha.ru/index.php'

# Сохранение запроса в переменную result
result = requests.get(URL)

# Проверка ответа сервера
print(result.status_code)
# Вывод результатв в консоль
print(result.text)

In [None]:
import requests
import re
URL = 'https://elteha.ru/index.php'

result = requests.get(URL).text

# Поиск всех вхождений, удовлетворяющих условиям
found_parts = re.findall('Проектирование[А-яA-z- ]+', result)
print(len(found_parts))
print(found_parts)

In [None]:
import pandas as pd
import requests 
from bs4 import BeautifulSoup

URL = 'https://elteha.ru/index.php'
result = requests.get(URL).text
soup = BeautifulSoup(result, 'lxml')

head_title = []
for row in soup.find_all('p', attrs = {'class':'top_text_1'}):
    head_title.append(row.text)

foot_title = []
for row in soup.find_all('p', attrs = {'class':'bottom_text_1'}):
    foot_title.append(row.text)

data = pd.DataFrame({'head-title': head_title,'foot-title': foot_title,})
print(data.head(5))

In [None]:
import requests
import json

BASE_URL = 'http://api.openweathermap.org/data/2.5/weather'

s_city = 'Saratov, RU'
appid = 'e9e0185f6cdf9bcb75dd543cb70738d7'

params = {'q': s_city, 'units': 'metric', 'APPID': appid}

response = requests.get(BASE_URL, params = params)
response_parsed = json.loads(response.text)

temp = response_parsed['main']['temp']
humidity = response_parsed['main']['humidity']

print('Погода в Саратове: температура t = {} градусов, влажность H = {}%'. format(temp, humidity))

## 7.5. Чтение из базы данных SQL, запись в базу данных SQL

### 1. Создание базы данных в DB Browser for SQLite

### 2. Создание программы для подключения к базе данных

In [None]:
import pandas as pd
import sqlite3

df = pd.read_csv('iris.csv')

# Подключение к базе данных
connection = sqlite3.connect('iris_db.sqlite3')

# Отправка данных DataFrame в базу (таблица создаётся автоматически)
df.to_sql('iris_table', connection, if_exists="append")

# Подтверждение отправки данных и закрытие соединения.
connection.commit()
connection.close()

### 3. Чтение данных из базы

In [None]:
import pandas as pd
import sqlite3

# Подключение к базе данных
connection = sqlite3.connect('iris_db.sqlite3')

# Чтение всего * содержимого из таблицы iris_table
iris_table = pd.read_sql('SELECT * FROM iris_table',
                                connection, index_col = 'index')
connection.close()

print(iris_table[:5])

In [None]:
import pandas as pd
import sqlite3

connection = sqlite3.connect('iris_db.sqlite3')

# Чтение данных по условию sepal_len > 5 AND species='iris-setosa'
query = "SELECT * FROM iris_table WHERE sepal_len > 5 AND species='iris-setosa'"

iris_table = pd.read_sql(query, connection, index_col = 'index')
connection.close()

print(iris_table[:10])

# 7.6. Операторы для работы с базой данных в библиотеке sqlite3

In [None]:
import sqlite3 as sq

# Соединение с базой данных db
con = sq.connect("db.sqlite3")

# Создание курсора (объекта для работы с БД)
cur = con.cursor()

# Создание новой таблицы
cur.executescript("""CREATE TABLE IF NOT EXISTS fruit (
            fruit_id INTEGER PRIMARY KEY AUTOINCREMENT,
            fruit TEXT,
            price INTEGER)
    """)
# Закрытие соединения
con.commit()
con.close()

In [None]:
import sqlite3 as sq

# Данные о фруктах
fruit = [
    ('Apple', 1.5),
    ('Orange', 2.0),
    ('Banana', 1.7),
    ('Peach', 1.0),
    ('Grape', 2.5)
]

con = sq.connect("db.sqlite3")
cur = con.cursor()

# Вставка данных в таблицу
cur.executemany("INSERT INTO fruit VALUES(NULL,?,?)", fruit)

con.commit()
con.close()

In [None]:
import sqlite3 as sq

con = sq.connect("db.sqlite3")
cur = con.cursor()

# Чтение всех данных из таблицы fruit
cur.execute("SELECT fruit, price FROM fruit")

# rows = cur.fetchall() – вывод всех данных
# rows = cur.fetchone() – вывод одного значения
# rows = cur.fetchmany(4) – вывод 4 значений

print(rows)

con.commit()
con.close()

In [None]:
import sqlite3 as sq

con = sq.connect("db.sqlite3")
cur = con.cursor()

# Удаление данных из таблицы с id = 3
cur.execute("DELETE FROM fruit WHERE fruit_id = 3")

# Обновим данных в таблице с id = 1
cur.execute("UPDATE fruit SET price = 2.2 WHERE fruit_id = 1")

con.commit()
con.close()

# 7.7. Представление результатов в Jupyter Notebook – IPython

In [None]:
pip3 install jupyter # Для Python 3

In [None]:
jupyter notebook # Запуск приложения

# 7.8. Редактор кода Visual Studio Code

In [None]:
# Создание виртуального окружения, venv - название вс
python -m venv venv

# Активация рабочей среды 
venv\scripts\activate    # для Windows
source venv/bin/activate # для Linux

# Деактивация рабочей среды 
venv\scripts\deactivate

# https://medium.com/@ph1l74/python-venv-на-windows-10-2118ad685b1

## 7.9. Система контроля версий git

### 1. Установка и настройка системы контроля версий git.

In [None]:
$ git config --list --show-origin

In [None]:
# Имя пользователя
$ git config --global user.name "John Doe"

# Адрес электронной почты пользователя
$ git config --global user.email johndoe@example.com

In [None]:
# Для инициализации ветки master по умолчанию
$ git init

# Для инициализации ветки main по умолчанию
$ git config --global init.defaultBranch main

In [None]:
# Проверка установок
$ git config –list

In [None]:
# Для Linux:
$ cd /home/user/my_project

# Для macOS:
$ cd /Users/user/my_project

# Для Windows:
$ cd C:/Users/user/my_project

$ git init

# Последующий коммит файлов
$ git add *.c
$ git add LICENSE
$ git commit -m 'Initial project version'

In [None]:
# Копирование удалённого репозитория
# url в формате https://
$ git сlone <url>

### 2. Создание аккаунта и удалённого репозитория на сайте github.com.

### 3. Подключение к репозиторию с помощью программы VS Code.

In [None]:
# Инициализация репозитория на компьютере
$ git init

# Проверка состояния системы (на любом этапе)
$ git status

# Добавление индексируемых файлов
$ git add *.c

# Подготовка коммита и сообщения для отправки
$ git commit -m 'Initial project version'

# Отправка изменений и содержимого НА удалённый репозиторий
$ git push

# Извлечение и загрузка содержимого ИЗ удалённого репозитория
$ git pull

In [None]:
# Инициализируем репозиторий на локальном компьютере
$ git init

# Клонируем удалённый репозиторий
$ git clone https://github.com/mculab64/new_rep.git

In [None]:
# Индексирование файлов, атрибут –A позволит индексировать все файлы
$ git add -A

# Подготовка коммита и сообщения для отправки
$ git commit -m 'Initial project version'

# Отправка изменений и содержимого НА удалённый репозиторий
$ git push