# Завантаження Датафрейму

In [None]:
import pandas as pd

# Завантаження датафрейму
df = pd.read_csv("car-details.csv")

df

# Фільтрації

In [None]:
# Фільтрація за певним значенням
df[df["fuel"]=="Petrol"]

Unnamed: 0,name,year,selling_price,km_driven,fuel,seller_type,transmission,owner
0,Maruti 800 AC,2007,60000,70000,Petrol,Individual,Manual,First Owner
1,Maruti Wagon R LXI Minor,2007,135000,50000,Petrol,Individual,Manual,First Owner
3,Datsun RediGO T Option,2017,250000,46000,Petrol,Individual,Manual,First Owner
5,Maruti Alto LX BSIII,2007,140000,125000,Petrol,Individual,Manual,First Owner
6,Hyundai Xcent 1.2 Kappa S,2016,550000,25000,Petrol,Individual,Manual,First Owner
...,...,...,...,...,...,...,...,...
4326,Honda City 1.5 GXI,2005,65000,150000,Petrol,Individual,Manual,Third Owner
4327,Tata Nano XM,2015,190000,60000,Petrol,Individual,Manual,Second Owner
4329,Tata Manza Aura Safire BS IV,2010,160000,60000,Petrol,Individual,Manual,Second Owner
4337,Maruti 800 AC BSIII,2009,110000,83000,Petrol,Individual,Manual,Second Owner


In [None]:
# Фільтрація по всіх значеннях окрім певного
df[df["owner"]!="Third Owner"]

Unnamed: 0,name,year,selling_price,km_driven,fuel,seller_type,transmission,owner
0,Maruti 800 AC,2007,60000,70000,Petrol,Individual,Manual,First Owner
1,Maruti Wagon R LXI Minor,2007,135000,50000,Petrol,Individual,Manual,First Owner
2,Hyundai Verna 1.6 SX,2012,600000,100000,Diesel,Individual,Manual,First Owner
3,Datsun RediGO T Option,2017,250000,46000,Petrol,Individual,Manual,First Owner
4,Honda Amaze VX i-DTEC,2014,450000,141000,Diesel,Individual,Manual,Second Owner
...,...,...,...,...,...,...,...,...
4335,Hyundai i20 Magna 1.4 CRDi (Diesel),2014,409999,80000,Diesel,Individual,Manual,Second Owner
4336,Hyundai i20 Magna 1.4 CRDi,2014,409999,80000,Diesel,Individual,Manual,Second Owner
4337,Maruti 800 AC BSIII,2009,110000,83000,Petrol,Individual,Manual,Second Owner
4338,Hyundai Creta 1.6 CRDi SX Option,2016,865000,90000,Diesel,Individual,Manual,First Owner


In [None]:
# Фільтрація по одному з декількох значень
df[df["owner"].isin(["First Owner", "Second Owner"])]

Unnamed: 0,name,year,selling_price,km_driven,fuel,seller_type,transmission,owner
0,Maruti 800 AC,2007,60000,70000,Petrol,Individual,Manual,First Owner
1,Maruti Wagon R LXI Minor,2007,135000,50000,Petrol,Individual,Manual,First Owner
2,Hyundai Verna 1.6 SX,2012,600000,100000,Diesel,Individual,Manual,First Owner
3,Datsun RediGO T Option,2017,250000,46000,Petrol,Individual,Manual,First Owner
4,Honda Amaze VX i-DTEC,2014,450000,141000,Diesel,Individual,Manual,Second Owner
...,...,...,...,...,...,...,...,...
4335,Hyundai i20 Magna 1.4 CRDi (Diesel),2014,409999,80000,Diesel,Individual,Manual,Second Owner
4336,Hyundai i20 Magna 1.4 CRDi,2014,409999,80000,Diesel,Individual,Manual,Second Owner
4337,Maruti 800 AC BSIII,2009,110000,83000,Petrol,Individual,Manual,Second Owner
4338,Hyundai Creta 1.6 CRDi SX Option,2016,865000,90000,Diesel,Individual,Manual,First Owner


In [None]:
# Завантажуємо інший датасет
df = pd.read_csv("pollution.csv")

# Фільтрація по діапазону значень
df[(df["date"] >= "2012-01-01 00:00:00") & (df["date"] <= "2012-01-02 00:00:00")]

# Генерації Датафреймів

In [None]:
# Створення нового датафрейму з колонок попереднього
df = pd.DataFrame({"date": df["date"], "wind": df["wnd_dir"]})
df.to_csv("out.csv", index=False)

In [None]:
import numpy as np

# Генерація датафрейму залежності споживання палива від швидкості
speed = np.random.uniform(low=0, high=260, size=(1, 100)).flatten()
consumption = np.random.uniform(low=0, high=15, size=(1,100)).flatten()

df = pd.DataFrame({"speed": speed, "consumption": consumption})
df.to_csv("out.csv", index=False)

# Графіки

In [2]:
import plotly.express as px

# Зчитуємо датафрейм
df = pd.read_csv("car-details.csv")

# Сортуємо дані за роком випуску автомобілів
df = df.sort_values(by="year")

# Відображуємо графічно залежність ціни від року випуску для різних власників
fig = px.line(df, x="year", y="selling_price", color="owner")

fig.show()

In [None]:
filtered_df = df[df["fuel"]=="Petrol"]

fig = px.line(filtered_df, x="year", y="selling_price", color="owner")

fig.show()

In [None]:
filtered_df = df[df["owner"]!="Third Owner"]

fig = px.line(filtered_df, x="year", y="selling_price", color="owner")

fig.show()

In [None]:
filtered_df = df[df["owner"].isin(["First Owner", "Second Owner"])]

fig = px.line(filtered_df, x="year", y="selling_price", color="owner")

fig.show()

In [None]:
df = pd.read_csv("pollution.csv")

filtered_df = df[(df["date"] >= "2012-01-01 00:00:00") & (df["date"] <= "2012-01-02 00:00:00")]

fig = px.line(filtered_df, x="date", y="pollution")

fig.show()

In [None]:
# Візуалізуємо залежності між характеристиками рослини за допомогою 3D-графіку
df = pd.read_csv("iris.csv")

fig = px.scatter_3d(df, x="Petal Length (cm)", y="Sepal Width (cm)", z="Sepal Length (cm)", color="Species")

fig.show()

# Нейронні Мережі

In [37]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
import tensorflow as tf
from tensorflow.keras import layers, models

# Зчитування датасету
df = pd.read_csv("alarms.csv")
fig = px.scatter_3d(df, x="sound", y="distance", z="alarm")
# fig.show()

# Підготовка даних
x = df[["sound", "distance", "visibility"]].values
y = df["alarm"].values

# Формування наборів даних для тренування та перевірки
x_train, x_test, y_train, y_test = train_test_split(x, y, test_size=0.2)

# Створення моделі нейронної мережі
model = models.Sequential([
    layers.Dense(8, input_shape=(x_train.shape[1],), activation="relu"),
    layers.Dense(2, activation="sigmoid"),
    layers.Dense(1, activation="sigmoid")
    # layers.Dense(8, activation="sigmoid")
])

model.compile(optimizer="adam", loss="mean_squared_error", metrics=["mse"])

# Тренування моделі
model.fit(x_train, y_train, epochs=100, batch_size=32, validation_data=(x_test, y_test))

# Перевірка моделі
loss, accuracy = model.evaluate(x_test, y_test)
print("Test Loss:", loss)
print("Test Accuracy:", accuracy)

Epoch 1/100
Epoch 2/100
Epoch 3/100
Epoch 4/100
Epoch 5/100
Epoch 6/100
Epoch 7/100
Epoch 8/100
Epoch 9/100
Epoch 10/100
Epoch 11/100
Epoch 12/100
Epoch 13/100
Epoch 14/100
Epoch 15/100
Epoch 16/100
Epoch 17/100
Epoch 18/100
Epoch 19/100
Epoch 20/100
Epoch 21/100
Epoch 22/100
Epoch 23/100
Epoch 24/100
Epoch 25/100
Epoch 26/100
Epoch 27/100
Epoch 28/100
Epoch 29/100
Epoch 30/100
Epoch 31/100
Epoch 32/100
Epoch 33/100
Epoch 34/100
Epoch 35/100
Epoch 36/100
Epoch 37/100
Epoch 38/100
Epoch 39/100
Epoch 40/100
Epoch 41/100
Epoch 42/100
Epoch 43/100
Epoch 44/100
Epoch 45/100
Epoch 46/100
Epoch 47/100
Epoch 48/100
Epoch 49/100
Epoch 50/100
Epoch 51/100
Epoch 52/100
Epoch 53/100
Epoch 54/100
Epoch 55/100
Epoch 56/100
Epoch 57/100
Epoch 58/100
Epoch 59/100
Epoch 60/100
Epoch 61/100
Epoch 62/100
Epoch 63/100
Epoch 64/100
Epoch 65/100
Epoch 66/100
Epoch 67/100
Epoch 68/100
Epoch 69/100
Epoch 70/100
Epoch 71/100
Epoch 72/100
Epoch 73/100
Epoch 74/100
Epoch 75/100
Epoch 76/100
Epoch 77/100
Epoch 78

In [38]:
# Тестуємо модель
# ["sound", "distance", "visibility"]
demo_data = np.array([
    [0.4, 0.2, 0.5],
    [0.2, 0.9, 0.3],
    [0.6, 0.7, 0.3],
    [0.9, 0.1, 0.4],
    [0.6, 0.6, 0.2],
    [0.4, 0.4, 0.8],
    [0.3, 0.1, 0.9],
])

predictions = model.predict(demo_data)
print("Predictions:")
print(predictions)

Predictions:
[[0.6315041 ]
 [0.23981941]
 [0.28247705]
 [0.6599496 ]
 [0.30070496]
 [0.62442166]
 [0.6522193 ]]
