In [1]:
import pandas as pd
import numpy as np
import plotly.graph_objects as go


In [18]:
df = pd.read_csv('Salary_dataset.csv').drop(columns=['Unnamed: 0'])
df = df.sort_values(by=['YearsExperience'])
df = df.drop_duplicates(subset='YearsExperience')
print(len(df))
df

28


Unnamed: 0,YearsExperience,Salary
0,1.2,39344.0
1,1.4,46206.0
2,1.6,37732.0
3,2.1,43526.0
4,2.3,39892.0
5,3.0,56643.0
6,3.1,60151.0
7,3.3,54446.0
9,3.8,57190.0
10,4.0,63219.0


# Линейная интерполяция

In [27]:
x = df['YearsExperience'].to_numpy()
y = df['Salary'].to_numpy()

x1 = np.arange(x[0], x[-1], 0.5)
y1 = np.interp(x1, x, y)

fig = go.Figure()

fig.add_trace(go.Scatter(
    x=x,
    y=y,
    name='Исходные данные',
    mode='markers')
)

fig.add_trace(go.Scatter(
    x=x1,
    y=y1,
    name='Линейная интерполяция',
)
)

fig.update_layout(title='Зависимость ЗП от опыта работы',
                  xaxis_title='Опыт работы (годы)',
                  yaxis_title='Зарплата')
fig.show()

# Кубический сплайн

In [25]:
from scipy.interpolate import CubicSpline

inter_f = CubicSpline(x, y)

fig = go.Figure()

fig.add_trace(go.Scatter(
    x=x,
    y=y,
    name='Исходные данные',
    mode='markers')
)

fig.add_trace(go.Scatter(
    x=x1,
    y=inter_f(x1),
    name='Интерполяция',
)
)

fig.update_layout(title='Зависимость ЗП от опыта работы',
                  xaxis_title='Опыт работы (годы)',
                  yaxis_title='Зарплата')
fig.show()

# Интерполяция Лагранжа

In [33]:
import numpy as np
from scipy.interpolate import lagrange
from numpy.polynomial.polynomial import Polynomial

x = x - np.mean(x)
x = x / np.max(x)

y = y - np.mean(y)
y = y / np.max(y)

x1 = np.arange(x[0], x[-1] + 0.005, 1e-4)

poly = lagrange(x, y)
y1 = Polynomial(poly.coef[::-1])(x1)

fig = go.Figure()

fig.add_trace(go.Scatter(
    x=x,
    y=y,
    name='Исходные данные',
    mode='markers')
)

fig.add_trace(go.Scatter(
    x=x1,
    y=y1,
    name='Интерполяция',
)
)

fig.update_layout(title='Потребление энергии',
                  xaxis_title='Время',
                  yaxis_title='кВт')
fig.show()

# Интерполяция Ньютона

In [ ]:

x1 = np.arange(x[0], x[-1], 1)


def divided_diff(x, y):
    n = len(y)
    coef = np.zeros([n, n])
    coef[:, 0] = y

    for j in range(1, n):
        for i in range(n - j):
            coef[i][j] = (coef[i + 1][j - 1] - coef[i][j - 1]) / (
                        x[i + j] - x[i])

    return coef


def newton_poly(coef, x_data, x):
    n = len(x_data) - 1
    p = coef[n]
    for k in range(1, n + 1):
        p = coef[n - k] + (x - x_data[n - k]) * p
    return p


a_s = divided_diff(x, y)[0, :]
y1 = newton_poly(a_s, x, x1)

fig = go.Figure()

fig.add_trace(go.Scatter(
    x=x,
    y=y,
    name='Исходные данные',
    mode='markers')
)

fig.add_trace(go.Scatter(
    x=x1,
    y=y1,
    name='Интерполяция',
)
)

fig.update_layout(title='Потребление энергии',
                  xaxis_title='Время',
                  yaxis_title='кВт')
fig.show()