Установка бибилиотек

In [None]:
pip install plotly



Этот код импортирует необходимые библиотеки Python и подготавливает набор данных “Ирис” для визуализации.

In [None]:
import plotly.express as px #для создания интерактивных веб-графиков
import pandas as pd #работы с данными в формате таблиц (DataFrame)
from sklearn.datasets import load_iris #загружает классический набор данных о цветах ирисов Фишера


iris = load_iris()#загруженный набор данных в переменную iris.
df = pd.DataFrame(data=iris.data, columns=iris.feature_names) #Создает объект DataFrame из данных, содержащихся в iris.data. iris.feature_names
df['species'] = iris.target_names[iris.target]#Добавляет новый столбец species в DataFrame df, содержащий названия видов ирисов (setosa, versicolor, virginica) на основе данных из iris.target
df['index'] = df.index #Добавляет новый столбец index, содержащий индексы строк DataFrame (от 0 до 149)

# Она группирует данные в df по двум столбцам: species (вид ириса) и index (номер наблюдения).
#Затем, для каждой группы, вычисляется среднее значение длины чашелистика ('sepal length (cm)') с помощью функции agg... сбрасывает индексы, создавая стандартный DataFrame с индексами от 0 до N.
grouped = df.groupby(['species', 'index']).agg({'sepal length (cm)': 'mean'}).reset_index()

1. Гистограмма: Графическое представление распределения частоты непрерывной переменной.
Создаёт интерактивную гистограмму. Можно наводить курсор на столбики для просмотра точных значений. Простой синтаксис.

In [None]:
# Создание гистограммы с помощью Plotly Express
# df:  DataFrame, содержащий данные.
# x="sepal length (cm)":  Столбец, по которому строится гистограмма (длина чашелистика).
# nbins=10:  Количество интервалов (корзин) на гистограмме.
# title='Гистограмма длины чашелистика':  Заголовок гистограммы.
fig = px.histogram(df, x="sepal length (cm)", nbins=10, title='Гистограмма распределения длины чашелистиков')

# Отображение гистограммы (интерактивная версия)
fig.show()
#nbins=10: Задает количество интервалов (корзин) на гистограмме.

Plotly добавляет интерактивность для графиков в отличие от других библиотек.

2. Диаграмма рассеяния (Scatter plot): График, показывающий взаимосвязь между двумя переменными.

In [None]:
# Создание диаграммы рассеяния с помощью Plotly Express
# df:  DataFrame, содержащий данные.
# x="sepal length (cm)":  Столбец для оси X (длина чашелистика).
# y="sepal width (cm)":  Столбец для оси Y (ширина чашелистика).
# color="species":  Разделение точек по цвету в зависимости от вида ириса.
# title='Диаграмма рассеяния': Заголовок диаграммы.
fig = px.scatter(df, x="sepal length (cm)", y="sepal width (cm)", color="species",
                 title='Диаграмма рассеяния: Зависимость длины и ширины чашелистиков')

# Отображение диаграммы рассеяния (интерактивная версия)
fig.show()

Создает интерактивную диаграмму рассеяния. Можно наводить курсор на точки и получать информацию о них, что удобно для исследования данных. Синтаксис краткий и понятный.

3. Ящик с усами (Box plot): Графическое представление распределения данных, показывающее медиану, квартили и выбросы.

In [None]:
# Создание графика "ящик с усами" с помощью Plotly Express
# df: DataFrame, содержащий данные.
# x="species": Категориальная переменная (вид ириса) для группировки данных.
# y="sepal length (cm)": Численная переменная (длина чашелистика), для которой строится распределение.
# title='Ящик с усами': Заголовок графика.
fig = px.box(df, x="species", y="sepal length (cm)", title='Ящик с усами: Распределение длины чашелистика по видам ирисов')

# Отображение графика (интерактивная версия)
fig.show()

Создает интерактивный график, позволяющий навести курсор на отдельные части графика для получения подробной информации. Легко читается и требует минимального количества кода.

 Plotly предлагает интерактивную версию графика, что может быть полезно для исследования данных, но может не требоваться во всех случаях.

4. Линейный график: График, отображающий изменения переменной во времени или в зависимости от другой переменной.

In [None]:
# Создание линейного графика с помощью Plotly Express
# grouped: DataFrame, содержащий сгруппированные данные.
# x="index": Столбец для оси X (индекс).
# y="sepal length (cm)": Столбец для оси Y (средняя длина чашелистика).
# color="species": Разделение линий по цвету в зависимости от вида ириса.
# title='Средняя длина чашелистика для каждого вида ирисов': Заголовок графика.
fig = px.line(grouped, x="index", y="sepal length (cm)", color="species",
              title='Средняя длина чашелистика для каждого вида ирисов')

# Обновление подписей осей
fig.update_layout(xaxis_title='Средний индекс наблюдения', yaxis_title='Средняя длина чашелистика (см)')

# Отображение графика (интерактивная версия, указан рендерер для colab)
fig.show(renderer="colab")

Plotly, в силу своей интерактивности, предоставляет пользователю наибольшие возможности для исследования данных, даже в данном простом примере.

5. 3D Диаграммы рассеяний для библиотек Plotly, Matplotlib.
Plotly.

Этот пример использует px.scatter_3d, который позволяет легко создавать 3D-графики рассеяния с различными параметрами, такими как цвета и типы маркеров для каждой категории.

In [None]:
# Создание 3D диаграммы рассеяния с помощью Plotly Express
# df: DataFrame, содержащий данные.
# x='sepal length (cm)': Столбец для оси X (длина чашелистика).
# y='sepal width (cm)': Столбец для оси Y (ширина чашелистика).
# z='petal width (cm)': Столбец для оси Z (ширина лепестка).
# color='species': Разделение точек по цвету в зависимости от вида ириса.
# title='3D Диаграмма рассеяния с Plotly': Заголовок графика.
fig_plotly = px.scatter_3d(df, x='sepal length (cm)', y='sepal width (cm)', z='petal width (cm)',
                           color='species', title='3D Диаграмма рассеяния: Визуализация данных ирисов')

# Отображение 3D диаграммы рассеяния (интерактивная версия)
fig_plotly.show()

Plotly часто предпочтительнее, особенно когда нужна интерактивность и гибкость, но Matplotlib предоставляет больше контроля над деталями построения. Но в случае больших наборов данных или более сложных визуализаций, Plotly предлагает более эффективные способы для взаимодействия с графиком и восприятия данных.

**Вывод:**

Plotly выделяется своей способностью создавать интерактивные веб-графики. Интерактивность Plotly позволяет пользователям взаимодействовать с визуализацией, что значительно повышает эффективность исследования данных. Plotly особенно удобен для представления результатов анализа в веб-приложениях и интерактивных отчетах. Недостатком может быть более сложное освоение библиотеки по сравнению с Matplotlib и Seaborn.