In [None]:
from google.colab import files
uploaded = files.upload()

In [None]:
# Importação das bibliotecas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import (
    accuracy_score, precision_score, recall_score,
    f1_score, confusion_matrix, classification_report
)
from xgboost import XGBClassifier

# Carregando a base de dados de vinhos
df_vinhos = pd.read_csv('dados_vinhos.csv')  # Substitua pelo caminho correto do seu arquivo

# Pré-processamento dos dados
df_vinhos = df_vinhos.dropna()  # Remover valores nulos
X = df_vinhos.drop('tipo', axis=1)  # Variáveis preditoras
y = df_vinhos['tipo']  # Variável alvo

# Divisão dos dados em conjuntos de treinamento e teste
X_train, X_test, y_train, y_test = train_test_split(
    X, y, test_size=0.2, random_state=42
)

# Padronização dos dados
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Criação do modelo de classificação XGBoost
modelo_xgb = XGBClassifier(use_label_encoder=False, eval_metric='logloss')

# Treinamento do modelo
modelo_xgb.fit(X_train, y_train)

# Previsões no conjunto de teste
predicoes = modelo_xgb.predict(X_test)

# Avaliação do modelo
accuracy = accuracy_score(y_test, predicoes)
precision = precision_score(y_test, predicoes, average='weighted')
recall = recall_score(y_test, predicoes, average='weighted')
f1 = f1_score(y_test, predicoes, average='weighted')

# Exibição dos resultados
print(f'Acurácia: {accuracy:.2f}')
print(f'Precisão: {precision:.2f}')
print(f'Recall: {recall:.2f}')
print(f'Pontuação F1: {f1:.2f}')
print(f'Matriz de Confusão:\n{confusion_matrix(y_test, predicoes)}')
print(f'Relatório de Classificação:\n{classification_report(y_test, predicoes)}')

# Visualização da matriz de confusão
sns.heatmap(confusion_matrix(y_test, predicoes), annot=True, fmt='d', cmap='Blues')
plt.title('Matriz de Confusão - XGBoost Classifier')
plt.xlabel('Previsões')
plt.ylabel('Valores Reais')
plt.show()

FileNotFoundError: [Errno 2] No such file or directory: 'downloads/ampfy.XLSX'

In [None]:
fig_pizza = px.pie(dados_pizza, names='Sabor', values='Preferencia', title='Gráfico de Pizza',
                  hole=0.6)
fig_pizza.show()

In [None]:
dados_dispersao = pd.DataFrame({
    'X': [1, 2, 3, 4, 5],
    'Y': [2, 4, 1, 3, 5],
    'Grupo': ['A', 'A', 'B', 'B', 'C']
})
dados_dispersao

Unnamed: 0,X,Y,Grupo
0,1,2,A
1,2,4,A
2,3,1,B
3,4,3,B
4,5,5,C


In [None]:
fig_dispersao = px.scatter(dados_dispersao, x='X', y='Y', color='Grupo', title='Gráfico de Dispersão')
fig_dispersao.show()

In [None]:
import plotly.express as px
import pandas as pd
import numpy as np

# Gerando dados fictícios
np.random.seed(42) # utilizado para garantir a mesma sequência de números aleatórios em todas as execuções
num_pontos = 20
dados_dispersao = pd.DataFrame({
    'X': np.random.rand(num_pontos),
    'Y': np.random.rand(num_pontos),
    'Tamanho': np.random.randint(5, 30, num_pontos),  # Definindo tamanhos diferentes para os pontos
    'Cor': np.random.rand(num_pontos)
})
# Criando o gráfico de dispersão
fig = px.scatter(dados_dispersao, x='X', y='Y', size='Tamanho', color='Cor', opacity=0.7,
                 title='Gráfico de Dispersão com Mais de 10 Pontos',
                 labels={'X': 'Eixo X', 'Y': 'Eixo Y'},  # Renomeando os rótulos dos eixos
                 hover_name=dados_dispersao.index,  # Exibindo os índices dos pontos no hover
                 hover_data={'Tamanho': True, 'Cor': True},  # Exibindo informações adicionais no hover
                 size_max=40  # Tamanho máximo dos pontos
                 )
# Exibindo o gráfico
fig.show()


In [None]:
#Dados fictícios para o gráfico de linha
dados_linha = pd.DataFrame({
    'Ano': [2010, 2011, 2012, 2013, 2014, 2015],
    'Vendas': [100, 120, 90, 110, 140, 160]
})

# Criando o gráfico de linha
fig_linha = px.line(dados_linha, x='Ano', y='Vendas', title='Gráfico de Linha', markers=True)
fig_linha.show()

In [None]:
dados_mapa_calor = pd.DataFrame({
    'Dia da Semana': ['Segunda', 'Terça', 'Quarta', 'Quinta', 'Sexta'],
    'Período do Dia': ['Manhã', 'Tarde', 'Noite', 'Manhã', 'Tarde'],
    'Valor': [10, 20, 30, 40, 50]
})

fig_mapa_calor = px.density_heatmap(dados_mapa_calor, x='Dia da Semana', y='Período do Dia', z='Valor',
                                   title='Gráfico de Mapa de Calor')
fig_mapa_calor.show()

In [None]:
# Exemplo de dados fictícios de localização
dados_pontos = pd.DataFrame({
    'Cidade': ['Nova York', 'Los Angeles', 'Chicago'],
    'Latitude': [40.7128, 34.0522, 41.8781],
    'Longitude': [-74.0060, -118.2437, -87.6298],
    'População': [8623000, 3990000, 2716000]
})

fig_pontos = px.scatter_mapbox(dados_pontos, lat='Latitude', lon='Longitude', hover_name='Cidade',
                               size='População', zoom=4, title='Mapa de Pontos')
fig_pontos.update_layout(mapbox_style='open-street-map')
fig_pontos.show()

In [None]:
# Dados fictícios para o gráfico de Gantt
dados_gantt = pd.DataFrame({
    'Atividade': ['Tarefa 1', 'Tarefa 2', 'Tarefa 3'],
    'Início': ['2023-07-01', '2023-07-15', '2023-07-30'],
    'Término': ['2023-07-10', '2023-07-25', '2023-08-05']
})

# Convertendo as colunas de data para o tipo datetime
dados_gantt['Início'] = pd.to_datetime(dados_gantt['Início'])
dados_gantt['Término'] = pd.to_datetime(dados_gantt['Término'])

# Criando o gráfico de Gantt
fig = px.timeline(dados_gantt, x_start='Início', x_end='Término', y='Atividade', title='Gráfico de Gantt',
                  labels={'Atividade': 'Atividade', 'Início': 'Início', 'Término': 'Término'})

# Configurações de layout
fig.update_layout(xaxis_title_standoff=10,  # Espaçamento do título do eixo x
                  yaxis_title_standoff=10)  # Espaçamento do título do eixo y

# Exibindo o gráfico
fig.show()

In [None]:
# Dados fictícios para o tempo de atendimento ao cliente em dois sistemas diferentes
sistema_a = np.random.normal(loc=20, scale=5, size=100)
sistema_b = np.random.normal(loc=18, scale=4, size=100)

# Criando um DataFrame com os dados
dados = pd.DataFrame({
    'Sistema': ['Sistema A'] * 100 + ['Sistema B'] * 100,
    'Tempo de Atendimento': np.concatenate((sistema_a, sistema_b))
})

# Criando os boxplots comparativos
fig = px.box(dados, x='Sistema', y='Tempo de Atendimento', title='Comparação do Tempo de Atendimento ao Cliente',
             labels={'Sistema': 'Sistema', 'Tempo de Atendimento': 'Tempo de Atendimento (minutos)'},
             color='Sistema')

# Configurações de layout
fig.update_layout(showlegend=False)

# Exibindo o gráfico
fig.show()

In [None]:
import plotly.graph_objects as go

# Exemplo de dados fictícios para o gráfico de Sankey
links = [
    {"source": "Origem A", "target": "Destino X", "value": 20},
    {"source": "Origem B", "target": "Destino X", "value": 30},
    {"source": "Origem B", "target": "Destino Y", "value": 15},
    {"source": "Origem C", "target": "Destino Y", "value": 25},
    {"source": "Origem C", "target": "Destino Z", "value": 40},
]

# Obtendo as listas de nós de origem e destino
sources = [link["source"] for link in links]
targets = [link["target"] for link in links]

# Criação do gráfico de Sankey
fig = go.Figure(data=[go.Sankey(
    node=dict(
        pad=15,
        thickness=20,
        line=dict(color="black", width=0.5),
        label=sources + targets
    ),
    link=dict(
        source=[sources.index(link["source"]) for link in links],
        target=[len(sources) + targets.index(link["target"]) for link in links],
        value=[link["value"] for link in links]
    )
)])

# Atualizando as propriedades do layout do gráfico
fig.update_layout(title_text="Gráfico de Sankey Interativo")

# Salvando o gráfico como um arquivo HTML
fig.write_html("grafico_sankey.html")
