<a href="https://colab.research.google.com/github/carolhcs/ML-Engineering-Data-Science/blob/main/PowerBI_Python.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Desafio de Projeto criado durante o bootcamp de Python Data Analytics da DIO
### por Hellen Caroline Salvato
💻
Os desafios originais foram feitos usando o Power BI da Microsoft, que é bem mais imples e amigavel. Porém como existem varias limitações relacionadas a ele, resolvi refazer meu desafio em python, como uma forma de me desafiar.


## Conexão com Fontes de Dados
**🐼Pandas**: Uma biblioteca essencial para manipulação de dados, que pode se conectar a diversas fontes de dados, como arquivos CSV, Excel, SQL, e APIs.

In [None]:
import pandas as pd

# Ler dados de um arquivo CSV
df = pd.read_csv('data.csv')

# Ler dados de um banco de dados SQL
import sqlalchemy
engine = sqlalchemy.create_engine('sqlite:///mydatabase.db')
df = pd.read_sql('SELECT * FROM my_table', engine)


## Transformação e Limpeza de Dados
🐼
**Pandas**: Ferramentas robustas para limpeza e transformação de dados

In [None]:
# Remover duplicatas
df = df.drop_duplicates()

# Alterar tipos de dados
df['date'] = pd.to_datetime(df['date'])

# Mesclar tabelas
df = df.merge(other_df, on='key')


## Visualização de Dados
📊
**Matplotlib**: Biblioteca básica para criação de gráficos.

In [None]:
import matplotlib.pyplot as plt

df.plot(kind='bar', x='category', y='values')
plt.show()


📊**Seaborn**: Biblioteca baseada no Matplotlib, com gráficos estatísticos mais sofisticados.

In [None]:
import seaborn as sns

sns.barplot(x='category', y='values', data=df)
plt.show()


**📊Plotly**: Biblioteca para criação de gráficos interativos.

In [None]:
import plotly.express as px

fig = px.bar(df, x='category', y='values')
fig.show()


## Dashboards Interativos
📈
**Dash**: Framework baseado em Flask e Plotly para criação de dashboards web interativos.

In [None]:
import dash
import dash_core_components as dcc
import dash_html_components as html
from dash.dependencies import Input, Output
import plotly.express as px

app = dash.Dash(__name__)

app.layout = html.Div([
    dcc.Graph(id='example-graph'),
    dcc.Dropdown(id='dropdown', options=[
        {'label': 'Option 1', 'value': '1'},
        {'label': 'Option 2', 'value': '2'},
    ], value='1')
])

@app.callback(
    Output('example-graph', 'figure'),
    [Input('dropdown', 'value')]
)
def update_graph(selected_value):
    filtered_df = df[df['category'] == selected_value]
    fig = px.bar(filtered_df, x='category', y='values')
    return fig

if __name__ == '__main__':
    app.run_server(debug=True)


## Publicação e Compartilhamento
🌶
**Flask/Django**: Frameworks para desenvolver aplicações web, que podem ser usadas para hospedar e compartilhar dashboards e relatórios.
🖱
**Streamlit**: Biblioteca para criação de aplicativos web interativos de forma rápida.

In [None]:
import streamlit as st

st.title('Dashboard de Vendas')
st.bar_chart(df.set_index('category')['values'])


## Agendamento e Automação

**APScheduler**: Biblioteca para agendar tarefas

In [None]:
from apscheduler.schedulers.blocking import BlockingScheduler

def update_data():
    # Código para atualizar os dados
    pass

scheduler = BlockingScheduler()
scheduler.add_job(update_data, 'interval', hours=1)
scheduler.start()


## Modelagem e Análises Avançadas

**Scikit-learn**: Biblioteca para machine learning.

In [None]:
from sklearn.linear_model import LinearRegression

model = LinearRegression()
model.fit(X_train, y_train)
predictions = model.predict(X_test)


## Exemplo Integrado

Abaixo está um exemplo integrado que usa Dash para criar um dashboard interativo:

In [None]:
import dash
import dash_core_components as dcc
import dash_html_components as html
from dash.dependencies import Input, Output
import pandas as pd
import plotly.express as px

# Ler dados
df = pd.read_csv('data.csv')

app = dash.Dash(__name__)

app.layout = html.Div([
    html.H1('Dashboard de Vendas'),
    dcc.Dropdown(
        id='category-dropdown',
        options=[{'label': category, 'value': category} for category in df['category'].unique()],
        value=df['category'].unique()[0]
    ),
    dcc.Graph(id='sales-graph')
])

@app.callback(
    Output('sales-graph', 'figure'),
    [Input('category-dropdown', 'value')]
)
def update_graph(selected_category):
    filtered_df = df[df['category'] == selected_category]
    fig = px.bar(filtered_df, x='subcategory', y='sales')
    return fig

if __name__ == '__main__':
    app.run_server(debug=True)
