In [1]:
import pandas as pd

# Carregar o arquivo CSV diretamente da URL
data_url = "https://raw.githubusercontent.com/altair-viz/vega_datasets/refs/heads/master/vega_datasets/_data/seattle-weather.csv"
climate_data = pd.read_csv(data_url, parse_dates=['date'])

# Verificar as primeiras linhas do dataset
climate_data.head()


Unnamed: 0,date,precipitation,temp_max,temp_min,wind,weather
0,2012-01-01,0.0,12.8,5.0,4.7,drizzle
1,2012-01-02,10.9,10.6,2.8,4.5,rain
2,2012-01-03,0.8,11.7,7.2,2.3,rain
3,2012-01-04,20.3,12.2,5.6,4.7,rain
4,2012-01-05,1.3,8.9,2.8,6.1,rain


In [2]:
import altair as alt

# Gráfico de barras para distribuição do clima
climate_distribution = (
    alt.Chart(climate_data)
    .mark_bar()
    .encode(
        x=alt.X('weather:N', title='Tipo de Clima'),
        y=alt.Y('count()', title='Frequência'),
        color='weather:N'
    )
    .properties(title="Distribuição dos Tipos de Clima", width=600)
)

climate_distribution


In [3]:
# Gráfico de linhas para variação de temperatura
temperature_trend = (
    alt.Chart(climate_data)
    .transform_fold(
        ['temp_max', 'temp_min'],
        as_=['Tipo', 'Temperatura']
    )
    .mark_line()
    .encode(
        x=alt.X('date:T', title='Data'),
        y=alt.Y('Temperatura:Q', title='Temperatura (°C)'),
        color='Tipo:N'
    )
    .properties(title="Variação de Temperatura ao Longo do Tempo", width=800)
)

temperature_trend


In [4]:
# Histograma para distribuição de temperaturas máximas
max_temp_histogram = (
    alt.Chart(climate_data)
    .mark_bar()
    .encode(
        x=alt.X('temp_max:Q', bin=True, title='Temperatura Máxima (°C)'),
        y=alt.Y('count()', title='Frequência')
    )
    .properties(title="Distribuição de Temperaturas Máximas", width=600)
)

# Histograma para distribuição de temperaturas mínimas
min_temp_histogram = (
    alt.Chart(climate_data)
    .mark_bar()
    .encode(
        x=alt.X('temp_min:Q', bin=True, title='Temperatura Mínima (°C)'),
        y=alt.Y('count()', title='Frequência')
    )
    .properties(title="Distribuição de Temperaturas Mínimas", width=600)
)

max_temp_histogram, min_temp_histogram


(alt.Chart(...), alt.Chart(...))

In [5]:
# Boxplot da velocidade do vento por tipo de clima
wind_speed_boxplot = (
    alt.Chart(climate_data)
    .mark_boxplot()
    .encode(
        x=alt.X('weather:N', title='Tipo de Clima'),
        y=alt.Y('wind:Q', title='Velocidade do Vento (km/h)'),
        color='weather:N'
    )
    .properties(title="Velocidade do Vento por Tipo de Clima", width=600)
)

wind_speed_boxplot


In [6]:
# Calcular a média mensal da temperatura máxima
numerical_columns = ['temp_max', 'temp_min', 'precipitation', 'wind']
monthly_avg_temp = climate_data.groupby([climate_data['date'].dt.to_period('M')])[numerical_columns].mean().reset_index()
monthly_avg_temp['date'] = monthly_avg_temp['date'].dt.to_timestamp()

# Gráfico de tendência mensal de temperatura máxima média
monthly_temp_trend = (
    alt.Chart(monthly_avg_temp)
    .mark_line()
    .encode(
        x=alt.X('date:T', title='Mês'),
        y=alt.Y('temp_max:Q', title='Temperatura Média Máxima (°C)'),
        color=alt.value('steelblue')
    )
    .properties(title="Tendência Mensal de Temperatura Média Máxima", width=800)
)

monthly_temp_trend


In [7]:
# Dispersão da temperatura máxima vs velocidade do vento
scatter_temp_wind = (
    alt.Chart(climate_data)
    .mark_circle(size=60, opacity=0.7)
    .encode(
        x=alt.X('temp_max:Q', title='Temperatura Máxima (°C)'),
        y=alt.Y('wind:Q', title='Velocidade do Vento (km/h)'),
        color='weather:N',
        tooltip=['date', 'temp_max', 'wind', 'weather']
    )
    .properties(title="Relação entre Temperatura Máxima e Velocidade do Vento", width=600)
)

scatter_temp_wind
