An√°lise Clim√°tica de Hong Kong - Projeto de Ci√™ncia de Dados
Descri√ß√£o
Este projeto tem como objetivo realizar uma an√°lise detalhada dos dados clim√°ticos de Hong Kong, incluindo pluviosidade, umidade e temperaturas (m√°ximas, m√≠nimas e m√©dias). Al√©m disso, ser√° realizada uma an√°lise de tend√™ncia de aquecimento global utilizando dados hist√≥ricos de temperatura. O projeto utiliza Python e bibliotecas como Pandas, Matplotlib e Seaborn para an√°lise de dados e visualiza√ß√£o.

Objetivos do Projeto
Analisar a pluviosidade de Hong Kong ao longo dos anos e identificar padr√µes sazonais.

Estudar a umidade relativa ao longo do tempo e suas rela√ß√µes com outras vari√°veis clim√°ticas.

Analisar as temperaturas (m√°ximas, m√≠nimas e m√©dias) de Hong Kong, observando varia√ß√µes e tend√™ncias sazonais.

Avaliar a tend√™ncia de aquecimento global usando as temperaturas m√©dias de Hong Kong, identificando a taxa de aquecimento ao longo dos anos.




Etapas do Projeto
Importa√ß√£o dos Dados

Carregar os dados e realizar as primeiras verifica√ß√µes.
Carregamento do dataframe
Inspecao de dados nulos
Conversao da coluna 'date' para datetime
"Drop" das colunas anteriores de anos, meses e dia da semana 
Correcao de t√≠tulos de colunas
Inclusao de estacoes

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns


In [None]:
import pandas as pd
#Carregamento do dataset
df = pd.read_excel(r"D:\Downloads\HK_Weather_2010_2019.xlsx")

#Exibir as primeiras linhas do dataframe
print(df.head())

In [None]:
#Verificacao de valores nulos/ausentes
print(df.isnull().sum())

#Remocao de linhas ou colunas com valores ausentes
df = df.dropna()

#Remocao de espacos extras nos nomes das colunas
df.columns = df.columns.str.strip()

In [None]:
# Ajustar o formato da data para 'dd/mm/aaaa'
df['date'] = pd.to_datetime(df['date'], format='%d/%m/%Y')

# Verificar se a convers√£o foi bem-sucedida
print(df['date'].head())

In [None]:
# Renomear as colunas para garantir que o c√≥digo funcione corretamente
df = df.rename(columns={'Year': 'year', 'Month': 'month', 'Day': 'day', 'WeekDay': 'weekday', 'temparature':'temperature','max temparature':'maxtemp'})

# Verifique as colunas novamente
print(df.columns)

In [None]:
#Criacao das colunas dia,dia da semana, mes e ano derivadas da coluna data convertida para datetime
df['Year'] = df['date'].dt.year
df['Month'] = df['date'].dt.month
df['Day'] = df['date'].dt.day
df['Weekday'] = df['date'].dt.day_name()
# Verificar as primeiras linhas do DataFrame
print(df.head())

In [None]:
# Garantir que 'Year' e 'Month' s√£o inteiros
df['Year'] = df['Year'].astype(int)
df['Month'] = df['Month'].astype(int)

# Agrupar por 'Year' e calcular a m√©dia da 'Rainfall'
df_yearly = df.groupby('Year').agg({'rainfall': 'mean'}).reset_index()

# Agrupar por 'Month' e calcular a m√©dia da 'Rainfall'
df_monthly = df.groupby('Month').agg({'rainfall': 'mean'}).reset_index()

# Visualizar os resultados
print(df_yearly.head())
print(df_monthly.head())

In [None]:
#Cria√ß√£o do agrupamento "Seasons"
def get_season(month):
    if month in [3, 4, 5]:  # Primavera
        return 'Spring'
    elif month in [6, 7, 8]:  # Ver√£o
        return 'Summer'
    elif month in [9, 10, 11]:  # Outono
        return 'Autumn'
    else:  # Inverno
        return 'Winter'

# Aplicar a fun√ß√£o para criar a coluna 'Season'
df['Season'] = df['Month'].apply(get_season)

# Agrupar por 'Season' e calcular a m√©dia de 'Rainfall'
df_seasonal = df.groupby('Season').agg({'rainfall': 'mean'}).reset_index()

# Exibir os resultados
print(df_seasonal)

An√°lise Explorat√≥ria

An√°lise de pluviosidade, umidade e temperatura ao longo dos anos.

Compara√ß√£o de m√©dias mensais e anuais.

In [None]:
# Garantir que 'Year' e 'Month' s√£o inteiros (se necess√°rio)
df['Year'] = df['Year'].astype(int)
df['Month'] = df['Month'].astype(int)



In [None]:
# Agrupar por 'Year' e calcular a m√©dia da 'Humidity'
df_yearly_humi=df.groupby('Year').agg({'humidity':'mean'}).reset_index()
# Agrupar por 'Month' e calcular a m√©dia da 'Humidity'
df_monthly_humi = df.groupby('Month').agg({'humidity':'mean'}).reset_index()
# Agrupar por 'Season' e calcular a m√©dia de 'humidity'
df_seasonal_humi = df.groupby('Season').agg({'humidity': 'mean'}).reset_index()
# Visualizar os resultados
print(df_yearly_humi.head())
print(df_monthly_humi.head())
print(df_seasonal_humi.head())

In [None]:
# Agrupar por 'Year' e calcular a m√©dia da 'Humidity'
df_yearly_rain=df.groupby('Year').agg({'rainfall':'mean'}).reset_index()
# Agrupar por 'Month' e calcular a m√©dia da 'Humidity'
df_monthly_rain = df.groupby('Month').agg({'rainfall':'mean'}).reset_index()
# Agrupar por 'Season' e calcular a m√©dia de 'humidity'
df_seasonal_rain = df.groupby('Season').agg({'rainfall': 'mean'}).reset_index()
# Visualizar os resultados
print(df_yearly_rain.head())
print(df_monthly_rain.head())
print(df_seasonal_rain.head())

In [None]:
# Exibir as primeiras linhas dos dados agregados

print("Annual Rainfall Average:")
print(df_yearly_rain.head())


print("\nMonthly Rainfall Average:")
print(df_monthly_rain.head())


print("\nMSeasonal Rainfall Average:")
print(df_seasonal_rain)

print("Annual Humidity Average:")
print(df_yearly_humi.head())


print("\nMonthly Temperature and Rainfall Average:")
print(df_monthly_humi.head())


print("\nMSeasonal Humidity:")
print(df_seasonal_humi)

In [None]:
# Agrupar por ano e calcular as temperaturas m√°ximas e m√≠nimas
df_yearly_temperature = df.groupby('Year').agg({'temperature':'mean'})
df_monthly_temperature = df.groupby('Month').agg({'temperature':'mean'})

# Exibir os resultados
df_yearly_temperature.head()
df_monthly_temperature.head() 



In [None]:
# Agrupar por ano e calcular as temperaturas m√°ximas e m√≠nimas
df_yearly_temperature = df.groupby('Year').agg({'temperature':'mean'})
df_yearly_temp = df.groupby('Year').agg({'maxtemp': 'max', 'mintemp': 'min'}).reset_index()
df_monthly_temp = df.groupby('Month').agg({'maxtemp': 'max', 'mintemp': 'min'}).reset_index()
# Exibir os resultados
df_monthly_temperature.head()
df_yearly_temp.head()
df_monthly_temp.head()





Visualiza√ß√µes

Gr√°ficos de linha, histogramas e box plots para representar as varia√ß√µes ao longo do tempo.

Precipitacao
M√©dias Anuais, Mensais e Sazonais

In [None]:
#M√©dias aanual e mensal da precipita√ß√£o
df_yearly_rain = df.groupby('Year').agg({'temperature': 'mean', 'rainfall': 'mean'}).reset_index()
df_monthly_rain = df.groupby('Month').agg({'temperature': 'mean', 'rainfall': 'mean'}).reset_index()

# Criar subgr√°ficos
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 6))

# Gr√°fico de m√©dia anual
ax1.plot(df_yearly_rain['Year'], df_yearly_rain['rainfall'], marker='o', color='b', linestyle='-', linewidth=2, markersize=6)
ax1.set_title('M√©dia Anual de Precipita√ß√£o')
ax1.set_xlabel('Ano')
ax1.set_ylabel('Precipita√ß√£o M√©dia (mm)')
ax1.grid(True)

# Gr√°fico de m√©dia mensal
ax2.plot(df_monthly_rain['Month'], df_monthly_rain['rainfall'], marker='o', color='g', linestyle='-', linewidth=2, markersize=6)
ax2.set_title('M√©dia Mensal de Precipita√ß√£o')
ax2.set_xlabel('M√™s')
ax2.set_ylabel('Precipita√ß√£o M√©dia (mm)')
ax2.set_xticks(df_monthly['Month'])
ax2.set_xticklabels(['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'])
ax2.grid(True)

plt.tight_layout()
plt.show()


In [4]:
import matplotlib.pyplot as plt

df_seasonal_rain = df.groupby('Season').agg({'rainfall': 'mean'}).reset_index()

# Plotar a m√©dia de precipita√ß√£o por esta√ß√£o
plt.figure(figsize=(8,6))
plt.bar(df_seasonal_rain['Season'], df_seasonal_rain['rainfall'], color=['green', 'yellow', 'orange', 'blue'])
plt.title('M√©dia de Precipita√ß√£o por Esta√ß√£o em Hong Kong (2010-2019)')
plt.xlabel('Esta√ß√£o')
plt.ylabel('Precipita√ß√£o M√©dia (mm)')
plt.show()

NameError: name 'df' is not defined

Umidade: m√©dias anuais, mensais e sazonais

In [None]:
df_yearly_humi= df.groupby('Year').agg({'humidity':'mean'}).reset_index()
df_monthly_humi = df.groupby('Month').agg({'humidity':'mean'}).reset_index()

# Criar subgr√°ficos
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(14, 6))


# Gr√°fico de m√©dia anual
ax1.plot(df_yearly_humi['Year'], df_yearly_humi['humidity'], marker='o', color='b', linestyle='-', linewidth=2, markersize=6)
ax1.set_title('M√©dia Anual de Umidade')
ax1.set_xlabel('Ano')
ax1.set_ylabel('Umidade M√©dia (mm)')
ax1.grid(True)


# Gr√°fico de m√©dia mensal
ax2.plot(df_monthly_humi['Month'], df_monthly_humi['humidity'], marker='o', color='g', linestyle='-', linewidth=2, markersize=6)
ax2.set_title('M√©dia Mensal de Umidade')
ax2.set_xlabel('M√™s')
ax2.set_ylabel('Umidade M√©dia (mm)')
ax2.set_xticks(df_monthly['Month'])
ax2.set_xticklabels(['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug', 'Sep', 'Oct', 'Nov', 'Dec'])
ax2.grid(True)


plt.tight_layout()
plt.show()

In [None]:
import matplotlib.pyplot as plt

df_seasonal_humi = df.groupby('Season').agg({'humidity': 'mean'}).reset_index()

# Plotar a m√©dia de Umidade por esta√ß√£o
plt.figure(figsize=(8,6))
plt.bar(df_seasonal_humi['Season'], df_seasonal_humi['humidity'], color=['green', 'yellow', 'orange', 'blue'])
plt.title('M√©dia de Umidade por Esta√ß√£o em Hong Kong (2010-2019)')
plt.xlabel('Esta√ß√£o')
plt.ylabel('Umidade M√©dia (mm)')
plt.show()

Gr√°ficos de Tend√™ncia Mensal e Anual de temperatura e precipita√ß√£o

In [None]:
import matplotlib.pyplot as plt
# Criar os subgr√°ficos
fig, axs = plt.subplots(2, 1, figsize=(12, 10))

# üìä Gr√°fico 1: Tend√™ncia Anual de Temperatura e Precipita√ß√£o
axs[0].plot(df_yearly['Year'], df_yearly_temperature['temperature'], label='Temperatura Anual', color='tab:red', marker='o')
axs[0].plot(df_yearly['Year'], df_yearly_rain['rainfall'], label='Precipita√ß√£o Anual', color='tab:blue', marker='s')
axs[0].set_title('Tend√™ncia Anual de Temperatura e Precipita√ß√£o')
axs[0].set_xlabel('Ano')
axs[0].set_ylabel('Valor')
axs[0].legend()

# üìä Gr√°fico 2: Tend√™ncia Mensal de Temperatura e Precipita√ß√£o
axs[1].plot(df_monthly['Month'], df_monthly_temperature['temperature'], label='Temperatura Mensal', color='tab:orange', marker='o')
axs[1].plot(df_monthly['Month'], df_monthly_rain['rainfall'], label='Precipita√ß√£o Mensal', color='tab:green', marker='s')
axs[1].set_title('Tend√™ncia Mensal de Temperatura e Precipita√ß√£o')
axs[1].set_xlabel('M√™s')
axs[1].set_ylabel('Valor')
axs[1].legend()

# Ajustar o layout
plt.tight_layout()
plt.show()





Temperaturas no decorrer dos anos(m√°ximas e m√≠nimas)

In [None]:
# Visualiza√ß√£o das temperaturas m√°ximas e m√≠nimas ao longo dos anos
plt.figure(figsize=(10,6))

# Temperaturas m√°ximas
plt.plot(df_yearly_temp['Year'], df_yearly_temp['maxtemp'], marker='o', linestyle='-', color='red', label='Temperatura M√°xima')

# Temperaturas m√≠nimas
plt.plot(df_yearly_temp['Year'], df_yearly_temp['mintemp'], marker='o', linestyle='-', color='blue', label='Temperatura M√≠nima')

# Adicionar t√≠tulo e r√≥tulos
plt.title('Temperaturas M√°ximas e M√≠nimas ao Longo dos Anos')
plt.xlabel('Ano')
plt.ylabel('Temperatura (¬∞C)')
plt.legend()

# Mostrar o gr√°fico
plt.grid(True)
plt.show()


Conclus√µes

Resumo dos insights obtidos com as an√°lises.
As perguntas que guiam a an√°lise s√£o:
Tend√™ncias Temporais: Como a temperatura, umidade e precipita√ß√£o variaram ao longo dos anos?
Padr√µes Sazonais: Existem diferen√ßas sazonais (mensais/trimestrais) nessas vari√°veis?
Correla√ß√£o Clim√°tica: Como a precipita√ß√£o se relaciona com a umidade e a temperatura?
Impacto Clim√°tico: Alguma dessas vari√°veis mostra um aumento ou diminui√ß√£o significativa ao longo do tempo?

A an√°lise dos dados de temperatura, umidade e precipita√ß√£o em Hong Kong revelou padr√µes clim√°ticos t√≠picos de uma regi√£o tropical, com √≠ndices m√©dios relativamente altos de umidade e pluviosidade durante as esta√ß√µes mais frias. No entanto, observamos uma anomalia no ano de 2015, que apresentou uma das menores m√©dias de umidade do conjunto de dados, resultando tamb√©m no menor √≠ndice de precipita√ß√£o m√©dia. J√° o ano de 2017 se destacou por registrar tanto as menores quanto as maiores temperaturas do dataset, sugerindo uma maior variabilidade t√©rmica nesse per√≠odo.

Uma descoberta interessante foi a aparente defini√ß√£o mais clara das esta√ß√µes em Hong Kong quando comparada a pa√≠ses subtropicais, como o Brasil. Enquanto os √≠ndices de umidade variam pouco ao longo do ano, a precipita√ß√£o segue um padr√£o mais marcante: aumentando significativamente no ver√£o, equilibrando-se na primavera e no outono, e tornando-se muito baixa no inverno. Esse comportamento refor√ßa a correla√ß√£o entre os meses mais quentes e o aumento da evapora√ß√£o, resultando em maior quantidade de chuvas.

Esses achados n√£o apenas contribuem para a compreens√£o do clima local, mas tamb√©m podem ser aplicados em estudos mais amplos sobre os impactos das varia√ß√µes clim√°ticas em diferentes regi√µes do mundo.