<a href="https://colab.research.google.com/github/casjunior93/Analise-de-terromotos-ocorridos-no-Brasil-desde-o-inicio-dos-registros-sismicos/blob/master/Terremotos_no_Brasil.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Análise de terromotos ocorridos no Brasil desde o início dos registros sísmicos**

No dia 24/02/2022, habitantes das cidades de Espírito Santo do Pinhal-SP, Santo Antônio do Jardim-SP, São João da Boa Vista-SP, Águas da Prata-SP e Poços de Caldas-MG, relataram que houve um tremor perceptível de terra após um barulho alto parecido com um trovão.

Segundo relatos, "Houve um estrondo grande, parecido com um forte trovão", e após houve um tremor de terra de curta duração.

Atualização: Segundo o Observatório Cismológico de São Sebastião da Grama (SP), o terremoto teve magnitude 2.7 na Escala Richter e teve como epicentro a cidade de São Sebastião da Grama (SP). Fonte: https://andradas.portaldacidade.com/noticias/regiao/regiao-de-andradas-e-atingida-por-terremoto-de-magnitude-27-5909

O interessante é que tal fenômeno ocorreu no centenário do maior tremor já registrado na Região Sudeste do Brasil. O "Sismo de Pinhal", ocorrido em 27 de janeiro de 1922, atingiu magnitude 5.1 na escala Richter. Fonte: https://portaldepinhal.com.br/2022/01/o-terremoto-que-apavorou-sp-ha-100-anos-epicentro-foi-em-espirito-santo-do-pinhal/ e https://www.youtube.com/watch?v=0qDSh68XqpY&ab_channel=DepartamentodeGeof%C3%ADsicadoIAG-USP .

Tal ocorrido me motivou a fazer uma análise dos terremotos que aconteceram no Brasil, na tentativa de identificar algum padrão geográfico ou temporal. Outro fator que me motivou é que moro em Andradas-MG, que fica na região onde ocorreu o tremor desse 24 de fevereiro e cerca de 30-40 quilômetros do epicentro do sismo de 1922.

Para essa análise vou usar dados da versão do Boletim Sísmico do Centro de Sismologia da USP de janeiro de 2022 (http://moho.iag.usp.br/eq/bulletin/). Como os dados do boletim vão até o final do ano de 2020, eu irei complementar os dados do boletim com os dados obtidos através da consulta à ferramenta Últimos terremotos do Centro de Sismologia da USP (http://moho.iag.usp.br/eq/latest).

# Importando os dados


## Bibliotecas Python

In [42]:
import pandas as pd

## Dados do Centro de Sismologia da USP

Dados obtidos da página Últimos terremotos (http://moho.iag.usp.br/eq/latest). Os dados são de 01 de janeiro de 2021 até 26 de fevereiro de 2022.

In [44]:
df_uterremotos = pd.read_csv('/content/drive/MyDrive/ANÁLISES DE DADOS/Terremotos/dados/Catalogo.csv')
df_uterremotos.tail(5)

Unnamed: 0,data,longitude,latitude,magnitude,regiao
320,2021-01-17T17:12:06.21Z,-48678,-13161,3.2,Montividiu do Norte/GO
321,2021-01-15T22:36:37.7Z,-39380,-5129,1.9,Quixeramobim/CE
322,2021-01-09T15:39:11.687Z,-58422,-25434,2.2,Northeastern Argentina
323,2021-01-07T15:27:44.690Z,-40104,-3715,2.1,Sobral/CE
324,2021-01-07T02:46:29.358Z,-40318,-3540,2.2,Massape/CE


## Features do dataframe

* `data` - Data do terremoto
* `longitude` - Longitude do epicentro
* `latitude` - Latitude do epicentro
* `magnitude` - Magnitude do sismo
* `regiao` - Região do sismo 

### Pré-análise do dataframe

Análise geral do dataframe df_boletim:

In [45]:
df_uterremotos.shape

(325, 5)

In [46]:
df_uterremotos.describe(include='all')

Unnamed: 0,data,longitude,latitude,magnitude,regiao
count,325,325.0,325.0,325.0,325
unique,325,,,,155
top,2022-02-24T23:48:48.359Z,,,,Guyana
freq,1,,,,48
mean,,-47005.858462,-9199.387692,2.503692,
std,,9665.982154,8547.95702,0.836541,
min,,-74186.0,-33643.0,0.9,
25%,,-57532.0,-17781.0,1.9,
50%,,-44825.0,-8181.0,2.3,
75%,,-39509.0,-3749.0,3.0,


Tipo dos dados:

In [47]:
df_uterremotos.dtypes

data          object
longitude      int64
latitude       int64
magnitude    float64
regiao        object
dtype: object

Dados faltantes:

In [48]:
df_uterremotos.isnull().sum()

data         0
longitude    0
latitude     0
magnitude    0
regiao       0
dtype: int64

O dataframe não tem dados faltantes, mas pode-se perceber pela visualização dos dados e pela análise descritiva que existem localidades que estão fora do Brasil. Como o foco do estudo é o território brasileiro, vou encontrar esse dados e excluí-los.

Na análise descritiva, pode-se perceber que a Guyana é a região com maior frequência de terremotos. Porém, é uma região fora do Brasil. Por isso decidi excluí-la.

In [55]:
df_uterremotos.drop(df_uterremotos.loc[df_uterremotos['regiao']=='Guyana'].index, inplace=True)

O próximo passo é identificar quais regiões possuem a sigla de algum estado brasileiro. As regiões que não tiverem serão avaliadas.

In [84]:
estados = [
    'AC',
    'AL',
    'AP',
    'AM',
    'BA',
    'CE',
    'DF',
    'ES',
    'GO',
    'MA',
    'MT',
    'MS',
    'MG',
    'PA',
    'PB',
    'PR',
    'PE',
    'PI',
    'RJ',
    'RN',
    'RS',
    'RO',
    'RR',
    'SC',
    'SP',
    'SE',
    'TO'
]

def temEstadoBR(df):
  ''' verifica se a região possui a sigla de algum estado brasileiro '''
  for estado in estados:
    if estado in df.regiao:
      return 1
  return 0
 
# creating and passing series to new column
df_uterremotos["temEstadoBR"]= df_uterremotos.apply(temEstadoBR, axis=1)

In [85]:
df_uterremotos["temEstadoBR"]

0      1
1      1
2      1
3      1
4      1
      ..
320    1
321    1
322    0
323    1
324    1
Name: temEstadoBR, Length: 277, dtype: int64

In [86]:
df_uterremotos.loc[df_uterremotos.temEstadoBR == 0].count()

data           10
longitude      10
latitude       10
magnitude      10
regiao         10
temEstadoBR    10
dtype: int64

In [87]:
df_uterremotos.loc[df_uterremotos.temEstadoBR == 0].head(10)

Unnamed: 0,data,longitude,latitude,magnitude,regiao,temEstadoBR
93,2021-10-12T04:34:34.519Z,-71313,-9599,4.3,Peru-Brazil Border Region,0
94,2021-10-02T12:52:33.664Z,-71204,-9569,5.9,Peru-Brazil Border Region,0
98,2021-09-27T21:52:31.489Z,-72667,-6805,4.3,Peru-Brazil Border Region,0
121,2021-09-03T16:29:06.750Z,-61784,-14656,4.0,Central Bolivia,0
130,2021-08-22T08:28:10.896Z,-74186,-8328,5.0,Peru-Brazil Border Region,0
206,2021-05-18T15:20:56.712Z,-72573,-8503,4.1,Peru-Brazil Border Region,0
219,2021-05-08T11:55:29.739Z,-55971,-33643,3.5,Uruguay,0
239,2021-04-11T04:21:02.674Z,-71304,-9243,4.3,Peru-Brazil Border Region,0
306,2021-01-29T15:46:07.125Z,-74135,-8490,4.2,Peru-Brazil Border Region,0
322,2021-01-09T15:39:11.687Z,-58422,-25434,2.2,Northeastern Argentina,0


Vou excluir as linhas que contém as regiões do Uruguai, Bolívia e Argentina e investigar as linhas que contém a região de fronteira com o Peru.

In [96]:
df_uterremotos.drop(df_uterremotos.loc[df_uterremotos['regiao']=='Central Bolivia'].index, inplace=True)
df_uterremotos.drop(df_uterremotos.loc[df_uterremotos['regiao']=='Uruguay'].index, inplace=True)
df_uterremotos.drop(df_uterremotos.loc[df_uterremotos['regiao']=='Northeastern Argentina'].index, inplace=True)

In [97]:
df_uterremotos.loc[df_uterremotos.temEstadoBR == 0].head(10)

Unnamed: 0,data,longitude,latitude,magnitude,regiao,temEstadoBR
93,2021-10-12T04:34:34.519Z,-71313,-9599,4.3,Peru-Brazil Border Region,0
94,2021-10-02T12:52:33.664Z,-71204,-9569,5.9,Peru-Brazil Border Region,0
98,2021-09-27T21:52:31.489Z,-72667,-6805,4.3,Peru-Brazil Border Region,0
130,2021-08-22T08:28:10.896Z,-74186,-8328,5.0,Peru-Brazil Border Region,0
206,2021-05-18T15:20:56.712Z,-72573,-8503,4.1,Peru-Brazil Border Region,0
239,2021-04-11T04:21:02.674Z,-71304,-9243,4.3,Peru-Brazil Border Region,0
306,2021-01-29T15:46:07.125Z,-74135,-8490,4.2,Peru-Brazil Border Region,0
