In [1]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [2]:
df_2024 = pd.read_csv("C:/Users/user/Desktop/Proyect ML - UN/Proyecto SISMO - Codigo/BBDD Servicio Geologico/2024.csv",delimiter=";")
df_2018 = pd.read_csv("C:/Users/user/Desktop/Proyect ML - UN/Proyecto SISMO - Codigo/BBDD Servicio Geologico/2018.csv",delimiter=";")

In [3]:
#Organizar el dataset de 2024 y normalizar los datos
df2 = df_2024
df1 = df_2018

In [4]:
#Eliminar columnas que no sirven en el modelo
df2 = df2.drop(columns=["QuakeML","Fases","Mapa","Estado","Tipo Mag.","Fases.1"])
df1 = df1.drop(columns=["ESTADO","MAGNITUD Mw","# FASES","DEPARTAMENTO"])

In [5]:
#Normalizar los datos y columnas con el mismo nombre de las columnas 
df1 = df1.rename(columns={"FECHA":"Fecha",
                            "HORA_UTC":"Hora",
                            "LATITUD (grados)":"Latitud",
                            "LONGITUD (grados)":"Longitud",
                            "PROFUNDIDAD (Km)":"Profundidad (Km)",
                            "MAGNITUD Ml":"Magnitud (MI)",
                            "DEPARTAMENTO":"Departamento",
                            "MUNICIPIO":"Municipio",
                            "RMS (Seg)":"Rms (Seg) / Velocidad del sismo",
                            "GAP (grados)":"Gap (Grados)",
                            "ERROR LATITUD (Km)":"Error Latitud (Km)",
                            "ERROR LONGITUD (Km)":"Error Longitud (Km)",
                            "ERROR PROFUNDIDAD (Km)":"Error Profundidad (Km)",
                            "INTENSIDAD":"Intensidad"})

df2 = df2.rename(columns={ "Fecha-Hora":"Fecha",
                            "(UTC)":"Hora",
                            "Lat(°)":"Latitud",
                            "Long(°)":"Longitud",
                            "Prof(Km)":"Profundidad (Km)",
                            "Mag.":"Magnitud (MI)",
                            "Rms(Seg)":"Rms (Seg) / Velocidad del sismo",
                            "Gap(°)":"Gap (Grados)",
                            "Error Lat(Km)":"Error Latitud (Km)",
                            "Error Long(Km)":"Error Longitud (Km)",
                            "Error Prof(Km)":"Error Profundidad (Km)",
                            "Region":"Municipio",
                            "Intensidad":"Intensidad"  
    
}
)   

In [6]:
df1 = df1[["Fecha","Hora","Latitud","Longitud","Profundidad (Km)","Magnitud (MI)","Rms (Seg) / Velocidad del sismo","Gap (Grados)","Error Latitud (Km)","Error Longitud (Km)","Error Profundidad (Km)","Municipio","Intensidad"]]

In [7]:
df2 = df2[["Fecha","Hora","Latitud","Longitud","Profundidad (Km)","Magnitud (MI)","Rms (Seg) / Velocidad del sismo","Gap (Grados)","Error Latitud (Km)","Error Longitud (Km)","Error Profundidad (Km)","Municipio","Intensidad"]]

In [8]:
# Para colocar los datos en minuscula y delimitar la columna muncipio y quitar la palabra Antioquia
df2["Municipio"] = df2["Municipio"].str.split(" - ").str[0]
df1["Municipio"] = df1["Municipio"].str.lower()
df1["Municipio"].str.lower().inplace=True

In [9]:
df1["Gap (Grados)"] = df1["Gap (Grados)"].fillna(0.0).astype("int64")

In [10]:
df = pd.concat([df1,df2], axis=0)

In [11]:
#cantidad de valores nulos o vacios 
df.isnull().sum()

Fecha                               0
Hora                                0
Latitud                             0
Longitud                            0
Profundidad (Km)                    0
Magnitud (MI)                       0
Rms (Seg) / Velocidad del sismo    22
Gap (Grados)                        0
Error Latitud (Km)                 22
Error Longitud (Km)                22
Error Profundidad (Km)             22
Municipio                           0
Intensidad                          0
dtype: int64

In [12]:
df["Rms (Seg) / Velocidad del sismo"].fillna(df["Rms (Seg) / Velocidad del sismo"].median(), inplace=True)
df["Error Latitud (Km)"].fillna(df["Error Latitud (Km)"].median(), inplace=True)
df["Error Longitud (Km)"].fillna(df["Error Longitud (Km)"].median(), inplace=True)
df["Error Profundidad (Km)"].fillna(df["Error Profundidad (Km)"].median(), inplace=True)

In [13]:
df["Fecha"] = pd.to_datetime(df["Fecha"], format="%d/%m/%Y")

In [14]:
df["Hora"] = pd.to_datetime(df["Hora"], format="%H:%M:%S").dt.time

In [15]:
df.columns

Index(['Fecha', 'Hora', 'Latitud', 'Longitud', 'Profundidad (Km)',
       'Magnitud (MI)', 'Rms (Seg) / Velocidad del sismo', 'Gap (Grados)',
       'Error Latitud (Km)', 'Error Longitud (Km)', 'Error Profundidad (Km)',
       'Municipio', 'Intensidad'],
      dtype='object')

In [16]:
df["Magnitud (MI)"].mean()

1.762807792910616

In [17]:
df["Municipio"].value_counts().sum()

22174

In [18]:
df["Municipio"].value_counts()

Municipio
Dabeiba        3151
murindo        1341
dabeiba        1153
Murindó         912
Uramita         761
               ... 
Santuario         1
angelopolis       1
carolina          1
La Pintada        1
Envigado          1
Name: count, Length: 245, dtype: int64

In [19]:
#Agrupar los datos

In [20]:
df_valores_unicos = df.sort_values(by=["Municipio","Magnitud (MI)"],ascending=False)


In [21]:
df_valores_unicos

Unnamed: 0,Fecha,Hora,Latitud,Longitud,Profundidad (Km),Magnitud (MI),Rms (Seg) / Velocidad del sismo,Gap (Grados),Error Latitud (Km),Error Longitud (Km),Error Profundidad (Km),Municipio,Intensidad
1025,1999-02-10,08:25:19,7.523,-74.869,32.10,4.5,1.2,127,15.600,12.700,47.70,zaragoza,2
1245,2000-12-16,23:48:48,7.404,-75.014,7.20,4.3,0.8,216,10.900,10.700,15.00,zaragoza,4
738,1996-10-24,14:41:35,7.520,-75.049,80.00,4.2,0.6,274,14.500,6.700,33.30,zaragoza,2
1914,2004-07-05,13:03:55,7.662,-75.056,4.00,4.2,0.7,177,9.600,10.600,12.50,zaragoza,5
1251,2000-12-29,15:43:49,7.373,-74.992,9.40,4.1,0.8,219,11.400,16.200,20.50,zaragoza,3
...,...,...,...,...,...,...,...,...,...,...,...,...,...
2392,2020-04-27,11:04:40,5.806,-75.464,3.78,0.5,0.2,164,0.495,0.495,1.30,Abejorral,2
3897,2021-03-03,12:42:00,5.766,-75.466,15.00,0.5,1.3,117,1.344,1.344,3.30,Abejorral,6
4890,2021-10-04,07:40:18,5.901,-75.486,0.84,0.5,0.4,147,1.344,1.344,3.40,Abejorral,2
4975,2021-10-08,08:41:46,5.898,-75.484,4.14,0.5,0.5,148,10.683,6.308,10.56,Abejorral,3


In [22]:
intensidad_pro = df["Intensidad"].mean()
intensidad_max = df["Intensidad"].max()
intensidad_min = df["Intensidad"].min()
print(intensidad_pro)
print(intensidad_max)
print(intensidad_min)

3.4235591232975557
19
0


In [23]:
df.loc[df["Intensidad"]>10] #Datos y regulares sismos mayores a 10*

Unnamed: 0,Fecha,Hora,Latitud,Longitud,Profundidad (Km),Magnitud (MI),Rms (Seg) / Velocidad del sismo,Gap (Grados),Error Latitud (Km),Error Longitud (Km),Error Profundidad (Km),Municipio,Intensidad
209,1994-09-19,22:28:26,7.001,-74.605,1.20,5.3,0.9,201,9.200,3.400,13.1,remedios,11
293,1994-11-23,03:27:06,7.044,-75.595,0.10,3.7,1.5,209,24.100,16.300,37.3,briceno,12
305,1994-11-24,02:29:40,6.914,-75.584,0.10,2.9,0.7,202,33.200,8.900,66.5,san_andres,11
651,1996-04-16,03:40:35,6.684,-76.719,0.10,3.1,0.4,257,21.700,16.000,22.4,vigia_del_fuerte,11
697,1996-08-28,04:34:20,6.982,-76.750,0.10,3.0,1.9,226,98.100,25.800,94.2,murindo,11
...,...,...,...,...,...,...,...,...,...,...,...,...,...
10885,2024-08-24,02:00:17,6.874,-76.336,0.06,1.4,0.4,158,1.626,1.626,2.8,Dabeiba,11
11248,2024-10-20,04:44:15,5.859,-74.877,0.01,1.2,1.1,95,2.828,2.828,6.4,San Francisco,15
11347,2024-11-05,07:17:43,5.874,-74.825,0.01,1.4,0.9,197,3.182,3.182,7.2,Sonsón,16
11409,2024-11-13,05:21:42,5.820,-74.842,0.03,1.0,0.5,136,1.980,1.980,4.3,Sonsón,12


In [24]:
df.loc[df["Magnitud (MI)"]>5.0].value_counts()

Fecha       Hora      Latitud  Longitud  Profundidad (Km)  Magnitud (MI)  Rms (Seg) / Velocidad del sismo  Gap (Grados)  Error Latitud (Km)  Error Longitud (Km)  Error Profundidad (Km)  Municipio  Intensidad
1994-09-13  10:01:34  7.246    -76.707   28.30             6.4            1.7                              157           30.200              24.900               52.60                   murindo    6             1
1994-09-19  22:28:26  7.001    -74.605   1.20              5.3            0.9                              201           9.200               3.400                13.10                   remedios   11            1
1995-03-29  16:10:51  7.020    -76.680   1.30              5.1            1.0                              223           14.400              6.000                14.10                   murindo    10            1
1996-06-11  16:57:38  7.357    -74.470   40.00             5.4            1.2                              272           30.500              18.900      

In [25]:
df.loc[df["Profundidad (Km)"]>50.00].value_counts().sum()

2193

In [26]:
df.loc[df["Profundidad (Km)"]>50.00].value_counts()

Fecha       Hora      Latitud  Longitud  Profundidad (Km)  Magnitud (MI)  Rms (Seg) / Velocidad del sismo  Gap (Grados)  Error Latitud (Km)  Error Longitud (Km)  Error Profundidad (Km)  Municipio           Intensidad
2009-06-11  22:47:18  6.495    -75.894   76.00             1.8            0.1                              168           3.000               7.800                7.50                    santa_fe_antioquia  8             2
1993-12-25  21:15:43  6.626    -75.062   75.10             2.6            0.3                              215           4.100               4.900                17.70                   yolombo             6             1
2021-09-27  09:39:30  7.201    -73.967   72.66             0.9            0.3                              73            0.849               0.849                2.20                    Yondó (Casabe)      9             1
2021-09-28  11:09:07  7.323    -75.621   55.32             1.3            0.2                              129       

In [27]:
value_counts = df['Municipio'].value_counts().unique()
value_counts 
#Se tiene un total de 99 muncipios

array([3151, 1341, 1153,  912,  761,  753,  664,  601,  590,  559,  431,
        412,  347,  329,  293,  254,  243,  235,  229,  222,  221,  206,
        201,  194,  193,  192,  188,  186,  185,  182,  167,  156,  154,
        153,  149,  145,  135,  127,  122,  121,  115,  106,  104,  101,
         98,   97,   88,   87,   83,   82,   75,   71,   69,   66,   61,
         60,   59,   57,   56,   53,   52,   49,   46,   43,   42,   41,
         40,   39,   37,   36,   35,   32,   31,   30,   29,   27,   25,
         24,   23,   21,   20,   19,   18,   17,   16,   15,   14,   13,
         12,   11,   10,    9,    8,    7,    6,    5,    4,    3,    2,
          1], dtype=int64)

In [28]:
df["Municipio"].unique()

array(['nechi', 'zaragoza', 'murindo', 'chigorodo', 'anori', 'san_carlos',
       'turbo', 'frontino', 'dabeiba', 'puerto_berrio', 'caceres',
       'liborina', 'segovia', 'yolombo', 'vigia_del_fuerte',
       'puerto_triunfo', 'urrao', 'salgar', 'abejorral', 'marinilla',
       'vegachi', 'betania', 'taraza', 'san_pedro', 'puerto_nare',
       'san_francisco', 'el_bagre', 'caucasia', 'san_juan_de_uraba',
       'yondo', 'ituango', 'yali', 'jerico', 'remedios', 'peque',
       'sonson', 'tarso', 'maceo', 'toledo', 'mutata', 'abriaqui',
       'campamento', 'canasgordas', 'sabanalarga', 'buritica', 'uramita',
       'briceno', 'granada', 'amalfi', 'san_andres', 'yarumal', 'tamesis',
       'cocorna', 'san_jose_de_la_montana', 'carepa', 'apartado',
       'valdivia', 'san_rafael', 'ciudad_bolivar', 'santo_domingo',
       'olaya', 'guatape', 'caicedo', 'ebejico', 'san_luis', 'argelia',
       'caracoli', 'san_pedro_de_uraba', 'san_jeronimo', 'san_vicente',
       'andes', 'santa_fe_antio

In [29]:
conteo = df.groupby("Municipio")["Intensidad"].count()

In [30]:
conteo[conteo>700]

Municipio
Dabeiba    3151
Murindó     912
Uramita     761
dabeiba    1153
murindo    1341
uramita     753
Name: Intensidad, dtype: int64

In [31]:
#Grafica matplotlib

In [34]:
top_municipios = df["Municipio"].value_counts().head(20)

In [35]:
top_municipios #Municipio con más sismo

Municipio
Dabeiba             3151
murindo             1341
dabeiba             1153
Murindó              912
Uramita              761
uramita              753
Ituango              664
Frontino             601
mutata               590
vigia_del_fuerte     559
puerto_berrio        431
Vigia del Fuerte     412
Yondó (Casabe)       412
yondo                347
el_bagre             329
caceres              293
zaragoza             254
peque                243
frontino             235
Tarazá               229
Name: count, dtype: int64

In [78]:
df_magnitudes = df.groupby("Municipio")["Intensidad"].count()

In [37]:
df_magnitudes

Municipio
Abejorral     115
Abriaquí       15
Alejandría     10
Amagá           4
Amalfi         61
             ... 
yali           25
yarumal        24
yolombo        12
yondo         347
zaragoza      254
Name: Intensidad, Length: 245, dtype: int64

In [74]:
df_magnitudes= df[df['Intensidad'] > 5.1].groupby("Municipio")["Intensidad"].count().sort_values(ascending=False)

In [79]:
df_seleccionados = df[(df['Intensidad'] ) & (df['Municipio'].isin(['envigado']))]



#df[df['Intensidad'] > 5.1].groupby("Municipio")["Intensidad"].count().sort_values(ascending=False)

In [80]:
df_seleccionados

Unnamed: 0,Fecha,Hora,Latitud,Longitud,Profundidad (Km),Magnitud (MI),Rms (Seg) / Velocidad del sismo,Gap (Grados),Error Latitud (Km),Error Longitud (Km),Error Profundidad (Km),Municipio,Intensidad


In [77]:
df_magnitudes = df.groupby("Municipio").filter(lambda x: x['Intensidad'].mean() > 5)["Intensidad"].count().sort

In [209]:

''' Clasificación de daños en edificios de mampostería
Grado 1: Daños despreciables o ligeros, el edificio no tiene daño estructural o son muy ligeros. Se visualizan fisuras en algunos muros y pueden haber caído pequeños trozos de revestimiento.
Grado 2: Daños moderados. Se aprecian grietas en los muros y caídas de revestimiento y colapso parcial de chimeneas.
Grado 3: Daños importantes a graves. Se detectan grandes grietas de manera generalizada en la mayoría de los muros. Se desprenden tejas del tejado, rotura de chimeneas y se dañan elementos no estructurales como los tabiques.
Grado 4: Daños muy graves. Se dañan seriamente los muros y parcialmente otros elementos como forjados o tejados.
Grado 5: Colapso o destrucción. Los daños estructurales son muy graves, puede darse el colapso total o caso total o ser necesario el derribo de la edificación. '''

' Clasificación de daños en edificios de mampostería\nGrado 1: Daños despreciables o ligeros, el edificio no tiene daño estructural o son muy ligeros. Se visualizan fisuras en algunos muros y pueden haber caído pequeños trozos de revestimiento.\nGrado 2: Daños moderados. Se aprecian grietas en los muros y caídas de revestimiento y colapso parcial de chimeneas.\nGrado 3: Daños importantes a graves. Se detectan grandes grietas de manera generalizada en la mayoría de los muros. Se desprenden tejas del tejado, rotura de chimeneas y se dañan elementos no estructurales como los tabiques.\nGrado 4: Daños muy graves. Se dañan seriamente los muros y parcialmente otros elementos como forjados o tejados.\nGrado 5: Colapso o destrucción. Los daños estructurales son muy graves, puede darse el colapso total o caso total o ser necesario el derribo de la edificación. '