# Geophysics Institutions Throughout the World
- https://www.usgs.gov/programs/earthquake-hazards/science/geophysics-institutions-throughout-world

In [3]:
import pandas as pd
import requests
import json 
import folium 
import numpy as np
import os
from datetime import datetime, timedelta

# USGS
## API Documentation - Earthquake Catalog
### URL
- https://earthquake.usgs.gov/fdsnws/event/1/[METHOD[?PARAMETERS]]
 - metodo: query
 - Parámetros:
   - Ubicación: Las peticiones que utilicen tanto rectángulo como círculo devolverán la intersección, que puede estar vacía, utilízala con precaución.
      * Conterminous U.S. [24.6, 50] Latitude. [-125, -65] Longitude.

https://earthquake.usgs.gov/fdsnws/event/1/query?format=geojson&starttime=1995-05-04&minlatitude=24.6&maxlatitude=50&minlongitude=-125&maxlongitude=-65&limit=19999

In [4]:
def sismo(url):
    # Establecer el tiempo de inicio desde hoy menos 20000 eventos
    endtime = datetime.today().strftime('%Y-%m-%dT%H:%M:%S')
    starttime = (datetime.today() - timedelta(days=20000)).strftime('%Y-%m-%dT%H:%M:%S')

    # Establecer los demás parámetros de solicitud
    params = {"format": "geojson", "starttime": starttime, "endtime": endtime, "minmagnitude": 2.5,
            "minlatitude": 24.6, "maxlatitude": 50, "minlongitude": -125, "maxlongitude": -65, "limit": 20000}    
    data = requests.get(url, params = params)
    data = json.loads(data.text)
    return data

url = r"https://earthquake.usgs.gov/fdsnws/event/1/query?"
dic_sismo = sismo(url)
count=0
for i in (dic_sismo["features"]):
    if i["properties"]['cdi']:
        count += 1
# Convertir los datos a un dataframe
df_sismo = pd.json_normalize(dic_sismo['features'])

In [5]:
folder_path = "../CSV_ORIGINAL"
file_name = "raw_USA.csv"
file_path = os.path.join(folder_path, file_name)

df_sismo.to_csv(file_path, index=False)

In [6]:
df_sismo = pd.read_csv('../CSV_ORIGINAL/raw_USA.csv', sep=',')

In [7]:
df_sismo

Unnamed: 0,type,id,properties.mag,properties.place,properties.time,properties.updated,properties.tz,properties.url,properties.detail,properties.felt,...,properties.types,properties.nst,properties.dmin,properties.rms,properties.gap,properties.magType,properties.type,properties.title,geometry.type,geometry.coordinates
0,Feature,us6000kbl9,2.50,"5 km W of Zurich, Kansas",1683937354350,1683939752040,,https://earthquake.usgs.gov/earthquakes/eventp...,https://earthquake.usgs.gov/fdsnws/event/1/que...,,...,",origin,phase-data,",10.0,0.46000,0.5100,119.00,mb_lg,earthquake,"M 2.5 - 5 km W of Zurich, Kansas",Point,"[-99.4995, 39.2354, 3.69]"
1,Feature,nn00859459,2.80,"28 km WSW of Hawthorne, Nevada",1683930554464,1683935028040,,https://earthquake.usgs.gov/earthquakes/eventp...,https://earthquake.usgs.gov/fdsnws/event/1/que...,,...,",origin,phase-data,",14.0,0.22000,0.1563,64.37,ml,earthquake,"M 2.8 - 28 km WSW of Hawthorne, Nevada",Point,"[-118.9145, 38.4022, 11.5]"
2,Feature,nc73887311,2.91,"13km NNW of San Simeon, CA",1683925051130,1683935714063,,https://earthquake.usgs.gov/earthquakes/eventp...,https://earthquake.usgs.gov/fdsnws/event/1/que...,,...,",nearby-cities,origin,phase-data,scitech-link,",24.0,0.10920,0.1100,182.00,md,earthquake,"M 2.9 - 13km NNW of San Simeon, CA",Point,"[-121.2613297, 35.7476654, 3.66]"
3,Feature,nc73887306,2.90,"13km NNW of San Simeon, CA",1683925044320,1683935650059,,https://earthquake.usgs.gov/earthquakes/eventp...,https://earthquake.usgs.gov/fdsnws/event/1/que...,,...,",nearby-cities,origin,phase-data,scitech-link,",12.0,0.10120,0.1200,180.00,ml,earthquake,"M 2.9 - 13km NNW of San Simeon, CA",Point,"[-121.2488327, 35.7475014, 4.59]"
4,Feature,ci40223751,2.77,"8km NE of Cabazon, CA",1683912647620,1683935257500,,https://earthquake.usgs.gov/earthquakes/eventp...,https://earthquake.usgs.gov/fdsnws/event/1/que...,,...,",focal-mechanism,nearby-cities,origin,phase-da...",94.0,0.07689,0.1400,20.00,ml,earthquake,"M 2.8 - 8km NE of Cabazon, CA",Point,"[-116.7351667, 33.9791667, 17.35]"
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
19995,Feature,nc72885755,2.50,"4 km N of East Foothills, California",1504641729360,1514357684502,,https://earthquake.usgs.gov/earthquakes/eventp...,https://earthquake.usgs.gov/fdsnws/event/1/que...,41.0,...,",dyfi,focal-mechanism,nearby-cities,origin,pha...",118.0,0.03090,0.1700,26.00,md,earthquake,"M 2.5 - 4 km N of East Foothills, California",Point,"[-121.816, 37.4216667, 2.91]"
19996,Feature,us2000ag9h,2.50,"12 km ESE of Soda Springs, Idaho",1504639439900,1512676814040,,https://earthquake.usgs.gov/earthquakes/eventp...,https://earthquake.usgs.gov/fdsnws/event/1/que...,1.0,...,",dyfi,origin,phase-data,",,0.31600,0.5900,56.00,ml,earthquake,"M 2.5 - 12 km ESE of Soda Springs, Idaho",Point,"[-111.4657, 42.5999, 10]"
19997,Feature,uw61303577,2.82,"25 km W of Yachats, Oregon",1504626489530,1512676813040,,https://earthquake.usgs.gov/earthquakes/eventp...,https://earthquake.usgs.gov/fdsnws/event/1/que...,1.0,...,",dyfi,origin,phase-data,",13.0,0.23500,0.2100,248.00,ml,earthquake,"M 2.8 - 25 km W of Yachats, Oregon",Point,"[-124.4218333, 44.3418333, 25.72]"
19998,Feature,us2000ag3c,2.70,"9 km ESE of Soda Springs, Idaho",1504622801690,1512676813040,,https://earthquake.usgs.gov/earthquakes/eventp...,https://earthquake.usgs.gov/fdsnws/event/1/que...,,...,",origin,phase-data,",,0.31900,0.8200,141.00,ml,earthquake,"M 2.7 - 9 km ESE of Soda Springs, Idaho",Point,"[-111.499, 42.6237, 9.51]"


Borro las columnas que no necesito

In [8]:
df_sismo.columns

Index(['type', 'id', 'properties.mag', 'properties.place', 'properties.time',
       'properties.updated', 'properties.tz', 'properties.url',
       'properties.detail', 'properties.felt', 'properties.cdi',
       'properties.mmi', 'properties.alert', 'properties.status',
       'properties.tsunami', 'properties.sig', 'properties.net',
       'properties.code', 'properties.ids', 'properties.sources',
       'properties.types', 'properties.nst', 'properties.dmin',
       'properties.rms', 'properties.gap', 'properties.magType',
       'properties.type', 'properties.title', 'geometry.type',
       'geometry.coordinates'],
      dtype='object')

In [9]:
df_sismo.drop(columns=['type',"properties.tz",'properties.tz','properties.rms', 'properties.url','properties.detail','properties.alert', 'properties.status','properties.types','properties.sources','properties.magType','properties.type', 'properties.title', 'geometry.type'], axis=1, inplace=True) 


Cambio el formato de la columna properties.time

In [10]:
df_sismo["properties.time"] = pd.to_datetime(df_sismo["properties.time"], unit="ms") 
df_sismo["properties.updated"] = pd.to_datetime(df_sismo["properties.updated"], unit="ms")

In [11]:
df_sismo['estado'] = df_sismo['properties.place'].str.split(',').str[1].str.strip()


In [12]:
df_sismo['properties.place'] = df_sismo['properties.place'].str.split(',', expand=True)[0]


In [13]:
df_sismo.head(5)

Unnamed: 0,id,properties.mag,properties.place,properties.time,properties.updated,properties.felt,properties.cdi,properties.mmi,properties.tsunami,properties.sig,properties.net,properties.code,properties.ids,properties.nst,properties.dmin,properties.gap,geometry.coordinates,estado
0,us6000kbl9,2.5,5 km W of Zurich,2023-05-13 00:22:34.350,2023-05-13 01:02:32.040,,,,0,96,us,6000kbl9,",us6000kbl9,",10.0,0.46,119.0,"[-99.4995, 39.2354, 3.69]",Kansas
1,nn00859459,2.8,28 km WSW of Hawthorne,2023-05-12 22:29:14.464,2023-05-12 23:43:48.040,,,,0,121,nn,00859459,",us6000kbkj,nn00859459,",14.0,0.22,64.37,"[-118.9145, 38.4022, 11.5]",Nevada
2,nc73887311,2.91,13km NNW of San Simeon,2023-05-12 20:57:31.130,2023-05-12 23:55:14.063,,,,0,130,nc,73887311,",nc73887311,us6000kbjl,",24.0,0.1092,182.0,"[-121.2613297, 35.7476654, 3.66]",CA
3,nc73887306,2.9,13km NNW of San Simeon,2023-05-12 20:57:24.320,2023-05-12 23:54:10.059,,,,0,129,nc,73887306,",nc73887306,",12.0,0.1012,180.0,"[-121.2488327, 35.7475014, 4.59]",CA
4,ci40223751,2.77,8km NE of Cabazon,2023-05-12 17:30:47.620,2023-05-12 23:47:37.500,,,,0,118,ci,40223751,",ci40223751,us6000kbhy,",94.0,0.07689,20.0,"[-116.7351667, 33.9791667, 17.35]",CA


In [14]:
df_sismo.drop(columns='properties.place', inplace=True)

In [15]:
#Divido la columna geometry coordinates
df_sismo[['Longitud', 'Latitud', 'Profundidad']] = df_sismo['geometry.coordinates'].apply(lambda x: pd.Series(str(x).strip('[]').split(',')))

In [16]:
df_sismo.head(1)

Unnamed: 0,id,properties.mag,properties.time,properties.updated,properties.felt,properties.cdi,properties.mmi,properties.tsunami,properties.sig,properties.net,properties.code,properties.ids,properties.nst,properties.dmin,properties.gap,geometry.coordinates,estado,Longitud,Latitud,Profundidad
0,us6000kbl9,2.5,2023-05-13 00:22:34.350,2023-05-13 01:02:32.040,,,,0,96,us,6000kbl9,",us6000kbl9,",10.0,0.46,119.0,"[-99.4995, 39.2354, 3.69]",Kansas,-99.4995,39.2354,3.69


In [17]:
df_sismo.drop("geometry.coordinates", axis=1, inplace=True) 

In [18]:
df_sismo.columns

Index(['id', 'properties.mag', 'properties.time', 'properties.updated',
       'properties.felt', 'properties.cdi', 'properties.mmi',
       'properties.tsunami', 'properties.sig', 'properties.net',
       'properties.code', 'properties.ids', 'properties.nst',
       'properties.dmin', 'properties.gap', 'estado', 'Longitud', 'Latitud',
       'Profundidad'],
      dtype='object')

properties.sig : un número que describe la importancia del evento. Los números más grandes indican un evento más significativo. Este valor se determina en función de una serie de factores, que incluyen: magnitud, MMI máximo, informes de sensación e impacto estimado.

properties.dmin Distancia horizontal desde el epicentro hasta la estación más cercana (en grados). 1 grado son aproximadamente 111,2 kilómetros. En general, cuanto menor sea este número, más confiable es la profundidad calculada del terremoto.

	properties.gap: La brecha azimutal más grande entre estaciones azimutalmente adyacentes (en grados). En general, cuanto más pequeño es este número, más confiable es la posición horizontal calculada del terremoto. Las ubicaciones de terremotos en las que la brecha azimutal supera los 180 grados suelen tener grandes incertidumbres de ubicación y profundidad.

In [19]:
df_sismo = df_sismo = df_sismo.rename(columns={"properties.mag" : "Magnitud"}) 
df_sismo = df_sismo.rename(columns={"properties.time" : "primer reg"})
df_sismo = df_sismo.rename(columns={"properties.updated": "Ult reg"})
df_sismo = df_sismo.rename(columns={"properties.tsunami": "Posivilidad tsunami"})
df_sismo = df_sismo.rename(columns={"properties.sig": "Importancia del evento"})
df_sismo = df_sismo.rename(columns={"properties.dmin": "Dist Horizontal epicentro"})
df_sismo = df_sismo.rename(columns={"properties.gap": "Brecha azimutal"})
df_sismo.head(1)

Unnamed: 0,id,Magnitud,primer reg,Ult reg,properties.felt,properties.cdi,properties.mmi,Posivilidad tsunami,Importancia del evento,properties.net,properties.code,properties.ids,properties.nst,Dist Horizontal epicentro,Brecha azimutal,estado,Longitud,Latitud,Profundidad
0,us6000kbl9,2.5,2023-05-13 00:22:34.350,2023-05-13 01:02:32.040,,,,0,96,us,6000kbl9,",us6000kbl9,",10.0,0.46,119.0,Kansas,-99.4995,39.2354,3.69


In [20]:
df_sismo.isnull().sum()

id                               0
Magnitud                         0
primer reg                       0
Ult reg                          0
properties.felt              10137
properties.cdi               10137
properties.mmi               17236
Posivilidad tsunami              0
Importancia del evento           0
properties.net                   0
properties.code                  0
properties.ids                   0
properties.nst                5591
Dist Horizontal epicentro      892
Brecha azimutal                 18
estado                         389
Longitud                         0
Latitud                          0
Profundidad                      0
dtype: int64

In [21]:
df_sismo.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20000 entries, 0 to 19999
Data columns (total 19 columns):
 #   Column                     Non-Null Count  Dtype         
---  ------                     --------------  -----         
 0   id                         20000 non-null  object        
 1   Magnitud                   20000 non-null  float64       
 2   primer reg                 20000 non-null  datetime64[ns]
 3   Ult reg                    20000 non-null  datetime64[ns]
 4   properties.felt            9863 non-null   float64       
 5   properties.cdi             9863 non-null   float64       
 6   properties.mmi             2764 non-null   float64       
 7   Posivilidad tsunami        20000 non-null  int64         
 8   Importancia del evento     20000 non-null  int64         
 9   properties.net             20000 non-null  object        
 10  properties.code            20000 non-null  object        
 11  properties.ids             20000 non-null  object        
 12  prop

Cambio el tipo de dato de Latitud y Longitud a float para poder utilizarlo en el mapa.

In [22]:
df_sismo["Longitud"] = df_sismo["Longitud"].astype(float) 
df_sismo["Latitud"] = df_sismo["Latitud"].astype(float) 
df_sismo["Profundidad"] = df_sismo["Profundidad"].astype(float)

In [23]:
# Crear un objeto de mapa centrado en una ubicación específica
m = folium.Map(location=[df_sismo['Latitud'].mean(), df_sismo['Longitud'].mean()], zoom_start=10)

# Iterar a través de las filas del dataframe y agregar marcadores al mapa
for index, row in df_sismo.iterrows(): 
    if row["Magnitud"] > 5.5:
        popup_text = "Magnitud: {}<br>Ubicación: {}".format(row['Magnitud'], row['estado'])
        folium.Marker(location=[row['Latitud'], row['Longitud']], popup=popup_text).add_to(m)

# Mostrar el mapa
m

In [24]:
df_sismo.columns

Index(['id', 'Magnitud', 'primer reg', 'Ult reg', 'properties.felt',
       'properties.cdi', 'properties.mmi', 'Posivilidad tsunami',
       'Importancia del evento', 'properties.net', 'properties.code',
       'properties.ids', 'properties.nst', 'Dist Horizontal epicentro',
       'Brecha azimutal', 'estado', 'Longitud', 'Latitud', 'Profundidad'],
      dtype='object')

DATOS UTILIZADOS

Alert
  - Tipo de datos: Cadena
  - Valores típicos: “verde”, “amarillo”, “naranja”, “rojo”.
  - Descripción: El nivel de alerta de la escala de impacto de terremotos de PAGER.  


**cdi**
  - Tipo de datos: decimal
  - Descripción: La máxima intensidad reportada para el evento. Calculado por DYFI. S 
i bien generalmente se informa como un número romano, para los fines de esta API, se espera que la intensidad  
sea el equivalente decimal del número romano. Obtenga más información sobre la magnitud frente a la intensidad. 
 

Depth 
- Tipo de datos: decimal 
- Profundidad del evento en kilómetros.

DepthError
  - Tipo de datos: decimal
  - Valores típicos: [0, 100]- Descripción: Incertidumbre de la profundidad reportada del evento en kilómetros.
  - Información adicional: El error de profundidad, en km, definido como la mayor proyección de los tres errores principales en una línea vertical. 


Dmin 
  - Tipo de datos: decimal
  - Descripción :Distancia horizontal desde el epicentro hasta la estación más cercana (en grados). 1 grado son aproximadamente 111,2 kilómetros.  
En general, cuanto menor sea este número, más confiable es la profundidad calculada del terremoto.

Gap
  - Tipo de datos: decimal
  - Descripción: La mayor brecha azimutal entre estaciones azimutalmente adyacentes (en grados). En general, cuanto más pequeño es este número, más confiable es la posición horizontal calculada del terremoto. Las ubicaciones de terremotos en las que la brecha azimutal supera los 180 grados suelen tener grandes incertidumbres de ubicación y profundidad.

HorizontalError
  - Tipo de datos: decimal
  - Descripción: Incertidumbre de la ubicación reportada del evento en kilómetros.
  - Información adicional: El error de ubicación horizontal, en km, definido como la longitud de la mayor proyección de los tres errores principales en un plano horizontal.  
Los errores principales son los ejes principales del elipsoide de error y son mutuamente perpendiculares.  
Las incertidumbres horizontales y verticales en la ubicación de un evento varían desde aproximadamente 100 m en horizontal y 300 metros en vertical para los eventos mejor ubicados, aquellos en medio de redes de sismógrafos densamente espaciadas, hasta decenas de kilómetros para eventos globales en muchas partes del mundo.  
Informamos un valor "desconocido" si la red sísmica contribuyente no proporciona estimaciones de incertidumbre. 

Latitud
  - Tipo de datos: decimal
  - Descripción :Grados decimales de latitud. Valores negativos para latitudes del sur.
  - Información adicional: Un terremoto comienza a romperse en un hipocentro que está definido por una posición en la superficie de la tierra (epicentro) y una profundidad por debajo de este punto (profundidad focal). Proporcionamos las coordenadas del epicentro en unidades de latitud y longitud. La latitud es el número de grados al norte (N) o al sur (S) del ecuador y varía de 0 en el ecuador a 90 en los polos.


LocationSource 
  - Tipo de datos: Cadena
  - Descripción: la red que originalmente creó la ubicación informada de este evento.

Longitud
  - Tipo de datos: decimal
  - Descripción :Grados decimales de longitud. Valores negativos para longitudes occidentales.
  - Información adicional: La longitud varía de 0 en Greenwich a 180 y el E o W muestra la dirección desde Greenwich. Las coordenadas se dan en el marco de referencia WGS84. La incertidumbre de la posición del hipocentro varía desde aproximadamente 100 m en horizontal y 300 metros en vertical para los eventos mejor ubicados, aquellos en medio de redes de sismógrafos densamente espaciadas, hasta decenas de kilómetros para eventos globales en muchas partes del mundo. 


mag 
 
- Información adicional: La magnitud reportada es la que el Servicio Geológico de los EE. UU. considera oficial para este terremoto, y fue la mejor estimación disponible del tamaño del terremoto, en el momento en que se creó esta página.

Mag Error
  - Tipo de datos: decimal
  - Descripción: Incertidumbre de la magnitud reportada del evento. El error estándar estimado de la magnitud. La incertidumbre corresponde al tipo de magnitud específica que se informa y no tiene en cuenta las variaciones de magnitud y los sesgos entre diferentes escalas de magnitud. Informamos un valor "desconocido" si la red sísmica contribuyente no proporciona estimaciones de incertidumbre.  
   
Podriamos hacer una alerta diferente cuando no se sabe la magnitud!!!

magNST
  - Tipo de datos: entero
  - - Descripción: El número total de estaciones sísmicas utilizadas para calcular la magnitud de este terremoto.

mmi (no lo voy a terminar utilizando porque no vamos a hacer una prediccion)
  - Tipo de datos: decimal
  - Descripción: La intensidad instrumental máxima estimada para el evento. Calculado por ShakeMap. Si bien generalmente se informa como un número romano, para los fines de esta API, se espera que la intensidad sea el equivalente decimal del número romano. Obtenga más información sobre la magnitud frente a la intensidad.


Nph
  - Número de fases utilizadas: Cadena
  - Descripción: número de observaciones de tiempo de llegada P y S utilizadas para calcular la ubicación del hipocentro. Un mayor número de observaciones de tiempo de llegada generalmente da como resultado mejores ubicaciones de terremotos.

Nst
  - Tipo de datos: entero
  - Descripción: El número total de estaciones sísmicas utilizadas para determinar la ubicación del terremoto.
  - Información Adicional: Número de estaciones sísmicas que reportaron tiempos de llegada P y S para este sismo. Este número: puede ser mayor que el Número de fases utilizadas si se rechazan los tiempos de llegada porque la distancia a una estación sísmica excede la distancia máxima permitida o porque la observación del tiempo de llegada es inconsistente con la solución.

Place
  - Tipo de datos: Cadena
  - - Descripción: Descripción textual de la región geográfica nombrada cercana al evento. Puede ser el nombre de una ciudad o el nombre de una región

Rms 
  - Tipo de datos: decimal
  - Descripción: El residual de tiempo de viaje de la raíz cuadrada media (RMS), en segundos, usando todos los pesos. Este parámetro proporciona una medida del ajuste de los tiempos de llegada observados a los tiempos de llegada previstos para esta ubicación. Los números más pequeños reflejan un mejor ajuste de los datos. El valor depende de la precisión del modelo de velocidad utilizado para calcular la ubicación del terremoto, los pesos de calidad asignados a los datos de tiempo de llegada y el procedimiento utilizado para localizar el terremoto. 

Sig (para discutir)
  - Tipo de datos: entero
  - Descripción: Un número que describe cuán significativo es el evento. Los números más grandes indican un evento más significativo. Este valor se determina en función de una serie de factores, que incluyen: magnitud, MMI máximo, informes de sensación e impacto estimado.

time
  - Tipo de datos: entero largo
  - Información: Indicamos la fecha y hora en que el sismo inicia la ruptura, lo que se conoce como hora "origen". Tenga en cuenta que los grandes terremotos pueden continuar rompiéndose durante muchas decenas de segundos. Proporcionamos la hora en UTC (Tiempo Universal Coordinado). Los sismólogos usan UTC para evitar la confusión causada por las zonas horarias locales y el horario de verano. En las páginas de eventos individuales, también se proporcionan los tiempos en el epicentro y su hora local en función de la hora configurada en su computadora.


tsunami
  - Tipo de datos: entero
  - Descripción: esta bandera se establece en "1" para grandes eventos en regiones oceánicas y "0" en caso contrario. La existencia o el valor de esta bandera no indica si realmente existió o existirá un tsunami.


Tipy(para discutir)
  - Tipo de datos: Cadena
  - Descripción :Tipo de evento sísmico.

Tz
  - Tipo de datos: entero
  - Descripción: Desplazamiento de zona horaria desde UTC en minutos en el epicentro del evento.

Updated
  - Tipo de datos: entero largo
  - Descripción: hora en que se actualizó el evento por última vez. Los tiempos se informan en milisegundos desde la época

Status
  - Tipo de datos: Cadena
  - Descripción: Indica si el evento ha sido revisado por un humano.

idss
  - Tipo de datos: Cadena
  - Descripción: una lista separada por comas de ID de eventos que están asociados a un evento.


In [25]:
df_sismo.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20000 entries, 0 to 19999
Data columns (total 19 columns):
 #   Column                     Non-Null Count  Dtype         
---  ------                     --------------  -----         
 0   id                         20000 non-null  object        
 1   Magnitud                   20000 non-null  float64       
 2   primer reg                 20000 non-null  datetime64[ns]
 3   Ult reg                    20000 non-null  datetime64[ns]
 4   properties.felt            9863 non-null   float64       
 5   properties.cdi             9863 non-null   float64       
 6   properties.mmi             2764 non-null   float64       
 7   Posivilidad tsunami        20000 non-null  int64         
 8   Importancia del evento     20000 non-null  int64         
 9   properties.net             20000 non-null  object        
 10  properties.code            20000 non-null  object        
 11  properties.ids             20000 non-null  object        
 12  prop

In [26]:
df_sismo.isnull().sum()

id                               0
Magnitud                         0
primer reg                       0
Ult reg                          0
properties.felt              10137
properties.cdi               10137
properties.mmi               17236
Posivilidad tsunami              0
Importancia del evento           0
properties.net                   0
properties.code                  0
properties.ids                   0
properties.nst                5591
Dist Horizontal epicentro      892
Brecha azimutal                 18
estado                         389
Longitud                         0
Latitud                          0
Profundidad                      0
dtype: int64

Voy a renombrar a columna otro a profundidad

In [27]:
df_sismo = df_sismo.rename(columns={'properties.gap': 'gap'})  
df_sismo = df_sismo.rename(columns={'properties.cdi': 'cdi'})
df_sismo = df_sismo.rename(columns={'properties.mmi': 'mmi'}) 
df_sismo = df_sismo.rename(columns={'properties.tsunami': 'tsunami'}) 
df_sismo = df_sismo.rename(columns={'properties.net': 'net'}) 
df_sismo = df_sismo.rename(columns={'properties.code': 'code'}) 
df_sismo = df_sismo.rename(columns={'properties.ids': 'ids'}) 
df_sismo = df_sismo.rename(columns={'properties.nst': 'nst'}) 

Cambio el tipo de dato de Gap_seconds

In [28]:
df_sismo.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 20000 entries, 0 to 19999
Data columns (total 19 columns):
 #   Column                     Non-Null Count  Dtype         
---  ------                     --------------  -----         
 0   id                         20000 non-null  object        
 1   Magnitud                   20000 non-null  float64       
 2   primer reg                 20000 non-null  datetime64[ns]
 3   Ult reg                    20000 non-null  datetime64[ns]
 4   properties.felt            9863 non-null   float64       
 5   cdi                        9863 non-null   float64       
 6   mmi                        2764 non-null   float64       
 7   Posivilidad tsunami        20000 non-null  int64         
 8   Importancia del evento     20000 non-null  int64         
 9   net                        20000 non-null  object        
 10  code                       20000 non-null  object        
 11  ids                        20000 non-null  object        
 12  nst 

In [29]:
folder_path = "../CSV_TRANSFORMADOS"
file_name = "Datos_USA.csv"
file_path = os.path.join(folder_path, file_name)

df_sismo.to_csv(file_path, index=False)