# **Predicción de magnitud**

 Puedes utilizar una regresión para predecir la magnitud de los terremotos (variable "Mag") basándote en otras características como la profundidad, la ubicación geográfica (latitud y longitud).

In [5]:
import pandas as pd
from sklearn.linear_model import LinearRegression
from sklearn.metrics import mean_squared_error, r2_score

# Cargar los datos desde el archivo CSV
data = pd.read_csv('./data/data.csv')

# Seleccionar características relevantes
features = ['Latitude', 'Longitude', 'Depth']

# Dividir los datos en características (X) y etiquetas (y)
X = data[features]
y = data['Mag']

# Crear un modelo de regresión lineal
model = LinearRegression()

# Entrenar el modelo utilizando los datos completos
model.fit(X, y)

# Realizar predicciones utilizando los datos completos
y_pred = model.predict(X)

# Calcular el error cuadrático medio (MSE)
mse = mean_squared_error(y, y_pred)
print('Error cuadrático medio (MSE):', mse)

# Calcular el coeficiente de determinación (R2)
r2 = r2_score(y, y_pred)
print('Coeficiente de determinación (R2):', r2)

# Función para validar la entrada de datos
def validar_valor(mensaje, valor_min, valor_max):
    while True:
        try:
            valor = float(input(mensaje))
            if valor_min <= valor <= valor_max:
                return valor
            else:
                print(f'Por favor, ingrese un valor entre {valor_min} y {valor_max}.')
        except ValueError:
            print('Por favor, ingrese un valor numérico válido.')

# Solicitar datos de entrada al usuario con validación
latitude, longitude, depth = None, None, None

while latitude is None:
    latitude = validar_valor('Ingrese la latitud (-90 a 90 grados): ', -90, 90)

while longitude is None:
    longitude = validar_valor('Ingrese la longitud (-180 a 180 grados): ', -180, 180)

while depth is None:
    depth = validar_valor('Ingrese la profundidad (0 a 6371 kilómetros): ', 0, 6371)

# Imprimir los valores ingresados por el usuario
print(f'Latitud introducida es: {latitude}')
print(f'Longitud introducida es: {longitude}')
print(f'Profundidad introducida es: {depth}')

# Crear un DataFrame con los datos de entrada
input_data = pd.DataFrame([[latitude, longitude, depth]], columns=features)

# Realizar la predicción
prediction = model.predict(input_data)

# Mostrar la predicción
print(f'Según los valores ingresados, la predicción de la magnitud es: {prediction[0]:.2f}')

Error cuadrático medio (MSE): 0.20646767075673436
Coeficiente de determinación (R2): 0.0023945363077092496
Latitud introducida es: 50.0
Longitud introducida es: 50.0
Profundidad introducida es: 500.0
Según los valores ingresados, la predicción de la magnitud es: 5.98


* **Explicación detallada:**

1. Se importa la biblioteca `pandas` para cargar y manipular los datos, y se importa la clase `LinearRegression` de `sklearn.linear_model` para crear un modelo de regresión lineal.
2. Se carga el archivo `CSV` usando `pd.read_csv` y se asigna a la variable `data`.
3. Se define la lista `features` que contiene las características relevantes para la predicción (`Latitude`, `Longitude`, `Depth`).
4. Se separan las características (`X`) y las etiquetas (`y`) del DataFrame `data`.
5. Se crea una instancia del modelo de regresión lineal utilizando `LinearRegression()`.
6. Se entrena el modelo utilizando los datos completos con `model.fit(X, y)`.
7. Se realizan las predicciones utilizando `model.predict(X)` y se asignan a `y_pred`.
8. Se calcula el error cuadrático medio (`MSE`) utilizando `mean_squared_error(y, y_pred)` y se muestra en pantalla.
9. Se calcula el coeficiente de determinación (`R2`) utilizando `r2_score(y, y_pred)` y se muestra en pantalla.
10. Se solicitan los datos de entrada al usuario (`latitud`, `longitud` y `profundidad`) utilizando `input()` y se convierten a números de punto flotante.
11. Se crea un nuevo DataFrame `input_data` con los datos de entrada.
12. Se realiza la predicción utilizando `model.predict(input_data)` y se asigna a `prediction`.
13. Se muestra la predicción en pantalla.

Este código optimizado carga los datos una sola vez, entrena el modelo y realiza las predicciones con mayor eficiencia. Además, se calcula y muestra tanto el error cuadrático medio (`MSE`) como el coeficiente de determinación (`R2`) para evaluar el rendimiento del modelo.

# **Predicción del tipo de terremoto**

 Puedes desarrollar un modelo de clasificación para predecir el tipo de terremoto (variable "Type") en función de las características como la magnitud, la profundidad, la ubicación geográfica, entre otros. Esto podría ayudar a identificar si un terremoto es de tipo "tectónico", "volcánico" u otro tipo.

In [7]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

# Cargar los datos desde el archivo CSV
data = pd.read_csv('./data/data.csv')

# Seleccionar las características relevantes para la predicción
features = ['Latitude', 'Longitude', 'Depth', 'Mag']

# Dividir los datos en características (X) y etiquetas (y)
X = data[features]
y = data['Type']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalar los datos de entrenamiento y prueba
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Crear un modelo de regresión logística
model = LogisticRegression(max_iter=1000)

# Entrenar el modelo con los datos de entrenamiento escalados
model.fit(X_train_scaled, y_train)

# Realizar predicciones en el conjunto de prueba
y_pred = model.predict(X_test_scaled)

# Calcular la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print('Precisión del modelo:', accuracy)

# Función para validar valores dentro de un rango
def validar_rango(mensaje, valor_min, valor_max):
    while True:
        try:
            valor = float(input(mensaje))
            if valor_min <= valor <= valor_max:
                return valor
            else:
                print(f'Por favor, ingrese un valor entre {valor_min} y {valor_max}.')
        except ValueError:
            print(f'Por favor, ingrese un valor numérico válido entre {valor_min} y {valor_max}.')

# Solicitar datos interactivamente para realizar la predicción con validaciones
input_latitude = validar_rango('Ingrese la latitud (-90 a 90 grados): ', -90, 90)
input_longitude = validar_rango('Ingrese la longitud (-180 a 180 grados): ', -180, 180)
input_depth = validar_rango('Ingrese la profundidad (0 a 6371 kilómetros): ', 0, 6371)
input_mag = validar_rango('Ingrese la magnitud (1 a 10): ', 1, 10)

# Mostrar los valores ingresados correctamente
print(f'Latitud introducida es: {input_latitude}')
print(f'Longitud introducida es: {input_longitude}')
print(f'Profundidad introducida es: {input_depth}')
print(f'Magnitud introducida es: {input_mag}')

# Crear un diccionario con los datos de entrada
input_data = {
    'Latitude': [input_latitude],
    'Longitude': [input_longitude],
    'Depth': [input_depth],
    'Mag': [input_mag]
}

# Escalar los datos de entrada
input_data_scaled = scaler.transform(pd.DataFrame(input_data))

# Realizar la predicción utilizando el modelo
prediction = model.predict(input_data_scaled)

# Mostrar la predicción
print('La predicción del tipo de terremoto es:', prediction[0])

Precisión del modelo: 0.994964886709951
Latitud introducida es: 50.0
Longitud introducida es: 50.0
Profundidad introducida es: 500.0
Magnitud introducida es: 5.5
La predicción del tipo de terremoto es: earthquake


* **Explicación detallada:**

1. Se importa la biblioteca `pandas` para cargar y manipular los datos, y se importan las clases `train_test_split`, `LogisticRegression`, `StandardScaler` y `accuracy_score` de sus respectivas bibliotecas de `sklearn`.
2. Se carga el archivo `CSV` utilizando `pd.read_csv` y se asigna a la variable `data`.
3. Se seleccionan las características relevantes para la predicción y se asignan a la lista `features`.
4. Se dividen los datos en características (`X`) y etiquetas (`y`) utilizando `data[features]` y `data['Type']`, respectivamente.
5. Se dividen los datos en conjuntos de entrenamiento y prueba utilizando `train_test_split`.
6. Se escalan los datos de entrenamiento y prueba utilizando `StandardScaler` para asegurar que todas las características tengan la misma escala.
7. Se crea una instancia del modelo de regresión logística utilizando `LogisticRegression` y se establece un límite máximo de iteraciones.
8. Se entrena el modelo utilizando los datos de entrenamiento escalados con `model.fit`.
9. Se realizan predicciones en el conjunto de prueba utilizando `model.predict`.
10. Se calcula la precisión del modelo comparando las etiquetas reales del conjunto de prueba con las etiquetas predichas utilizando `accuracy_score` y se muestra en pantalla.
11. Se solicitan datos interactivamente al usuario para realizar la predicción.
12. Se crea un diccionario con los datos de entrada proporcionados por el usuario.
13. Se escalan los datos de entrada utilizando el mismo `StandardScaler` utilizado en los datos de entrenamiento y prueba.
14. Se realiza la predicción utilizando el modelo entrenado y los datos de entrada escalados.
15. Se muestra la predicción en pantalla.

Este código optimizado y detallado divide los datos en conjuntos de entrenamiento y prueba, escala los datos correctamente y calcula la precisión del modelo. Además, solicita los datos de entrada de forma interactiva y realiza la predicción correspondiente.

# **Predicción de Country**

In [9]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

# Cargar los datos desde el archivo CSV
data = pd.read_csv('./data/data.csv')

# Seleccionar las características relevantes para la predicción
features = ['Latitude', 'Longitude', 'Depth', 'Mag']

# Dividir los datos en características (X) y etiquetas (y)
X = data[features]
y = data['Country']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalar los datos de entrenamiento y prueba
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Crear un modelo de regresión logística
model = LogisticRegression(max_iter=1000)

# Entrenar el modelo con los datos de entrenamiento escalados
model.fit(X_train_scaled, y_train)

# Realizar predicciones en el conjunto de prueba
y_pred = model.predict(X_test_scaled)

# Calcular la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print('Precisión del modelo:', accuracy)

# Función para validar valores dentro de un rango
def validar_rango(mensaje, valor_min, valor_max):
    while True:
        try:
            valor = float(input(mensaje))
            if valor_min <= valor <= valor_max:
                return valor
            else:
                print(f'Por favor, ingrese un valor entre {valor_min} y {valor_max}.')
        except ValueError:
            print('Por favor, ingrese un valor numérico válido.')

# Solicitar datos interactivamente para realizar la predicción con validaciones
input_latitude = validar_rango('Ingrese la latitud (-90 a 90 grados): ', -90, 90)
input_longitude = validar_rango('Ingrese la longitud (-180 a 180 grados): ', -180, 180)
input_depth = validar_rango('Ingrese la profundidad (0 a 6371 kilómetros): ', 0, 6371)
input_mag = validar_rango('Ingrese la magnitud (1 a 10): ', 1, 10)

# Mostrar los valores ingresados correctamente
print(f'Latitud introducida es: {input_latitude}')
print(f'Longitud introducida es: {input_longitude}')
print(f'Profundidad introducida es: {input_depth}')
print(f'Magnitud introducida es: {input_mag}')

# Crear un DataFrame con los datos de entrada
input_data = pd.DataFrame({
    'Latitude': [input_latitude],
    'Longitude': [input_longitude],
    'Depth': [input_depth],
    'Mag': [input_mag]
})

# Escalar los datos de entrada utilizando el mismo escalador
input_data_scaled = scaler.transform(input_data)

# Realizar la predicción utilizando el modelo
prediction = model.predict(input_data_scaled)

# Mostrar la predicción
print('La predicción del país es:', prediction[0])

Precisión del modelo: 0.5725453822711011
Latitud introducida es: 50.0
Longitud introducida es: 50.0
Profundidad introducida es: 500.0
Magnitud introducida es: 5.5
La predicción del país es: Alaska


# **Predicción de Subtype**

In [10]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score

# Cargar los datos desde el archivo CSV
data = pd.read_csv('./data/data.csv')

# Seleccionar las características relevantes para la predicción
features = ['Latitude', 'Longitude', 'Depth', 'Mag']

# Dividir los datos en características (X) y etiquetas (y)
X = data[features]
y = data['Subtype']

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Escalar los datos de entrenamiento y prueba
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

# Crear un modelo de regresión logística
model = LogisticRegression(max_iter=1000)

# Entrenar el modelo con los datos de entrenamiento escalados
model.fit(X_train_scaled, y_train)

# Realizar predicciones en el conjunto de prueba
y_pred = model.predict(X_test_scaled)

# Calcular la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print('Precisión del modelo:', accuracy)

# Función para validar la entrada de datos
def validar_valor(mensaje, valor_min, valor_max):
    while True:
        try:
            valor = float(input(mensaje))
            if valor_min <= valor <= valor_max:
                return valor
            else:
                print(f'Por favor, ingrese un valor entre {valor_min} y {valor_max}.')
        except ValueError:
            print('Por favor, ingrese un valor numérico válido.')

# Solicitar datos de entrada al usuario con validación
latitude = validar_valor('Ingrese la latitud (-90 a 90 grados): ', -90, 90)
longitude = validar_valor('Ingrese la longitud (-180 a 180 grados): ', -180, 180)
depth = validar_valor('Ingrese la profundidad (0 a 6371 kilómetros): ', 0, 6371)
magnitude = validar_valor('Ingrese la magnitud (1 a 10): ', 1, 10)

# Mostrar los valores ingresados correctamente
print(f'Latitud introducida es: {input_latitude}')
print(f'Longitud introducida es: {input_longitude}')
print(f'Profundidad introducida es: {input_depth}')
print(f'Magnitud introducida es: {input_mag}')

# Crear un DataFrame con los datos de entrada
input_data = pd.DataFrame({
    'Latitude': [latitude],
    'Longitude': [longitude],
    'Depth': [depth],
    'Mag': [magnitude]
})

# Escalar los datos de entrada utilizando el mismo escalador
input_data_scaled = scaler.transform(input_data)

# Realizar la predicción utilizando el modelo
prediction = model.predict(input_data_scaled)

# Mostrar la predicción
print('La predicción del Subtype es:', prediction[0])

Precisión del modelo: 0.9941698688220485
Latitud introducida es: 50.0
Longitud introducida es: 50.0
Profundidad introducida es: 500.0
Magnitud introducida es: 5.5
La predicción del Subtype es: Ground movement


* **Explicación paso a paso:**

1. Se cargan los datos desde el archivo `CSV` utilizando `pd.read_csv()` y se asignan a la variable data.

2. Se definen las características relevantes para la predicción en la lista features, que en este caso son '`Latitude`', '`Longitude`', '`Depth`' y '`Mag`'.

3. Se divide el conjunto de datos en características (`X`) y etiquetas (`y`) utilizando `data[features]` para `X` y `data['Subtype']` para `y`.

4. Se divide el conjunto de datos en conjuntos de entrenamiento y prueba utilizando `train_test_split()`. Aquí se reserva el 20% de los datos para pruebas y se utiliza un estado aleatorio de 42 para garantizar la reproducibilidad de los resultados.

5. Se escala los datos de entrenamiento y prueba utilizando `StandardScaler()` para asegurar que todas las características tengan la misma escala y evitar sesgos en el modelo.

6. Se crea un modelo de regresión logística utilizando `LogisticRegression()` con `max_iter=1000` para permitir un mayor número de iteraciones en el ajuste del modelo.

7. Se entrena el modelo utilizando los datos de entrenamiento escalados utilizando el método `fit()`.

8. Se realizan predicciones en el conjunto de prueba utilizando el método `predict()`.

9. Se calcula la precisión del modelo comparando las etiquetas predichas con las etiquetas reales utilizando `accuracy_score()`.

10. Se solicitan los datos interactivamente para realizar la predicción utilizando la función `input()`. Cada dato se convierte a float para asegurar que se pueda procesar correctamente.

11. Se crea un DataFrame `input_data` con los datos de entrada.

12. Se escala los datos de entrada utilizando el mismo escalador `scaler.transform()` para garantizar que se aplique la misma escala que se utilizó para los datos de entrenamiento.

13. Se realiza la predicción utilizando el modelo entrenado y los datos de entrada escalados utilizando `model.predict()`.

14. Se muestra la predicción resultante.