In [3]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.metrics import accuracy_score

# Cargar los datos
dat_csv = pd.read_csv('Clima-rg-Año.csv', encoding="ISO-8859-1", delimiter=";")


# Reemplazar las comas por puntos en la columna 'Lluvia total'
dat_csv['Lluvia total'] = dat_csv['Lluvia total'].replace({',': '.'}, regex=True)

# Asegurarse de que 'Lluvia total' es de tipo numérico
dat_csv['Lluvia total'] = pd.to_numeric(dat_csv['Lluvia total'], errors='coerce')


# Calcular la media de lluvia total
media_lluvia = dat_csv['Lluvia total'].mean()

# Crear una nueva columna 'Lluvia mayor que la media' para la clasificación
dat_csv['Lluvia mayor que la media'] = np.where(dat_csv['Lluvia total'] > media_lluvia, 1, 0)

# Seleccionar las características (X) y la variable objetivo (y)
X = dat_csv[['año']]  # Usamos 'Año' como característica
y = dat_csv['Lluvia mayor que la media']  # La variable objetivo es si hay más lluvia que la media

# Dividir los datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Crear y entrenar el modelo SVM
model = SVC(kernel='linear', random_state=42)  # Usamos un kernel lineal
model.fit(X_train, y_train)

# Realizar predicciones
y_pred = model.predict(X_test)

# Calcular la precisión del modelo
accuracy = accuracy_score(y_test, y_pred)
print(f"Precisión del modelo: {accuracy}")

# Ejemplo de predicción para el próximo año (suponiendo que sea 2025)
nueva_fila = pd.DataFrame([[2025]], columns=['año'])  # Predecir para el año 2025
prediccion = model.predict(nueva_fila)
print(f"Predicción de lluvia para el año 2025: {'Más lluvia que la media' if prediccion[0] == 1 else 'Menos lluvia que la media'}")


Precisión del modelo: 0.6666666666666666
Predicción de lluvia para el año 2025: Menos lluvia que la media
