In [34]:
import pandas as pd
import re

df_nat = pd.read_csv("resultados_tarifas_naturgy.csv")
df_octopus = pd.read_csv("resultados_tarifas_octopus.csv")
df_repsol = pd.read_csv("resultados_tarifas_repsol_unificado.csv")
df_xenera = pd.read_csv("resultados_tarifas_xenera_unificado.csv")

# Potencia
#P1 Periodo Punta 
#P2 Periodo Llano
#P3 Periodo Valle


# Limpiamos nombres en Octopus
df_octopus.columns = ['Tarifa', 'Descripción', 'Punta', 'Llano','Valle', 'P1', 'P3','Excedentes']
df_octopus['Empresa'] = "Octopus"
df_octopus.at[0, 'Llano'] = df_octopus.at[0, 'Punta']
df_octopus.at[0, 'Valle'] = df_octopus.at[0, 'Punta']

# Limpiamos nombres en Repsol y añadimos columnas faltantes
df_repsol.columns = ['Tarifa', 'Descripción', 'Punta', 'P1','P3']
df_repsol['Llano'] = df_repsol['Punta']
df_repsol['Valle'] = df_repsol['Punta']
df_repsol['Valle'][2] = 0.086415 # Durante 10 horas al día que se elijan.
df_repsol['Empresa'] = "Repsol"

#Limpiamos nombres en Xenera
df_xenera.columns = ['Valle', 'Llano', 'Punta', 'P1','Coste de gestión']
df_xenera['Llano'] = df_xenera['Llano'].fillna(df_xenera['Valle'])
df_xenera['Punta'] = df_xenera['Punta'].fillna(df_xenera['Valle'])
df_xenera['P1'] = 0.070357
df_xenera['P3'] = df_xenera['P1']
df_xenera['Tarifa'] = ["Home contigo","En casa","A vaquiña fija","Home contigo única"]
df_xenera['Empresa'] = "Xenera"

# Limpiamos nombres en Naturgy
df_naturgy = df_nat.transpose().reset_index()

df_naturgy.columns = ['Tarifa','Descripción', 'A', 'B','Punta','P1','C','D']
df_naturgy = df_naturgy.drop(columns=['A', 'B','C','D']).drop(1)
df_naturgy['Empresa'] = "Naturgy"
df_naturgy['P3'] = df_naturgy['P1']
df_naturgy['Llano'] = df_naturgy['Punta']
df_naturgy['Valle'] = df_naturgy['Punta']

# Corregimos las potencias

valor_punta_pot = df_naturgy['P1'].str.extract(r'Punta: ([\d,]+)')
valor_valle_pot = df_naturgy['P3'].str.extract(r'Valle: ([\d,]+)')
df_naturgy['P1'] = valor_punta_pot
df_naturgy['P3'] = valor_valle_pot
# Corregimos la fila 0

valor_inicial = re.search(r'([\d,]+)', df_naturgy.loc[0, 'Punta']).group(1)

# Asigna este valor a las columnas 'Punta', 'Llano' y 'Valle' en la fila 0
df_naturgy.at[0, 'Punta'] = valor_inicial if valor_inicial else None
df_naturgy.at[0, 'Llano'] = valor_inicial if valor_inicial else None
df_naturgy.at[0, 'Valle'] = valor_inicial if valor_inicial else None

# Corregimos la fila 1
fila_1 = df_naturgy.loc[2, 'Punta']
valor_punta = re.search(r'Punta: ([\d,]+€/kWh)', fila_1)
valor_llano = re.search(r'Llano: ([\d,]+€/kWh)', fila_1)
valor_valle = re.search(r'Valle: ([\d,]+€/kWh)', fila_1)
df_naturgy.at[2, 'Punta'] = valor_punta.group(1) if valor_punta else None
df_naturgy.at[2, 'Llano'] = valor_llano.group(1) if valor_llano else None
df_naturgy.at[2, 'Valle'] = valor_valle.group(1) if valor_valle else None

#Unimos todos los datos en una misma dataframe

df_companias = pd.concat([df_naturgy,df_octopus,df_repsol,df_xenera], ignore_index=True)

# Reordenamos las columnas
orden = ['Empresa', 'Tarifa', 'Descripción', 'Punta', 'Llano',
       'Valle', 'P1', 'P3', 'Excedentes', 'Coste de gestión']
df_companias=df_companias[orden]

def convertir_unidades(celda):
    if isinstance(celda, str) and '€/kWh' in celda:
        return float(celda.replace('€/kWh', '').replace(',', '.'))
    elif isinstance(celda, str) and '€/kW/día' in celda:
        return float(celda.replace('€/kW/día', '').replace(',', '.'))
    elif isinstance(celda, str) and '€ / mes' in celda:
        return float(celda.replace('€ / mes', '').replace(',', '.'))
    elif isinstance(celda, str) and ',' in celda:
        try:
            return float(celda.replace(',', '.'))
        except:
            pass
    return celda

    

# Aplica la función a todo el DataFrame
df_companias = df_companias.applymap(convertir_unidades)

# Verifica los cambios
df_companias

#octopus = {
#    "nombre": "Octopus",
#    "punta": 0.1780, #€/kWh
#    "llano": 0.1300, #€/kWh
#    "valle": 0.0810, #€/kWh
#    "P1": 0.089, #€/kW/día
#    "P2": 0.026, #€/kW/día
#    "excedente": 0.05, #€/kWh
#    "batería": 0
#}

# Una vez limpitos, los metemos en un único data frame y lo guardamos en un csv
df = pd.DataFrame(df_companias)
df.to_csv("tarifas.csv", index=False)

A value is trying to be set on a copy of a slice from a DataFrame

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  df_repsol['Valle'][2] = 0.086415 # Durante 10 horas al día que se elijan.
