In [37]:
import numpy as np
from collections import defaultdict

# Entorno
class IrrigationEnv:

  def __init__(self, crop, soil):
    self.crop = crop
    self.soil = soil
    self.state = {'soil_moisture': 0.5, 'crop_stage': 1}

  def step(self, action):

    if action == 0: # no regar
      self.state['soil_moisture'] -= 0.05
    elif action == 1: # regar poco
      self.state['soil_moisture'] += 0.1
    else: # regar mucho
      self.state['soil_moisture'] += 0.2

    if self.state['soil_moisture'] < 0.2:
      reward = -10
    elif self.state['soil_moisture'] > 0.9:
      reward = -5
    else:
      reward = 1

    return self.state, reward

# Agente Q-learning
class QAgent:

  def __init__(self, actions):
    self.actions = actions
    self.qtable = defaultdict(lambda: np.zeros(len(self.actions)))
    self.lr = 0.1
    self.gamma = 0.8

  def act(self, state):
    return np.argmax(self.qtable[str(state)])

  def learn(self, state, action, reward, next_state):
    current = self.qtable[str(state)][action]
    optimal = np.max(self.qtable[str(next_state)])
    self.qtable[str(state)][action] = current + self.lr*(reward + self.gamma*optimal - current)

# Parámetros
umedad_bajo = 0.2
umedad_alto = 0.8

# Entrenamiento
env = IrrigationEnv('tomato', 'clay')
agent = QAgent([0, 1, 2])

for i in range(1000):
  state={}
  state['soil_moisture'] = np.random.uniform(0.2, 0.8)

  action = agent.act(state)
  dias_sin_regar = 0

  if action == 0: # no regar
    dias_sin_regar += 1
    if dias_sin_regar > 2:
      reward -= 2

  else:
    dias_sin_regar = 0

  if 0.4 < state['soil_moisture'] < 0.6:
    reward += 1

  if state['soil_moisture'] < 0.3:
    action = 2 # forzar regar mucho

  next_state, reward = env.step(action)
  agent.learn(state, action, reward, next_state)

# Evaluación
for i in range(30):

  state['soil_moisture'] = np.random.uniform(0.08, 0.9)
  print(f"Día {i+1}")
  print(f"Humedad suelo: {state['soil_moisture']}")
  if state['soil_moisture'] < umedad_bajo:
    action = 2
  elif umedad_bajo<state['soil_moisture'] <umedad_alto:

    action = 1
  elif state['soil_moisture'] > umedad_alto:

    action = 0

  else:
    action = agent.act(state)

  if action == 0:
    print("Acción:No regar")
  elif action == 1:
    print("Acción:Regar poco")
  else:
    print("Acción:Regar mucho")

  state = next_state
  next_state, reward = env.step(action)
  print(f"Resultado: {reward}")
  # Resto del código de evaluación

print("Entrenamiento completado!")

Día 1
Humedad suelo: 0.760866109007181
Acción:Regar poco
Resultado: -10
Día 2
Humedad suelo: 0.3119177368878981
Acción:Regar poco
Resultado: 1
Día 3
Humedad suelo: 0.3654872781082072
Acción:Regar poco
Resultado: 1
Día 4
Humedad suelo: 0.5787500892968294
Acción:Regar poco
Resultado: 1
Día 5
Humedad suelo: 0.8086079530591856
Acción:No regar
Resultado: 1
Día 6
Humedad suelo: 0.23588768586816028
Acción:Regar poco
Resultado: 1
Día 7
Humedad suelo: 0.7948184021684056
Acción:Regar poco
Resultado: 1
Día 8
Humedad suelo: 0.794060339279774
Acción:Regar poco
Resultado: 1
Día 9
Humedad suelo: 0.7627782570201772
Acción:Regar poco
Resultado: 1
Día 10
Humedad suelo: 0.3355676890355802
Acción:Regar poco
Resultado: 1
Día 11
Humedad suelo: 0.6047639478887471
Acción:Regar poco
Resultado: 1
Día 12
Humedad suelo: 0.563228679616666
Acción:Regar poco
Resultado: 1
Día 13
Humedad suelo: 0.7733872936644061
Acción:Regar poco
Resultado: 1
Día 14
Humedad suelo: 0.18705168996213256
Acción:Regar mucho
Resultado: 1
D