In [1]:
import numpy as np
import pandas as pd
from sklearn.preprocessing import StandardScaler
import gym
from gym import spaces

In [None]:
# Carregar o dataset de diabetes (simplificado para o exemplo)
data = pd.read_csv('ohiot1dm.csv')
# Suponha que o dataset contenha colunas 'glucose_level' e 'insulin_dose'

In [None]:
# Definir o ambiente de aprendizado por reforço
class DiabetesEnv(gym.Env):
    def __init__(self):
        super(DiabetesEnv, self).__init__()
        # Definir o espaço de ações (dosagem de insulina)
        self.action_space = spaces.Discrete(10)  # 10 doses possíveis
        # Definir o espaço de observação (nível de glicose)
        self.observation_space = spaces.Box(low=0, high=500, shape=(1,), dtype=np.float32)
        self.state = None
        self.current_step = 0
    
    def reset(self):
        # Reiniciar o ambiente
        self.state = np.array([data['glucose_level'][self.current_step]])
        return self.state
    
    def step(self, action):
        # Aplicar a ação (administrar insulina)
        insulin_dose = action * 0.1
        glucose_level = data['glucose_level'][self.current_step]
        
        # Atualizar estado (glicose após insulina)
        next_glucose_level = glucose_level - insulin_dose * 10  # Exemplo simples de efeito
        
        # Calcular a recompensa
        if 80 <= next_glucose_level <= 140:
            reward = 1  # Glicose em nível saudável
        else:
            reward = -1  # Glicose fora da faixa saudável

        self.current_step += 1
        done = self.current_step >= len(data) - 1

        self.state = np.array([next_glucose_level])
        return self.state, reward, done, {}
    
    def render(self):
        pass


In [None]:
# Exemplo de uso do ambiente
env = DiabetesEnv()
state = env.reset()


In [None]:
for _ in range(100):
    action = env.action_space.sample()
    next_state, reward, done, _ = env.step(action)
    if done:
        break