# Equação de Bellman em cenário financeiro:

Como a Equação de Bellman pode ser aplicada em um problema de alocação de recursos financeiros em ações. O objetivo é maximizar o valor final do investimento após um período de 6 meses, considerando três tipos de ações: Ações de Tecnologia, Ações de Energia e Ações de Saúde. O agente (investidor) pode alocar dinheiro em cada tipo de ação a cada mês.

# Configuração Inicial e Parâmetros

Nesta célula, configuramos os parâmetros iniciais do problema, como o dinheiro inicial disponível, o número de escolhas de investimento (ações), o número de meses e o fator de desconto (γγ). Também definimos os retornos médios esperados e os fatores de risco associados a cada tipo de ação.

In [4]:
import numpy as np

# Parâmetros do problema
initial_money = 10000  # Dinheiro inicial
investment_choices = 3  # Número de tipos de ações para investir (Tech, Energy, Health)
months = 6  # Número de meses de investimento
gamma = 0.9  # Fator de desconto

# Retorno médio esperado por ação e risco associado (usados para gerar recompensas)
mean_returns = np.array([0.02, 0.015, 0.01])
risk_factors = np.array([0.03, 0.02, 0.015])


# Funções de Cálculo de Recompensa e Valor dos Estados

Nesta célula, definimos duas funções:

* calculate_reward: Calcula a recompensa esperada com base nas alocações de dinheiro entre as ações e nos retornos médios esperados, levando em consideração o risco.

* calculate_value: Calcula o valor esperado do estado usando a Equação de Bellman. Ela leva em consideração o mês atual e a alocação de recursos. Se o mês atual for o último (6º mês), o valor final é o próprio estado.

In [5]:
# Função para calcular as recompensas com base nas alocações e retornos médios
def calculate_reward(allocation):
    returns = np.sum(mean_returns * allocation)  # Retorno total
    risk = np.sqrt(np.sum((allocation * risk_factors) ** 2))  # Risco total
    return returns - 0.5 * risk  # Recompensa é o retorno menos metade do risco

# Função para calcular o valor esperado do estado usando a Equação de Bellman
def calculate_value(state, month):
    if month == months:
        return state  # Valor final após 6 meses é o próprio estado
    
    max_value = -np.inf
    for allocation in generate_allocations(state, investment_choices):
        reward = calculate_reward(allocation)
        next_state = state - np.sum(allocation)
        value = reward + gamma * calculate_value(next_state, month + 1)
        if value > max_value:
            max_value = value
    
    return max_value


# Função para Gerar Alocações de Recursos

Nesta célula, definimos uma função chamada generate_allocations que gera todas as possíveis alocações de dinheiro entre as ações (Tecnologia, Energia, Saúde) com base no dinheiro disponível e no número de escolhas de investimento. Essa função nos ajudará a explorar todas as combinações possíveis de alocação.

In [6]:
# Função para gerar todas as possíveis alocações de dinheiro entre as ações
def generate_allocations(total_money, num_choices):
    allocations = []
    for i in range(total_money + 1):
        for j in range(total_money + 1 - i):
            k = total_money - i - j
            if i % 1000 == 0 and j % 1000 == 0 and k % 1000 == 0:
                allocations.append(np.array([i, j, k]))
    return allocations


# Cálculo da Alocação Ótima e Resultados

Nesta célula, calculamos a alocação ótima de dinheiro em cada tipo de ação (Tecnologia, Energia, Saúde) a cada mês, de forma a maximizar o valor final após 6 meses usando a Equação de Bellman. Em seguida, exibimos os resultados, incluindo a alocação ótima e o valor final do investimento.

In [8]:
# Calcular a alocação ótima de dinheiro em cada mês usando a Equação de Bellman
optimal_allocation = [0, 0, 0]
max_value = -np.inf

for allocation in generate_allocations(initial_money, investment_choices):
    reward = calculate_reward(allocation)
    next_state = initial_money - np.sum(allocation)
    value = reward + gamma * calculate_value(next_state, 1)
    
    if value > max_value:
        max_value = value
        optimal_allocation = allocation

    # Resultado
    print("Alocação ótima de dinheiro em cada tipo de ação:")
    print("Ações de Tecnologia: $", optimal_allocation[0])
    print("Ações de Energia: $", optimal_allocation[1])
    print("Ações de Saúde: $", optimal_allocation[2])
    print("Valor final após 6 meses: $", max_value)


Alocação ótima de dinheiro em cada tipo de ação:
Ações de Tecnologia: $ 0
Ações de Energia: $ 0
Ações de Saúde: $ 10000
Valor final após 6 meses: $ 25.0
Alocação ótima de dinheiro em cada tipo de ação:
Ações de Tecnologia: $ 0
Ações de Energia: $ 1000
Ações de Saúde: $ 9000
Valor final após 6 meses: $ 36.7632796802191
Alocação ótima de dinheiro em cada tipo de ação:
Ações de Tecnologia: $ 0
Ações de Energia: $ 2000
Ações de Saúde: $ 8000
Valor final após 6 meses: $ 46.754446796632415
Alocação ótima de dinheiro em cada tipo de ação:
Ações de Tecnologia: $ 0
Ações de Energia: $ 3000
Ações de Saúde: $ 7000
Valor final após 6 meses: $ 54.533066887760874
Alocação ótima de dinheiro em cada tipo de ação:
Ações de Tecnologia: $ 0
Ações de Energia: $ 4000
Ações de Saúde: $ 6000
Valor final após 6 meses: $ 59.792027106038525
Alocação ótima de dinheiro em cada tipo de ação:
Ações de Tecnologia: $ 0
Ações de Energia: $ 5000
Ações de Saúde: $ 5000
Valor final após 6 meses: $ 62.5
Alocação ótima de 