In [1]:
import pandas as pd
import numpy as np

# Parâmetros
n_assets = 200
n_days = 15000
start_date = '1980-01-01'

# Gerar datas (dias úteis)
dates = pd.bdate_range(start=start_date, periods=n_days)

# Gerar nomes fictícios para os ativos
tickers = [f'TICKER_{i}' for i in range(n_assets)]

# Gerar retornos aleatórios (distribuição normal)
# Média diária levemente positiva (0.05%) e volatilidade diária de 2%
np.random.seed(42)
returns = np.random.normal(loc=0.0005, scale=0.02, size=(n_days, n_assets))

# Gerar preços a partir dos retornos (Preço inicial = 100)
# P_t = P_{t-1} * (1 + r_t)
price_data = 100 * np.cumprod(1 + returns, axis=0)

# Criar DataFrame
df_large = pd.DataFrame(data=price_data, index=dates, columns=tickers)
df_large.index.name = 'date'

# Mostrar as primeiras linhas e informações sobre o tamanho
print(df_large.head())
print(df_large.shape)



              TICKER_0    TICKER_1    TICKER_2    TICKER_3   TICKER_4  \
date                                                                    
1980-01-01  101.043428   99.773471  101.345377  103.096060  99.581693   
1980-01-02  101.816991  100.942387  103.591294  105.320465  96.887671   
1980-01-03   98.621103   99.782811  103.653954  105.472085  96.063999   
1980-01-04  100.163515   97.992377  105.508543  108.384460  96.906355   
1980-01-07  102.093233   97.030004  105.764129  107.436583  96.112700   

              TICKER_5    TICKER_6    TICKER_7    TICKER_8    TICKER_9  ...  \
date                                                                    ...   
1980-01-01   99.581726  103.208426  101.584869   99.111051  101.135120  ...   
1980-01-02   97.763712  104.323149  102.679519  100.181545  108.978617  ...   
1980-01-03   99.030437  102.147760  102.438470  100.472664  110.154363  ...   
1980-01-04  102.797150  100.618018   99.939679   96.948645  113.505356  ...   
1980-01-07  10

In [2]:
# Salvar em CSV (simulação)
df_large.to_csv('portfolio_allocation.csv')