In [1]:
import pandas as pd 
import yfinance as yf
from datetime import datetime, timedelta


In [2]:
SP500_Url = "https://en.wikipedia.org/wiki/Nasdaq-100"
data_table = pd.read_html(
    SP500_Url,
    storage_options={"User-Agent": "Mozilla/5.0 (X11; Linux x86_64) AppleWebKit/537.36 "
                                   "(KHTML, like Gecko) Chrome/123.0 Safari/537.36"}
)
data_table

[                                     0                                      1
 0   Nasdaq-100 Index from 1985 to 2015     Nasdaq-100 Index from 1985 to 2015
 1                           Foundation         January 31, 1985; 40 years ago
 2                             Operator                           Nasdaq, Inc.
 3                            Exchanges                                 Nasdaq
 4                       Trading symbol                            ^NDX or NDX
 5                         Constituents                                    101
 6                                 Type                              Large-cap
 7                           Market cap  US$25.34 trillion (as of May 1, 2025)
 8                     Weighting method     Free-float capitalization-weighted
 9                      Related indices                   Nasdaq Financial-100
 10                             Website                  nasdaq.com/nasdaq-100,
    Category  All-Time Highs[8]         All-Time Hi

In [3]:
tickers = data_table[4]["Ticker"].tolist()

In [4]:
supp = ['ASML', 'AZN', 'F', 'G', 'GOOGL', 'H', 'I', 'J', 'L', 'O', 'Q', 'R', 'U', 'VRSK', 'W', 'Y']

tickers = [x for x in tickers if x not in supp]
print(len(tickers), len(supp))

97 16


In [5]:
# Extraction des données
Date = data_table[5]['Date']
Removed = data_table[5]['Removed']['Ticker']  # Supposant que 'Removed' est un DataFrame ou Series
Added = data_table[5]['Added']['Ticker']      # Supposant que 'Added' est un DataFrame ou Series

# Combinaison des données dans un DataFrame
Data_Change = pd.concat([Date, Added, Removed], axis = 1)

#Date au format Date
Data_Change['Date'] = pd.to_datetime(Data_Change['Date'])

# Changer le format de la date en 'jour/mois/année'
Data_Change['Date'] = Data_Change['Date'].dt.strftime('%Y-%m-%d')


# Renommer toutes les colonnes
Data_Change.columns = ['Date', 'Added', 'Removed']

# Mettre 'colonne_a' en tant qu'index
Data_Change.set_index('Date', inplace=True)

# Nan en vide
Data_Change = Data_Change.fillna('')

Data_Change

Unnamed: 0_level_0,Added,Removed
Date,Unnamed: 1_level_1,Unnamed: 2_level_1
2025-07-28,TRI,
2025-07-17,,ANSS
2025-05-19,SHOP,MDB
2024-12-23,PLTR,ILMN
2024-12-23,MSTR,MRNA
...,...,...
2007-07-12,FWLT,BMET
2007-06-01,CEPH,MEDI
2007-03-08,UAUA,AEOS
2007-02-14,RYAAY,APCC


In [6]:
len(tickers)

97

In [7]:
# Supposons que la liste tickers ait déjà 503 éléments au départ
# tickers = ['AAPL', 'MSFT', ...]  # Exemples de tickers initiaux

# Initialiser un dictionnaire vide
dict = {}

# Boucle pour parcourir les données et mettre à jour le dictionnaire
for i in range(0, len(Data_Change)):
    
    # Ajouter les nouveaux tickers (si ce n'est pas déjà un ensemble vide)
    tickers.extend(Data_Change.Added[i])
    
    # Essayer de supprimer les tickers retirés, si possible
    try:
        tickers = [t for t in tickers if t not in Data_Change.Removed[i]]  # Supprimer les tickers retirés
    except ValueError:
        # Si l'élément à supprimer n'existe pas dans la liste, continuer sans erreur
        pass
    
    # Trier les tickers
    tickers = sorted(set(tickers))  # Utilisation de set pour éviter les doublons

    # Ajouter une **copie** de la liste `tickers` dans le dictionnaire
    dict[Data_Change.index[i]] = tickers.copy()

df = pd.DataFrame(list(dict.items()), columns=['date', 'tickers'])

df['date'] = pd.to_datetime(df['date'])

# Mettre la colonne 'date' comme index
df.set_index('date', inplace=True)

df

  tickers.extend(Data_Change.Added[i])
  tickers = [t for t in tickers if t not in Data_Change.Removed[i]]  # Supprimer les tickers retirés


Unnamed: 0_level_0,tickers
date,Unnamed: 1_level_1
2025-07-28,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."
2025-07-17,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."
2025-05-19,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."
2024-12-23,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA..."
2024-11-18,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA..."
...,...
2007-07-12,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA..."
2007-06-01,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA..."
2007-03-08,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."
2007-02-14,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."


In [8]:
# Récupère l'index en liste
new_index = list(df.index)

# Remplace la première valeur
new_index[0] = datetime.today().date()

# Réapplique l'index modifié
df.index = pd.to_datetime(new_index)

In [9]:
df

Unnamed: 0,tickers
2025-10-07,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."
2025-07-17,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."
2025-05-19,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."
2024-12-23,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA..."
2024-11-18,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA..."
...,...
2007-07-12,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA..."
2007-06-01,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA..."
2007-03-08,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."
2007-02-14,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ..."


In [10]:

data_SP500_old = pd.read_parquet('/Users/forget/Library/Mobile Documents/com~apple~CloudDocs/Project Stock Market Deep Learning/Data/data_NASDAQ.parquet')
last_date = data_SP500_old['Date'].sort_values(ascending=True).iloc[-1] + timedelta(days=1)
last_date


Timestamp('2025-10-04 00:00:00')

In [11]:

df['Last_Date'] = last_date
df

Unnamed: 0,tickers,Last_Date
2025-10-07,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ...",2025-10-04
2025-07-17,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ...",2025-10-04
2025-05-19,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ...",2025-10-04
2024-12-23,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA...",2025-10-04
2024-11-18,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA...",2025-10-04
...,...,...
2007-07-12,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA...",2025-10-04
2007-06-01,"[A, AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMA...",2025-10-04
2007-03-08,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ...",2025-10-04
2007-02-14,"[AAPL, ABNB, ADBE, ADI, ADP, ADSK, AEP, AMAT, ...",2025-10-04


In [12]:

# Initialiser une DataFrame vide pour stocker toutes les données
data_SP500 = pd.DataFrame()

df = df.explode('tickers')
end_date = df[df.index > last_date].groupby('tickers').apply(lambda x: x.index.max())

# Combiner les résultats dans une nouvelle DataFrame
resultat = pd.DataFrame({'Start': last_date, 'End': end_date})
resultat


  end_date = df[df.index > last_date].groupby('tickers').apply(lambda x: x.index.max())


Unnamed: 0_level_0,Start,End
tickers,Unnamed: 1_level_1,Unnamed: 2_level_1
AAPL,2025-10-04,2025-10-07
ABNB,2025-10-04,2025-10-07
ADBE,2025-10-04,2025-10-07
ADI,2025-10-04,2025-10-07
ADP,2025-10-04,2025-10-07
...,...,...
VRTX,2025-10-04,2025-10-07
WBD,2025-10-04,2025-10-07
WDAY,2025-10-04,2025-10-07
XEL,2025-10-04,2025-10-07


In [13]:
"""
# Initialiser une DataFrame vide pour stocker toutes les données
data_SP500 = pd.DataFrame()

df = df.explode('tickers')
start_date = df.groupby('tickers').apply(lambda x: x.index.min())
end_date = df.groupby('tickers').apply(lambda x: x.index.max())

# Combiner les résultats dans une nouvelle DataFrame
resultat = pd.DataFrame({'Start': start_date, 'End': end_date})
resultat
"""

"\n# Initialiser une DataFrame vide pour stocker toutes les données\ndata_SP500 = pd.DataFrame()\n\ndf = df.explode('tickers')\nstart_date = df.groupby('tickers').apply(lambda x: x.index.min())\nend_date = df.groupby('tickers').apply(lambda x: x.index.max())\n\n# Combiner les résultats dans une nouvelle DataFrame\nresultat = pd.DataFrame({'Start': start_date, 'End': end_date})\nresultat\n"

In [14]:
# Télécharger les données pour chaque ticker
for ticker in resultat.index:
    start_date = resultat.loc[ticker, 'Start']
    end_date = resultat.loc[ticker, 'End']

    print(f"Téléchargement des données pour {ticker} de {start_date} à {end_date}")

    # Télécharger les données de l'action entre les dates spécifiées
    data = yf.download(
                        ticker,
                        start=start_date,
                        end=end_date,
                        interval="1d",
                        auto_adjust=True,
                        actions=False
                        )

    # Ajouter une colonne pour identifier le ticker
    data['Ticker'] = ticker

    # On retire le niveau des tickers pour ne garder que 'Close' et 'Volume'
    data.columns = data.columns.droplevel(level=1)
    
    # Concaténer les données dans la DataFrame globale
    data_SP500 = pd.concat([data_SP500, data])

# Affichage de la DataFrame résultante
data_SP500

Téléchargement des données pour AAPL de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour ABNB de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour ADBE de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour ADI de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour ADP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour ADSK de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour AEP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour AMAT de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour AMD de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour AMGN de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour AMZN de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour APP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour ARM de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour AVGO de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour AXON de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour BIIB de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour BKNG de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour BKR de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour CCEP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour CDNS de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour CDW de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour CEG de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour CHTR de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour CMCSA de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour COST de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour CPRT de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour CRWD de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour CSCO de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour CSGP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour CSX de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour CTAS de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour CTSH de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour DASH de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour DDOG de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour DXCM de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour EA de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour EXC de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour FANG de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour FAST de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour FTNT de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour GEHC de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour GFS de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour GILD de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour GOOG de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour HON de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour I de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed

1 Failed download:
['I']: YFTzMissingError('possibly delisted; no timezone found')
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour IDXX de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour INTC de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour INTU de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour ISRG de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour KDP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour KHC de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour KLAC de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour LIN de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour LRCX de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour LULU de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour MAR de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour MCHP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour MDLZ de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour MELI de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour META de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour MNST de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour MRVL de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour MSFT de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour MSTR de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour MU de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour NFLX de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour NVDA de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour NXPI de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour ODFL de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour ON de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour ORLY de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour PANW de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour PAYX de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour PCAR de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour PDD de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour PEP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour PLTR de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour PYPL de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour QCOM de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour R de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour REGN de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour ROP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour ROST de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour SBUX de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour SHOP de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour SNPS de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour T de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour TEAM de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour TMUS de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour TRI de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour TSLA de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour TTD de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour TTWO de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour TXN de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed

Téléchargement des données pour VRTX de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour WBD de 2025-10-04 00:00:00 à 2025-10-07 00:00:00



[*********************100%***********************]  1 of 1 completed


Téléchargement des données pour WDAY de 2025-10-04 00:00:00 à 2025-10-07 00:00:00
Téléchargement des données pour XEL de 2025-10-04 00:00:00 à 2025-10-07 00:00:00


[*********************100%***********************]  1 of 1 completed
[*********************100%***********************]  1 of 1 completed

Téléchargement des données pour ZS de 2025-10-04 00:00:00 à 2025-10-07 00:00:00





Price,Close,High,Low,Open,Volume,Ticker,Adj Close
Date,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
2025-10-06,256.690002,259.070007,255.050003,257.989990,44292200.0,AAPL,
2025-10-06,120.349998,123.150002,120.050003,120.730003,5469000.0,ABNB,
2025-10-06,350.140015,357.339996,342.040009,346.929993,5326600.0,ADBE,
2025-10-06,242.500000,245.009995,238.919998,245.009995,3863100.0,ADI,
2025-10-06,290.549988,291.950012,288.489990,291.500000,1703700.0,ADP,
...,...,...,...,...,...,...,...
2025-10-06,402.899994,405.450012,400.739990,404.660004,1191100.0,VRTX,
2025-10-06,19.080000,19.180000,18.879999,19.030001,17518400.0,WBD,
2025-10-06,238.360001,243.949997,234.690002,235.660004,2253000.0,WDAY,
2025-10-06,81.000000,81.279999,79.889999,80.410004,4082600.0,XEL,


In [15]:
data_SP500 = data_SP500.reset_index()
data_SP500

Price,Date,Close,High,Low,Open,Volume,Ticker,Adj Close
0,2025-10-06,256.690002,259.070007,255.050003,257.989990,44292200.0,AAPL,
1,2025-10-06,120.349998,123.150002,120.050003,120.730003,5469000.0,ABNB,
2,2025-10-06,350.140015,357.339996,342.040009,346.929993,5326600.0,ADBE,
3,2025-10-06,242.500000,245.009995,238.919998,245.009995,3863100.0,ADI,
4,2025-10-06,290.549988,291.950012,288.489990,291.500000,1703700.0,ADP,
...,...,...,...,...,...,...,...,...
94,2025-10-06,402.899994,405.450012,400.739990,404.660004,1191100.0,VRTX,
95,2025-10-06,19.080000,19.180000,18.879999,19.030001,17518400.0,WBD,
96,2025-10-06,238.360001,243.949997,234.690002,235.660004,2253000.0,WDAY,
97,2025-10-06,81.000000,81.279999,79.889999,80.410004,4082600.0,XEL,


In [16]:
df_concat = pd.concat([data_SP500, data_SP500_old])
df_concat

Price,Date,Close,High,Low,Open,Volume,Ticker,Adj Close
0,2025-10-06,256.690002,259.070007,255.050003,257.989990,44292200.0,AAPL,
1,2025-10-06,120.349998,123.150002,120.050003,120.730003,5469000.0,ABNB,
2,2025-10-06,350.140015,357.339996,342.040009,346.929993,5326600.0,ADBE,
3,2025-10-06,242.500000,245.009995,238.919998,245.009995,3863100.0,ADI,
4,2025-10-06,290.549988,291.950012,288.489990,291.500000,1703700.0,ADP,
...,...,...,...,...,...,...,...,...
200,2025-10-03,187.619995,190.360001,185.380005,189.190002,137340500.0,NVDA,
98,2025-10-03,271.220001,272.440002,268.140015,270.000000,2417200.0,DASH,
197,2025-10-03,1153.319946,1168.000000,1143.219971,1165.000000,3133100.0,NFLX,
59,2025-10-03,347.269989,353.149994,345.000000,347.239990,1056300.0,CDNS,


In [17]:
df_concat.sort_values(by=['Date'], ascending=True, inplace=True)
df_concat.tail(50)

Price,Date,Close,High,Low,Open,Volume,Ticker,Adj Close
49,2025-10-06,25.299999,25.83,25.190001,25.799999,23702900.0,KDP,
51,2025-10-06,1139.709961,1152.119995,1121.680054,1121.680054,946000.0,KLAC,
77,2025-10-06,71.290001,71.870003,69.452003,70.220001,16586300.0,PYPL,
78,2025-10-06,168.619995,170.880005,167.720001,170.539993,8262100.0,QCOM,
79,2025-10-06,194.220001,195.479996,189.960007,192.919998,297300.0,R,
80,2025-10-06,585.47998,603.650024,584.409973,602.0,1071900.0,REGN,
81,2025-10-06,506.98999,507.359985,497.119995,501.899994,1210200.0,ROP,
82,2025-10-06,152.259995,153.460007,151.199997,152.240005,2669700.0,ROST,
83,2025-10-06,82.110001,86.290001,82.059998,86.290001,14978700.0,SBUX,
84,2025-10-06,164.5,169.690002,162.809998,166.550003,11311800.0,SHOP,


In [18]:
df_concat['Date'].max()

Timestamp('2025-10-06 00:00:00')

In [19]:
# Sauvegarder la DataFrame résultante dans un fichier CSV
#data_SP500.to_csv('/Users/forget/PyCharmMiscProject/historical_data_S&P500_From_Wiki.csv')

In [20]:
"""
mask_1 = data_SP500[(data_SP500['Ticker'] == 'NVR') & (data_SP500['Date'] < '1993-10-01')]
mask_2 = data_SP500[(data_SP500['Ticker'] == 'HUBB') & (data_SP500['Date'] < '1994-10-31')]
mask_3 = data_SP500[(data_SP500['Date'] == '1984-12-31') & (data_SP500['Ticker'] == 'BEN')]
"""

"\nmask_1 = data_SP500[(data_SP500['Ticker'] == 'NVR') & (data_SP500['Date'] < '1993-10-01')]\nmask_2 = data_SP500[(data_SP500['Ticker'] == 'HUBB') & (data_SP500['Date'] < '1994-10-31')]\nmask_3 = data_SP500[(data_SP500['Date'] == '1984-12-31') & (data_SP500['Ticker'] == 'BEN')]\n"

In [21]:
"""
idx_to_drop = mask_1.index.union(mask_2.index).union(mask_3.index)
data_SP500 = data_SP500.drop(index=idx_to_drop).copy()
"""

'\nidx_to_drop = mask_1.index.union(mask_2.index).union(mask_3.index)\ndata_SP500 = data_SP500.drop(index=idx_to_drop).copy()\n'

In [22]:
df_concat.to_parquet("/Users/forget/Library/Mobile Documents/com~apple~CloudDocs/Project Stock Market Deep Learning/Data/data_NASDAQ.parquet")