In [9]:
import yfinance as yf
import requests
import pandas as pd
from datetime import datetime

# Liste des actifs à suivre (cryptos et actions)
assets = ['BTC-USD', 'ETH-USD', 'AAPL', 'GOOG', 'MSFT']

# Fonction pour récupérer les données depuis Yahoo Finance
def get_yahoo_data(asset):
    stock = yf.Ticker(asset)
    hist = stock.history(period="1d")
    info = stock.info
    
    data = {
        'Date': datetime.today().strftime('%Y-%m-%d'),
        'Actif': asset,
        'Type': 'Crypto' if 'USD' in asset else 'Stock',
        'Prix actuel': hist['Close'].iloc[0],
        'Variation journalière (%)': hist['Close'].pct_change().iloc[-1] * 100,
        'Volume de transactions': hist['Volume'].iloc[0],
        'Market Capitalization': info.get('marketCap', '-'),
        'P/E Ratio': info.get('trailingPE', '-'),
        'EPS': info.get('trailingEps', '-'),
        'Dividend Yield': info.get('dividendYield', '-'),
        'ROE': info.get('returnOnEquity', '-'),
        'ROA': info.get('returnOnAssets', '-'),
        'Beta': info.get('beta', '-'),
        'Debt-to-Equity Ratio': info.get('debtToEquity', '-')
    }
    return data

# Fonction pour récupérer les données depuis DeFi Pulse (pour les cryptos)
def get_defi_pulse_data():
    defi_url = "https://defipulse.com/api/v1/defi/overview"
    response = requests.get(defi_url)
    print(response.status_code)  # Vérifie si la requête a réussi (200)
    print(response.text)  # Affiche le contenu brut de la réponse
    try:
        data = response.json()  # Essaie de décoder la réponse JSON
    except ValueError as e:
        print("Erreur de décodage JSON:", e)
        return []
    return data

# Fonction pour récupérer les données économiques depuis IMF (PIB, Inflation, etc.)
def get_imf_data():
    imf_url = "https://api.worldbank.org/v2/country/all/indicator/NY.GDP.MKTP.KD.ZG?format=json"
    imf_data = requests.get(imf_url).json()
    data = []
    for country_data in imf_data[1]:
        country = country_data['country']['value']
        gdp_growth = country_data['value'] if country_data['value'] is not None else '-'
        
        # Exemple d'ajout d'autres indicateurs
        data.append({
            'Date': datetime.today().strftime('%Y-%m-%d'),
            'Actif': country,
            'Type': 'Economique',
            'Prix actuel': '-',  # Non applicable ici
            'Variation journalière (%)': '-',  # Non applicable ici
            'Volume de transactions': '-',  # Non applicable ici
            'Market Capitalization': '-',  # Non applicable ici
            'P/E Ratio': '-',  # Non applicable ici
            'EPS': '-',  # Non applicable ici
            'Dividend Yield': '-',  # Non applicable ici
            'ROE': '-',  # Non applicable ici
            'ROA': '-',  # Non applicable ici
            'Beta': '-',  # Non applicable ici
            'Debt-to-Equity Ratio': '-',  # Non applicable ici
            'Total Value Locked (TVL)': '-',  # Non applicable ici
            'Supply Circulant': '-',  # Non applicable ici
            'Hashrate': '-',  # Non applicable ici
            'Gas Fees': '-',  # Non applicable ici
            'Staking Yield': '-',  # Non applicable ici
            'PIB (%)': gdp_growth,
            'Inflation Rate': '-',  # Exemple d'ajout de données d'inflation
            'Taux d’intérêt directeur': '-',  # Exemple
            'Unemployment Rate': '-',  # Exemple
            'Indice des prix à la consommation (CPI)': '-'  # Exemple
        })
    return data

# Récupérer les données pour tous les actifs financiers
data_list = []

# Extraire les données de Yahoo Finance pour chaque actif
for asset in assets:
    data = get_yahoo_data(asset)
    data_list.append(data)

# Extraire les données DeFi Pulse
defi_data = get_defi_pulse_data()
data_list.extend(defi_data)

# Extraire les données IMF (Economiques)
imf_data = get_imf_data()
data_list.extend(imf_data)

# Créer un DataFrame avec toutes les données
df = pd.DataFrame(data_list)

# Sauvegarder dans un fichier CSV
df.to_csv('investment_metrics.csv', index=False)

print("Les données ont été extraites et sauvegardées dans 'investment_metrics.csv'.")


404
<!DOCTYPE html><html lang="en"><head><meta charSet="utf-8"/><meta name="viewport" content="width=device-width"/><script>!function(){var d=document.documentElement.classList;d.remove('light','dark');d.add('light')}()</script><meta name="next-head-count" content="3"/><link rel="preconnect" href="https://fonts.googleapis.com"/><link rel="preconnect" href="https://fonts.gstatic.com" crossorigin="true"/><link href="/fonts/Codec-Pro/Codec-Pro-Regular.ttf" rel="preload" as="font" crossorigin="anonymous"/><link href="/fonts/Codec-Pro/Codec-Pro-Light.ttf" rel="preload" as="font" crossorigin="anonymous"/><link href="/fonts/Codec-Pro/Codec-Pro-Thin.ttf" rel="preload" as="font" crossorigin="anonymous"/><link href="/fonts/Codec-Pro/Codec-Pro-Bold.ttf" rel="preload" as="font" crossorigin="anonymous"/><link href="/fonts/Codec-Pro/Codec-Pro-Extrabold.ttf" rel="preload" as="font" crossorigin="anonymous"/><script>
            (function(w,d,s,l,i){w[l]=w[l]||[];w[l].push({'gtm.start':new Date().getTi

In [2]:
import time

def get_yahoo_data(asset):
    stock = yf.Ticker(asset)
    time.sleep(2)  # Attendre 2 secondes entre chaque requête
    hist = stock.history(period="1d")
    info = stock.info
    
    if hist.empty:
        return None  # Retourne None si aucune donnée disponible
    
    data = {
        'Date': datetime.today().strftime('%Y-%m-%d'),
        'Actif': asset,
        'Type': 'Crypto' if 'USD' in asset else 'Stock',
        'Prix actuel': hist['Close'].iloc[-1],
        'Variation journalière (%)': hist['Close'].pct_change().iloc[-1] * 100,
        'Volume de transactions': hist['Volume'].iloc[-1],
        'Market Capitalization': info.get('marketCap', '-'),
        'P/E Ratio': info.get('trailingPE', '-'),
        'EPS': info.get('trailingEps', '-'),
        'Dividend Yield': info.get('dividendYield', '-'),
        'ROE': info.get('returnOnEquity', '-'),
        'ROA': info.get('returnOnAssets', '-'),
        'Beta': info.get('beta', '-'),
        'Debt-to-Equity Ratio': info.get('debtToEquity', '-')
    }
    return data


In [3]:
yahoo_data = yf.download(assets, period="1d")
print(yahoo_data)


YF.download() has changed argument auto_adjust default to True


[*********************100%***********************]  5 of 5 completed

5 Failed downloads:
['BTC-USD', 'ETH-USD', 'GOOG', 'AAPL', 'MSFT']: YFRateLimitError('Too Many Requests. Rate limited. Try after a while.')


Empty DataFrame
Columns: [(Adj Close, AAPL), (Adj Close, BTC-USD), (Adj Close, ETH-USD), (Adj Close, GOOG), (Adj Close, MSFT), (Close, AAPL), (Close, BTC-USD), (Close, ETH-USD), (Close, GOOG), (Close, MSFT), (High, AAPL), (High, BTC-USD), (High, ETH-USD), (High, GOOG), (High, MSFT), (Low, AAPL), (Low, BTC-USD), (Low, ETH-USD), (Low, GOOG), (Low, MSFT), (Open, AAPL), (Open, BTC-USD), (Open, ETH-USD), (Open, GOOG), (Open, MSFT), (Volume, AAPL), (Volume, BTC-USD), (Volume, ETH-USD), (Volume, GOOG), (Volume, MSFT)]
Index: []

[0 rows x 30 columns]


In [None]:
pip install requests[socks]


Erreur avec BTC-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec ETH-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec AAPL: Too Many Requests. Rate limited. Try after a while.
Erreur avec GOOG: Too Many Requests. Rate limited. Try after a while.
Erreur avec MSFT: Too Many Requests. Rate limited. Try after a while.
⚠️ Aucune donnée récupérée.


In [10]:
import os
print(os.getcwd())


c:\Users\Lyna Bouzouita\AppData\Local\Programs\Microsoft VS Code


In [11]:
pip install pysocks


Defaulting to user installation because normal site-packages is not writeable
Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 23.2.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [12]:
import yfinance as yf
import pandas as pd
import time
import requests
import os
from datetime import datetime

# Configuration du proxy (remplace avec ton proxy si besoin)
proxies = {
    "http": "socks5h://127.0.0.1:9050",  # Exemple avec Tor
    "https": "socks5h://127.0.0.1:9050"
}

# Configurer les variables d'environnement pour que toutes les requêtes utilisent le proxy
os.environ['http_proxy'] = proxies['http']
os.environ['https_proxy'] = proxies['https']

assets = ['BTC-USD', 'ETH-USD', 'AAPL', 'GOOG', 'MSFT']

def get_yahoo_data(asset, retries=5, delay=20):
    for _ in range(retries):
        try:
            stock = yf.Ticker(asset)
            time.sleep(2)  # Pause pour éviter le blocage
            
            hist = stock.history(period="1d")
            info = stock.info
            
            if hist.empty:
                print(f"⚠️ Aucune donnée pour {asset}.")
                return None  
            
            return {
                'Date': datetime.today().strftime('%Y-%m-%d'),
                'Actif': asset,
                'Prix actuel': hist['Close'].iloc[-1],
                'Volume': hist['Volume'].iloc[-1],
                'MarketCap': info.get('marketCap', '-')
            }
        except requests.exceptions.HTTPError as e:
            if e.response.status_code == 429:
                print(f"Rate limit dépassé pour {asset}. Attente de {delay} sec...")
                time.sleep(delay)
            else:
                print(f"Erreur HTTP pour {asset}: {e}")
                return None
        except Exception as e:
            print(f"Erreur avec {asset}: {e}")
            return None
    return None

# Récupération des données Yahoo Finance
yahoo_data = [get_yahoo_data(asset) for asset in assets]
yahoo_data = [d for d in yahoo_data if d]

# Enregistrement des données
if yahoo_data:
    yahoo_df = pd.DataFrame(yahoo_data)
    file_name = f"yahoo_finance_{datetime.today().strftime('%Y-%m-%d')}.csv"
    yahoo_df.to_csv(file_name, index=False)
    print(f"✅ Données enregistrées : {file_name}")
else:
    print("⚠️ Aucune donnée récupérée.")


$BTC-USD: possibly delisted; no price data found  (period=1d)


Erreur avec BTC-USD: Missing dependencies for SOCKS support.


$ETH-USD: possibly delisted; no price data found  (period=1d)


Erreur avec ETH-USD: Missing dependencies for SOCKS support.


$AAPL: possibly delisted; no price data found  (period=1d)


Erreur avec AAPL: Missing dependencies for SOCKS support.


$GOOG: possibly delisted; no price data found  (period=1d)


Erreur avec GOOG: Missing dependencies for SOCKS support.


$MSFT: possibly delisted; no price data found  (period=1d)


Erreur avec MSFT: Missing dependencies for SOCKS support.
⚠️ Aucune donnée récupérée.


In [7]:

def get_defi_pulse_data():
    defi_url = "https://defipulse.com/api/v1/defi/overview"
    response = requests.get(defi_url)
    print(response.status_code)  # Vérifie si la requête a réussi (200)
    print(response.text)  # Affiche le contenu brut de la réponse
    try:
        data = response.json()  # Essaie de décoder la réponse JSON
    except ValueError as e:
        print("Erreur de décodage JSON:", e)
        return []
    return data


In [20]:
import yfinance as yf
import pandas as pd
import time
from datetime import datetime

# Liste des actifs (tickers) à récupérer
assets = ['BTC-USD', 'ETH-USD', 'AAPL', 'GOOG', 'MSFT']

# Fonction pour récupérer les metrics d'investissement et les insights financiers
def get_investment_metrics(asset, retries=5, delay=5):
    for _ in range(retries):
        try:
            stock = yf.Ticker(asset)
            info = stock.info  # Récupère toutes les informations financières

            # Vérifier si les données sont disponibles
            if not info:
                print(f"⚠️ Aucune donnée pour {asset}.")
                return None

            # Extraire les métriques financières importantes
            return {
                'Date': datetime.today().strftime('%Y-%m-%d'),
                'Actif': asset,
                'MarketCap': info.get('marketCap', '-'),
                'PE Ratio': info.get('trailingPE', '-'),
                'Dividend Yield': info.get('dividendYield', '-'),
                'Revenue': info.get('totalRevenue', '-'),
                'NetIncome': info.get('netIncomeToCommon', '-'),
                'ROE': info.get('returnOnEquity', '-'),
                'Revenue Growth': info.get('revenueGrowth', '-'),
                'Current Price': info.get('currentPrice', '-')
            }
        
        except Exception as e:
            print(f"Erreur avec {asset}: {e}")
            time.sleep(delay)  # Attendre avant de réessayer
    return None

# Récupération des données pour tous les actifs
investment_data = []
for asset in assets:
    data = get_investment_metrics(asset)
    if data:
        investment_data.append(data)
    time.sleep(2)  # Délai entre les requêtes pour éviter les limitations

# Enregistrement des données dans un fichier CSV
if investment_data:
    investment_df = pd.DataFrame(investment_data)
    file_name = f"investment_metrics_{datetime.today().strftime('%Y-%m-%d')}.csv"
    investment_df.to_csv(file_name, index=False)
    print(f"✅ Données enregistrées : {file_name}")
else:
    print("⚠️ Aucune donnée récupérée.")


Erreur avec BTC-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec BTC-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec BTC-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec BTC-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec BTC-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec ETH-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec ETH-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec ETH-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec ETH-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec ETH-USD: Too Many Requests. Rate limited. Try after a while.
Erreur avec AAPL: Too Many Requests. Rate limited. Try after a while.
Erreur avec AAPL: Too Many Requests. Rate limited. Try after a while.
Erreur avec AAPL: HTTPSConnectionPool(host='query2.finance.yahoo.com', port=443): Max retries exceeded with url: /v10/finance/quot

In [22]:
import requests
import pandas as pd
import time
from datetime import datetime

# ----------------------------
# 1. Récupération des données macroéconomiques de l'IMF
# ----------------------------
def get_imf_data():
    imf_url = "http://dataservices.imf.org/REST/SDMX_JSON.svc/CompactData/IFS/M.US.PCPI_IX?startPeriod=2020&endPeriod=2024"
    
    try:
        response = requests.get(imf_url)
        data = response.json()
        series = data['CompactData']['DataSet']['Series']
        records = []
        
        for item in series['Obs']:
            records.append({
                'Date': item['@TIME_PERIOD'],
                'Inflation_Index': item['@OBS_VALUE']
            })
        
        return pd.DataFrame(records)
    except Exception as e:
        print(f"Erreur IMF: {e}")
        return pd.DataFrame(columns=['Date', 'Inflation_Index'])

# ----------------------------
# 2. Récupération des données DeFi via DefiLlama
# ----------------------------
def get_defi_llama_data():
    defi_url = "https://api.llama.fi/tvl/defi"
    
    try:
        response = requests.get(defi_url)
        data = response.json()
        
        records = [{
            'Date': datetime.today().strftime('%Y-%m-%d'),
            'TVL_USD': data.get('totalLiquidityUSD', 'N/A')
        }]
        
        return pd.DataFrame(records)
    except Exception as e:
        print(f"Erreur DefiLlama: {e}")
        return pd.DataFrame(columns=['Date', 'TVL_USD'])

# ----------------------------
# 3. Exécution et sauvegarde
# ----------------------------
if __name__ == "__main__":
    imf_df = get_imf_data()
    defi_df = get_defi_llama_data()
    
    final_df = pd.concat([imf_df, defi_df], ignore_index=True)
    print("Aperçu des données collectées :")
    print(final_df.head())
    
    file_name = f"investment_metrics_{datetime.today().strftime('%Y-%m-%d')}.csv"
    final_df.to_csv(file_name, index=False)
    
    print(f"✅ Données enregistrées : {file_name}")


Erreur DefiLlama: Expecting value: line 1 column 1 (char 0)
Aperçu des données collectées :
      Date   Inflation_Index TVL_USD
0  2020-01  118.305202115975     NaN
1  2020-02  118.629431497944     NaN
2  2020-03  118.371240349361     NaN
3  2020-04   117.57969874642     NaN
4  2020-05  117.581991740635     NaN
✅ Données enregistrées : investment_metrics_2025-02-19.csv


In [23]:
import os

file_name = f"investment_metrics_{datetime.today().strftime('%Y-%m-%d')}.csv"
file_path = os.path.abspath(file_name)

print(f"📂 Chemin du fichier : {file_path}")


📂 Chemin du fichier : c:\Users\Lyna Bouzouita\AppData\Local\Programs\Microsoft VS Code\investment_metrics_2025-02-19.csv


In [25]:
import requests
import pandas as pd
import time
from datetime import datetime

# ----------------------------
# 1. Récupération des données macroéconomiques de l'IMF (1980-2024)
# ----------------------------
def get_imf_data():
    imf_url = "http://dataservices.imf.org/REST/SDMX_JSON.svc/CompactData/IFS/M.US.PCPI_IX?startPeriod=1980&endPeriod=2024"
    
    try:
        response = requests.get(imf_url)
        data = response.json()
        series = data['CompactData']['DataSet']['Series']
        records = []
        
        for item in series['Obs']:
            records.append({
                'Source': 'IMF',
                'Date': item['@TIME_PERIOD'],
                'Indicator': 'Inflation_Index',
                'Value': item['@OBS_VALUE']
            })
        
        return pd.DataFrame(records)
    except Exception as e:
        print(f"Erreur IMF: {e}")
        return pd.DataFrame(columns=['Source', 'Date', 'Indicator', 'Value'])

# ----------------------------
# 2. Récupération de l'historique TVL via DefiLlama
# ----------------------------
def get_defi_llama_data():
    defi_url = "https://api.llama.fi/charts"
    
    try:
        response = requests.get(defi_url)
        data = response.json()
        records = []
        
        for item in data:
            records.append({
                'Source': 'DefiLlama',
                'Date': datetime.utcfromtimestamp(item['date']).strftime('%Y-%m-%d'),
                'Indicator': 'TVL_USD',
                'Value': item['totalLiquidityUSD']
            })
        
        return pd.DataFrame(records)
    except Exception as e:
        print(f"Erreur DefiLlama: {e}")
        return pd.DataFrame(columns=['Source', 'Date', 'Indicator', 'Value'])

# ----------------------------
# 3. Exécution et sauvegarde
# ----------------------------
if __name__ == "__main__":
    imf_df = get_imf_data()
    defi_df = get_defi_llama_data()
    
    final_df = pd.concat([imf_df, defi_df], ignore_index=True)
    print("Aperçu des données collectées :")
    print(final_df.head())
    print(f"Nombre total de lignes : {len(final_df)}")
    
    file_name = f"investments_metrics_{datetime.today().strftime('%Y-%m-%d')}.csv"
    final_df.to_csv(file_name, index=False)
    
    print(f"✅ Données enregistrées : {file_name}")


Erreur DefiLlama: 'str' object cannot be interpreted as an integer
Aperçu des données collectées :
  Source     Date        Indicator             Value
0    IMF  1980-01  Inflation_Index  35.6789899819083
1    IMF  1980-02  Inflation_Index  36.1834487091589
2    IMF  1980-03  Inflation_Index   36.733767320705
3    IMF  1980-04  Inflation_Index  37.1465062793647
4    IMF  1980-05  Inflation_Index  37.5133853537288
Nombre total de lignes : 540
✅ Données enregistrées : investments_metrics_2025-02-19.csv


  'Date': datetime.utcfromtimestamp(item['date']).strftime('%Y-%m-%d'),


In [26]:
import requests
import pandas as pd
from bs4 import BeautifulSoup
from datetime import datetime

# ----------------------------
# 1. Récupération des données macroéconomiques de l'IMF (1980-2024)
# ----------------------------
def get_imf_data():
    imf_url = "http://dataservices.imf.org/REST/SDMX_JSON.svc/CompactData/IFS/M.US.PCPI_IX?startPeriod=1980&endPeriod=2024"
    
    try:
        response = requests.get(imf_url)
        data = response.json()
        series = data['CompactData']['DataSet']['Series']
        records = []
        
        for item in series['Obs']:
            records.append({
                'Source': 'IMF',
                'Date': item['@TIME_PERIOD'],
                'Indicator': 'Inflation_Index',
                'Value': item['@OBS_VALUE']
            })
        
        return pd.DataFrame(records)
    except Exception as e:
        print(f"Erreur IMF: {e}")
        return pd.DataFrame(columns=['Source', 'Date', 'Indicator', 'Value'])

# ----------------------------
# 2. Récupération de l'historique TVL via Defi Pulse (Web Scraping)
# ----------------------------
def get_defi_pulse_data():
    defi_url = "https://defipulse.com/"
    
    try:
        response = requests.get(defi_url)
        soup = BeautifulSoup(response.text, 'html.parser')
        
        # Example scraping logic (adjust according to the actual page structure)
        # Scraping TVL data and dates
        records = []
        # Assuming TVL data is in a table or a section on the page (this needs to be adjusted based on actual site structure)
        data_section = soup.find('section', {'class': 'tvl-data'})  # Replace with the correct class or tag
        
        for row in data_section.find_all('div', {'class': 'data-row'}):  # Adjust tag/class as needed
            date = row.find('span', {'class': 'date'}).text.strip()  # Adjust the selector
            tvl_value = row.find('span', {'class': 'value'}).text.strip()  # Adjust the selector
            
            records.append({
                'Source': 'Defi Pulse',
                'Date': date,
                'Indicator': 'TVL_USD',
                'Value': tvl_value
            })
        
        return pd.DataFrame(records)
    except Exception as e:
        print(f"Erreur Defi Pulse: {e}")
        return pd.DataFrame(columns=['Source', 'Date', 'Indicator', 'Value'])

# ----------------------------
# 3. Exécution et sauvegarde
# ----------------------------
if __name__ == "__main__":
    imf_df = get_imf_data()
    defi_pulse_df = get_defi_pulse_data()
    
    final_df = pd.concat([imf_df, defi_pulse_df], ignore_index=True)
    print("Aperçu des données collectées :")
    print(final_df.head())
    print(f"Nombre total de lignes : {len(final_df)}")
    
    file_name = f"investments_metrics2_{datetime.today().strftime('%Y-%m-%d')}.csv"
    final_df.to_csv(file_name, index=False)
    
    print(f"✅ Données enregistrées : {file_name}")


Erreur Defi Pulse: 'NoneType' object has no attribute 'find_all'
Aperçu des données collectées :
  Source     Date        Indicator             Value
0    IMF  1980-01  Inflation_Index  35.6789899819083
1    IMF  1980-02  Inflation_Index  36.1834487091589
2    IMF  1980-03  Inflation_Index   36.733767320705
3    IMF  1980-04  Inflation_Index  37.1465062793647
4    IMF  1980-05  Inflation_Index  37.5133853537288
Nombre total de lignes : 540
✅ Données enregistrées : investments_metrics2_2025-02-19.csv


In [27]:
import requests
import pandas as pd
from bs4 import BeautifulSoup
from datetime import datetime

# ----------------------------
# 1. Récupération de l'historique TVL via Defi Pulse (Web Scraping)
# ----------------------------
def get_defi_pulse_data():
    defi_url = "https://defipulse.com/"  # URL de Defi Pulse
    
    try:
        # Récupération de la page HTML
        response = requests.get(defi_url)
        soup = BeautifulSoup(response.text, 'html.parser')
        
        # Liste pour stocker les données extraites
        records = []
        
        # Exemple de scraping - ajustez cette section en fonction de la structure de la page
        # Nous allons chercher une section ou un tableau contenant des informations sur le TVL
        data_section = soup.find('section', {'class': 'tvl-data'})  # Remplacer par la bonne classe ou tag
        
        # Parcours des éléments contenant les données TVL
        for row in data_section.find_all('div', {'class': 'data-row'}):  # Remplacer par la bonne classe ou tag
            date = row.find('span', {'class': 'date'}).text.strip()  # Extraire la date
            tvl_value = row.find('span', {'class': 'value'}).text.strip()  # Extraire la valeur du TVL
            
            # Ajouter les informations dans la liste
            records.append({
                'Source': 'Defi Pulse',
                'Date': date,
                'Indicator': 'TVL_USD',
                'Value': tvl_value
            })
        
        # Retourner les données sous forme de DataFrame
        return pd.DataFrame(records)
    
    except Exception as e:
        print(f"Erreur Defi Pulse: {e}")
        return pd.DataFrame(columns=['Source', 'Date', 'Indicator', 'Value'])

# ----------------------------
# 2. Exécution et sauvegarde
# ----------------------------
if __name__ == "__main__":
    defi_pulse_df = get_defi_pulse_data()  # Récupérer les données de Defi Pulse
    
    # Afficher un aperçu des données collectées
    print("Aperçu des données collectées :")
    print(defi_pulse_df.head())
    print(f"Nombre total de lignes : {len(defi_pulse_df)}")
    
    # Sauvegarder les données dans un fichier CSV
    file_name = f"defi_pulse_data_{datetime.today().strftime('%Y-%m-%d')}.csv"
    defi_pulse_df.to_csv(file_name, index=False)
    
    print(f"✅ Données enregistrées : {file_name}")


Erreur Defi Pulse: 'NoneType' object has no attribute 'find_all'
Aperçu des données collectées :
Empty DataFrame
Columns: [Source, Date, Indicator, Value]
Index: []
Nombre total de lignes : 0
✅ Données enregistrées : defi_pulse_data_2025-02-19.csv


In [28]:
pip install selenium


Defaulting to user installation because normal site-packages is not writeable
Collecting selenium
  Obtaining dependency information for selenium from https://files.pythonhosted.org/packages/a0/9f/34d0ec09b0dd6fb7b08b93eb4b7b80049e0b9db0ba7f81ad814c9be78b8f/selenium-4.28.1-py3-none-any.whl.metadata
  Downloading selenium-4.28.1-py3-none-any.whl.metadata (7.1 kB)
Collecting trio~=0.17 (from selenium)
  Obtaining dependency information for trio~=0.17 from https://files.pythonhosted.org/packages/c9/55/c4d9bea8b3d7937901958f65124123512419ab0eb73695e5f382521abbfb/trio-0.29.0-py3-none-any.whl.metadata
  Downloading trio-0.29.0-py3-none-any.whl.metadata (8.5 kB)
Collecting trio-websocket~=0.9 (from selenium)
  Obtaining dependency information for trio-websocket~=0.9 from https://files.pythonhosted.org/packages/d3/b9/b07ec357ba125ad26e1c07781b9d7f0414af85ad76e0d73617ddb5ce041c/trio_websocket-0.12.1-py3-none-any.whl.metadata
  Downloading trio_websocket-0.12.1-py3-none-any.whl.metadata (5.1 kB)


[notice] A new release of pip is available: 23.2.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [33]:
pip install webdriver-manager


Defaulting to user installation because normal site-packages is not writeable
Note: you may need to restart the kernel to use updated packages.



[notice] A new release of pip is available: 23.2.1 -> 25.0.1
[notice] To update, run: python.exe -m pip install --upgrade pip


In [37]:
from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.chrome.service import Service
from selenium.webdriver.chrome.options import Options
from selenium.webdriver.support.ui import WebDriverWait
from selenium.webdriver.support import expected_conditions as EC
from webdriver_manager.chrome import ChromeDriverManager
import pandas as pd
from datetime import datetime
import time

# ----------------------------
# 1. Récupération de l'historique TVL via Defi Pulse (Selenium)
# ----------------------------
def get_defi_pulse_data():
    # Configuration du Service et du WebDriver
    service = Service(ChromeDriverManager().install())
    options = Options()
    options.headless = False  # Garder True pour exécuter sans ouvrir la fenêtre du navigateur
    driver = webdriver.Chrome(service=service, options=options)
    defi_url = "https://defipulse.com/"
    
    try:
        driver.get(defi_url)
        
        # Attendre que l'élément contenant les données TVL soit visible
        WebDriverWait(driver, 10).until(EC.presence_of_element_located((By.XPATH, "//div[contains(@class, 'chart-item')]")))
        
        print("Page complètement chargée")
        
        # Attendre encore un peu pour s'assurer que tous les éléments ont été chargés
        time.sleep(5)
        
        records = []
        
        # Sélectionner les éléments contenant les informations
        tvl_elements = driver.find_elements(By.XPATH, "//div[contains(@class, 'chart-item')]")
        
        if not tvl_elements:
            print("Aucun élément trouvé !")
        
        for item in tvl_elements:
            try:
                # Ajustez ces XPaths en fonction de la structure exacte de la page
                date = item.find_element(By.XPATH, ".//div[contains(@class, 'date')]").text.strip()
                tvl_value = item.find_element(By.XPATH, ".//div[contains(@class, 'value')]").text.strip()
                
                # Impression pour vérifier les données extraites
                print(f"Date: {date}, TVL: {tvl_value}")
                
                records.append({
                    'Source': 'Defi Pulse',
                    'Date': date,
                    'Indicator': 'TVL_USD',
                    'Value': tvl_value
                })
            except Exception as e:
                print(f"Erreur d'extraction dans un élément : {e}")
        
        driver.quit()  # Fermer le navigateur après extraction
        return pd.DataFrame(records)
    
    except Exception as e:
        print(f"Erreur Defi Pulse: {e}")
        driver.quit()
        return pd.DataFrame(columns=['Source', 'Date', 'Indicator', 'Value'])

# ----------------------------
# 2. Exécution et sauvegarde
# ----------------------------
if __name__ == "__main__":
    defi_pulse_df = get_defi_pulse_data()  # Récupérer les données de Defi Pulse
    
    # Afficher un aperçu des données collectées
    print("Aperçu des données collectées :")
    print(defi_pulse_df.head())
    print(f"Nombre total de lignes : {len(defi_pulse_df)}")
    
    # Sauvegarder les données dans un fichier CSV
    file_name = f"defi_pulse_data3_{datetime.today().strftime('%Y-%m-%d')}.csv"
    defi_pulse_df.to_csv(file_name, index=False)
    
    print(f"✅ Données enregistrées : {file_name}")


Erreur Defi Pulse: Message: 
Stacktrace:
	GetHandleVerifier [0x00C374A3+25091]
	(No symbol) [0x00BBDC04]
	(No symbol) [0x00A9B373]
	(No symbol) [0x00ADF4DC]
	(No symbol) [0x00ADF65B]
	(No symbol) [0x00B1D8E2]
	(No symbol) [0x00B01F54]
	(No symbol) [0x00B1B49E]
	(No symbol) [0x00B01CA6]
	(No symbol) [0x00AD31D5]
	(No symbol) [0x00AD435D]
	GetHandleVerifier [0x00F307C3+3142947]
	GetHandleVerifier [0x00F41A2B+3213195]
	GetHandleVerifier [0x00F3C412+3191154]
	GetHandleVerifier [0x00CD8720+685184]
	(No symbol) [0x00BC6E1D]
	(No symbol) [0x00BC3E18]
	(No symbol) [0x00BC3FB6]
	(No symbol) [0x00BB66F0]
	BaseThreadInitThunk [0x757D5D49+25]
	RtlInitializeExceptionChain [0x77BECEBB+107]
	RtlGetAppContainerNamedObjectPath [0x77BECE41+561]

Aperçu des données collectées :
Empty DataFrame
Columns: [Source, Date, Indicator, Value]
Index: []
Nombre total de lignes : 0
✅ Données enregistrées : defi_pulse_data3_2025-02-19.csv


In [4]:
import yfinance as yf
import pandas as pd
import time
from datetime import datetime

# ----------------------------
# 1. Fonction pour récupérer les données avec une pause pour éviter le blocage
# ----------------------------
def get_yahoo_finance_data(ticker, start_date, end_date):
    try:
        print(f"📊 Récupération des données pour {ticker}...")
        time.sleep(5)  # Attendre 5 secondes entre chaque requête pour éviter le blocage
        data = yf.download(ticker, start=start_date, end=end_date, progress=True)
        
        if data.empty:
            print(f"⚠️ Aucune donnée trouvée pour {ticker}.")
            return pd.DataFrame()

        # Ajouter des colonnes supplémentaires
        data['Source'] = 'Yahoo Finance'
        data['Indicator'] = 'Stock_Price'
        data['Date'] = data.index.strftime('%Y-%m-%d')
        
        # Réorganiser les colonnes
        data = data[['Source', 'Date', 'Indicator', 'Open', 'High', 'Low', 'Close', 'Adj Close', 'Volume']]
        
        print("✅ Données collectées avec succès !")
        return data

    except Exception as e:
        print(f"❌ Erreur Yahoo Finance: {e}")
        return pd.DataFrame()

# ----------------------------
# 2. Exécution et sauvegarde
# ----------------------------
if __name__ == "__main__":
    #ticker = 'AAPL'  # Apple
    start_date = '2000-01-01'
    end_date = '2024-12-31'

    yahoo_data = get_yahoo_finance_data(ticker, start_date, end_date)

    if not yahoo_data.empty:
        file_name = f"yahoo_finance_data_{ticker}_{datetime.today().strftime('%Y-%m-%d')}.csv"
        yahoo_data.to_csv(file_name, index=False)
        print(f"✅ Données enregistrées : {file_name}")
    else:
        print("⚠️ Le fichier est vide, aucune donnée récupérée.")


📊 Récupération des données pour AAPL...


[*********************100%***********************]  1 of 1 completed

1 Failed download:
['AAPL']: YFRateLimitError('Too Many Requests. Rate limited. Try after a while.')


⚠️ Aucune donnée trouvée pour AAPL.
⚠️ Le fichier est vide, aucune donnée récupérée.


In [43]:
import requests
import pandas as pd
import time

# Remplace par ta clé API Alpha Vantage
API_KEY = "VOTRE_CLE_API"
SYMBOL = "AAPL"
URL = f"https://www.alphavantage.co/query?function=TIME_SERIES_DAILY&symbol={SYMBOL}&apikey={API_KEY}&outputsize=full"

# Requête à l'API
response = requests.get(URL)
if response.status_code == 200:
    data = response.json()
    if "Time Series (Daily)" in data:
        df = pd.DataFrame.from_dict(data["Time Series (Daily)"], orient="index")
        df.columns = ["Open", "High", "Low", "Close", "Volume"]
        df.index = pd.to_datetime(df.index)
        df = df.sort_index()
        
        # Sauvegarde en CSV
        filename = f"apple_stock_data_{time.strftime('%Y-%m-%d')}.csv"
        df.to_csv(filename)
        print(f"✅ Données enregistrées : {filename}")
        print(df.head())
    else:
        print("❌ Erreur : Données introuvables dans la réponse API.")
else:
    print(f"❌ Erreur HTTP {response.status_code} lors de l'accès à l'API.")

✅ Données enregistrées : apple_stock_data_2025-02-19.csv
               Open     High      Low    Close   Volume
1999-11-01  80.0000  80.6900  77.3700  77.6200  2487300
1999-11-02  78.0000  81.6900  77.3100  80.2500  3564600
1999-11-03  81.6200  83.2500  81.0000  81.5000  2932700
1999-11-04  82.0600  85.3700  80.6200  83.6200  3384700
1999-11-05  84.6200  88.3700  84.0000  88.3100  3721500
