In [None]:
# %%
import yfinance as yf
import pandas as pd
from datetime import datetime, timedelta

# 1. تعریف پارامترهای دیتا
# نماد جفت ارز در یاهو فایننس به صورت Ticker=X است
ticker = "AUDUSD=X" 

# محاسبه تاریخ شروع (دقیقا یک سال قبل از امروز)
end_date = datetime.now()
start_date = end_date - timedelta(days=365)

# 2. دانلود دیتا با استفاده از yfinance
print(f"در حال دانلود دیتای {ticker} از تاریخ {start_date.strftime('%Y-%m-%d')} تا {end_date.strftime('%Y-%m-%d')}...")

# تابع download اطلاعات را در یک pandas DataFrame میریزد
audusd_data = yf.download(ticker, start=start_date, end=end_date)

# 3. نمایش چند سطر اول و آخر دیتا برای بررسی
print("\nچند ردیف اول دیتا:")
print(audusd_data.head())

print("\nچند ردیف آخر دیتا:")
print(audusd_data.tail())

# بررسی تعداد کل ردیف های دریافت شده
print(f"\nتعداد {len(audusd_data)} کندل روزانه دریافت شد.")

# Commit for data download branch - 2025-07-30

      

In [None]:
print(audusd_data.columns)

In [None]:
# --- Standardize and Flatten Column Names ---

# 1. Check if columns are a MultiIndex and flatten them
if isinstance(audusd_data.columns, pd.MultiIndex):
    print("MultiIndex detected. Flattening column names...")
    # Keep only the first level of the column names (e.g., 'Open' from ('Open', 'Ticker'))
    audusd_data.columns = audusd_data.columns.get_level_values(0)

# 2. Now that names are simple strings, convert them to lowercase
audusd_data.columns = [str(col).lower() for col in audusd_data.columns]

# 3. Print the final, clean column names to confirm
print("\nFinal standardized column names:")
print(audusd_data.columns)

# 4. Now, the dropna() command will work perfectly
audusd_data.dropna(subset=['open', 'high', 'low', 'close'], inplace=True)

print(f"\nRows after cleaning: {len(audusd_data)}")
print("✅ Missing data successfully removed.")

In [None]:
# --- Remove Duplicate Data Step ---

print(f"Rows before checking for duplicates: {len(audusd_data)}")

# Remove any rows that have a duplicated index (Date)
audusd_data = audusd_data[~audusd_data.index.duplicated(keep='first')]

print(f"Rows after checking for duplicates: {len(audusd_data)}")
print("\n✅ Duplicate data check complete.")

In [None]:
# Just type the variable name in the last line of the cell
audusd_data.head()

In [None]:
# Drop only the 'volume' column
audusd_data.drop(columns=['volume'], inplace=True)
audusd_data.head()

In [None]:
audusd_data.info()

In [None]:
# Check the statistics of the data
audusd_data.describe()