# Pandas i szeregi czasowe

In [2]:
import pandas as pd

# Funkcja read_csv przyjmuje bardzo dużo argumentów, dzięki czemu można bardzo precyzjnie określić jak dokładnie ma się zachować i jak ma Pandas ma rozumieć nasze dane.
# W szczególności chcemy, aby kolumna `date(y-m-d)` została zinterpretowana jako data, stąd:

df = pd.read_csv(
    'data/forex_usd_data.csv',
    parse_dates=['date(y-m-d)'],  # ✅ lista wszystkich kolumn, które powinny zostać potraktowane jako daty
) 
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 3930 entries, 0 to 3929
Data columns (total 54 columns):
 #   Column                 Non-Null Count  Dtype         
---  ------                 --------------  -----         
 0   date(y-m-d)            3930 non-null   datetime64[ns]
 1   Argentine Peso         3930 non-null   float64       
 2   Australian Dollar      3930 non-null   float64       
 3   Bahraini Dinar         3930 non-null   float64       
 4   Botswana Pula          3930 non-null   float64       
 5   Brazilian Real         3930 non-null   float64       
 6   Bruneian Dollar        3930 non-null   float64       
 7   Bulgarian Lev          3930 non-null   float64       
 8   Canadian Dollar        3930 non-null   float64       
 9   Chilean Peso           3930 non-null   float64       
 10  Chinese Yuan Renminbi  3930 non-null   float64       
 11  Colombian Peso         3930 non-null   float64       
 12  Croatian Kuna          3930 non-null   float64       
 13  Cze

In [2]:
# Chcemy też, żeby potraktować właśnie tę kolumnę z datą jako index, czyli specjalną kolumnę:

df = pd.read_csv(
    'data/forex_usd_data.csv',
    parse_dates=['date(y-m-d)'],
    index_col='date(y-m-d)',  # ✅ ok
) 
df.info()

# Teraz już nie ma kolumny `date(y-m-d)` - stała się indexem.

<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 3930 entries, 2011-01-01 to 2021-10-04
Data columns (total 53 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   Argentine Peso         3930 non-null   float64
 1   Australian Dollar      3930 non-null   float64
 2   Bahraini Dinar         3930 non-null   float64
 3   Botswana Pula          3930 non-null   float64
 4   Brazilian Real         3930 non-null   float64
 5   Bruneian Dollar        3930 non-null   float64
 6   Bulgarian Lev          3930 non-null   float64
 7   Canadian Dollar        3930 non-null   float64
 8   Chilean Peso           3930 non-null   float64
 9   Chinese Yuan Renminbi  3930 non-null   float64
 10  Colombian Peso         3930 non-null   float64
 11  Croatian Kuna          3930 non-null   float64
 12  Czech Koruna           3930 non-null   float64
 13  Danish Krone           3930 non-null   float64
 14  Euro                   3930 non-null  

# 🔴 Ćwiczenie

W poprzednim ćwiczeniu:

1. Upewnij się, że Pandas rozumie, że w kolumnie DATE ma do czynienia z datami. 
2. Daty mogą być w formacie amerykańskim YYYY-DD-MM lub europejskim YYYY-MM-DD. Jak Pandas zinterpretował daty? Jeśli źle, to jak możesz to poprawić? Poszukaj w dokumentacji!
3. Która kolumna najlepiej nadaje się na index?