## Displaying intial data
___

In [1]:
from tabulate import tabulate
import pandas as pd

# Loading the dataset
file_path = '/Users/pranavkhot/Documents/STOCKS/data/Ford.csv'
ford_data = pd.read_csv(file_path)

# Displaying the first few rows of the dataset
print("Initial Data:")
print(tabulate(ford_data.head(10), headers='keys', tablefmt='fancy_grid', showindex=False))


Initial Data:
╒════════════╤════════╤════════╤═══════╤═════════╤═════════════╤══════════╕
│ Date       │   Open │   High │   Low │   Close │   Adj Close │   Volume │
╞════════════╪════════╪════════╪═══════╪═════════╪═════════════╪══════════╡
│ 2018-12-17 │   8.48 │   8.72 │  8.41 │    8.5  │     6.83442 │ 44469900 │
├────────────┼────────┼────────┼───────┼─────────┼─────────────┼──────────┤
│ 2018-12-18 │   8.55 │   8.68 │  8.41 │    8.47 │     6.8103  │ 38263000 │
├────────────┼────────┼────────┼───────┼─────────┼─────────────┼──────────┤
│ 2018-12-19 │   8.46 │   8.65 │  8.27 │    8.32 │     6.68969 │ 75272900 │
├────────────┼────────┼────────┼───────┼─────────┼─────────────┼──────────┤
│ 2018-12-20 │   8.33 │   8.42 │  8.18 │    8.26 │     6.64145 │ 58926200 │
├────────────┼────────┼────────┼───────┼─────────┼─────────────┼──────────┤
│ 2018-12-21 │   8.22 │   8.4  │  8.04 │    8.05 │     6.4726  │ 57542300 │
├────────────┼────────┼────────┼───────┼─────────┼─────────────┼──────────

## Checking for missing values
___

In [5]:
missing_values = ford_data.isnull().sum()

print("Missing Values in Each Column:")
print(tabulate(missing_values.reset_index(), headers=['Column', 'Missing Values'], tablefmt='fancy_grid', showindex=False))


Missing Values in Each Column:
╒═══════════╤══════════════════╕
│ Column    │   Missing Values │
╞═══════════╪══════════════════╡
│ Date      │                0 │
├───────────┼──────────────────┤
│ Open      │                0 │
├───────────┼──────────────────┤
│ High      │                0 │
├───────────┼──────────────────┤
│ Low       │                0 │
├───────────┼──────────────────┤
│ Close     │                0 │
├───────────┼──────────────────┤
│ Adj Close │                0 │
├───────────┼──────────────────┤
│ Volume    │                0 │
╘═══════════╧══════════════════╛


## Normalizing the Data
___

In [3]:
from sklearn.preprocessing import MinMaxScaler

# Columns to be normalized
columns_to_normalize = ['Open', 'High', 'Low', 'Close', 'Adj Close', 'Volume']

# Initializing the Min-Max Scaler
scaler = MinMaxScaler()

# Normalizing the data
ford_data[columns_to_normalize] = scaler.fit_transform(ford_data[columns_to_normalize])
print("Normalized Data:")
print(tabulate(ford_data.head(), headers='keys', tablefmt='fancy_grid'))


Normalized Data:
╒════╤════════════╤══════════╤══════════╤══════════╤══════════╤═════════════╤═══════════╕
│    │ Date       │     Open │     High │      Low │    Close │   Adj Close │    Volume │
╞════╪════════════╪══════════╪══════════╪══════════╪══════════╪═════════════╪═══════════╡
│  0 │ 2018-12-17 │ 0.204369 │ 0.200466 │ 0.21803  │ 0.211992 │    0.179638 │ 0.108713  │
├────┼────────────┼──────────┼──────────┼──────────┼──────────┼─────────────┼───────────┤
│  1 │ 2018-12-18 │ 0.207767 │ 0.198601 │ 0.21803  │ 0.210576 │    0.17834  │ 0.0880073 │
├────┼────────────┼──────────┼──────────┼──────────┼──────────┼─────────────┼───────────┤
│  2 │ 2018-12-19 │ 0.203398 │ 0.197203 │ 0.211171 │ 0.203494 │    0.171848 │ 0.211471  │
├────┼────────────┼──────────┼──────────┼──────────┼──────────┼─────────────┼───────────┤
│  3 │ 2018-12-20 │ 0.197087 │ 0.18648  │ 0.206761 │ 0.200661 │    0.169252 │ 0.156939  │
├────┼────────────┼──────────┼──────────┼──────────┼──────────┼─────────────┼──────

## Converting 'Date' Column to Datetime Format and Display
___

In [4]:
# Convert the 'Date' column to datetime format
ford_data['Date'] = pd.to_datetime(ford_data['Date'])

# Displaying the data with 'Date' as datetime
print("\nData with 'Date' as datetime:")
print(tabulate(ford_data.head(100), headers='keys', tablefmt='fancy_grid'))



Data with 'Date' as datetime:
╒════╤═════════════════════╤══════════╤══════════╤══════════╤══════════╤═════════════╤═══════════╕
│    │ Date                │     Open │     High │      Low │    Close │   Adj Close │    Volume │
╞════╪═════════════════════╪══════════╪══════════╪══════════╪══════════╪═════════════╪═══════════╡
│  0 │ 2018-12-17 00:00:00 │ 0.204369 │ 0.200466 │ 0.21803  │ 0.211992 │    0.179638 │ 0.108713  │
├────┼─────────────────────┼──────────┼──────────┼──────────┼──────────┼─────────────┼───────────┤
│  1 │ 2018-12-18 00:00:00 │ 0.207767 │ 0.198601 │ 0.21803  │ 0.210576 │    0.17834  │ 0.0880073 │
├────┼─────────────────────┼──────────┼──────────┼──────────┼──────────┼─────────────┼───────────┤
│  2 │ 2018-12-19 00:00:00 │ 0.203398 │ 0.197203 │ 0.211171 │ 0.203494 │    0.171848 │ 0.211471  │
├────┼─────────────────────┼──────────┼──────────┼──────────┼──────────┼─────────────┼───────────┤
│  3 │ 2018-12-20 00:00:00 │ 0.197087 │ 0.18648  │ 0.206761 │ 0.200661 │    0.

In [10]:
# Save the pre-processed data to a new CSV file
ford_data.to_csv('/Users/pranavkhot/Documents/STOCKS/data/Ford_Preprocessed.csv', index=False)