In [2]:
import csv
import numpy as np
import pickle
import os
from datetime import datetime
from collections import Counter
from tqdm import tqdm

In [3]:
def one_hot(data, ret_type):
    #print(data)
    counts = Counter(data)
    output = []
    
    if ret_type == "coin":
        values = {"ETH": 0, "WETH": 1, "WAX": 2}
        
    elif ret_type == "market":
        values = {"OpenSea": 0, "Atomic": 1, "Cryptokitties": 2, "Godsunchained": 3, "Decentraland": 4}
        
    else:
        values = {"Other": 0, "Art": 1, "Games": 2, "Collectible": 3}
        
    for v in values.keys():
        if v not in counts.keys():
            output.append(0)
        else:
            output.append(counts[v])
    #print(output)
    return output

In [14]:
def loadCollection(c):
    return pickle.load(open(f"{DIR}{c}", "rb"))

def getTimestamp(date):
    return datetime.fromisoformat(date).timestamp()

def getCollectionDateRange(c_nfts):
    dates = {i: getTimestamp(el[19]) for i, el in enumerate(c_nfts)}
    return c_nfts[max(dates, key=dates.get)][19], c_nfts[min(dates, key=dates.get)][19]

def collStats(c, start, end):
    doc_vars = [[]]*6
    #start_ts = getTimestamp(start)
    #end_ts = getTimestamp(end)
    
    c_nfts = loadCollection(c)
    #print(c_nfts)
    #maxDate, minDate = getCollectionDateRange(c_nfts)
    
    for nft in c_nfts:
        date = nft[19]
        date_ts = getTimestamp(date)
        if date_ts >= start and date_ts <= end:
            doc_vars[0] = doc_vars[0] + [nft[13]] # USD
            doc_vars[1] = doc_vars[1] + [nft[11]] # CRYPTO
            doc_vars[2] = doc_vars[2] + [nft[12]] # COIN
            #doc_vars[3] = doc_vars[3] + [nft[5]]  # Buyer address
            doc_vars[3] = doc_vars[3] + [nft[17]] # Market
            doc_vars[4] = doc_vars[4] + [nft[23]] # Category
    
    output = []
    for el in doc_vars[1:2]:
        #print(el)
        el = np.array(el).astype(float)
        if len(el) > 0:
            output = output + [np.mean(el), np.median(el), np.var(el), np.sum(el), np.prod(el)]
        else: output = output + [0]*5
    output = output + one_hot(doc_vars[2], "coin")
    output = output + one_hot(doc_vars[3], "market")
    output = output + one_hot(doc_vars[4], "category")
    output.append(len(c_nfts))
    return output

In [15]:
DIR = "/media/hwixley/data-drive/mlp-coursework3/OSF-data/"
window_size = 10

In [16]:
files = os.listdir(f"{DIR}windows/size{window_size}")
print(files)

['Pandemicgame', 'Davincicollection', 'Mddeesignerr', 'Demonicgirlz', 'Hedbighedbig', 'Licarthen', 'Illumination', 'Myownarts', 'Ethernitywtti', 'Nowthenwhencollection', 'Zodiac', 'Sticknshits', 'Paigedragon', 'Crufromedia', 'Dejavu', 'Hiphophotte', 'Wpcwrarecard', 'Japanmechadv', 'Viruse', 'Superclstyle', 'Mrmonkpropaganda', 'Wivfuture', 'Ligermanspor', 'Hugamonster', 'Greenrabbit', 'Jyglitch', 'Sandiamaeu', 'Petrdavydtchenko', 'Xuniverse', 'Fndmusqqqq', 'Rplanatverif', 'Pornhubcard', 'Julianedelmanincredelmannftcollection', 'Cryptoshirt', 'Alwayspastel', 'Acryptocoin', 'Toltecwarrio', 'Folk', 'Cryptocross', 'Surrogatesofficial', 'Powpanda', 'Brianromero', 'Blobsedition', 'Thiccpokemon', 'Azurineart', 'Parody', 'Graffiti', 'Absurd', 'Unifty', 'Hmsequencing', 'Fedfedaxie', 'Unitedartist', 'Lapin', 'Cryptolighter', 'Gradgrid', 'Aeforia', 'Perrycper', 'Spiral', 'Eyescollection', 'Japanesetraditionalcolor', 'Crative', 'Sighbster', 'Cosantacosan', 'Banillaxtractsltd', 'Pinupart', 'Ethday',

In [18]:
window_size = 10
# interval: crypto, time_difference
all_samples = []
all_labels = []

for f in tqdm(files):
    samples = pickle.load(open(f"{DIR}windows/size{window_size}/{f}", "rb"))
    #print(samples)
    for s in tqdm(samples):
        #s = s[0]
        if len(s) > 0 and len(s[0]) > 0:
            s = s[0]
            sample_size = int((len(s) - 2)/3)
            assert sample_size == 10
            
            labels = s[-2:]
            s = s[:-2]
            start = s[2]
            end = s[-3]
            
            coll_stats = collStats(f, start, end)
            #print(coll_stats)
            x = [[s[i*3], s[i*3 + 1]] for i in range(sample_size)]
            #print(x)
            x = [i for el in x for i in el]
            x = x + coll_stats
            
            #print(x)
            all_samples.append(x)
            all_labels.append(labels)

  0%|                                                  | 0/3164 [00:00<?, ?it/s]
100%|█████████████████████████████████████████| 6/6 [00:00<00:00, 125829.12it/s][A

100%|███████████████████████████████████████| 13/13 [00:00<00:00, 436207.62it/s][A

100%|███████████████████████████████████████| 17/17 [00:00<00:00, 552737.74it/s][A

100%|███████████████████████████████████████| 25/25 [00:00<00:00, 738433.80it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 76260.07it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38836.15it/s][A

100%|███████████████████████████████████████| 24/24 [00:00<00:00, 751218.63it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 109416.63it/s][A

100%|███████████████████████████████████████| 19/19 [00:00<00:00, 510844.72it/s][A

100%|███████████████████████████████████████| 13/13 [00:00<00:00, 432745.65it/s][A

100%|███████████████████████████████████████| 24/24 [00:00<00:00, 774

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39568.91it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 76959.71it/s][A

100%|███████████████████████████████████████| 20/20 [00:00<00:00, 660520.31it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 113359.57it/s][A

100%|███████████████████████████████████████| 10/10 [00:00<00:00, 358487.52it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38836.15it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 113359.57it/s][A

100%|████████████████████████████████████████| 19/19 [00:00<00:00, 46171.37it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38130.04it/s][A

100%|██████████████████████████████████████| 67/67 [00:00<00:00, 1672728.38it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39199.10it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00

100%|█████████████████████████████████████████| 96/96 [00:00<00:00, 1996.35it/s][A

100%|████████████████████████████████████████| 11/11 [00:00<00:00, 30234.17it/s][A

100%|███████████████████████████████████████| 74/74 [00:00<00:00, 139183.18it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 74235.47it/s][A

100%|███████████████████████████████████████| 12/12 [00:00<00:00, 445412.81it/s][A

100%|██████████████████████████████████████| 37/37 [00:00<00:00, 1149549.99it/s][A

100%|███████████████████████████████████████████| 1/1 [00:00<00:00, 3744.91it/s][A

100%|████████████████████████████████| 45867/45867 [00:00<00:00, 4780343.44it/s][A

100%|████████████████████████████████████| 833/833 [00:00<00:00, 4561168.71it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 58254.22it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 117597.31it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00

100%|█████████████████████████████████████████| 12/12 [00:00<00:00, 8311.04it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 75573.05it/s][A

100%|████████████████████████████████████| 244/244 [00:00<00:00, 3457466.81it/s][A

100%|█████████████████████████████████████████| 8/8 [00:00<00:00, 294337.12it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 40721.40it/s][A

100%|█████████████████████████████████████████| 8/8 [00:00<00:00, 294337.12it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 116508.44it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 37117.73it/s][A

100%|████████████████████████████████████| 389/389 [00:00<00:00, 3821040.41it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 112347.43it/s][A

100%|███████████████████████████████████████| 29/29 [00:00<00:00, 914547.49it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 74235.47it/s][A

100%|█████████████████████████████████████████| 10/10 [00:00<00:00, 8430.76it/s][A
 11%|████▌                                   | 361/3164 [00:04<00:37, 74.17it/s]
100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 36472.21it/s][A

100%|██████████████████████████████████████| 43/43 [00:00<00:00, 1243828.08it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 153919.41it/s][A

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 187245.71it/s][A

100%|██████████████████████████████████████| 71/71 [00:00<00:00, 1793949.30it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39568.91it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38479.85it/s][A

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 145635.56it/s][A

100%|███████████████████████████████████████| 10/10 [00:00<00:00, 3524

100%|█████████████████████████████████████████| 20/20 [00:00<00:00, 6499.77it/s][A

100%|██████████████████████████████████████| 44/44 [00:00<00:00, 1206205.07it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 72944.42it/s][A

100%|████████████████████████████████████████| 16/16 [00:00<00:00, 11123.63it/s][A

100%|███████████████████████████████████████| 32/32 [00:00<00:00, 951898.78it/s][A

100%|███████████████████████████████████████| 29/29 [00:00<00:00, 862658.27it/s][A

100%|███████████████████████████████████████| 10/10 [00:00<00:00, 364722.09it/s][A

100%|████████████████████████████████████████| 15/15 [00:00<00:00, 36900.04it/s][A

100%|██████████████████████████████████████| 48/48 [00:00<00:00, 1342177.28it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38130.04it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 74898.29it/s][A

100%|█████████████████████████████████████████| 9/9 [00:00<00:00,

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 115439.56it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39945.75it/s][A

100%|█████████████████████████████████████████| 7/7 [00:00<00:00, 259824.14it/s][A

100%|██████████████████████████████████████| 48/48 [00:00<00:00, 1360314.81it/s][A

100%|████████████████████████████████████████| 13/13 [00:00<00:00, 12283.39it/s][A
 17%|██████▊                                | 551/3164 [00:05<00:13, 188.41it/s]
100%|██████████████████████████████████| 6184/6184 [00:00<00:00, 5140225.12it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38836.15it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 73584.28it/s][A

100%|████████████████████████████████████| 549/549 [00:00<00:00, 4171508.87it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 76260.07it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 748

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 74898.29it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 79137.81it/s][A

100%|████████████████████████████████████████| 31/31 [00:00<00:00, 56165.63it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 37786.52it/s][A

100%|████████████████████████████████████| 179/179 [00:00<00:00, 2780668.21it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39945.75it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 71697.50it/s][A

100%|████████████████████████████████████| 111/111 [00:00<00:00, 2293437.16it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39568.91it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 40329.85it/s][A

100%|████████████████████████████████████| 615/615 [00:00<00:00, 3914259.42it/s][A

100%|███████████████████████████████████████| 29/29 [00:00<00:00,

100%|█████████████████████████████████████████| 9/9 [00:00<00:00, 331129.26it/s][A

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 185588.67it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 112347.43it/s][A

100%|██████████████████████████████████████| 34/34 [00:00<00:00, 1033379.25it/s][A

100%|████████████████████████████████████| 408/408 [00:00<00:00, 3811305.19it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39568.91it/s][A

100%|████████████████████████████████████████| 65/65 [00:00<00:00, 21119.36it/s][A

100%|██████████████████████████████████████| 39/39 [00:00<00:00, 1168413.26it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 76959.71it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 148470.94it/s][A

100%|████████████████████████████████████| 410/410 [00:00<00:00, 4027317.66it/s][A

100%|████████████████████████████████████| 900/900 [00:00<00:00, 

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39568.91it/s][A

100%|███████████████████████████████████████| 13/13 [00:00<00:00, 466033.78it/s][A

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 187245.71it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39568.91it/s][A

100%|███████████████████████████████████████| 14/14 [00:00<00:00, 489335.47it/s][A

100%|███████████████████████████████████████| 14/14 [00:00<00:00, 493447.53it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39945.75it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38130.04it/s][A

100%|███████████████████████████████████████| 19/19 [00:00<00:00, 658609.72it/s][A

100%|███████████████████████████████████████| 11/11 [00:00<00:00, 401194.30it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 73584.28it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39945.75it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39199.10it/s][A

100%|██████████████████████████████████████| 35/35 [00:00<00:00, 1087412.15it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38836.15it/s][A

100%|██████████████████████████████████| 2971/2971 [00:00<00:00, 4516591.95it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 37117.73it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38479.85it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38479.85it/s][A

100%|█████████████████████████████████████████| 6/6 [00:00<00:00, 224694.86it/s][A
 29%|███████████▍                           | 929/3164 [00:09<00:11, 202.06it/s]
100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 37117.73it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 361

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 115439.56it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 76260.07it/s][A

100%|█████████████████████████████████████████| 8/8 [00:00<00:00, 296941.88it/s][A

100%|███████████████████████████████████████| 23/23 [00:00<00:00, 765626.92it/s][A

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 188932.61it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 151146.09it/s][A

100%|███████████████████████████████████████| 11/11 [00:00<00:00, 397735.72it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 152520.15it/s][A

100%|█████████████████████████████████████| 113/113 [00:00<00:00, 431654.24it/s][A

100%|████████████████████████████████████| 2825/2825 [00:00<00:00, 33704.28it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 35848.75it/s][A
 32%|████████████▎                         | 1025/3164 [00:09<00:0

  0%|                                                | 0/568530 [00:00<?, ?it/s][A
100%|███████████████████████████████| 568530/568530 [00:02<00:00, 270755.76it/s][A

100%|███████████████████████████████████████| 24/24 [00:00<00:00, 613800.59it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 67650.06it/s][A

100%|███████████████████████████████████████| 24/24 [00:00<00:00, 724196.37it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 37449.14it/s][A

100%|█████████████████████████████████████████| 10/10 [00:00<00:00, 2303.68it/s][A

100%|██████████████████████████████████████| 51/51 [00:00<00:00, 1371214.77it/s][A

100%|███████████████████████████████████████| 21/21 [00:00<00:00, 615946.74it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 32768.00it/s][A

100%|███████████████████████████████████████████| 5/5 [00:00<00:00, 4582.94it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00,

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 70492.50it/s][A

100%|█████████████████████████████████████████| 8/8 [00:00<00:00, 281970.02it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39199.10it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 110376.42it/s][A

100%|██████████████████████████████████████| 88/88 [00:00<00:00, 2097152.00it/s][A

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 188932.61it/s][A

100%|███████████████████████████████████████| 19/19 [00:00<00:00, 647900.62it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 76260.07it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38836.15it/s][A

100%|████████████████████████████████████| 196/196 [00:00<00:00, 3236549.54it/s][A

100%|███████████████████████████████████████| 32/32 [00:00<00:00, 979691.45it/s][A

100%|████████████████████████████████████| 126/126 [00:00<00:00, 

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 79891.50it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38836.15it/s][A

100%|██████████████████████████████████████████| 7/7 [00:00<00:00, 12488.36it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 19972.88it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 19972.88it/s][A

100%|████████████████████████████████████| 161/161 [00:00<00:00, 1507328.00it/s][A

100%|███████████████████████████████████████████| 1/1 [00:00<00:00, 3738.24it/s][A

100%|███████████████████████████████████████████| 1/1 [00:00<00:00, 3688.92it/s][A

100%|███████████████████████████████████████████| 2/2 [00:00<00:00, 3440.77it/s][A

100%|███████████████████████████████████████████| 1/1 [00:00<00:00, 3708.49it/s][A

100%|██████████████████████████████████████████| 7/7 [00:00<00:00, 24987.34it/s][A

100%|███████████████████████████████████████| 76/76 [00:00<00:00,

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 19508.39it/s][A

100%|███████████████████████████████████████| 87/87 [00:00<00:00, 947803.76it/s][A

100%|███████████████████████████████████████████| 6/6 [00:00<00:00, 5515.19it/s][A

100%|█████████████████████████████████████| 264/264 [00:00<00:00, 735256.48it/s][A

100%|████████████████████████████████████| 347/347 [00:00<00:00, 2047009.13it/s][A

100%|█████████████████████████████████████████| 9/9 [00:00<00:00, 173957.31it/s][A

100%|███████████████████████████████████████| 29/29 [00:00<00:00, 471452.78it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 19972.88it/s][A

100%|███████████████████████████████████████| 24/24 [00:00<00:00, 417690.02it/s][A

100%|█████████████████████████████████████████| 8/8 [00:00<00:00, 141579.88it/s][A

100%|██████████████████████████████████████████| 3/3 [00:00<00:00, 11618.57it/s][A

100%|███████████████████████████████████████████| 1/1 [00:00<00:0

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 102801.57it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 103991.01it/s][A

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 177724.75it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 37786.52it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 74235.47it/s][A

100%|██████████████████████████████████████| 54/54 [00:00<00:00, 1424480.60it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 143395.01it/s][A

100%|████████████████████████████████████████| 15/15 [00:00<00:00, 34549.46it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 49932.19it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 124275.67it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 52758.54it/s][A

100%|███████████████████████████████████████| 31/31 [00:00<00:00,

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 36157.79it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 55188.21it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 74235.47it/s][A

100%|█████████████████████████████████████████| 9/9 [00:00<00:00, 325420.14it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 109416.63it/s][A

100%|███████████████████████████████████████| 15/15 [00:00<00:00, 499321.90it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 71697.50it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 142179.80it/s][A

100%|███████████████████████████████████████| 16/16 [00:00<00:00, 383479.22it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 34379.54it/s][A

100%|██████████████████████████████████| 3185/3185 [00:00<00:00, 4967965.13it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00

100%|████████████████████████████████████████| 12/12 [00:00<00:00, 29764.43it/s][A

100%|███████████████████████████████████████████| 3/3 [00:00<00:00, 9634.70it/s][A

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 149796.57it/s][A

100%|███████████████████████████████████████| 10/10 [00:00<00:00, 242445.32it/s][A

100%|█████████████████████████████████████████| 7/7 [00:00<00:00, 190650.18it/s][A

  0%|                                                    | 0/54 [00:00<?, ?it/s][A
100%|██████████████████████████████████████████| 54/54 [00:00<00:00, 320.01it/s][A

100%|█████████████████████████████████████████| 9/9 [00:00<00:00, 218200.79it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 37786.52it/s][A

100%|█████████████████████████████████████████| 6/6 [00:00<00:00, 206277.25it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38130.04it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 

100%|█████████████████████████████████████████| 6/6 [00:00<00:00, 216946.76it/s][A

100%|███████████████████████████████████████| 15/15 [00:00<00:00, 519955.04it/s][A

100%|██████████████████████████████████████| 67/67 [00:00<00:00, 1778597.27it/s][A

100%|██████████████████████████████████████| 54/54 [00:00<00:00, 1530354.16it/s][A

100%|███████████████████████████████████████| 14/14 [00:00<00:00, 493447.53it/s][A

100%|███████████████████████████████████████| 15/15 [00:00<00:00, 533174.24it/s][A

100%|███████████████████████████████████████| 21/21 [00:00<00:00, 699050.67it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 36792.14it/s][A

100%|█████████████████████████████████████████| 9/9 [00:00<00:00, 304425.29it/s][A

100%|██████████████████████████████████████| 82/82 [00:00<00:00, 1954164.36it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38130.04it/s][A

100%|████████████████████████████████████| 212/212 [00:00<00:00, 

100%|███████████████████████████████████████| 22/22 [00:00<00:00, 562650.54it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 61680.94it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 118149.41it/s][A

100%|████████████████████████████████████| 304/304 [00:00<00:00, 3502935.21it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 29959.31it/s][A

100%|██████████████████████████████████████| 74/74 [00:00<00:00, 1815078.92it/s][A

100%|████████████████████████████████████| 114/114 [00:00<00:00, 2026062.10it/s][A

100%|██████████████████████████████████████| 97/97 [00:00<00:00, 1792279.68it/s][A

100%|███████████████████████████████████████| 28/28 [00:00<00:00, 857230.01it/s][A

100%|██████████████████████████████████████| 51/51 [00:00<00:00, 1336934.40it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 151146.09it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00

100%|████████████████████████████████████| 143/143 [00:00<00:00, 2607762.92it/s][A

100%|██████████████████████████████████████| 54/54 [00:00<00:00, 1480342.59it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38479.85it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 30174.85it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38130.04it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 74898.29it/s][A

100%|███████████████████████████████████████| 38/38 [00:00<00:00, 910763.15it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38479.85it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 111353.20it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 28926.23it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 30615.36it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00

100%|████████████████████████████████████████| 22/22 [00:00<00:00, 83582.14it/s][A

100%|███████████████████████████████████████████| 1/1 [00:00<00:00, 3560.53it/s][A

100%|███████████████████████████████████████| 52/52 [00:00<00:00, 186095.40it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 35696.20it/s][A

100%|██████████████████████████████████████████| 4/4 [00:00<00:00, 68759.08it/s][A

100%|████████████████████████████████████| 609/609 [00:00<00:00, 1208864.71it/s][A

100%|████████████████████████████████████████| 12/12 [00:00<00:00, 44073.25it/s][A

100%|██████████████████████████████████████████| 4/4 [00:00<00:00, 15307.68it/s][A

100%|███████████████████████████████████████| 96/96 [00:00<00:00, 342975.45it/s][A

100%|█████████████████████████████████████████| 7/7 [00:00<00:00, 225847.14it/s][A

100%|██████████████████████████████████████| 49/49 [00:00<00:00, 1361065.54it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 36472.21it/s][A

100%|███████████████████████████████████████| 14/14 [00:00<00:00, 383792.52it/s][A

100%|██████████████████████████████████████| 51/51 [00:00<00:00, 1398101.33it/s][A

100%|██████████████████████████████████████| 41/41 [00:00<00:00, 1154137.34it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 72315.59it/s][A

100%|███████████████████████████████████████| 17/17 [00:00<00:00, 398341.72it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38479.85it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 26379.27it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 101475.10it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 110376.42it/s][A

100%|██████████████████████████████████████| 55/55 [00:00<00:00, 1460042.53it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 144631.17it/s][A

100%|███████████████████████████████████████████| 2/2 [00:00<00:00, 6255.49it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38130.04it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 103991.01it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00, 109416.63it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 134217.73it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 37786.52it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 74235.47it/s][A

100%|███████████████████████████████████████| 11/11 [00:00<00:00, 397735.72it/s][A

100%|█████████████████████████████████████████| 8/8 [00:00<00:00, 189573.06it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 72944.42it/s][A

100%|██████████████████████████████████████████| 6/6 [00:00<00:00

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 75573.05it/s][A

100%|███████████████████████████████████████| 20/20 [00:00<00:00, 514638.53it/s][A

100%|███████████████████████████████████████| 11/11 [00:00<00:00, 390994.44it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 59074.70it/s][A

100%|██████████████████████████████████████████| 3/3 [00:00<00:00, 89240.51it/s][A

100%|██████████████████████████████████████████| 3/3 [00:00<00:00, 75346.78it/s][A

100%|██████████████████████████████████████| 43/43 [00:00<00:00, 1202367.15it/s][A

100%|██████████████████████████████████| 9728/9728 [00:00<00:00, 4904698.80it/s][A

100%|███████████████████████████████████████| 15/15 [00:00<00:00, 393216.00it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 29746.84it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 74235.47it/s][A

100%|████████████████████████████████████████| 94/94 [00:00<00:00

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 33288.13it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 29959.31it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38130.04it/s][A

100%|███████████████████████████████████████| 10/10 [00:00<00:00, 352462.52it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 70492.50it/s][A

100%|██████████████████████████████████████████| 3/3 [00:00<00:00, 85598.04it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 29537.35it/s][A

100%|██████████████████████████████████████████| 2/2 [00:00<00:00, 62137.84it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 34952.53it/s][A

100%|█████████████████████████████████████████| 5/5 [00:00<00:00, 177724.75it/s][A

100%|██████████████████████████████████████| 65/65 [00:00<00:00, 1323445.44it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38479.85it/s][A

100%|█████████████████████████████████████████| 8/8 [00:00<00:00, 294337.12it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 39199.10it/s][A

100%|██████████████████████████████████████| 90/90 [00:00<00:00, 1534501.46it/s][A

100%|██████████████████████████████████████| 75/75 [00:00<00:00, 1883669.46it/s][A

100%|██████████████████████████████████████| 46/46 [00:00<00:00, 1330606.79it/s][A

100%|█████████████████████████████████████████| 7/7 [00:00<00:00, 225847.14it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38479.85it/s][A

100%|█████████████████████████████████████████| 4/4 [00:00<00:00, 138654.68it/s][A

100%|████████████████████████████████████████| 42/42 [00:00<00:00, 59094.52it/s][A

100%|██████████████████████████████████████████| 1/1 [00:00<00:00, 38130.04it/s][A

100%|█████████████████████████████████████████| 3/3 [00:00<00:00,

In [19]:
len(all_samples)
len(all_labels)

681

In [20]:
len(all_samples[0])

38

In [18]:
import math

dummy_features = (math.floor(np.sqrt(38))+1)**2 - 38
print(dummy_features)
square_size = int(np.sqrt(dummy_features+38))
print(square_size)

11
7


In [30]:
xx = np.zeros((len(all_samples),38))# 1, square_size, square_size))
yy = np.zeros((len(all_samples), 2))

for i in range(len(all_samples)):
    #data = np.zeros(dummy_features+38)
    #data[:38] = all_samples[i]
    #data[38:] = np.zeros((dummy_features))
    #xx[i,:,:] = data.reshape(1, square_size, square_size)
    xx[i,:] = all_samples[i]
    yy[i,:] = all_labels[i]
    print(all_samples[i])
    
x_mean = np.mean(xx, axis=0)
y_mean = np.mean(yy, axis=0)
xx = xx-x_mean
yy = yy-y_mean

[0.0, 0.0, 0.0, 0.0, 0.0, 10.0, 0.0, 15.0, 0.0, 1.0, 0.0, 0.0, 0.0, 82.0, 0.0, 32.0, 0.0, 21.0, 0.0, 190.0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 733]
[0.0, 1.0, 0.0, 25.0, 0.0, 212.0, 0.0, 36.0, 0.0, 1009.0, -0.06250000000000006, 34962.0, 0.03333333333333337, 4928.0, 0.03225806451612906, 17660.0, 0.0, 16149.0, 0.0, 39908.0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 733]
[0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 1.0, 0.0, 3.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 733]
[0.0, 50.0, 0.0, 183.0, 0.0, 192.0, 0.0, 585.0, 0.0, 1031.0, 0.0, 851.0, 0.0, 4072.0, 0.0, 9794.0, 0.0, 1883.0, 0.0, 1627.0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 733]
[0.0, 295.0, 0.0, 1864.0, 0.0, 1764.0, 0.0, 254.0, 0.0, 208.0, 0.0, 610.0, 0.0, 329.0, 0.0, 10214.0, 0.0, 10521.0, 0.0, 82865.0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 733]
[0.4000000000000001, 2574.0, -0.28571428571428575, 7466.0, 4.25, 516.0, -0.838095

In [31]:
np.save(os.getcwd() + "/data/xx-38.npy", xx)
np.save(os.getcwd() + "/data/yy-38.npy", yy)

In [32]:
x_mean.shape

(38,)