In [1]:
import os
import webdataset as wds
import logging
import numpy
import json
import torch
import numpy as np
import pandas as pd
from tqdm import tqdm
from pathlib import Path
from typing import Optional
from itertools import islice

from torch.utils.data import DataLoader, IterableDataset
from webdataset.filters import pipelinefilter
from webdataset.utils import pytorch_worker_info


In [29]:
!ls YandexCup2024v2/YaCupTrain/0/
!ls YandexCup2024v2/YaCupTest/0/


control.csv		       localization.csv		   quant20mc
control_norm_v1.csv	       localization-quant20mc.csv
control_norm_v1-quant20mc.csv  metadata.json
control.csv		       metadata.json
control_norm_v1.csv	       quant20mc
control_norm_v1-quant20mc.csv  requested_stamps.csv
localization.csv	       requested_stamps-quant20mc.csv
localization-quant20mc.csv


In [30]:
!head YandexCup2024v2/YaCupTrain/0/control_norm_v1-quant20mc.csv

stamp_ns,acceleration_level,steering,norm_acceleration_level,norm_steering
0.0,-114.0,-2.655139533023165,-0.4514997100029219,-0.0615109367890647
1.0,-118.51124043222295,-2.6265831542518203,-0.4812146939425406,-0.06101266412300235
2.0,-123.02273633437042,-2.5980333021733926,-0.5109313606310214,-0.060514505339470656
3.0,-127.58524197730276,-2.57078663642703,-0.5409840221863152,-0.06003908550800475
4.0,-132.14585451381703,-2.5444222994575325,-0.5710242140832847,-0.0595790611969412
5.0,-136.64990027292015,-2.5444222994575325,-0.6006918075990458,-0.0595790611969412
6.0,-141.10246811465205,-2.5434682242216784,-0.6300203224266029,-0.05956241379163819
7.0,-144.10040882917525,-2.5155545556234253,-0.6497673879005857,-0.05907535560462499
8.0,-147.08219304041114,-2.487715056006009,-0.6694080324814873,-0.05858959157245253


In [31]:
!head YandexCup2024v2/YaCupTrain/0/localization-quant20mc.csv

stamp_ns,x,y,z,roll,pitch,yaw
-149.0,-4292.346493792404,-14527.351865581526,66.04828378656846,0.0038841648135669667,-0.054192977118628395,-1.9368185091788004
-148.0,-4292.434627804271,-14527.581805518565,66.06164121751011,0.0037722121488635474,-0.0541798604632994,-1.9368425656572617
-147.0,-4292.522253342697,-14527.81156859566,66.07382280575607,0.0034592108718404678,-0.05425698778655318,-1.9368518636282488
-146.0,-4292.609022484208,-14528.041033796213,66.08402397974696,0.0028075932652278372,-0.054486108622434,-1.9368363045680264
-145.0,-4292.696232114875,-14528.270457198889,66.09546114109773,0.002455461353684493,-0.05461626036609381,-1.9368380534109395
-144.0,-4292.7841572669495,-14528.499812705968,66.1089060145706,0.0025898077670152724,-0.054585648777846066,-1.9368679168511878
-143.0,-4292.871967887383,-14528.729133961555,66.12196841585748,0.0027456198291566087,-0.05449949224467743,-1.9368931484338072
-142.0,-4292.958891041339,-14528.958189814079,66.13206717112308,0.003067761854690518

In [32]:
!head YandexCup2024v2/YaCupTrain/0/metadata.json

{"ride_date": "2022-03-14", "tires": {"front": 0, "rear": 0}, "vehicle_id": 0, "vehicle_model": 0, "vehicle_model_modification": 0, "location_reference_point_id": 0}

In [5]:
os.listdir('YandexCup2024v2/YaCupTest/0')

['metadata.json',
 'control.csv',
 'localization.csv',
 'requested_stamps.csv',
 'control_norm_v1.csv',
 'control_norm_v1-quant20mc.csv',
 'localization-quant20mc.csv',
 'requested_stamps-quant20mc.csv',
 'quant20mc']

In [2]:
def configure_logging(log_level='INFO'):
    handlers =  {
            "base_out": {
                "class": "logging.StreamHandler",
                "formatter": "basic",
                "stream": "ext://sys.stderr",
            }
    }
    CONFIG = {
        "version": 1,
        "disable_existing_loggers": False,
        "formatters": {"basic": {"format": '%(asctime)s %(name)s %(pathname)s:%(lineno)d - %(levelname)s - %(message)s'}},
        "handlers": handlers,
        "loggers": {"base": {"handlers": handlers.keys(), "level": log_level}},
        "root": {"handlers": handlers.keys(), "level": log_level}
    }
    logging.config.dictConfig(CONFIG)
configure_logging()


In [10]:
class DirLoader(IterableDataset):
    def __init__(self, root_dir, 
                 control_bname='control_norm_v1-quant20mc.csv',
                loc_bname='localization-quant20mc.csv',
                req_bname=None,
                meta_bname='metadata.json',
                start_bname='quant20mc',
                seed=None,
                pad_value= -1000000):
        super().__init__()
        self.root_dir = root_dir
        self.control_bname = control_bname
        self.loc_bname = loc_bname
        self.req_bname = req_bname
        self.meta_bname = meta_bname
        self.start_bname = start_bname
        self.seed = seed
        self.pad_value = pad_value
        self.dirlist = [*os.listdir(root_dir)]

    def __len__(self):
        return len(self.dirlist)

    def __iter__(self):
        dirlist = self.dirlist
        rank, world_size, worker, num_workers = pytorch_worker_info()
        assert world_size == 1, "Do not use this class for DDP"
        if num_workers > 1:
            full_len = len(dirlist)
            dirlist = list(islice(dirlist, worker, None, num_workers))
            logging.info(
                f"Subset for {worker} worker contains {len(dirlist)}/{full_len} annotations"
            )
            logging.debug(f"First dir is {dirlist[0]}")
        if len(dirlist) == 0:
            logging.warning(
                f"Zero len dirs list! {worker=}, {num_workers=}, {len(dirlist)=}, {len(self.dirlist)}"
            )
            return

        if self.seed is not None:
            random.Random(self.seed).shuffle(dirlist)
        for dbname in dirlist:
            d = f'{self.root_dir}/{dbname}'
            control_df = pd.read_csv(f"{d}/{self.control_bname}")
            loc_df = pd.read_csv(f"{d}/{self.loc_bname}")
            df = control_df.set_index('stamp_ns').join(loc_df.set_index('stamp_ns'))
            df = df.fillna(self.pad_value)
            with open(f"{d}/{self.meta_bname}") as f:
                meta = json.load(f)
            assert np.allclose(df.index, np.arange(len(df))), f"{len(df)=}, \n{df.stamp_ns=}"
            out = {
                '__key__': f"{Path(self.root_dir).stem}__{Path(d).stem}",
                'stamps.pth': torch.from_numpy(df.index.values),
                'c_stamps.pth': torch.from_numpy(control_df.stamp_ns.values),
                'acceleration_level.pth': torch.from_numpy(df.norm_acceleration_level.values),
                'steering.pth' : torch.from_numpy(df.norm_steering.values),
                'l_stamps.pth': torch.from_numpy(loc_df.stamp_ns.values),
                'x.pth': torch.from_numpy(df.x.values),
                'y.pth': torch.from_numpy(df.y.values),
                'z.pth': torch.from_numpy(df.z.values),
                'roll.pth': torch.from_numpy(df.roll.values),
                'pitch.pth': torch.from_numpy(df.pitch.values),
                'yaw.pth': torch.from_numpy(df.yaw.values),
                'ride_date.txt': meta['ride_date'],
                "tires.pickle": meta['tires'],
                "vehicle_id.id": meta['vehicle_id'], 
                "vehicle_model.id": meta['vehicle_model'], 
                "vehicle_model_modification.id": meta['vehicle_model_modification'], 
                "location_reference_point_id.id": meta['location_reference_point_id']
            }
            if self.req_bname is not None:
                req_df = pd.read_csv(f"{d}/{self.req_bname}")
                out['req_stamps.pth'] = torch.from_numpy(req_df.stamp_ns.values)
            if self.start_bname is not None:
                with open(f"{d}/{self.start_bname}") as f:
                    start_ns = int(float(f.read()))
                out['start_ns.id'] = start_ns
            yield out

In [11]:
def _prepare_input_feats_v1(data):
    for e in data:
        T = e['stamps.pth'].shape[0]
        al = e.pop('acceleration_level.pth')
        s = e.pop('steering.pth')
        # 4 X T
        e['control_feats.pth'] = torch.stack([al, 
                                    s, 
                                    torch.full((T,), e['vehicle_model.id']),
                                    torch.full((T,), e['vehicle_model_modification.id'])
                                    ])
        x = e.pop('x.pth')
        y = e.pop('y.pth')
        z = e.pop('z.pth')
        roll = e.pop('roll.pth')
        pitch = e.pop('pitch.pth')
        yaw = e.pop('yaw.pth')
        e['loc.pth'] =  torch.stack([x, 
                               y,
                               z,
                               roll,
                               pitch,
                               yaw])
        yield e
        
prepare_input_feats_v1  = pipelinefilter(_prepare_input_feats_v1)

In [73]:
#!rm -rf exp_v1

In [74]:
for d in ['YandexCup2024v2/YaCupTrain/']:
    out_d = f'exp_v1/{d}'
    os.makedirs(out_d, exist_ok=True)
    max_elements_per_shard=50
    num_e = len(os.listdir(d))
    with wds.ShardWriter(f'{out_d}/dump-%06d.tar', maxcount=400) as sink:
        for e in tqdm(
            _prepare_input_feats_v1(
                DataLoader(
                    DirLoader(d, seed=42), 
                    batch_size=None, 
                    num_workers=6,
                    sampler=None
                )
            ), 
            total=num_e
        ):
            sink.write(e)
    print(f'Done {out_d}')

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000000.tar 0 0.0 GB 0


  0%|                                                                                                                                                                                                                                                    | 0/8000 [00:00<?, ?it/s]2024-10-26 00:18:33,416 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 0 worker contains 1334/8000 annotations
2024-10-26 00:18:33,416 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 1 worker contains 1334/8000 annotations
2024-10-26 00:18:33,444 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 2 worker contains 1333/8000 annotations
2024-10-26 00:18:33,472 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 4 worker contains 1333/8000 annotations
2024-10-26 00:18:33,474 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 3 worker contains 1333/8000 annotations
2024-10-26 00:18:33,488 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset fo

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000001.tar 400 0.0 GB 400


 10%|███████████████████████▊                                                                                                                                                                                                                 | 816/8000 [00:09<00:58, 122.28it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000002.tar 400 0.0 GB 800


 15%|███████████████████████████████████▎                                                                                                                                                                                                    | 1217/8000 [00:12<00:51, 131.16it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000003.tar 400 0.0 GB 1200


 20%|███████████████████████████████████████████████                                                                                                                                                                                          | 1616/8000 [00:16<01:15, 85.03it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000004.tar 400 0.0 GB 1600


 25%|██████████████████████████████████████████████████████████▊                                                                                                                                                                              | 2020/8000 [00:21<01:03, 94.61it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000005.tar 400 0.0 GB 2000


 30%|██████████████████████████████████████████████████████████████████████▎                                                                                                                                                                 | 2424/8000 [00:25<00:46, 120.13it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000006.tar 400 0.0 GB 2400


 35%|█████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                      | 2818/8000 [00:28<00:41, 125.04it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000007.tar 400 0.0 GB 2800


 40%|█████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                          | 3221/8000 [00:32<00:42, 111.67it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000008.tar 400 0.0 GB 3200


 45%|█████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                                | 3609/8000 [00:36<00:57, 76.18it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000009.tar 400 0.0 GB 3600


 50%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                                                                                   | 4020/8000 [00:41<00:31, 126.70it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000010.tar 400 0.0 GB 4000


 55%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                       | 4421/8000 [00:45<00:30, 118.17it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000011.tar 400 0.0 GB 4400


 60%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                            | 4815/8000 [00:48<00:26, 122.23it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000012.tar 400 0.0 GB 4800


 65%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                | 5217/8000 [00:52<00:26, 105.76it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000013.tar 400 0.0 GB 5200


 70%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                     | 5619/8000 [00:56<00:18, 125.68it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000014.tar 400 0.0 GB 5600


 75%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                         | 6017/8000 [00:59<00:16, 116.96it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000015.tar 400 0.0 GB 6000


 80%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                              | 6414/8000 [01:04<00:19, 80.65it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000016.tar 400 0.0 GB 6400


 85%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                  | 6821/8000 [01:08<00:10, 110.39it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000017.tar 400 0.0 GB 6800


 90%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                       | 7210/8000 [01:12<00:07, 101.23it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000018.tar 400 0.0 GB 7200


 95%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊           | 7616/8000 [01:17<00:03, 112.23it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000019.tar 400 0.0 GB 7600


100%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 8000/8000 [01:21<00:00, 98.63it/s]


Done exp_v1/YandexCup2024v2/YaCupTest/
# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000000.tar 0 0.0 GB 0


  0%|                                                                                                                                                                                                                                                   | 0/42000 [00:00<?, ?it/s]2024-10-26 00:19:54,579 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 0 worker contains 7000/42000 annotations
2024-10-26 00:19:54,578 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 1 worker contains 7000/42000 annotations
2024-10-26 00:19:54,578 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 2 worker contains 7000/42000 annotations
2024-10-26 00:19:54,634 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 3 worker contains 7000/42000 annotations
2024-10-26 00:19:54,634 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subset for 4 worker contains 7000/42000 annotations
2024-10-26 00:19:54,667 root /tmp/ipykernel_353021/3015727835.py:29 - INFO - Subs

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000001.tar 400 0.1 GB 400


  2%|████▌                                                                                                                                                                                                                                    | 813/42000 [00:10<07:27, 92.06it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000002.tar 400 0.1 GB 800


  3%|██████▋                                                                                                                                                                                                                                 | 1213/42000 [00:15<07:47, 87.22it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000003.tar 400 0.1 GB 1200


  4%|████████▉                                                                                                                                                                                                                               | 1617/42000 [00:20<06:52, 97.98it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000004.tar 400 0.1 GB 1600


  5%|███████████                                                                                                                                                                                                                             | 2011/42000 [00:24<06:51, 97.09it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000005.tar 400 0.1 GB 2000


  6%|█████████████▎                                                                                                                                                                                                                          | 2414/42000 [00:30<08:23, 78.66it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000006.tar 400 0.1 GB 2400


  7%|███████████████▌                                                                                                                                                                                                                        | 2807/42000 [00:35<07:50, 83.31it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000007.tar 400 0.1 GB 2800


  8%|█████████████████▊                                                                                                                                                                                                                      | 3217/42000 [00:40<07:25, 87.09it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000008.tar 400 0.1 GB 3200


  9%|███████████████████▉                                                                                                                                                                                                                    | 3605/42000 [00:45<08:35, 74.44it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000009.tar 400 0.1 GB 3600


 10%|██████████████████████▏                                                                                                                                                                                                                 | 4009/42000 [00:50<09:51, 64.21it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000010.tar 400 0.1 GB 4000


 11%|████████████████████████▍                                                                                                                                                                                                               | 4413/42000 [00:54<06:40, 93.86it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000011.tar 400 0.1 GB 4400


 11%|██████████████████████████▍                                                                                                                                                                                                            | 4815/42000 [00:59<05:41, 108.87it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000012.tar 400 0.1 GB 4800


 12%|████████████████████████████▊                                                                                                                                                                                                           | 5213/42000 [01:04<08:19, 73.60it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000013.tar 400 0.1 GB 5200


 13%|██████████████████████████████▉                                                                                                                                                                                                         | 5611/42000 [01:08<07:32, 80.40it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000014.tar 400 0.1 GB 5600


 14%|█████████████████████████████████▏                                                                                                                                                                                                      | 6011/42000 [01:13<08:05, 74.08it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000015.tar 400 0.1 GB 6000


 15%|███████████████████████████████████▎                                                                                                                                                                                                   | 6414/42000 [01:18<05:44, 103.44it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000016.tar 400 0.1 GB 6400


 16%|█████████████████████████████████████▋                                                                                                                                                                                                  | 6812/42000 [01:22<07:33, 77.58it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000017.tar 400 0.1 GB 6800


 17%|███████████████████████████████████████▊                                                                                                                                                                                                | 7215/42000 [01:26<05:58, 97.16it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000018.tar 400 0.1 GB 7200


 18%|██████████████████████████████████████████                                                                                                                                                                                              | 7610/42000 [01:31<06:29, 88.18it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000019.tar 400 0.1 GB 7600


 19%|████████████████████████████████████████████▏                                                                                                                                                                                           | 8008/42000 [01:36<07:04, 80.07it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000020.tar 400 0.1 GB 8000


 20%|██████████████████████████████████████████████▍                                                                                                                                                                                         | 8408/42000 [01:42<08:58, 62.43it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000021.tar 400 0.1 GB 8400


 21%|████████████████████████████████████████████████▋                                                                                                                                                                                       | 8819/42000 [01:47<06:03, 91.40it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000022.tar 400 0.1 GB 8800


 22%|██████████████████████████████████████████████████▊                                                                                                                                                                                     | 9209/42000 [01:52<06:49, 80.04it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000023.tar 400 0.1 GB 9200


 23%|█████████████████████████████████████████████████████                                                                                                                                                                                   | 9613/42000 [01:57<06:15, 86.18it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000024.tar 400 0.1 GB 9600


 24%|███████████████████████████████████████████████████████                                                                                                                                                                                | 10005/42000 [02:01<05:37, 94.70it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000025.tar 400 0.1 GB 10000


 25%|█████████████████████████████████████████████████████████▏                                                                                                                                                                             | 10407/42000 [02:07<07:35, 69.32it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000026.tar 400 0.1 GB 10400


 26%|███████████████████████████████████████████████████████████▍                                                                                                                                                                           | 10815/42000 [02:12<06:29, 80.02it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000027.tar 400 0.1 GB 10800


 27%|█████████████████████████████████████████████████████████████▋                                                                                                                                                                         | 11216/42000 [02:17<06:05, 84.16it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000028.tar 400 0.1 GB 11200


 28%|███████████████████████████████████████████████████████████████▊                                                                                                                                                                       | 11609/42000 [02:21<07:40, 66.04it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000029.tar 400 0.1 GB 11600


 29%|██████████████████████████████████████████████████████████████████                                                                                                                                                                     | 12009/42000 [02:26<07:17, 68.52it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000030.tar 400 0.1 GB 12000


 30%|████████████████████████████████████████████████████████████████████▎                                                                                                                                                                  | 12417/42000 [02:31<05:07, 96.22it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000031.tar 400 0.1 GB 12400


 31%|██████████████████████████████████████████████████████████████████████▏                                                                                                                                                               | 12814/42000 [02:35<04:23, 110.65it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000032.tar 400 0.1 GB 12800


 31%|████████████████████████████████████████████████████████████████████████▋                                                                                                                                                              | 13213/42000 [02:39<06:56, 69.05it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000033.tar 400 0.1 GB 13200


 32%|██████████████████████████████████████████████████████████████████████████▊                                                                                                                                                            | 13610/42000 [02:44<06:52, 68.79it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000034.tar 400 0.1 GB 13600


 33%|████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                         | 14014/42000 [02:50<04:33, 102.29it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000035.tar 400 0.1 GB 14000


 34%|███████████████████████████████████████████████████████████████████████████████▎                                                                                                                                                       | 14420/42000 [02:54<04:37, 99.40it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000036.tar 400 0.1 GB 14400


 35%|█████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                                     | 14811/42000 [02:59<05:58, 75.82it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000037.tar 400 0.1 GB 14800


 36%|███████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                                   | 15214/42000 [03:03<04:42, 94.97it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000038.tar 400 0.1 GB 15200


 37%|█████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                                 | 15614/42000 [03:08<05:21, 82.12it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000039.tar 400 0.1 GB 15600


 38%|████████████████████████████████████████████████████████████████████████████████████████                                                                                                                                               | 16014/42000 [03:13<05:15, 82.26it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000040.tar 400 0.1 GB 16000


 39%|██████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                                            | 16413/42000 [03:18<04:32, 93.93it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000041.tar 400 0.1 GB 16400


 40%|████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                                          | 16810/42000 [03:22<05:12, 80.64it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000042.tar 400 0.1 GB 16800


 41%|██████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                        | 17215/42000 [03:27<04:13, 97.76it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000043.tar 400 0.1 GB 17200


 42%|████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                                      | 17616/42000 [03:31<04:44, 85.71it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000044.tar 400 0.1 GB 17600


 43%|██████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                                   | 18022/42000 [03:36<03:28, 114.89it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000045.tar 400 0.1 GB 18000


 44%|████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                                 | 18413/42000 [03:40<03:40, 106.81it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000046.tar 400 0.1 GB 18400


 45%|███████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                               | 18812/42000 [03:45<05:04, 76.14it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000047.tar 400 0.1 GB 18800


 46%|█████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                                             | 19211/42000 [03:50<04:44, 80.17it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000048.tar 400 0.1 GB 19200


 47%|███████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                                           | 19616/42000 [03:55<04:15, 87.65it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000049.tar 400 0.1 GB 19600


 48%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                                         | 20013/42000 [03:59<05:04, 72.20it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000050.tar 400 0.1 GB 20000


 49%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                                                                      | 20419/42000 [04:04<04:27, 80.82it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000051.tar 400 0.1 GB 20400


 50%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                                                    | 20814/42000 [04:09<04:52, 72.33it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000052.tar 400 0.1 GB 20800


 51%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                                                                 | 21217/42000 [04:14<03:27, 100.20it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000053.tar 400 0.1 GB 21200


 51%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                                                                | 21607/42000 [04:19<05:29, 61.93it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000054.tar 400 0.1 GB 21600


 52%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                              | 22015/42000 [04:24<03:45, 88.76it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000055.tar 400 0.1 GB 22000


 53%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                           | 22410/42000 [04:28<02:58, 109.83it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000056.tar 400 0.1 GB 22400


 54%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                         | 22812/42000 [04:33<03:10, 100.52it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000057.tar 400 0.1 GB 22800


 55%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                       | 23214/42000 [04:38<04:36, 67.97it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000058.tar 400 0.1 GB 23200


 56%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                                     | 23617/42000 [04:44<03:03, 99.97it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000059.tar 400 0.1 GB 23600


 57%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                                   | 24008/42000 [04:49<04:15, 70.49it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000060.tar 400 0.1 GB 24000


 58%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                                | 24417/42000 [04:54<02:50, 103.03it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000061.tar 400 0.1 GB 24400


 59%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                              | 24818/42000 [04:58<02:48, 102.25it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000062.tar 400 0.1 GB 24800


 60%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                            | 25220/42000 [05:03<03:06, 89.79it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000063.tar 400 0.1 GB 25200


 61%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                                                          | 25617/42000 [05:07<02:52, 94.80it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000064.tar 400 0.1 GB 25600


 62%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                                        | 26011/42000 [05:12<03:20, 79.90it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000065.tar 400 0.1 GB 26000


 63%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                     | 26417/42000 [05:16<02:32, 102.50it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000066.tar 400 0.1 GB 26400


 64%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                                   | 26817/42000 [05:22<02:47, 90.88it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000067.tar 400 0.1 GB 26800


 65%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                                 | 27215/42000 [05:26<02:39, 92.96it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000068.tar 400 0.1 GB 27200


 66%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏                                                                              | 27613/42000 [05:31<02:21, 101.86it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000069.tar 400 0.1 GB 27600


 67%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                                             | 28019/42000 [05:35<02:36, 89.35it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000070.tar 400 0.1 GB 28000


 68%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                                          | 28412/42000 [05:39<02:36, 86.58it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000071.tar 400 0.1 GB 28400


 69%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                        | 28813/42000 [05:45<03:09, 69.67it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000072.tar 400 0.1 GB 28800


 70%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                                      | 29208/42000 [05:50<03:04, 69.50it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000073.tar 400 0.1 GB 29200


 70%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                                                    | 29609/42000 [05:56<02:36, 79.23it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000074.tar 400 0.1 GB 29600


 71%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                                 | 30020/42000 [06:01<01:55, 103.32it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000075.tar 400 0.1 GB 30000


 72%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▌                                                               | 30420/42000 [06:06<01:46, 108.40it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000076.tar 400 0.1 GB 30400


 73%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                             | 30812/42000 [06:10<03:38, 51.25it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000077.tar 400 0.1 GB 30800


 74%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                           | 31214/42000 [06:15<01:49, 98.20it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000078.tar 400 0.1 GB 31200


 75%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                                                         | 31614/42000 [06:21<02:33, 67.81it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000079.tar 400 0.1 GB 31600


 76%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                                       | 32013/42000 [06:26<01:52, 88.57it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000080.tar 400 0.1 GB 32000


 77%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                                    | 32414/42000 [06:31<01:41, 94.68it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000081.tar 400 0.1 GB 32400


 78%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                                  | 32810/42000 [06:36<01:53, 81.29it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000082.tar 400 0.1 GB 32800


 79%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                                | 33213/42000 [06:40<01:31, 95.68it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000083.tar 400 0.1 GB 33200


 80%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                              | 33611/42000 [06:45<02:05, 66.87it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000084.tar 400 0.1 GB 33600


 81%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                            | 34012/42000 [06:50<01:58, 67.40it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000085.tar 400 0.1 GB 34000


 82%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                                         | 34412/42000 [06:55<01:34, 80.67it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000086.tar 400 0.1 GB 34400


 83%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                                       | 34818/42000 [07:00<01:12, 99.11it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000087.tar 400 0.1 GB 34800


 84%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                                     | 35210/42000 [07:04<01:40, 67.55it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000088.tar 400 0.1 GB 35200


 85%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊                                   | 35609/42000 [07:10<01:31, 69.69it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000089.tar 400 0.1 GB 35600


 86%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                                 | 36015/42000 [07:15<01:01, 97.64it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000090.tar 400 0.1 GB 36000


 87%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                              | 36414/42000 [07:19<01:00, 93.01it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000091.tar 400 0.1 GB 36400


 88%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                            | 36814/42000 [07:24<00:55, 93.95it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000092.tar 400 0.1 GB 36800


 89%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋                          | 37213/42000 [07:29<00:49, 96.82it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000093.tar 400 0.1 GB 37200


 90%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉                        | 37618/42000 [07:34<00:45, 95.77it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000094.tar 400 0.1 GB 37600


 91%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████                      | 38011/42000 [07:39<01:04, 61.51it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000095.tar 400 0.1 GB 38000


 91%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▎                   | 38416/42000 [07:43<00:39, 91.61it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000096.tar 400 0.1 GB 38400


 92%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍                 | 38810/42000 [07:49<00:51, 62.41it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000097.tar 400 0.1 GB 38800


 93%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋               | 39210/42000 [07:54<00:31, 89.17it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000098.tar 400 0.1 GB 39200


 94%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▊             | 39607/42000 [07:58<00:26, 90.90it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000099.tar 400 0.1 GB 39600


 95%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████           | 40007/42000 [08:02<00:19, 103.32it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000100.tar 400 0.1 GB 40000


 96%|██████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▏        | 40408/42000 [08:07<00:23, 67.81it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000101.tar 400 0.1 GB 40400


 97%|████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▍      | 40808/42000 [08:12<00:14, 81.27it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000102.tar 400 0.1 GB 40800


 98%|█████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▋    | 41216/42000 [08:17<00:07, 101.66it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000103.tar 400 0.1 GB 41200


 99%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████▉  | 41617/42000 [08:22<00:03, 110.35it/s]

# writing exp_v1/YandexCup2024v2/YaCupTrain//dump-000104.tar 400 0.1 GB 41600


100%|███████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████████| 42000/42000 [08:27<00:00, 82.83it/s]

Done exp_v1/YandexCup2024v2/YaCupTrain/





In [12]:
for d in ['YandexCup2024v2/YaCupTest/']:
    out_d = f'exp_v1/{d}'
    os.makedirs(out_d, exist_ok=True)
    max_elements_per_shard=50
    num_e = len(os.listdir(d))
    with wds.ShardWriter(f'{out_d}/dump-%06d.tar', maxcount=400) as sink:
        for e in tqdm(
            _prepare_input_feats_v1(
                DataLoader(
                    DirLoader(d, req_bname='requested_stamps-quant20mc.csv', seed=None), 
                    batch_size=None, 
                    num_workers=6,
                    sampler=None
                )
            ), 
            total=num_e
        ):
            sink.write(e)
    print(f'Done {out_d}')

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000000.tar 0 0.0 GB 0


  0%|                                                                                                          | 0/8000 [00:00<?, ?it/s]2024-10-29 20:36:19,434 root /tmp/ipykernel_3958573/3831414468.py:31 - INFO - Subset for 0 worker contains 1334/8000 annotations
2024-10-29 20:36:19,449 root /tmp/ipykernel_3958573/3831414468.py:31 - INFO - Subset for 2 worker contains 1333/8000 annotations
2024-10-29 20:36:19,449 root /tmp/ipykernel_3958573/3831414468.py:31 - INFO - Subset for 1 worker contains 1334/8000 annotations
2024-10-29 20:36:19,452 root /tmp/ipykernel_3958573/3831414468.py:31 - INFO - Subset for 3 worker contains 1333/8000 annotations
2024-10-29 20:36:19,488 root /tmp/ipykernel_3958573/3831414468.py:31 - INFO - Subset for 4 worker contains 1333/8000 annotations
2024-10-29 20:36:19,488 root /tmp/ipykernel_3958573/3831414468.py:31 - INFO - Subset for 5 worker contains 1333/8000 annotations
  5%|█████                                                                                

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000001.tar 400 0.0 GB 400


 10%|█████████▊                                                                                     | 822/8000 [00:06<00:51, 138.46it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000002.tar 400 0.0 GB 800


 15%|██████████████▍                                                                                | 1211/8000 [00:10<01:30, 75.14it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000003.tar 400 0.0 GB 1200


 20%|███████████████████                                                                           | 1625/8000 [00:13<00:46, 137.76it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000004.tar 400 0.0 GB 1600


 25%|███████████████████████▊                                                                      | 2025/8000 [00:16<00:43, 136.23it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000005.tar 400 0.0 GB 2000


 30%|████████████████████████████▍                                                                 | 2415/8000 [00:19<00:39, 142.11it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000006.tar 400 0.0 GB 2400


 35%|█████████████████████████████████                                                             | 2818/8000 [00:22<00:37, 138.69it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000007.tar 400 0.0 GB 2800


 40%|█████████████████████████████████████▊                                                        | 3222/8000 [00:25<00:34, 138.96it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000008.tar 400 0.0 GB 3200


 45%|██████████████████████████████████████████▌                                                   | 3626/8000 [00:27<00:31, 138.97it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000009.tar 400 0.0 GB 3600


 50%|███████████████████████████████████████████████▏                                              | 4012/8000 [00:31<00:34, 113.97it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000010.tar 400 0.0 GB 4000


 55%|███████████████████████████████████████████████████▉                                          | 4417/8000 [00:34<00:25, 141.57it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000011.tar 400 0.0 GB 4400


 60%|█████████████████████████████████████████████████████████▏                                     | 4811/8000 [00:38<00:38, 83.16it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000012.tar 400 0.0 GB 4800


 65%|█████████████████████████████████████████████████████████████▉                                 | 5215/8000 [00:43<00:36, 76.49it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000013.tar 400 0.0 GB 5200


 70%|██████████████████████████████████████████████████████████████████                            | 5619/8000 [00:48<00:17, 132.95it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000014.tar 400 0.0 GB 5600


 75%|██████████████████████████████████████████████████████████████████████▋                       | 6019/8000 [00:51<00:14, 135.53it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000015.tar 400 0.0 GB 6000


 80%|███████████████████████████████████████████████████████████████████████████▍                  | 6419/8000 [00:53<00:11, 136.54it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000016.tar 400 0.0 GB 6400


 85%|████████████████████████████████████████████████████████████████████████████████              | 6816/8000 [00:58<00:08, 135.31it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000017.tar 400 0.0 GB 6800


 90%|████████████████████████████████████████████████████████████████████████████████████▊         | 7220/8000 [01:00<00:05, 138.04it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000018.tar 400 0.0 GB 7200


 95%|█████████████████████████████████████████████████████████████████████████████████████████▌    | 7624/8000 [01:03<00:02, 141.99it/s]

# writing exp_v1/YandexCup2024v2/YaCupTest//dump-000019.tar 400 0.0 GB 7600


100%|██████████████████████████████████████████████████████████████████████████████████████████████| 8000/8000 [01:06<00:00, 120.33it/s]

Done exp_v1/YandexCup2024v2/YaCupTest/





In [65]:
df = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3', 'K4', 'K5'],
                   'A': ['A0', 'A1', 'A2', 'A3', 'A4', 'A5']})
other = pd.DataFrame({'key': ['K0', 'K1', 'K2'],
                      'B': ['B0', 'B1', 'B2']})
df.set_index('key').join(other.set_index('key'))

Unnamed: 0_level_0,A,B
key,Unnamed: 1_level_1,Unnamed: 2_level_1
K0,A0,B0
K1,A1,B1
K2,A2,B2
K3,A3,
K4,A4,
K5,A5,


In [66]:
other.set_index('key').join(df.set_index('key'))

Unnamed: 0_level_0,B,A
key,Unnamed: 1_level_1,Unnamed: 2_level_1
K0,B0,A0
K1,B1,A1
K2,B2,A2


In [77]:
a = torch.nn.functional.pad(torch.arange(30).view(2,3,5), (0,0, 1, 0), value=-1000)
print(a.shape)
a

torch.Size([2, 4, 5])


tensor([[[-1000, -1000, -1000, -1000, -1000],
         [    0,     1,     2,     3,     4],
         [    5,     6,     7,     8,     9],
         [   10,    11,    12,    13,    14]],

        [[-1000, -1000, -1000, -1000, -1000],
         [   15,    16,    17,    18,    19],
         [   20,    21,    22,    23,    24],
         [   25,    26,    27,    28,    29]]])

In [122]:
data = torch.load('tmp/YaCupTrain__11687.pth')

  data = torch.load('tmp/YaCupTrain__11687.pth')


In [123]:
data.keys()

dict_keys(['batch', 'attention_mask', 'mask', 'inputs_embeds', 'labels_w_mask', 'outputs', 'logits_w_mask', 'loss'])

In [124]:
data['outputs']['loc.pth'][0]

tensor([[ 2.2097e+04, -6.5113e+04,  3.4293e+01,  1.0708e-01, -1.7448e-01,
         -2.8186e+00],
        [ 2.2097e+04, -6.5113e+04,  3.4290e+01, -2.9861e-02,  4.5324e-02,
         -2.7439e+00],
        [ 2.2096e+04, -6.5111e+04,  3.4629e+01,  8.5670e-02, -2.4974e-02,
         -2.5952e+00],
        ...,
        [ 2.2154e+04, -6.5281e+04,  3.1793e+01, -1.6713e+00,  2.4100e+00,
         -4.7205e+00],
        [ 2.2163e+04, -6.5283e+04,  3.6307e+01, -2.5581e+00, -1.8996e+00,
         -4.8193e+00],
        [ 2.2160e+04, -6.5283e+04,  3.5243e+01, -4.0093e+00, -2.4420e-01,
         -1.3853e+00]], device='cuda:0', grad_fn=<SelectBackward0>)

In [125]:
data['outputs']['logits.pth'][0]

tensor([[-7.4201e-01, -2.1288e-01,  2.4525e-01,  9.6820e-02, -1.6709e-01,
          4.4357e-02],
        [-1.0309e+00, -1.6344e-02,  2.4240e-01, -4.0124e-02,  5.2717e-02,
          1.1906e-01],
        [-1.5823e+00,  1.2993e+00,  5.8091e-01,  7.5407e-02, -1.7581e-02,
          2.6778e-01],
        ...,
        [ 5.5628e+01, -1.6816e+02, -2.2544e+00, -1.6816e+00,  2.4174e+00,
         -1.8575e+00],
        [ 6.5307e+01, -1.7079e+02,  2.2589e+00, -2.5684e+00, -1.8922e+00,
         -1.9563e+00],
        [ 6.2129e+01, -1.7051e+02,  1.1957e+00, -4.0196e+00, -2.3681e-01,
          1.4776e+00]], device='cuda:0', grad_fn=<SelectBackward0>)

In [126]:
data['batch'].keys()

dict_keys(['__key__', 'loc.pth', 'control_feats.pth'])

In [127]:
data['labels_w_mask'][0]

tensor([-0.1309, -0.0352,  0.0010,  0.0003, -0.0003,  0.0027], device='cuda:0')

In [128]:
data['logits_w_mask'][0]

tensor([-0.7420, -0.2129,  0.2453,  0.0968, -0.1671,  0.0444], device='cuda:0',
       grad_fn=<SelectBackward0>)

In [129]:
data['batch']['loc.pth'][0]

tensor([[ 2.2098e+04, -6.5113e+04,  3.4048e+01,  1.0263e-02, -7.3928e-03,
         -2.8629e+00],
        [ 2.2098e+04, -6.5113e+04,  3.4049e+01,  1.0582e-02, -7.7387e-03,
         -2.8603e+00],
        [ 2.2098e+04, -6.5113e+04,  3.4051e+01,  1.0162e-02, -7.9580e-03,
         -2.8575e+00],
        ...,
        [ 2.2183e+04, -6.5354e+04,  3.5068e+01,  1.4019e-02,  2.0624e-03,
         -7.9009e-01],
        [ 2.2183e+04, -6.5354e+04,  3.5063e+01,  1.6044e-02,  1.6661e-03,
         -7.8786e-01],
        [-1.0000e+06, -1.0000e+06, -1.0000e+06, -1.0000e+06, -1.0000e+06,
         -1.0000e+06]], device='cuda:0')

In [113]:
data['inputs_embeds'][0]

tensor([[ 0.0000e+00,  0.0000e+00,  0.0000e+00,  ..., -8.1063e-02,
          1.0000e+00,  2.0000e+00],
        [-1.5625e-01, -4.8340e-02,  4.4851e-03,  ..., -8.2834e-02,
          1.0000e+00,  2.0000e+00],
        [-3.1152e-01, -9.6191e-02,  8.5697e-03,  ..., -8.4605e-02,
          1.0000e+00,  2.0000e+00],
        ...,
        [ 2.3125e+02, -7.4085e+02,  1.0253e+01,  ..., -1.7573e-02,
          1.0000e+00,  2.0000e+00],
        [ 2.3135e+02, -7.4114e+02,  1.0262e+01,  ..., -1.7573e-02,
          1.0000e+00,  2.0000e+00],
        [ 2.3144e+02, -7.4142e+02,  1.0270e+01,  ..., -1.7573e-02,
          1.0000e+00,  2.0000e+00]], device='cuda:0')