# Parsing h5 files, Python

### Cell Ranger [output](https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/output/overview)
* [molecule_info.h5](https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/output/molecule_info)
* [filtered_feature_bc_matrix.h5](https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/output/matrices)
* [raw_feature_bc_matrix_h5.h5](https://support.10xgenomics.com/single-cell-gene-expression/software/pipelines/latest/output/matrices)


HDF5 format: https://www.neonscience.org/about-hdf5

Resources: 
* Python3 library: http://docs.h5py.org/en/stable/quick.html
* Input data file: http://cf.10xgenomics.com/samples/cell-exp/3.1.0/5k_pbmc_protein_v3_nextgem/5k_pbmc_protein_v3_nextgem_molecule_info.h5
* From Nigel, Python: https://github.com/10XDev/cellranger/pull/2567/files#r366615200
* From Nigel, R: https://github.com/10XDev/cellranger-rkit/blob/cc878c7c6c4ff280939a4d8f5a849600aa037abb/R/io.r#L460
* KB:"How can I get read counts from UMIs?": https://kb.10xgenomics.com/hc/en-us/articles/360002364512-How-can-I-get-read-counts-for-the-observed-UMIs-
* Bioconductor DropletUtils with function read10xCounts: https://www.bioconductor.org/packages/release/bioc/html/DropletUtils.html
* Helpful ZD from Rachana: https://10xgenomics.zendesk.com/agent/tickets/48547
* [ZD from customer](https://10xgenomics.zendesk.com/agent/tickets/54712)

## After installation, import functions and libraries

In [8]:
import h5py
import numpy as np
import pandas as pd
from collections import OrderedDict

In [9]:
def _to_numeric_safe(x, downcast=None):
    # pandas.to_numeric(x, downcast='unsigned') fails if len(x) == 0
    if downcast == 'unsigned' and len(x) == 0:
        return x.astype('uint8')

In [10]:
# Downloaded from:
# http://cf.10xgenomics.com/samples/cell-exp/3.1.0/5k_pbmc_protein_v3_nextgem/5k_pbmc_protein_v3_nextgem_molecule_info.h5
f = h5py.File('5k_pbmc_protein_v3_nextgem_molecule_info.h5', 'r')

In [23]:
list(f.keys())

['barcode_idx',
 'barcode_info',
 'barcodes',
 'count',
 'feature_idx',
 'features',
 'gem_group',
 'library_idx',
 'library_info',
 'metrics',
 'umi']

In [24]:
f['barcode_idx'].shape

(61910072,)

In [32]:
for key in ['barcode_idx','count','feature_idx','gem_group', 'library_idx','umi']:
    print(key)
    print(f[key].dtype)

barcode_idx
uint64
count
uint32
feature_idx
uint32
gem_group
uint16
library_idx
uint16
umi
uint32


In [36]:
for s in f['umi']:
    print(s)

14447931
4330830
3584363
10064873
14499623
4481023
16544446
12906501
9391472
11496108
4038045
3700998
15475632
3907770
8130554
16634752
7671976
437168
12651980
11376166
15958712
6867967
7857199
13541704
4550565
144255
13162257
15897462
3207799
6761599
2935
7541931
9530559
7136905
9219844
16285750
13564786
3633137
3722703
1881064
5371970
15679769
16766445
4318871
6196656
8061782
1958520
343606
10382080
11267277
9870067
13581301
3011725
7158319
5681561
5294714
15746444
463573
1471740
16678787
3102451
2414591
2801522
16113229
10627019
6259387
2484442
8312381
2427348
5190125
350038
3645507
5912057
12880698
15895234
2899669
3781380
10826394
7251255
5830316
5017055
14875985
8198447
2932378
13782934
9875563
11471299
7183346
15580974
13571732
5421046
14673886
3199991
12480211
11506032
15860861
1268428
8371903
12177349
8111167
15983862
8061255
5913159
8092206
13470956
16078952
14100499
3452848
16544446
16132920
10864544
9189980
6018811
7042547
13835765
1930949
9279509
13925669
12039024
13044606

7639889
9755718
12720861
45071
5910883
1015740
1273257
8935228
1167084
15405951
4193867
14671645
15694796
1395326
11367781
3428188
14601215
1628985
1545998
7142687
15531259
14978288
8198911
12899275
9172208
12793006
11747737
12932849
15941087
1040887
12045247
13202576
16105012
6678298
8049267
4331095
881409
10333262
15937880
9893285
1843011
9907346
4210174
8863427
13098788
16523133
14613443
8174497
9067839
12350167
5595807
6881080
7746850
133266
8905723
1539904
5127132
7162052
11431726
15983491
15847999
15587290
1319075
60931
4262909
10731006
24788
6153535
186283
3958345
3913730
11844524
5529331
6058777
5781973
6264658
14569323
16164557
14505950
1789209
5796200
14420524
1089101
10423557
785350
8662169
8200007
2083807
14632567
13864708
4678732
9109299
4714649
7165403
13832518
288500
2085097
7273130
3209337
1427051
12579908
9698343
6806976
9564929
15709997
12928699
1340338
7108319
664331
12345295
16461851
10347312
5998291
4749150
8887499
10990776
12554023
3923146
9836259
8040136
1508599


15216286
16222256
8077203
9135327
4950995
4057787
13638830
11256075
720521
5111334
9387270
11685943
5414142
7518130
277473
15528893
15993967
10841548
10187997
1175805
4158420
2033336
13877988
11418874
1313857
4210107
2091963
11502477
1819441
12870226
11625541
15913820
11625246
10901194
9122064
14076668
840740
12511486
12384325
10271054
13763704
16770879
16264806
1445271
3373022
15004595
647691
9025389
1694907
13674061
408662
14869862
9713281
3296312
13024170
1342667
1065395
1239767
5326933
71479
1556097
1791999
9620216
14277347
5095402
7013400
14415980
5245448
15458612
14160652
11238618
16376049
8356111
3917011
2501445
4027350
15371222
2601991
8785731
11991869
12323862
16335991
10980004
12140350
13857624
373454
16239951
13126863
7493095
6020319
7491307
8288459
1351480
10438788
7310600
2616587
12099740
8241798
8014000
3346287
10255359
12265920
15524088
14423076
7364919
3149551
508859
11284955
2801665
811485
11990782
9370396
1457551
11522103
3276588
16549788
13406783
2034982
9540838
1383

7759738
3618700
5870924
14795649
1569860
14091242
13658123
13604222
10941737
16247416
11501540
1821865
16590310
15125155
3857539
8506253
16048969
2229553
7070259
13109756
5663922
7549274
9306047
8453265
16477058
13270139
5645685
10430919
11111989
5029688
941880
4175757
2211739
12554219
16134099
12017647
5475838
14337228
10965687
3978462
15565849
11075327
6775408
12913545
16218838
1461610
5089914
13274364
2707620
16170027
1678150
10471511
7929793
14544043
15646715
16749555
14142283
7052830
15910528
3075986
10694748
12489239
9316642
4127212
5043959
10975772
8327753
2341304
12316721
12909131
16764558
8717819
9529832
255639
854030
1911283
8151245
2776118
4714391
16251863
16727682
11452671
12571452
4843382
13099661
2551210
4141868
14778255
8223466
8081058
14861007
5109569
15307452
15333633
14741951
12535283
4186141
8876012
8013049
11728436
8413313
7266050
10496777
3247138
9923913
8256364
12501792
13895966
16504250
16188303
5233616
15658356
4909120
15959102
16017954
3944829
7650339
7848944
1

9778709
4226897
10107998
1026597
14929849
7031720
16107153
841757
4436818
3976829
13887955
15779008
4879082
1282925
13445010
7973933
14378549
14405754
5483964
10844029
7756907
3714336
12518617
7173256
9840308
3252431
8376182
3991413
9954428
5455319
4201500
11481453
4694224
16741497
8375714
9868163
14000632
14650724
1411967
7628229
16763691
11760937
14145584
979519
16403881
16519806
11730829
3364671
12630750
4482134
11347949
4003565
7800959
6775896
2573906
5681519
9491755
6133237
13403415
6231726
15747066
13492294
10100335
1636035
8015814
8221615
3300627
10109103
14883583
6554610
16565743
15656411
16713232
13009659
10459120
3394932
16497675
10414356
10437203
2171508
11535294
8289079
12440230
2479563
11616149
16371871
16721277
14479454
11531260
6298299
10867917
15920498
7532646
14820107
513681
7660560
2120895
12536049
3131541
10133743
16013309
14027906
14095004
4977266
15292105
5240655
5593637
12493765
2078883
8660818
13910964
11874215
15011825
15066722
13172799
13445074
5272042
12613091

11288084
13955592
13652463
15718386
10280130
6372290
6725
2487240
15547774
485162
12416465
10404704
14638740
7562879
15916877
14164964
14228706
13566443
8241753
8123815
321135
4724124
1260947
15879460
7474447
9752382
11007494
11173336
7078873
5274191
10056336
15239118
10993655
3598604
8438171
15306685
16036843
14525493
14384055
5176086
16085601
4122207
16616174
3243710
15466538
7431789
2860557
1285365
13334115
14327251
14937698
13785391
12533237
11268120
7158997
8679501
5809382
16505287
3938123
14499084
7323836
15411029
7563636
7696752
14440641
10155515
6902789
6388054
3665926
16167385
8511351
983647
7349
6200620
5262789
2037581
12351984
16694062
10940267
13729338
6970382
13628585
9125564
8845182
1580561
3793797
3792799
7335257
16625114
2989469
7814270
14632531
5837885
8173564
7117257
14920241
40262
14725277
16131531
13157829
12494030
8380223
3208319
5312771
6121240
12106076
4446993
6156602
12135653
472027
2642723
2150075
10740517
3089309
15510732
8300639
9723431
6656888
10959669
53407

15094064
8769770
75905
16775772
15469450
11089049
265479
12510005
6537879
11033775
1184382
13885628
1415470
13682599
1047832
11214163
1579424
15982931
15296691
13342059
3607995
16144398
7011745
14626743
9705147
307637
2312442
16194290
9894250
14348482
10758710
7466330
6155295
16024186
4853139
11344508
10004444
16561581
1752893
1552240
555942
16028916
11875541
14437681
8596656
7794384
12299054
10297574
1277425
3331081
1684493
3114351
15923155
12094722
1177785
2879757
5286901
14912363
13502715
3611356
9124230
12340733
7126555
13872655
1674582
11159727
6867959
1609766
16539709
3471855
10050544
5737446
81107
3475208
9580333
9302115
10473805
13626675
4645110
7429566
4900031
14340992
3201682
13606847
12289034
4954915
13590891
16167923
14761324
16323958
2296935
7842594
15347415
13882863
2434011
14267353
1667080
1096733
573791
3587436
3110856
2941466
12938668
16334113
11726075
6113214
4575781
15910765
7337289
12195692
2244558
15646553
1471759
4131937
11882806
11118438
14932058
1426650
3036463


13907055
1825557
12973956
2046223
5550063
1142959
16244534
11292229
16276302
2017446
11472846
2388335
1853425
8463662
14281329
12452054
12398747
5586200
14613741
3968722
11473414
11851069
5043705
13002788
6753693
14480287
4195770
4337979
9663837
1493403
14765596
1724232
4409814
3015331
16196474
2596076
6101909
3634617
11630047
10842250
11385567
16227224
5479136
13041038
15181604
3076270
4821574
2496892
7453563
3422787
1724732
1459651
12116490
15514084
13351594
10008617
8780597
10382360
1662923
15473494
1310394
3798625
15245728
14516133
11439084
10358348
7506218
875206
12197635
3112314
3769084
7625273
15202754
2170352
4149446
9430369
4584160
4455877
1082726
8901900
12648769
5831129
7807677
5348826
12881686
2328140
4161252
1211635
1801761
6312509
11890581
6994779
2848129
4188398
6616340
11751282
11729341
4169570
2583684
11333559
15280938
5452477
7465184
15388070
3149885
10966948
11789103
1923937
15030657
12074270
12951613
14905236
5092574
14659640
8477644
800101
13651
4161282
2611692
411

4605804
9351729
12572364
695953
11501253
3439735
1844962
15489098
16764737
14628012
8439030
899171
14272579
644412
5024307
15206636
16126751
11550621
466755
3495675
10231807
15847945
16364748
2448610
16694186
4506402
5296444
16080044
8728454
1033303
4099341
15012643
5137231
446913
3552500
13106532
4783564
6243794
15406374
10159897
15148154
1805833
11273944
16441034
10014967
5400957
12446563
471697
10801510
13852747
14675844
7384041
14520625
2268057
3664228
16757018
11209347
1553991
12274073
1770872
1103079
14327648
203948
14519644
5724888
14695486
10473138
5022402
15798399
8356829
13358655
11587819
10772073
3351092
13135737
15456750
1995496
997102
16078616
794652
11773983
13885791
14835615
13524580
4376135
14456581
10881990
1042901
843225
8683980
1859232
2582409
7635969
4329983
1479607
13587926
4652230
1958104
5689785
851583
11443714
15759975
16060403
15841776
9814445
5365305
11786108
16034372
2629438
12886842
3457957
4106355
5048556
2813697
8448487
1897113
477183
9346737
11575635
6245

16734961
9952375
5703405
14832099
5202311
1878880
5514010
1506778
4256453
12743939
15700723
14087166
15290551
8652166
10079206
15220651
11843744
16101999
2357680
4932780
4754905
14806971
14456954
13355
2218815
16515028
15182106
2196400
11604455
1124140
4940433
9289590
3201916
7697419
3903478
1211509
16754631
4046061
6111695
1390900
13790795
8368188
11931134
111087
13055283
10865211
10022227
13582808
9673773
9021274
9984871
2107790
4877260
13483098
15623257
5152984
3634833
9685076
11033410
10047354
12644353
1263337
13854344
11831913
1034486
7198384
4039003
13941858
5389884
250938
392674
4570879
6276090
16571430
7023201
3827652
2434429
11902157
3088631
14524603
14941812
2894851
10136671
8339323
3577181
12357469
9354178
7968144
11804530
3435528
10771751
10503478
710451
2741948
14392327
11462009
12813195
15989838
4650062
2017964
13603753
5294217
8213884
1618939
2629655
5134884
14457546
6915777
6890686
2763972
2822223
10987428
13609251
6781215
7541983
11624856
14253819
10191203
8260622
1078

15529310
2562123
5461155
7522934
2032607
6079422
15973337
9224658
15271030
5188337
1104388
15273711
1169599
11852805
7557567
4399235
1565135
12502334
4450622
13714595
11628538
14735182
2629138
7475144
7695457
11789689
15155478
3342192
12241787
3788736
6044106
838302
3342292
12808599
1430112
15437183
6225093
14679666
4133765
985079
2420244
15533708
13681283
6259915
4445439
11597106
2122960
8226799
7687222
13892091
9593720
1015804
11005725
8870909
13087490
5299524
51571
13455250
9577499
8455088
15309375
4054357
6066708
9179198
2614920
976970
12693188
13839443
13983836
10480701
10274649
16249024
3023299
4177632
6007807
16189924
13651789
3803493
3615843
13032980
6205187
14627719
8113423
7712845
5381367
14039853
2965296
8736348
12721407
13627278
3466234
75854
13882288
12410795
5656288
11585745
11462031
15812322
14220287
5519839
4081240
13772688
15600967
5342662
471263
11583020
9409044
4173021
13881320
6694449
16760628
11485287
4162614
10251399
10384692
11268936
14081413
24570
14141496
12571

1642767
12633157
4552123
16165855
13585785
6582269
3051403
6793620
859507
15257980
10435394
12368223
6412701
1242899
7692089
14500602
2902067
14936781
6115711
5966432
16047924
987642
15533163
5706578
11982704
12272138
6277245
13099841
9244275
6274321
15697858
14487247
14163895
5210984
6561483
12965567
11761514
10356692
847361
12345010
6819537
7858306
12197304
12491102
12122460
15189262
12776536
2147619
7122680
15594444
11474407
3454354
6124032
2163565
6103628
11859839
12615287
6180703
10384175
4445228
15629555
14646776
13569248
14958436
7514735
8637467
9142133
7385133
3537604
13389406
8183520
2092098
9492877
7566541
13107191
8372165
5599237
14397774
988807
14825303
1362768
12620296
13427667
818874
13654130
3529331
4797335
6240435
14183443
7930874
5746224
5748821
5617627
11780348
10720232
6189077
9563766
3181740
13244055
8561475
15057918
943969
10633211
12499255
7839203
15799731
6189500
12818804
1041210
1843003
3469677
11815675
13538623
9171919
8038717
11870130
8775407
11583206
8678816


14613754
10405687
11584550
13643233
12655091
15241089
2568571
10551525
4171789
1933653
15611854
9763531
10520054
10487368
6289709
9649876
11859779
2038724
11160543
654959
2661337
13381873
13692466
11789381
12582200
8900846
1886642
15717718
10970224
5181430
11806087
936906
7900560
10118095
14756868
8883619
7289537
12684992
16698949
13641701
1223283
2129466
14334702
9555467
12243930
3530300
11552834
7685381
16724862
3650077
3235011
7111673
5637059
9691415
11851591
10744099
5385311
4388139
3374903
2305848
6561762
1976791
2805279
3141359
5217325
413806
2606811
12811880
14175538
12820105
7360920
3879405
9781367
15990223
7458267
15792681
12189436
12807976
8509309
8301835
1202024
10521038
11581300
8875985
15723984
920547
12652769
16088053
15655645
211696
7146406
8405995
15997964
7547533
12704687
11275827
13045278
14534070
8187491
14084813
12615677
15647927
927261
2216430
3880899
4050393
2621124
4132038
13570369
1249503
12562642
6159414
13162659
14155382
10766228
9524800
11531477
16114127
6067

11661235
11456269
12530039
1736323
13911329
15689658
5528746
12711344
14946050
8386456
6006766
15967144
8363889
11297763
8807578
13047660
8326595
12528268
12488254
14696279
7408625
4052379
12441432
9642966
7402113
7340276
10757260
2912921
9297909
7833581
16725120
208380
1507804
10704369
7438994
14208288
10315327
12389543
14436285
13518814
7483220
1272480
12573697
14578167
11631885
1857298
5390657
202304
2096967
2969377
15873082
10407919
2082251
15806793
16756915
1509581
1137663
14732592
10944269
13576005
8591114
1915475
8452586
14638864
16263462
3443853
12251478
14265252
3291387
12745826
10624974
2444936
8401360
11750908
1462253
16653764
1616614
7566185
11899162
13442961
12306222
11610880
5299311
3601225
6303499
785058
15205195
6726588
12581567
14810430
7434026
4221382
9913039
771514
13450739
1210668
5688620
14618391
11670756
7733792
11815664
10049231
8780722
3154126
14223389
13940494
12193475
12039126
6142000
16052691
1646107
12482191
1416610
8532664
3584995
3767865
13579325
14674332


14517918
13311855
8377990
15584329
6849978
14666015
6668159
5537133
13717602
6125089
16522038
10906351
3882121
16594163
15626825
13206108
12451860
12867565
8009336
11754407
12940885
12539790
14609647
3169338
10464753
16679099
3328543
15097576
16614816
9238349
8379589
16511845
10479343
7472061
12761742
10297141
10068478
12658732
3873986
13574989
8566901
683506
2869555
13288886
4170708
457997
12439518
9697997
10199810
11262633
12098639
2220315
15812833
5976768
1028544
8166900
2422727
14139979
10715132
4643855
13783786
9775581
15764388
1460831
13205301
3438667
2466899
16147463
12450457
2195091
5887230
12442377
16628977
15050557
345308
14977840
3018191
8048436
13157584
14707583
13811219
10836940
10442561
5965665
749111
12043910
14651887
12447642
12710233
2904012
9994099
3825660
5947885
15935315
14549510
8235615
5771716
4157788
3144331
14327615
2036428
12972793
13851868
12528645
3821647
2642654
15584274
7503363
16405996
3123421
8515246
9357902
9649717
10960907
1781674
15037133
12053698
1256

15680634
646738
11591174
8122171
10775003
14515641
2094851
15436166
7174430
7364198
4068400
1201075
1010433
3639408
4390917
8167083
6954247
7664823
4323210
13043255
5309895
13642742
14021459
3756144
11479260
14769419
13059419
16558684
16502748
12096220
13651761
5724599
16607284
8746895
2895154
13526943
3164029
9303126
5054703
15420418
16536571
12382713
10711610
16623429
16529853
3586119
16088148
7663702
16745206
11626047
11498555
7452887
2889712
8025470
5719171
799698
13247769
6680235
9436319
9304810
1528930
6387624
4340991
8344561
8344289
16265843
4206847
4952899
7944689
4133339
4415710
7907279
7136363
9996615
8249180
15666806
5188953
2587563
12973689
7067497
4520658
3165835
15459611
3472409
16700313
10381187
9912480
15633405
5500560
15864414
602096
340253
3463976
1824607
7368879
13303695
6626210
9556332
15048023
16289090
7594828
14860180
4716528
13361127
15324168
14417143
14538879
3010098
11793752
8148
10297047
607136
11338987
15171635
3895969
14687560
7311984
15674739
2375039
115076

12751326
14569697
3399916
16772332
607567
16322315
15557149
3130187
6205951
16613036
14322640
8388528
8358355
13612894
6238631
13591761
15683235
13934466
4267701
7004219
14967718
7630067
1231655
6553390
7184367
12249787
12787685
15717289
16707533
11422236
12824094
12772586
3990331
3257167
4177892
4157414
4765902
10182079
4112149
5394647
4890635
7776835
13520578
3992629
13834788
11251430
14045089
16396183
9627893
2834125
12160499
2545129
739706
7361398
4711775
5549830
14614764
16574668
1548785
5031966
3100701
13969251
12444499
5028045
1262462
11492147
13444395
15564344
12628447
9263074
10277523
15078783
14888228
5603960
6494671
14540980
646799
1301775
8281279
3392167
1107535
13319307
11396105
638092
359399
16315086
10818159
11313033
8878443
7497131
6291407
8321682
14501754
2307121
9650159
14508676
13887296
2237685
2454182
4977089
920910
8280799
15429542
8535418
14241712
855448
1928937
4183903
7536307
4879367
4449863
16483466
5174013
3998521
14701528
2092179
3357692
11260658
6099243
1276

1383403
6072362
9446887
3037406
579577
4047293
11775947
7176736
14454382
16665844
14866653
5054351
8024781
10323582
10689791
15310127
14133561
16424312
14905627
8244012
14229035
7130878
8249615
11450963
2798558
6289553
11883087
8848590
3267885
7487281
5230163
5105347
16329439
15256555
15783679
6350712
1386458
11875140
4605907
7343804
16518123
11050556
6384609
5108638
1551133
15847088
7489015
3476366
15562042
5774577
16454412
11779644
3231170
5745473
13698202
6988515
12255075
11927299
6249366
11927488
500445
12009807
3797234
4016306
12592578
3459642
14943332
5878006
4168756
7670568
11490877
1461280
13326935
9442559
4551307
10404076
4086271
12267511
10291519
3398337
7652349
15968820
13160206
13893503
10354326
3858503
13466979
1589502
11324555
9599951
8692683
7707504
12094335
14861806
2838899
13234259
7015824
7788523
15531642
9494275
7599945
11729799
11714435
1494031
5470603
3838425
14122223
15117425
11070164
9950147
755707
16036314
15486586
7626332
9344099
13204355
5498223
3388399
137082

6220179
3438499
9376726
3027151
3947839
16301485
3399711
13720904
8909610
3562209
14736381
11479037
2857254
13736485
15171440
12381996
6787366
13998994
14421047
8318950
2554605
15005977
16119207
9382895
14700403
8191176
15992037
7039546
1056663
15665130
10474482
13662940
5057264
7797968
15684919
15191123
4130268
10483927
4998194
7584039
1184101
5995753
8386988
2843214
6849786
1108805
12436159
16088954
2922810
15805379
16598418
10161458
373214
5408958
8123756
6121466
678492
737303
14868731
10843434
8633338
7331566
7374911
6510783
4346940
16525860
16345438
1626244
779279
330511
12755098
7202199
14300295
3373487
4823538
7250174
12168252
13623639
9617044
12020982
12523241
16356304
10748927
8091820
6031929
7588850
7307008
12345365
7167739
14021306
16277023
4610620
6170511
16185322
16709626
13709131
15008650
11129077
7329396
12570345
13859023
4017867
11509691
15233167
6275214
4458983
10302459
13775494
11064747
9706329
6417504
15200727
16120279
8994518
7246338
2068660
9919961
13344934
7534926

5870568
910683
8308913
12856920
8137269
7031099
2353915
6781426
14552714
16039305
12872827
10397078
5129080
9305547
4084331
10354172
10349446
10424308
12451069
7589027
15939938
15443407
1177580
6214500
2904488
12854103
10718227
5958521
13394359
8035938
5436777
16536712
10580724
6852726
1981686
6773895
7337831
14719766
7579395
8679564
9524612
8542974
6235282
13845132
2375667
3843154
6178750
3356975
700172
8339663
1310479
14008019
5311691
16757967
7233268
6238554
3393073
3632780
14017539
11674719
907998
11058925
13611870
10957855
7732867
10213582
3649573
1895149
12580747
578269
15411151
9700769
12544566
11278335
5235365
7617189
4301821
15254963
11478002
7076109
15992696
12399577
7642882
3458018
4077553
14532628
16564798
6186700
15713304
2087998
8723233
8333913
4090873
14251926
12118057
4587518
2973647
6738563
16381899
12852943
16033589
13323509
15952754
298267
9807600
12563603
12642364
6707317
5656007
9233818
13689604
10205600
4258643
7955706
16019404
15915066
10454509
11255686
15016875


13005507
4316592
2070225
2882553
3190838
13735342
12365638
16565656
5892993
11804478
16281418
5241166
3488009
2905288
14393603
10611034
1023919
14724028
6186019
14894651
11158571
10348779
14742493
1046576
15808360
5329615
7720933
6293455
7405297
904187
9142042
1597416
736574
15969776
5123983
16495551
9221458
3144597
14941515
9160398
15119439
15310161
1237149
8208341
7041849
4472544
195626
4689970
4019007
9752638
16102725
13811718
5045952
8541875
6413272
8933255
15964203
11799500
9909207
969727
13578746
9087198
6734331
15564777
15068675
6305617
3897918
14920778
14828834
3145929
9629463
14732364
13859178
15365992
5782377
10678786
6944633
844031
7757786
15125854
7877507
2635504
14343099
4041401
16669398
16093066
13571576
13169466
16602093
16608459
2691058
13454160
15255852
969573
13386674
12090300
10551857
16650230
14473064
1837484
15524014
782141
5105319
11412350
5712530
1775267
15122191
5948299
15629825
6769731
2988319
53297
5894800
14868469
16517462
16595106
15560841
836662
16101182
15

15882748
3934975
9418225
12138303
980488
16693071
13184885
14072560
14581693
3924447
13972160
10740278
4148881
461226
1063619
11554895
12820505
994877
10357487
3908860
4376348
12390975
2034381
13162249
10437283
7864263
10870480
8043431
7521769
4755541
16653189
13495765
8511564
13081998
13850324
16696555
4176667
15948266
16678334
14988170
4213472
6357092
7295153
12343277
2402740
8412541
10362000
13582008
6223081
5691174
14144863
13860064
12752659
16645428
12054673
200666
12581877
4138719
15402837
379263
12583884
8957939
4240370
10697585
783699
11655488
7131635
9192293
14155060
9411833
10177706
3448446
12737400
6917011
7361355
4330454
4850507
13131108
12032723
12030824
14201274
9936499
9489583
13373396
15813463
3977570
15779821
9049406
2502506
14678496
10166151
5243857
8927983
8110794
15726371
9911839
5597952
8207572
16385317
1787062
8551568
325032
5227358
4052477
5481152
9907196
15263934
16709159
13384556
1170236
142351
10325004
4166397
8633431
777577
4060294
7492002
2002200
3290339
296

8885052
3675132
7433565
12907797
6026529
13084680
3388704
10483259
4542995
12234486
15481984
5537597
7736526
12601626
4508759
3036356
16332640
6577463
10037495
10769574
12978605
1933201
15380642
6648807
16211144
15586190
9133431
6099423
6430744
12353379
3036923
13892659
953165
10692533
8070644
10194749
9335431
15685626
15840339
15249903
5858190
8779278
9222356
9456054
15790228
12572402
16394837
7237878
15244475
4085934
8090386
3746900
7092074
2483284
14585068
11764892
8344827
9930326
4112050
15984607
14459054
14981206
5356755
7169403
14594629
15283504
8175851
4480207
16322853
13006062
4124383
7427359
12581846
9846581
9715022
16237355
16498694
8219742
8201385
13332676
11937886
10021066
10050422
8129740
9174316
5985310
8099342
5044806
8617343
6065246
11623268
16183507
13152234
7984713
3661367
9399784
13182461
12690749
15784448
11522001
10260691
10121258
16145216
15734269
12790827
16039633
4546034
4541725
15628464
12654252
16466765
4995358
5666714
3766591
12125894
15128458
9424477
1140237

7627325
13369540
16678301
4250924
7313340
2854399
7798588
14642773
12643440
9229722
1537196
7677647
5890075
4179834
8248170
6320108
4033981
4056247
16721751
9313615
3753131
13943889
12465017
7178677
5228691
12281445
13595995
11426639
13304662
12777263
13290509
12600979
4636346
15867067
4390527
15880029
14056102
13740011
3754837
7325871
15825197
3251835
8337778
3830349
4443972
16714079
12366324
1808635
8211336
14307911
636727
7881552
12724510
11927011
7633239
4131769
486848
15607542
535431
15484034
8362512
15120442
16531318
8025584
13435868
7676998
13895563
12747283
14870461
14044515
65072
6131304
12967726
13252683
12720692
2955823
15540470
6288596
9681823
3447691
6268016
13336040
15945339
8368771
2420278
9246034
11895615
12237470
5990443
14416829
14565504
14159853
15386431
4121900
4177706
12691851
13590670
7351355
15851093
4147619
5875240
12096267
3627152
7841909
11915246
3562353
9074003
16111726
437983
480364
5712895
7420660
14062036
1524935
10233504
8575835
10441630
16511359
4586808


13263044
13193139
8301394
14496899
14906911
4454853
16493729
4707760
5456031
8838019
10770269
14485052
7520965
14192185
1586631
16416723
4611246
10957027
14999212
12901311
3665915
15527895
8378465
1747651
12831293
10484813
4141487
577763
2588520
2691513
8681466
6159593
11081559
1095136
3890228
11750865
4160852
16761587
4484559
13095551
11114289
11747242
15759040
13893119
16185986
6283589
15913392
1524992
3533819
12975560
3944831
12017705
13893566
1542853
1871484
11318333
7020431
13024871
5193964
1128583
9825586
3607912
16619371
15640143
13835683
8779209
7661605
2514045
8254192
6140074
8074485
12910684
15961302
9319285
3689303
15597823
7401963
3198682
8336547
4011836
2032557
13229976
123168
16644862
4160670
14124800
14732019
14077692
13415459
8222076
14879860
1025458
4445096
13038767
8491197
3518669
14552148
248298
15094069
3749571
1270056
6411786
16768787
3209054
8379827
3752363
4355067
12614892
872701
815626
13553911
3668952
13533475
11539168
5112303
12852161
9977207
3718835
8763174
1

10211318
4701812
9270719
11995444
16744123
7544795
7936967
2473883
13548919
14930932
9951863
3145726
3512342
7817464
6348480
10323774
2579463
4452281
14152695
13512469
280574
6838722
10106305
2035391
3444626
3115665
10195005
9526487
4906044
12003420
10473396
2193685
16318416
6021275
4201427
9562611
1128246
10206679
13167857
14912483
5851109
196802
6375586
9251886
10471941
3472819
12503199
16244001
5012822
8744469
7908474
8589001
7563777
3233327
8062455
7861119
4109310
6217669
1114948
10152398
13041104
4292347
14236884
14513662
14456480
13119944
5971622
8150352
15384095
15238338
6485573
8715263
13974572
4408289
2423935
3224620
2619772
15998366
7194243
2988257
8347412
817077
8607415
9686803
15768810
3541254
3522805
10160948
16513417
14582776
2378887
3764972
14425509
12861236
2960581
13776363
4349648
8310770
10302174
8073310
13712206
3783695
16394828
3182651
16393543
10571316
5642246
14442397
2808410
9884698
1858915
6629301
16727045
6789815
4194295
14154753
13018930
6273030
11464512
23421

16121412
8372084
11583358
13918372
12460095
4204863
12582094
2616152
5767161
4116836
16722750
13137159
9739207
682329
9319075
12909288
16154190
5497912
12455551
7156615
1989283
6107827
6042629
5361213
4309071
11458173
7332746
10528700
4352766
13948117
10092781
16735475
5822495
1204731
7585728
4891907
6335355
14945440
2601656
8743736
12844896
13395829
12516335
8356670
3848724
13841411
2047972
9776599
964000
3943287
11760207
2014847
6870234
12567509
12829884
16222041
8287532
9782649
749293
3675735
1557525
9322129
3668809
16009577
5739818
11958456
9740192
15531575
8311872
2730199
8268294
16155697
7737840
13025753
3554511
6053158
8905264
11999735
12749203
15485242
4185717
6198645
3925139
15832995
2308501
10560047
296067
14656809
16651894
7230208
16657710
12489685
1356252
381020
462237
1339393
5517395
6049475
13258621
8243164
4544501
8320081
4054385
12331164
6879353
13086684
8537198
1907977
12459873
126467
4115167
3091399
4506830
16321897
3359026
10295992
5809914
10303472
12889036
2674357
1

KeyboardInterrupt: 

In [33]:
idx_mol = np.ones(len(f['count']), dtype='bool')
mol_info_cols = OrderedDict()
for key in ['gem_group', 'library_idx', 'barcode_idx', 'feature_idx', 'count']:
        mol_info_cols[key] = 'unsigned'

In [34]:
print(mol_info_cols)

OrderedDict([('gem_group', 'unsigned'), ('library_idx', 'unsigned'), ('barcode_idx', 'unsigned'), ('feature_idx', 'unsigned'), ('count', 'unsigned')])


In [13]:
type(idx_mol)

numpy.ndarray

In [14]:
print(idx_mol)

[ True  True  True ...  True  True  True]


In [6]:
# comment here, break apart
df = pd.DataFrame({x: _to_numeric_safe(f[x][:][idx_mol], downcast=mol_info_cols[x])
                       for x in mol_info_cols.keys()}, columns=mol_info_cols.keys())
df.rename(columns={'count':'num_reads'}, inplace=True)

In [7]:
df.shape

(0, 5)

In [8]:
type(idx_mol)

numpy.ndarray

In [9]:
df.head()

Unnamed: 0,gem_group,library_idx,barcode_idx,feature_idx,num_reads


In [10]:
pd.show_versions()


INSTALLED VERSIONS
------------------
commit           : None
python           : 3.7.3.final.0
python-bits      : 64
OS               : Darwin
OS-release       : 18.5.0
machine          : x86_64
processor        : i386
byteorder        : little
LC_ALL           : None
LANG             : en_US.UTF-8
LOCALE           : en_US.UTF-8

pandas           : 0.25.3
numpy            : 1.17.4
pytz             : 2019.3
dateutil         : 2.8.0
pip              : 19.1.1
setuptools       : 41.0.1
Cython           : None
pytest           : None
hypothesis       : None
sphinx           : None
blosc            : None
feather          : None
xlsxwriter       : None
lxml.etree       : None
html5lib         : None
pymysql          : None
psycopg2         : None
jinja2           : 2.10.1
IPython          : 7.6.0
pandas_datareader: None
bs4              : None
bottleneck       : None
fastparquet      : None
gcsfs            : None
lxml.etree       : None
matplotlib       : None
numexpr          : 2.7.0
odfp