In [1]:
import numpy as np
from scipy import sparse
import pandas as pd

In [2]:
%load_ext autoreload
%autoreload 2

In [3]:
import sys
sys.path.insert(0, '../')
from hetmech.hetmat import HetMat
from hetmech.degree_weight import dwpc

In [4]:
hetmat = HetMat('../data/hetionet-v1.0.hetmat/')

In [5]:
metapaths = hetmat.metagraph.extract_metapaths(source=hetmat.metagraph.get_metanode('C'), 
                                               target=hetmat.metagraph.get_metanode('D'),
                                               max_length=4)
print(len(metapaths))

1208


# Without parallel processing 
12 minutes to do all Rephetio metapaths for a single HetMat

In [6]:
%%time

for damping in [0.0, 0.4, 0.5]:
    i = 1
    for metapath in metapaths:
        try:
            row, col, dwpc_matrix, t = dwpc(hetmat, metapath, damping=damping, dense_threshold=0.6, dtype=np.float64)
            print(i, metapath, f'{t :.2f}')
            if sparse.issparse(dwpc_matrix):
                sparse.save_npz(hetmat.directory / 'paths' / f'dwpc-{damping}' / f'{metapath}.sparse.npz', dwpc_matrix)
        except NotImplementedError:
            print(i, 'skipped: ', metapath)
        i += 1

1 CpD 0.01
2 CtD 0.00
3 CpDrD 0.01
4 CtDrD 0.01
5 CbGaD 0.03
6 CbGuD 0.01
7 CbGdD 0.01
8 CuGaD 0.01
9 CuGuD 0.01
10 CuGdD 0.01
11 CdGaD 0.01
12 CdGuD 0.01
13 CdGdD 0.01
14 CrCpD 0.01
15 CrCtD 0.00
16 CiPCiCpD 0.01
17 CiPCiCtD 0.00
18 CpDpSpD 0.01
19 CpDrDrD 0.01
20 CpDpCpD 0.01
21 CpDpCtD 0.00
22 CpDdGaD 0.01
23 CpDdGuD 0.01
24 CpDdGdD 0.01
25 CpDtCpD 0.01
26 CpDtCtD 0.00
27 CpDaGaD 0.01
28 CpDaGuD 0.01
29 CpDaGdD 0.01
30 CpDuGaD 0.01
31 CpDuGuD 0.01
32 CpDuGdD 0.01
33 CpDlAlD 0.01
34 CtDpSpD 0.01
35 CtDrDrD 0.01
36 CtDpCpD 0.00
37 CtDpCtD 0.00
38 CtDdGaD 0.01
39 CtDdGuD 0.01
40 CtDdGdD 0.01
41 CtDtCpD 0.00
42 CtDtCtD 0.00
43 CtDaGaD 0.01
44 CtDaGuD 0.01
45 CtDaGdD 0.01
46 CtDuGaD 0.01
47 CtDuGuD 0.01
48 CtDuGdD 0.01
49 CtDlAlD 0.01
50 CbGr>GaD 0.05
51 CbGr>GuD 0.01
52 CbGr>GdD 0.01
53 CbGcGaD 0.02
54 CbGcGuD 0.00
55 CbGcGdD 0.00
56 CbGbCpD 0.04
57 CbGbCtD 0.01
58 CbGaDrD 0.02
59 CbGeAlD 0.06
60 CbGuDrD 0.02
61 CbG<rGaD 0.04
62 CbG<rGuD 0.00
63 CbG<rGdD 0.00
64 CbGuCpD 0.01
65 CbGuCtD 

444 CbGcGdCpD 0.01
445 CbGcGdCtD 0.01
446 CbGcGiGaD 0.11
447 CbGcGiGuD 0.12
448 CbGcGiGdD 0.11
449 CbGcGdAlD 0.03
450 CbGcGdDrD 0.00
451 CbGbCpDrD 0.01
452 CbGbCtDrD 0.00
453 CbGbCbGaD 0.07
454 CbGbCbGuD 0.05
455 CbGbCbGdD 0.05
456 CbGbCuGaD 0.11
457 CbGbCuGuD 0.10
458 CbGbCuGdD 0.09
459 CbGbCdGaD 0.10
460 CbGbCdGuD 0.10
461 CbGbCdGdD 0.10
462 CbGbCrCpD 0.06
463 CbGbCrCtD 0.05
464 CbGaDpSpD 0.02
465 CbGaDrDrD 0.01
466 CbGaDpCpD 0.01
467 CbGaDpCtD 0.01
468 CbGaDdGaD 0.06
469 CbGaDdGuD 0.04
470 CbGaDdGdD 0.05
471 CbGaDtCpD 0.01
472 CbGaDtCtD 0.01
473 CbGaDaGaD 0.18
474 CbGaDaGuD 0.11
475 CbGaDaGdD 0.10
476 CbGaDuGaD 0.06
477 CbGaDuGuD 0.05
478 CbGaDuGdD 0.05
479 CbGaDlAlD 0.02
480 CbGeAdGaD 33.75
481 CbGeAdGuD 0.03
482 CbGeAdGdD 0.02
483 CbGeAlDrD 0.07
484 CbGeAeGaD 48.77
485 CbGeAeGuD 0.03
486 CbGeAeGdD 0.03
487 CbGeAuGaD 27.59
488 CbGeAuGuD 0.04
489 CbGeAuGdD 0.04
490 CbGuDpSpD 0.01
491 CbGuDrDrD 0.01
492 CbGuDpCpD 0.00
493 CbGuDpCtD 0.00
494 CbGuDdGaD 0.08
495 CbGuDdGuD 0.06
496 CbGuD

868 CdGr>GdCtD 0.04
869 CdGr>GiGaD 0.47
870 CdGr>GiGuD 0.45
871 CdGr>GiGdD 0.46
872 CdGr>GdAlD 0.11
873 CdGr>GdDrD 0.02
874 CdGpPWpGaD 0.59
875 CdGpPWpGuD 0.01
876 CdGpPWpGdD 0.01
877 CdGcGr>GaD 0.11
878 CdGcGr>GuD 0.10
879 CdGcGr>GdD 0.11
880 CdGcGcGaD 0.20
881 CdGcGcGuD 0.21
882 CdGcGcGdD 0.21
883 CdGcGbCpD 0.01
884 CdGcGbCtD 0.01
885 CdGcGaDrD 0.00
886 CdGcGeAlD 0.03
887 CdGcGuDrD 0.00
888 CdGcG<rGaD 0.13
889 CdGcG<rGuD 0.11
890 CdGcG<rGdD 0.12
891 CdGcGuCpD 0.01
892 CdGcGuCtD 0.01
893 CdGcGuAlD 0.03
894 CdGcGdCpD 0.01
895 CdGcGdCtD 0.01
896 CdGcGiGaD 0.13
897 CdGcGiGuD 0.12
898 CdGcGiGdD 0.12
899 CdGcGdAlD 0.03
900 CdGcGdDrD 0.00
901 CdGbCpDrD 0.00
902 CdGbCtDrD 0.00
903 CdGbCbGaD 0.01
904 CdGbCbGuD 0.01
905 CdGbCbGdD 0.01
906 CdGbCuGaD 0.01
907 CdGbCuGuD 0.02
908 CdGbCuGdD 0.02
909 CdGbCdGaD 0.02
910 CdGbCdGuD 0.01
911 CdGbCdGdD 0.02
912 CdGbCrCpD 0.02
913 CdGbCrCtD 0.02
914 CdGaDpSpD 0.01
915 CdGaDrDrD 0.01
916 CdGaDpCpD 0.01
917 CdGaDpCtD 0.00
918 CdGaDdGaD 0.06
919 CdGaDdGuD 0.

91 CuGdCpD 0.02
92 CuGdCtD 0.00
93 CuGiGaD 0.05
94 CuGiGuD 0.00
95 CuGiGdD 0.00
96 CuGdAlD 0.04
97 CuGdDrD 0.02
98 CdGr>GaD 0.06
99 CdGr>GuD 0.00
100 CdGr>GdD 0.00
101 CdGcGaD 0.03
102 CdGcGuD 0.00
103 CdGcGdD 0.00
104 CdGbCpD 0.02
105 CdGbCtD 0.00
106 CdGaDrD 0.02
107 CdGeAlD 0.07
108 CdGuDrD 0.02
109 CdG<rGaD 0.09
110 CdG<rGuD 0.00
111 CdG<rGdD 0.00
112 CdGuCpD 0.03
113 CdGuCtD 0.00
114 CdGuAlD 0.04
115 CdGdCpD 0.03
116 CdGdCtD 0.00
117 CdGiGaD 0.06
118 CdGiGuD 0.00
119 CdGiGdD 0.00
120 CdGdAlD 0.04
121 CdGdDrD 0.02
122 CrCpDrD 0.01
123 CrCtDrD 0.00
124 CrCbGaD 0.00
125 CrCbGuD 0.00
126 CrCbGdD 0.00
127 CrCuGaD 0.00
128 CrCuGuD 0.00
129 CrCuGdD 0.00
130 CrCdGaD 0.00
131 CrCdGuD 0.00
132 CrCdGdD 0.00
133 CrCrCpD 0.02
134 CrCrCtD 0.02
135 CcSEcCpD 0.17
136 CcSEcCtD 0.01
137 CiPCiCpDrD 0.00
138 CiPCiCtDrD 0.00
139 CiPCiCbGaD 0.00
140 CiPCiCbGuD 0.00
141 CiPCiCbGdD 0.00
142 CiPCiCuGaD 0.00
143 CiPCiCuGuD 0.00
144 CiPCiCuGdD 0.00
145 CiPCiCdGaD 0.00
146 CiPCiCdGuD 0.00
147 CiPCiCdGdD 0.00

515 CbG<rGeAlD 0.08
516 CbG<rGuDrD 0.01
517 CbG<rG<rGaD 0.65
518 CbG<rG<rGuD 0.65
519 CbG<rG<rGdD 0.65
520 CbG<rGuCpD 0.02
521 CbG<rGuCtD 0.02
522 CbG<rGuAlD 0.03
523 CbG<rGdCpD 0.02
524 CbG<rGdCtD 0.02
525 CbG<rGiGaD 0.57
526 CbG<rGiGuD 0.59
527 CbG<rGiGdD 0.59
528 CbG<rGdAlD 0.03
529 CbG<rGdDrD 0.01
530 CbGpMFpGaD 0.64
531 CbGpMFpGuD 0.01
532 CbGpMFpGdD 0.01
533 CbGuCpDrD 0.00
534 CbGuCtDrD 0.00
535 CbGuCbGaD 0.01
536 CbGuCbGuD 0.01
537 CbGuCbGdD 0.01
538 CbGuCuGaD 0.06
539 CbGuCuGuD 0.06
540 CbGuCuGdD 0.06
541 CbGuCdGaD 0.06
542 CbGuCdGuD 0.06
543 CbGuCdGdD 0.06
544 CbGuCrCpD 0.03
545 CbGuCrCtD 0.03
546 CbGuAdGaD 14.23
547 CbGuAdGuD 0.03
548 CbGuAdGdD 0.03
549 CbGuAlDrD 0.05
550 CbGuAeGaD 25.72
551 CbGuAeGuD 0.06
552 CbGuAeGdD 0.06
553 CbGuAuGaD 16.54
554 CbGuAuGuD 0.03
555 CbGuAuGdD 0.04
556 CbGdCpDrD 0.00
557 CbGdCtDrD 0.00
558 CbGdCbGaD 0.02
559 CbGdCbGuD 0.01
560 CbGdCbGdD 0.01
561 CbGdCuGaD 0.06
562 CbGdCuGuD 0.06
563 CbGdCuGdD 0.06
564 CbGdCdGaD 0.07
565 CbGdCdGuD 0.08
566 CbG

941 CdGuDrDrD 0.01
942 CdGuDpCpD 0.01
943 CdGuDpCtD 0.00
944 CdGuDdGaD 0.08
945 CdGuDdGuD 0.07
946 CdGuDdGdD 0.08
947 CdGuDtCpD 0.00
948 CdGuDtCtD 0.01
949 CdGuDaGaD 0.09
950 CdGuDaGuD 0.05
951 CdGuDaGdD 0.04
952 CdGuDuGaD 0.09
953 CdGuDuGuD 0.08
954 CdGuDuGdD 0.09
955 CdGuDlAlD 0.02
956 CdG<rGr>GaD 1.22
957 CdG<rGr>GuD 1.38
958 CdG<rGr>GdD 1.45
959 CdG<rGcGaD 0.32
960 CdG<rGcGuD 0.30
961 CdG<rGcGdD 0.33
962 CdG<rGbCpD 0.07
963 CdG<rGbCtD 0.06
964 CdG<rGaDrD 0.05
965 CdG<rGeAlD 0.22
966 CdG<rGuDrD 0.05
967 CdG<rG<rGaD 0.91
968 CdG<rG<rGuD 0.86
969 CdG<rG<rGdD 0.86
970 CdG<rGuCpD 0.07
971 CdG<rGuCtD 0.07
972 CdG<rGuAlD 0.18
973 CdG<rGdCpD 0.07
974 CdG<rGdCtD 0.07
975 CdG<rGiGaD 1.04
976 CdG<rGiGuD 1.14
977 CdG<rGiGdD 1.06
978 CdG<rGdAlD 0.26
979 CdG<rGdDrD 0.07
980 CdGpMFpGaD 0.78
981 CdGpMFpGuD 0.01
982 CdGpMFpGdD 0.02
983 CdGuCpDrD 0.00
984 CdGuCtDrD 0.00
985 CdGuCbGaD 0.03
986 CdGuCbGuD 0.02
987 CdGuCbGdD 0.02
988 CdGuCuGaD 0.11
989 CdGuCuGuD 0.11
990 CdGuCuGdD 0.10
991 CdGuCdGaD 0.1

176 CpDpCdGuD 0.00
177 CpDpCdGdD 0.00
178 skipped:  CpDpCrCpD
179 skipped:  CpDpCrCtD
180 CpDdGr>GaD 0.07
181 CpDdGr>GuD 0.02
182 CpDdGr>GdD 0.02
183 CpDdGcGaD 0.03
184 CpDdGcGuD 0.01
185 CpDdGcGdD 0.01
186 CpDdGbCpD 0.02
187 CpDdGbCtD 0.00
188 CpDdGaDrD 0.03
189 CpDdGeAlD 0.06
190 CpDdGuDrD 0.02
191 CpDdG<rGaD 0.05
192 CpDdG<rGuD 0.02
193 CpDdG<rGdD 0.01
194 CpDdGuCpD 0.02
195 CpDdGuCtD 0.00
196 CpDdGuAlD 0.03
197 CpDdGdCpD 0.02
198 CpDdGdCtD 0.00
199 CpDdGiGaD 0.06
200 CpDdGiGuD 0.01
201 CpDdGiGdD 0.01
202 CpDdGdAlD 0.04
203 CpDdGdDrD 0.03
204 skipped:  CpDtCpDrD
205 skipped:  CpDtCtDrD
206 CpDtCbGaD 0.01
207 CpDtCbGuD 0.00
208 CpDtCbGdD 0.00
209 CpDtCuGaD 0.00
210 CpDtCuGuD 0.00
211 CpDtCuGdD 0.00
212 CpDtCdGaD 0.00
213 CpDtCdGuD 0.00
214 CpDtCdGdD 0.00
215 skipped:  CpDtCrCpD
216 skipped:  CpDtCrCtD
217 CpDaGr>GaD 0.02
218 CpDaGr>GuD 0.01
219 CpDaGr>GdD 0.02
220 CpDaGcGaD 0.01
221 CpDaGcGuD 0.01
222 CpDaGcGdD 0.01
223 CpDaGbCpD 0.03
224 CpDaGbCtD 0.01
225 CpDaGaDrD 0.03
226 CpDaGeA

596 CbGdAdGaD 16.89
597 CbGdAdGuD 0.02
598 CbGdAdGdD 0.03
599 CbGdAlDrD 0.05
600 CbGdAeGaD 22.15
601 CbGdAeGuD 0.03
602 CbGdAeGdD 0.03
603 CbGdAuGaD 13.89
604 CbGdAuGuD 0.02
605 CbGdAuGdD 0.03
606 CbGdDpSpD 0.01
607 CbGdDrDrD 0.01
608 CbGdDpCpD 0.00
609 CbGdDpCtD 0.00
610 CbGdDdGaD 0.08
611 CbGdDdGuD 0.06
612 CbGdDdGdD 0.07
613 CbGdDtCpD 0.00
614 CbGdDtCtD 0.01
615 CbGdDaGaD 0.08
616 CbGdDaGuD 0.05
617 CbGdDaGdD 0.04
618 CbGdDuGaD 0.08
619 CbGdDuGuD 0.08
620 CbGdDuGdD 0.06
621 CbGdDlAlD 0.02
622 CbGpBPpGaD 2.77
623 CbGpBPpGuD 0.04
624 CbGpBPpGdD 0.02
625 CuGr>Gr>GaD 0.56
626 CuGr>Gr>GuD 0.55
627 CuGr>Gr>GdD 0.56
628 CuGr>GcGaD 0.15
629 CuGr>GcGuD 0.17
630 CuGr>GcGdD 0.16
631 CuGr>GbCpD 0.02
632 CuGr>GbCtD 0.02
633 CuGr>GaDrD 0.02
634 CuGr>GeAlD 0.09
635 CuGr>GuDrD 0.02
636 CuGr>G<rGaD 1.23
637 CuGr>G<rGuD 1.22
638 CuGr>G<rGdD 1.24
639 CuGr>GuCpD 0.03
640 CuGr>GuCtD 0.03
641 CuGr>GuAlD 0.08
642 CuGr>GdCpD 0.04
643 CuGr>GdCtD 0.04
644 CuGr>GiGaD 0.45
645 CuGr>GiGuD 0.46
646 CuGr>GiGdD 0.

1017 CdGdCrCpD 0.04
1018 CdGdCrCtD 0.04
1019 CdGpCCpGaD 0.64
1020 CdGpCCpGuD 0.01
1021 CdGpCCpGdD 0.01
1022 CdGiGr>GaD 0.46
1023 CdGiGr>GuD 0.44
1024 CdGiGr>GdD 0.43
1025 CdGiGcGaD 0.16
1026 CdGiGcGuD 0.16
1027 CdGiGcGdD 0.18
1028 CdGiGbCpD 0.02
1029 CdGiGbCtD 0.03
1030 CdGiGaDrD 0.03
1031 CdGiGeAlD 0.13
1032 CdGiGuDrD 0.02
1033 CdGiG<rGaD 0.50
1034 CdGiG<rGuD 0.39
1035 CdGiG<rGdD 0.39
1036 CdGiGuCpD 0.02
1037 CdGiGuCtD 0.02
1038 CdGiGuAlD 0.07
1039 CdGiGdCpD 0.02
1040 CdGiGdCtD 0.02
1041 CdGiGiGaD 3.40
1042 CdGiGiGuD 3.34
1043 CdGiGiGdD 3.44
1044 CdGiGdAlD 0.07
1045 CdGiGdDrD 0.01
1046 CdGdAdGaD 15.98
1047 CdGdAdGuD 0.01
1048 CdGdAdGdD 0.01
1049 CdGdAlDrD 0.04
1050 CdGdAeGaD 25.80
1051 CdGdAeGuD 0.02
1052 CdGdAeGdD 0.02
1053 CdGdAuGaD 14.47
1054 CdGdAuGuD 0.02
1055 CdGdAuGdD 0.02
1056 CdGdDpSpD 0.02
1057 CdGdDrDrD 0.01
1058 CdGdDpCpD 0.00
1059 CdGdDpCtD 0.00
1060 CdGdDdGaD 0.08
1061 CdGdDdGuD 0.06
1062 CdGdDdGdD 0.08
1063 CdGdDtCpD 0.00
1064 CdGdDtCtD 0.01
1065 CdGdDaGaD 0.10
1066 CdG