In [17]:
import pandas as pd
from joblib import Parallel, delayed

SEMGROUPPATH = '/export/home/cse200093/Jacques_Bio/eds-nlp_umls/data_umls/SemGroups_2018.txt'
SAVE_PATH = '/export/home/cse200093/Jacques_Bio/data_bio/snomed_loinc_mapping/umls_loinc_snomed_mapping.csv'
OHDSI_MAPPING_PATH = "/export/home/cse200093/Jacques_Bio/data_bio/snomed_loinc_mapping/loinc_snomed_mapping.csv"
LANGUAGES = ['ENG', 'FRE']
SAB = ['SNOMEDCT_US']

# MRCONSO.RRF
Le fichier MRCONSO.RRF (concepts dans l'UMLS) est un fichier de données du Metathesaurus de l'Unified Medical Language System (UMLS) qui contient des informations sur les concepts terminologiques et les termes associés dans les sources incluses dans l'UMLS. Il est composé de plusieurs colonnes, chacune contenant des informations spécifiques sur les termes et concepts du Metathesaurus. Voici une description de chaque colonne :

1. CUI (Unique Identifier for Concept) : Cette colonne contient un identifiant unique pour chaque concept dans l'UMLS. Tous les termes associés à un concept ont le même CUI.
2. LAT (Language of Term) : Cette colonne indique la langue du terme, par exemple "ENG" pour l'anglais.
3. TS (Term Status) : Cette colonne contient un code indiquant si le terme est actif ("A") ou obsolète ("O").
4. LUI (Unique Identifier for Lexical Unit) : Cette colonne contient un identifiant unique pour chaque forme lexicale (par exemple, chaque mot) utilisée pour représenter un concept dans la source d'origine. Il permet de suivre l'utilisation des différentes formes lexicales pour un même concept, qui peuvent être utilisées dans différentes sources.
5. STT (String Type) : Cette colonne indique le type de terme associé à une unité lexicale, par exemple "PF" pour une forme plurielle.
6. SUI (Unique Identifier for String) : Cette colonne contient un  identifiant unique pour chaque occurrence d'un terme spécifique dans une source, qui tient compte de la combinaison du terme spécifique et de la langue. Il permet de suivre l'utilisation de chaque occurrence d'un terme spécifique, qui peut avoir différentes formes grammaticales ou variantes orthographiques dans une même source.
7. ISPREF (Atom is Preferred Term) : Cette colonne contient un code indiquant si le terme est le terme préféré pour le concept. Les termes préférés sont généralement choisis pour leur clarté et leur utilité pour la recherche.
8. AUI (Unique Identifier for Atom) : Cette colonne contient un identifiant unique pour chaque "atome" dans l'UMLS. Les atomes sont des unités terminologiques élémentaires, chacune associée à un seul CUI.
9. SAUI (Source asserted atom identifier) : Cette colonne contient un identifiant unique pour chaque atome provenant d'une source spécifique dans l'UMLS.
10. SCUI (Source asserted concept identifier) : Cette colonne contient un identifiant unique pour chaque type sémantique dans l'UMLS. Les types sémantiques sont des catégories générales de concepts, tels que "Maladie ou syndrome" ou "Substance chimique".
11. SDUI (Source asserted descriptor identifier) : Cette colonne contient un identifiant unique pour chaque descripteur sémantique dans l'UMLS.
12. SAB (Abbreviation for Source) : Cette colonne contient l'abréviation de la source de chaque atome.
13. TTY (Term Type in Source) : Abbreviation for term type in source vocabulary, for example PN (Metathesaurus Preferred Name) or CD (Clinical Drug).
14. CODE : Most useful source asserted identifier (if the source vocabulary has more than one identifier), or a Metathesaurus-generated source entry identifier (if the source vocabulary has none)
15. STR (String) : Cette colonne contient le terme sous forme de chaîne de caractères.
16. SRL (Source Restriction Level) : Cette colonne contient un code indiquant le niveau de restriction de la source d'origine.
17. SUPPRESS (Suppressible Flag) : Cette colonne contient un code indiquant si le terme doit être supprimé ("O") ou non ("N").
18. CVF (Content View Flag) : Bit field used to flag rows included in Content View. This field is a varchar field to maximize the number of bits available for use.

In [2]:
mrconso = sql("SELECT * FROM cse_200093_work.MRCONSO")
mrconso.show()
mrconso.filter(mrconso.LAT.isin(LANGUAGES)).show()

                                                                                

+--------+---+---+---------+---+---------+------+---------+-------+---------+-------+------+---+---------+--------------------+---+--------+----+
|     CUI|LAT| TS|      LUI|STT|      SUI|ISPREF|      AUI|   SAUI|     SCUI|   SDUI|   SAB|TTY|     CODE|                 STR|SRL|SUPPRESS| CVF|
+--------+---+---+---------+---+---------+------+---------+-------+---------+-------+------+---+---------+--------------------+---+--------+----+
|C0000005|ENG|  P| L0000005| PF| S0007492|     Y|A26634265|   null| M0019694|D012711|   MSH|PEP|  D012711|(131)I-Macroaggre...|  0|       N| 256|
|C0000005|ENG|  S| L0270109| PF| S0007491|     Y|A26634266|   null| M0019694|D012711|   MSH| ET|  D012711|          (131)I-MAA|  0|       N| 256|
|C0000005|FRE|  P| L6220710| PF| S7133957|     Y|A13433185|   null| M0019694|D012711|MSHFRE|PEP|  D012711|Macroagrégats d'a...|  3|       N|null|
|C0000005|FRE|  S| L6215648| PF| S7133916|     Y|A27488794|   null| M0019694|D012711|MSHFRE| ET|  D012711|           MAA-I 1

# MRREL.RRF
Le fichier MRREL.RRF du Metathesaurus de l'UMLS contient des informations sur les relations entre les concepts médicaux. Chaque ligne du fichier représente une relation entre deux concepts, qui sont identifiés par leur concept unique identifier (CUI). Les colonnes de ce fichier sont les suivantes :
1. CUI1 (Concept Unique Identifier 1) : C'est l'identifiant unique du premier concept impliqué dans la relation.
2. AUI1 (Atom Unique Identifier 1) : C'est l'identifiant unique de l'atome (terme spécifique) du premier concept impliqué dans la relation.
3. STYPE1 : The name of the column in MRCONSO.RRF that contains the identifier used for the first element in the relationship, i.e. AUI, CODE, CUI, SCUI, SDUI.
4. REL (Relation Label) : C'est l'étiquette de la relation entre les deux concepts, qui décrit la nature de la relation. Par exemple, "isa" pour la relation "est un type de".
5. CUI2 (Concept Unique Identifier 2) : C'est l'identifiant unique du deuxième concept impliqué dans la relation.
6. AUI2 (Atom Unique Identifier 2) : C'est l'identifiant unique de l'atome (terme spécifique) du deuxième concept impliqué dans la relation.
7. STYPE2 (Semantic Type 2) : C'est le type sémantique du deuxième concept impliqué dans la relation.
8. RELA (Relation Attribute) : C'est l'attribut de la relation, qui précise davantage la nature de la relation. Par exemple, "has_tradename" pour la relation "a pour nom commercial".
9. RUI (Relationship Unique Identifier) : Unique identifier relationship.
10. SRUI (Source Relationship Unique Identifier) : Source asserted relationship identifier.
11. SAB (Source Abbreviation) : C'est l'abréviation de la source de l'atome (terme spécifique) impliqué dans la relation.
12. SL : Source of relationship labels
13. RG (Relationship Group) : C'est le groupe de relations auquel appartient la relation. Plusieurs relations peuvent être regroupées pour former une relation complexe.
14. DIR (Directionality) : Source asserted directionality flag. Y indicates that this is the direction of the relationship in its source; N indicates that it is not; a blank indicates that it is not important or has not yet been determined.
15. SUPPRESS (Suppressible Flag) : Cette colonne contient un code indiquant si le terme doit être supprimé ("O") ou non ("N").
16. CVF (Content View Flag) : Bit field used to flag rows included in Content View. This field is a varchar field to maximize the number of bits available for use.

In [3]:
mrrel = sql("SELECT * FROM cse_200093_work.MRREL")
mrrel.show()

+--------+---------+------+---+--------+---------+------+--------------------+----------+----------+-----------+-----------+----+----+--------+----+
|    CUI1|     AUI1|STYPE1|REL|    CUI2|     AUI2|STYPE2|                RELA|       RUI|      SRUI|        SAB|         SL|  RG| DIR|SUPPRESS| CVF|
+--------+---------+------+---+--------+---------+------+--------------------+----------+----------+-----------+-----------+----+----+--------+----+
|C0000731|A24682424|   AUI| SY|C0000731|A24677906|   AUI|                null|R156220030|      null|        HPO|        HPO|null|null|       N|null|
|C0000578|A29964450|   AUI| SY|C0000578|A31714794|   AUI|                null|R194213061|      null|     RXNORM|     RXNORM|null|null|       N|null|
|C0000735|A31375265|   AUI| RQ|C0000735|A31265766|   AUI|          classifies|R189569623|      null|     MDRKOR|     MDRKOR|null|null|       N|null|
|C0000359| A7480813|  SDUI|CHD|C0673071|A13463875|  SDUI|                null| R86651182|      null|     M

# MRSTY.RRF
Le fichier MRSTY.RRF du Metathesaurus de l'UMLS contient des informations sur les types sémantiques des concepts médicaux. Chaque ligne du fichier représente un concept et son type sémantique. Les colonnes de ce fichier sont les suivantes :
1. CUI (Concept Unique Identifier) : C'est l'identifiant unique du concept.
2. TUI (Semantic Type Identifier) : C'est l'identifiant unique du type sémantique du concept.
3. STN (Semantic Type tree number) : C'est le numéro de l'arborescence du type sémantique du concept.
4. STY (Semantic Type) : C'est le nom du type sémantique du concept.
5. ATUI (Attribute Identifier) : C'est l'identifiant de l'attribut, qui précise davantage le type sémantique du concept.
6. CVF (Concept Valid Flag) :  Bit field used to flag rows included in Content View. This field is a varchar field to maximize the number of bits available for use.

In [4]:
mrsty = sql("SELECT * FROM cse_200093_work.mrsty")
mrsty.show()

+--------+----+------------+--------------------+-----------+---+
|     CUI| TUI|         STN|                 STY|       ATUI|CVF|
+--------+----+------------+--------------------+-----------+---+
|C0045741|T109|  A1.4.1.2.1|    Organic Chemical|AT205398241|256|
|C0055347|T121|  A1.4.1.1.1|Pharmacologic Sub...| AT07948737|256|
|C0030605|T059|    B1.3.1.1|Laboratory Procedure| AT28874865|256|
|C0031702|T197|  A1.4.1.2.2|  Inorganic Chemical| AT17732223|256|
|C0010724|T123|  A1.4.1.1.3|Biologically Acti...| AT17599869|256|
|C0050591|T129|A1.4.1.1.3.5|  Immunologic Factor| AT17747257|256|
|C0055213|T109|  A1.4.1.2.1|    Organic Chemical| AT17689936|256|
|C0034843|T116|A1.4.1.2.1.7|Amino Acid, Pepti...| AT17641623|256|
|C0049101|T114|A1.4.1.2.1.5|Nucleic Acid, Nuc...| AT08150504|256|
|C0000413|T116|A1.4.1.2.1.7|Amino Acid, Pepti...| AT17641835|256|
|C0036883|T123|  A1.4.1.1.3|Biologically Acti...| AT17597192|256|
|C0048405|T109|  A1.4.1.2.1|    Organic Chemical| AT08591312|256|
|C0027427|

# Récupération des STY d'intérêt

Ce sont les STY liés aux Procédures en laboratoire. Pour cela, on utilise le fichier `SemGroups_2018.txt` que nous trouvons sur le site de la NIH : https://lhncbc.nlm.nih.gov/ii/tools/MetaMap/documentation/SemanticTypesAndGroups.html. Le fichier contient une table composée de 4 colonnnes :
1. GUI (Semantic Group Unique Identifier) : Identifiant unique associé à chaque groupe de types sémantiques.
2. STG (Semantic Type Group) : Nom du groupe de types sémantiques.
3. TUI (Semantic Type Identifier) : C'est l'identifiant unique du type sémantique du concept.
4. STY (Semantic Type) : C'est le nom du type sémantique du concept.

Rq1 : Ce travail a été réalisé avant d'avoir implémenté la base de données SQL liée aux données de `SemGroups_2018.txt`.

Rq2 : La base de données `SemGroups_2018.txt` n'est pas nécessaire ici puisque nous nous intéressons qu'à un seul type sémantique (et non plusieurs types sémantiques liés à un ou plusieurs groupes sémantiques). Nous avons fait cette démarche dans un but de compréhension de l'organistion des données et dans un but d'une possible généralisation de ce programme.

In [5]:
semgroups = pd.read_csv(SEMGROUPPATH,
    sep="|",
    names=['GUI', 'STG', 'TUI', 'STY'])

# Find the TUI linked to 'Laboratory Procedure'
labprocrow = semgroups.loc[semgroups['STY'] == 'Laboratory Procedure']
labproctui = labprocrow.iloc[0]['TUI']

In [6]:
# Get all the 'CUI' ich describe a 'Laboratory Procedure'
labproc = mrsty.select('CUI').filter(mrsty.TUI == labproctui)
cuiwithgoodsab = mrconso.select('CUI').filter(mrconso.SAB.isin(SAB))

# Get all STR linked to each ATUI
labprocstr = mrconso.join(cuiwithgoodsab, 'CUI', 'inner').join(labproc, 'CUI', 'inner').filter(mrconso.LAT.isin(LANGUAGES)).select('CUI', 'STR', 'SAB', 'CODE')
labprocstr.show()

[Stage 7:>                                                          (0 + 1) / 1]

+--------+--------------------+-----------+-----------+
|     CUI|                 STR|        SAB|       CODE|
+--------+--------------------+-----------+-----------+
|C0004618|Bacterial Count M...|        MTH|     NOCODE|
|C0004618|Bacterial Count M...|        MTH|     NOCODE|
|C0004618|            Bacteria|  NCI_CDISC|     C64469|
|C0004618|            Bacteria|  NCI_CDISC|     C64469|
|C0004618|            Bacteria|  NCI_CDISC|SDTM-MBTEST|
|C0004618|            Bacteria|  NCI_CDISC|SDTM-MBTEST|
|C0004618|            Bacteria|  NCI_CDISC|SDTM-LBTEST|
|C0004618|            Bacteria|  NCI_CDISC|SDTM-LBTEST|
|C0004618|     Bacterial Count|        NCI|     C64469|
|C0004618|     Bacterial Count|        NCI|     C64469|
|C0004618|     Bacterial Count|        MSH|    D058491|
|C0004618|     Bacterial Count|        MSH|    D058491|
|C0004618|     bacterial count|        CHV| 0000001668|
|C0004618|     bacterial count|        CHV| 0000001668|
|C0004618|     Bacterial count|SNOMEDCT_US|  115

                                                                                

In [7]:
# Saving as a pandas DataFrame and saving as json
labprocstr_df = labprocstr.toPandas()
labprocstr_df

                                                                                

Unnamed: 0,CUI,STR,SAB,CODE
0,C0004618,Bacterial Count Measurement,MTH,NOCODE
1,C0004618,Bacterial Count Measurement,MTH,NOCODE
2,C0004618,Bacteria,NCI_CDISC,C64469
3,C0004618,Bacteria,NCI_CDISC,C64469
4,C0004618,Bacteria,NCI_CDISC,SDTM-MBTEST
...,...,...,...,...
577104,C3164018,25-Hydroxyvitamin D2 Measurement,NCI,C156528
577105,C3266121,Measurement of Theileria equi antibody,SNOMEDCT_US,449852008
577106,C3266121,Measurement of Theileria equi antibody,SNOMEDCT_US,449852008
577107,C3266121,Measurement of Theileria equi antibody (proced...,SNOMEDCT_US,449852008


In [None]:
# Try to find LOINC linked to our CUIs

labprocstr_df = labprocstr_df.groupby("CUI").agg({"CUI":"first", "STR":list, "SAB":list}).reset_index(drop=True)
print("Number of CUIs in our dataset:", len(labprocstr_df))
print("Number of CUIs with possible link to LOINC in our dataset:", len(labprocstr_df.loc[labprocstr_df["SAB"].apply(lambda sabs: len([sab for sab in sabs if "LNC" in sab])) > 0]))
labprocstr_df.loc[labprocstr_df["SAB"].apply(lambda sabs: len([sab for sab in sabs if "LNC" in sab])) > 0]

In [15]:
# Saving as a pandas DataFrame and saving as json
labprocstr_df = labprocstr.toPandas()
labprocstr_df

                                                                                

Unnamed: 0,CUI,STR,SAB,CODE
0,C0004618,Bacterial Count Measurement,MTH,NOCODE
1,C0004618,Bacterial Count Measurement,MTH,NOCODE
2,C0004618,Bacteria,NCI_CDISC,C64469
3,C0004618,Bacteria,NCI_CDISC,C64469
4,C0004618,Bacteria,NCI_CDISC,SDTM-MBTEST
...,...,...,...,...
577104,C3164018,25-Hydroxyvitamin D2 Measurement,NCI,C156528
577105,C3266121,Measurement of Theileria equi antibody,SNOMEDCT_US,449852008
577106,C3266121,Measurement of Theileria equi antibody,SNOMEDCT_US,449852008
577107,C3266121,Measurement of Theileria equi antibody (proced...,SNOMEDCT_US,449852008


In [8]:
# Try to find number of SNOMED codes in our dataset which have a link with LOINC thx to ohdsi mapping

ohdsi_mapping_df = pd.read_csv(OHDSI_MAPPING_PATH)
ohdsi_mapping_df["snomed_code"] = ohdsi_mapping_df["snomed_code"].apply(str)
cui_loinc_mapping_df = ohdsi_mapping_df[["snomed_code", "loinc_code"]].merge(labprocstr_df, left_on="snomed_code", right_on="CODE", how="inner")
display(len(cui_loinc_mapping_df["CUI"].unique()))
display(len(labprocstr_df["CUI"].unique()))
cui_loinc_mapping_df

2683

10048

Unnamed: 0,snomed_code,loinc_code,CUI,STR,SAB,CODE
0,122104008,85978-5,C1294545,Measurement of Streptococcus pneumoniae Danish...,SNOMEDCT_US,122104008
1,122104008,85978-5,C1294545,Measurement of Streptococcus pneumoniae Danish...,SNOMEDCT_US,122104008
2,122104008,85978-5,C1294545,Measurement of Streptococcus pneumoniae Danish...,SNOMEDCT_US,122104008
3,122104008,85978-5,C1294545,Measurement of Streptococcus pneumoniae Danish...,SNOMEDCT_US,122104008
4,122104008,85978-5,C1294545,Measurement of Streptococcus pneumoniae Danish...,SNOMEDCT_US,122104008
...,...,...,...,...,...,...
297066,121739001,79495-8,C1295101,Azelate measurement (procedure),SNOMEDCT_US,121739001
297067,105114001,80608-3,C0524060,Cefuroxime measurement,SNOMEDCT_US,105114001
297068,105114001,80608-3,C0524060,Cefuroxime measurement,SNOMEDCT_US,105114001
297069,105114001,80608-3,C0524060,Cefuroxime measurement (procedure),SNOMEDCT_US,105114001


In [16]:
# Map the possible SNOMED
# Group by CUI and look if some SNOMED are linked to more than one CUI
parallelizer = Parallel(
    n_jobs=-1, verbose=20, backend="multiprocessing", prefer="processes"
)

labprocstr_per_cui_df = labprocstr_df.loc[labprocstr_df["SAB"].str.contains("SNOMED")].groupby("CUI").agg({"CUI":"first", "STR":set, "CODE":set}).reset_index(drop=True)

# Load ohdsi mapping dataset
ohdsi_mapping_df = pd.read_csv(OHDSI_MAPPING_PATH)
ohdsi_mapping_df["snomed_code"] = ohdsi_mapping_df["snomed_code"].apply(str)

def link_to_loinc(snomed_codes):
    loinc_codes = set()
    loinc_des = set()
    for snomed_code in snomed_codes:
        ohdsi_part_df = ohdsi_mapping_df.loc[ohdsi_mapping_df["snomed_code"] == snomed_code]
        loinc_codes = loinc_codes.union(set(ohdsi_part_df["loinc_code"].tolist()))
        loinc_des = loinc_des.union(set(ohdsi_part_df["loinc_term"].tolist()))
    return [loinc_codes, loinc_des]

labprocstr_per_cui_df[["loinc_codes", "loinc_des"]] = parallelizer(
    delayed(link_to_loinc)(snomed_codes)
    for snomed_codes in labprocstr_per_cui_df["CODE"].tolist()
)

labprocstr_per_cui_df

[Parallel(n_jobs=-1)]: Using backend MultiprocessingBackend with 5 concurrent workers.
[Parallel(n_jobs=-1)]: Done   1 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Batch computation too fast (0.0134s.) Setting batch_size=2.
[Parallel(n_jobs=-1)]: Done   2 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Done   3 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Done   4 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Done   5 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Done   6 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Done   7 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Done   8 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Done   9 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Done  11 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Batch computation too fast (0.0065s.) Setting batch_size=4.
[Parallel(n_jobs=-1)]: Done  12 tasks      | elapsed:    0.0s
[Parallel(n_jobs=-1)]: Done  14 tasks      | elapsed:    0.0s
[Pa

Unnamed: 0,CUI,STR,CODE,loinc_codes,loinc_des
0,C0001802,"{Agglutination assay (procedure) [Ambiguous], ...","{359818001, 73865004, 359821004}",{},{}
1,C0002500,"{Amikacin level, Amikacin measurement (procedu...",{1550000},"{3321-7, 13546-7, 50802-8, 31099-5, 17798-0, 3...",{Amikacin [Mass/volume] in Serum or Plasma --p...
2,C0002778,"{Analysis (qualifier value), Analysis}",{272389005},{},{}
3,C0002866,"{Androsterone measurement (procedure), Androst...",{104519008},"{34242-8, 34241-0, 57640-5, 15029-2, 57641-3, ...",{Androsterone [Mass/volume] in 24 hour Urine -...
4,C0004076,"{Glucose measurement, urine (procedure), Urine...","{30994003, 144506006, 308745007, 171246008, 69...","{74351-8, 15077-1, 56124-1, 16907-8, 1505-7, 2...",{Glucose [Moles/volume] in Urine collected for...
...,...,...,...,...,...
10043,C3165166,{Measurement of thiopurine methyltransferase i...,{447959006},{},{}
10044,C3241939,"{White blood cell test (procedure), White bloo...",{252305002},{},{}
10045,C3249876,"{Sample microscopy (procedure), Sample microsc...","{145358009, 168127009}",{},{}
10046,C3266121,{Measurement of Theileria equi antibody (proce...,{449852008},"{23466-6, 20690-4, 22105-1}",{Theileria equi Ab [Presence] in Serum by Comp...


In [18]:
# Keep only the CUIs with a link to SNOMED and rename columns

labprocstr_per_cui_df = labprocstr_per_cui_df.loc[labprocstr_per_cui_df["loinc_codes"].apply(len) > 0]
labprocstr_per_cui_df = labprocstr_per_cui_df.rename(columns={"CODE": "snomed_codes", "STR":"snomed_des"})
labprocstr_per_cui_df.to_csv(SAVE_PATH)

In [13]:
# Find CUI which may lead to same LOINC match

def find_connected_component(cui1, code1):
    cui_res = []
    for index2, (cui2, code2) in labprocstr_per_cui_df[["CUI", "loinc_codes"]].iterrows():
        if code1.intersection(code2):
            cui_res.append(cui2)
    return cui_res

labprocstr_per_cui_df["cuis_which_are_intersected"] = parallelizer(
    delayed(find_connected_component)(cui1, code1)
    for _, (cui1, code1) in labprocstr_per_cui_df[["CUI", "loinc_codes"]].iterrows()
)

labprocstr_per_cui_df.loc[labprocstr_per_cui_df["cuis_which_are_intersected"].apply(len) > 1]

[Parallel(n_jobs=-1)]: Using backend MultiprocessingBackend with 5 concurrent workers.
[Parallel(n_jobs=-1)]: Done   1 tasks      | elapsed:    0.1s
[Parallel(n_jobs=-1)]: Batch computation too fast (0.0838s.) Setting batch_size=2.
[Parallel(n_jobs=-1)]: Done   2 tasks      | elapsed:    0.1s
[Parallel(n_jobs=-1)]: Done   3 tasks      | elapsed:    0.1s
[Parallel(n_jobs=-1)]: Done   4 tasks      | elapsed:    0.1s
[Parallel(n_jobs=-1)]: Done   5 tasks      | elapsed:    0.1s
[Parallel(n_jobs=-1)]: Done   6 tasks      | elapsed:    0.2s
[Parallel(n_jobs=-1)]: Done   7 tasks      | elapsed:    0.2s
[Parallel(n_jobs=-1)]: Done   8 tasks      | elapsed:    0.2s
[Parallel(n_jobs=-1)]: Done   9 tasks      | elapsed:    0.2s
[Parallel(n_jobs=-1)]: Done  10 tasks      | elapsed:    0.2s
[Parallel(n_jobs=-1)]: Done  12 tasks      | elapsed:    0.3s
[Parallel(n_jobs=-1)]: Done  14 tasks      | elapsed:    0.3s
[Parallel(n_jobs=-1)]: Done  16 tasks      | elapsed:    0.3s
[Parallel(n_jobs=-1)]: D

Unnamed: 0,CUI,snomed_des,snomed_codes,loinc_codes,loinc_des,cuis_which_are_intersected
1,C0002500,"{Amikacin level, Amikacin measurement (procedu...",{1550000},"{3321-7, 13546-7, 50802-8, 31099-5, 17798-0, 3...",{Amikacin [Mass/volume] in Serum or Plasma --p...,[C0002500]
3,C0002866,"{Androsterone measurement (procedure), Androst...",{104519008},"{34242-8, 34241-0, 57640-5, 15029-2, 57641-3, ...",{Androsterone [Mass/volume] in 24 hour Urine -...,[C0002866]
4,C0004076,"{Glucose measurement, urine (procedure), Urine...","{30994003, 144506006, 308745007, 171246008, 69...","{74351-8, 15077-1, 56124-1, 16907-8, 1505-7, 2...",{Glucose [Moles/volume] in Urine collected for...,"[C0004076, C0523658]"
10,C0005643,"{Bismuth measurement (procedure), Bismuth meas...",{64685008},"{60057-7, 60059-3, 43894-5, 43878-8, 81429-3, ...","{Bismuth [Moles/volume] in Serum or Plasma, Bi...",[C0005643]
15,C0005800,"{Blood gases NOS (procedure), Blood gas analys...","{167018008, 167032005, 270009008, 278297009, 1...",{24345-1},{Deprecated Gas & CO panel},[C0005800]
...,...,...,...,...,...,...
9983,C2739807,"{Platelet antibody assay, NOS, Platelet antibo...",{55605003},"{22759-5, 41616-4, 5379-3, 24375-8, 57440-0}","{Platelet Ab [Titer] in Serum, Platelet Ab [Pr...",[C2739807]
9988,C2919221,{Measurement of cancer antigen 27-29 (procedur...,{445430004},"{17842-6, 19187-4, 2012-3, 50782-2}",{Cancer Ag 27-29 [Units/volume] in Serum or Pl...,[C2919221]
9997,C2919612,{Detection of Treponema pallidum using polymer...,{444975002},{29310-0},{Treponema pallidum [Presence] in Specimen by ...,[C2919612]
10039,C3164018,"{Measurement of 25-hydroxyergocalciferol, Meas...",{447678008},"{95593-0, 49054-0, 46269-7}",{25-hydroxyvitamin D2 [Mass/volume] in Serum o...,[C3164018]
