In [2]:
%%capture
!pip install biopython
!pip install wikidataintegrator
from wikidataintegrator import wdi_core, wdi_login, wdi_helpers
import getpass
import pandas as pd
from Bio import Entrez

In [3]:
print("username:")
username = input()
print("password:")
password = getpass.getpass()
login = wdi_login.WDLogin(user=username, pwd=password)

username:
andrawaag
password:
········


In [4]:
def search(query):
    Entrez.email = 'andra@micelio.be'
    handle = Entrez.esearch(db='pubmed',
                            sort='relevance',
                            retmax='500',
                            retmode='xml',
                            term=query)
    results = Entrez.read(handle)
    return results

def fetch_details(id_list):
    ids = ','.join(id_list)
    Entrez.email = 'andra@micelio.be',
    handle = Entrez.efetch(db='pubmed',
                           retmode='xml',
                           id=ids)
    results = Entrez.read(handle)
    return results

def getDois(authorName):
    doiList = []
    results = fetch_details(search(authorName)['IdList'])
    for result in results["PubmedArticle"]:
        for id in result['PubmedData']['ArticleIdList']:
            if id.attributes['IdType'] == "doi":
                 doiList.append(str(id))
    return doiList

def create_or_get_wd(dois):
    for doi in dois:
        print(doi, wdi_helpers.PublicationHelper(doi, id_type="doi", source="crossref").get_or_create(login))

# Jason Swedlow
Extracted list of DOIs from Pubmed

In [5]:
create_or_get_wd(getDois("Jason Swedlow[AU]"))

10.1093/humrep/deac007 ('Q111442107', [], True)
10.1016/j.jmb.2022.167505 ('Q111442108', [], True)
10.1038/s41592-021-01387-x ('Q111442109', [], True)
10.1038/d41573-021-00196-3 ('Q111442112', [], True)
10.1530/REP-21-0372 ('Q111442113', [], True)
10.1038/s41592-021-01326-w ('Q111442114', [], True)
10.1038/s41592-021-01162-y ('Q111442118', [], True)
10.1038/s41592-022-01415-4 (None, [], KeyError('given'))
10.1038/s41592-021-01166-8 ('Q111441329', [], True)
10.1038/s41592-021-01113-7 ('Q111442122', [], True)
10.1038/d41586-021-02776-0 ('Q111442123', [], True)
10.1111/jmi.13041 ('Q111442124', [], True)
10.1093/gigascience/giaa041 ('Q94585053', [], True)
10.1021/acsnano.9b05891 ('Q92004876', [], True)
10.1007/978-3-030-23937-4_1 (None, ['unknown type: book-chapter'], ValueError('can not create WDItemID with None'))
10.1364/BOE.10.001999 ('Q62573482', [], True)
10.1038/s41592-018-0195-8 ('Q58083861', [], True)
10.1038/s41592-018-0169-x ('Q57030119', [], True)
10.1371/journal.ppat.1007230 (

## Angus Lamond

In [6]:
create_or_get_wd(getDois("Angus Lamond[AU]"))

10.1016/j.isci.2022.103827 ('Q111442137', [], True)
10.21769/BioProtoc.4106 ('Q111442138', [], True)
10.1093/nar/gkab465 ('Q110073995', [], True)
10.1038/s41556-022-00867-2 ('Q111442139', [], True)
10.7554/eLife.70055 ('Q111442140', [], True)
10.1038/s41467-020-18089-1 ('Q98725915', [], True)
10.7554/eLife.57390 (None, [], KeyError('given'))
10.1016/j.celrep.2021.109032 ('Q111442142', [], True)
10.12688/wellcomeopenres.15405.2 ('Q90890718', [], True)
10.1038/s41590-019-0495-x ('Q90576371', [], True)
10.12688/wellcomeopenres.15421.1 ('Q91085331', [], True)
10.1016/j.jaci.2019.05.024 ('Q92489299', [], True)
10.15252/embj.2020104419 ('Q94463039', [], True)
10.1074/mcp.RA119.001889 ('Q90051656', [], True)
10.1038/s41467-020-15173-4 ('Q90316968', [], True)
10.1093/bioinformatics/bty823 (None, [], ValueError("More than one wikidata ID found for P236 1367-4803: [{'item': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q4914910'}}, {'item': {'type': 'uri', 'value': 'http://www.wikidat

10.1615/critreveukaryotgeneexpr.v13.i1.40 ('Q35168228', [], True)
10.1091/mbc.e02-07-0376 ('Q39697073', [], True)
10.1038/ncb809 ('Q44030629', [], True)
10.1017/s1355838202020022 ('Q24540106', [], True)
10.1016/s0092-8674(02)00730-4 ('Q28217970', [], True)
10.1083/jcb.200201120 ('Q24671777', [], True)
10.1083/jcb.200206111 ('Q24672790', [], True)
10.1091/mbc.02-03-0034 ('Q33960367', [], True)
10.1016/s0960-9822(01)00650-9 ('Q24292165', [], True)
10.1100/tsw.2002.43 ('Q55405866', [], True)
10.1186/gb-2002-3-6-reports4016 (None, [], IndexError('list index out of range'))
10.1016/s0960-9822(01)00632-7 ('Q29397010', [], True)


# Tom Owen-Hughes

In [7]:
create_or_get_wd(getDois("Tom Owen-Hughes[AU]"))

10.1016/j.celrep.2021.109943 ('Q111442182', [], True)
10.1016/j.gde.2020.11.003 ('Q104106137', [], True)
10.12688/f1000research.21933.1 ('Q99630524', [], True)
10.1016/j.cell.2019.08.024 ('Q93151283', [], True)
10.1038/s41589-019-0329-z ('Q91565780', [], True)
10.1038/s41589-019-0294-6 ('Q92616532', [], True)
10.7554/eLife.36530 ('Q56529918', [], True)
10.1371/journal.pgen.1007783 ('Q59810745', [], True)
10.7554/eLife.35720 ('Q56530225', [], True)
10.7554/eLife.22510 ('Q41850902', [], True)
10.1038/nsmb.3347 ('Q48372682', [], True)
10.1093/nar/gkw331 ('Q41005325', [], True)
10.1016/j.celrep.2017.02.045 ('Q51116901', [], True)
10.1126/science.aam5403 ('Q51180482', [], True)
10.1261/rna.058339.116 ('Q41131980', [], True)
10.1186/s12860-016-0111-y ('Q27318586', [], True)
10.1093/nar/gkw209 ('Q27704509', [], True)
10.1261/rna.053959.115 ('Q38889056', [], True)
10.1371/journal.pgen.1005940 ('Q34520034', [], True)
10.1093/bioinformatics/btv425 (None, [], ValueError("More than one wikidata ID

# Julian Blow

In [8]:
create_or_get_wd(getDois("Julian Blow[AU]"))

10.1098/rsob.210121 ('Q111442196', [], True)
10.1021/acs.jmedchem.1c01532 ('Q111442197', [], True)
10.1083/jcb.201905181 ('Q91563646', [], True)
10.1038/s41467-018-06066-8 ('Q58747295', [], True)
10.1002/cbic.201700500 ('Q47309289', [], True)
10.1083/jcb.201708023 ('Q52723140', [], True)
10.1016/j.chembiol.2017.06.019 ('Q41461302', [], True)
10.1073/pnas.1603241113 ('Q37304838', [], True)
10.1016/j.celrep.2017.02.042 ('Q42136223', [], True)
10.1371/journal.pgen.1005872 ('Q27309114', [], True)
10.1073/pnas.1603252113 ('Q37304981', [], True)
10.1080/15384101.2016.1199305 ('Q39666879', [], True)
10.1007/978-1-4939-2957-3_6 (None, ['unknown type: book-chapter'], ValueError('can not create WDItemID with None'))
10.1038/ncb3378 ('Q39669947', [], True)
10.1016/j.celrep.2016.03.078 ('Q36850235', [], True)
10.1016/j.bbamcr.2015.12.019 ('Q52890738', [], True)
10.1126/science.aad5634 ('Q28272401', [], True)
10.1387/ijdb.160142jb ('Q48539046', [], True)
10.1038/ncomms7352 ('Q43180171', [], True)
1

# Ronald Hay

In [9]:
create_or_get_wd(getDois("Ronald Hay[AU]"))

10.3389/fcell.2022.743287 ('Q111442215', [], True)
10.1042/BCJ20210256 ('Q111442216', [], True)
10.1083/jcb.202005130 ('Q111442217', [], True)
10.15252/embj.2020107413 ('Q111442218', [], True)
10.1016/j.mcpro.2021.100164 ('Q111442219', [], True)
10.1038/s41467-020-17647-x ('Q98177170', [], True)
10.1016/j.isci.2020.101638 ('Q100995088', [], True)
10.1016/j.molcel.2020.04.032 ('Q95847924', [], True)
10.3390/cells9030777 ('Q90631620', [], True)
10.1038/s41467-020-16666-y ('Q96171834', [], True)
10.1016/j.chembiol.2019.11.013 ('Q92142744', [], True)
10.1016/j.molcel.2019.06.002 ('Q93114616', [], True)
10.1371/journal.pgen.1008427 ('Q91439426', [], True)
10.1242/jcs.232330 ('Q93051383', [], True)
10.1073/pnas.1907031116 ('Q92482312', [], True)
10.1016/j.isci.2019.05.028 ('Q92660613', [], True)
10.1016/bs.mie.2018.11.005 (None, ['unknown type: book-chapter'], ValueError('can not create WDItemID with None'))
10.1016/j.celrep.2018.09.080 ('Q57796342', [], True)
10.1016/j.celrep.2018.04.022 ('

# Victoria Cowling

In [10]:
create_or_get_wd(getDois("Victoria Cowling[AU]"))

10.1016/j.jmb.2022.167451 ('Q111442246', [], True)
10.1093/nar/gkac122 ('Q111442247', [], True)
10.1136/emermed-2020-209797 ('Q97566417', [], True)
10.1042/BCJ20210219 ('Q111442249', [], True)
10.1093/nar/gkab465 ('Q110073995', [], True)
10.1177/24725552211000652 ('Q111442250', [], True)
10.1093/nar/gkab130 ('Q111442251', [], True)
10.1098/rsob.190306 ('Q89876922', [], True)
10.1073/pnas.2002360117 ('Q100550292', [], True)
10.1002/chem.202001036 ('Q91661050', [], True)
10.1098/rsob.190052 ('Q64106179', [], True)
10.1016/j.bbagrm.2018.09.011 ('Q57479681', [], True)
10.1093/nar/gkz613 ('Q92075235', [], True)
10.26508/lsa.201800092 ('Q57753844', [], True)
10.1016/j.celrep.2018.04.004 ('Q52714681', [], True)
10.1016/j.tibs.2019.01.002 ('Q64085149', [], True)
10.1002/wrna.1450 ('Q47710506', [], True)
10.1371/journal.pone.0201263 ('Q58867158', [], True)
10.1080/15476286.2018.1460996 ('Q52316043', [], True)
10.1016/j.celrep.2016.06.089 ('Q41786413', [], True)
10.1042/BCJ20160930 ('Q41768979',

# Kasper Lippert-Rasmussen

In [11]:
create_or_get_wd(getDois("Kasper Lippert-Rasmussen[AU]"))

10.1136/medethics-2020-106078 ('Q89701024', [], True)
10.1111/bioe.12908 ('Q111442269', [], True)
10.1136/medethics-2015-103360 ('Q87381739', [], True)
10.1136/medethics-2012-100580 ('Q58664869', [], True)
10.1136/medethics-2011-100163 ('Q48516367', [], True)
10.1007/s11019-010-9240-9 ('Q48857652', [], True)


# Tomoyuki U Tanaka

In [12]:
create_or_get_wd(getDois("Tomoyuki U Tanaka[AU]"))

10.1002/bies.202100246 ('Q111442270', [], True)
10.1083/jcb.202011117 ('Q111442272', [], True)
10.1080/15384101.2020.1757242 ('Q94656800', [], True)
10.1016/j.molcel.2020.04.036 ('Q95650889', [], True)
10.7554/eLife.46902 ('Q83231218', [], True)
10.1016/j.cub.2019.03.051 ('Q64065354', [], True)
10.1083/jcb.201807125 ('Q64107981', [], True)
10.1242/jcs.203000 ('Q38762817', [], True)
10.1016/j.molcel.2017.10.009 ('Q44076675', [], True)
10.1083/jcb.201608122 ('Q38818100', [], True)
10.1186/s12860-016-0111-y ('Q27318586', [], True)
10.1038/ncb3128 ('Q41790587', [], True)
10.1016/j.cub.2015.06.023 ('Q42436460', [], True)
10.1038/ncb3153 ('Q86998659', [], True)
10.1038/embor.2013.181 ('Q27008596', [], True)
10.1016/j.celrep.2013.10.014 ('Q41885231', [], True)
10.1016/j.molcel.2013.05.011 ('Q27940145', [], True)
10.1083/jcb.201306143 ('Q41997371', [], True)
10.1016/j.devcel.2011.09.006 ('Q41050003', [], True)
10.1038/ncb2495 ('Q27937573', [], True)
10.1016/j.cub.2010.12.050 ('Q42056835', [], 

# Tony Ly

In [13]:
create_or_get_wd(getDois("Tony Ly[AU]"))

10.15252/embj.2021108599 ('Q111442280', [], True)
10.1016/j.mcpro.2021.100169 ('Q111442281', [], True)
10.1083/jcb.202009167 ('Q104682651', [], True)
10.3389/fcell.2021.727441 ('Q111442282', [], True)
10.1038/s41598-021-86070-z ('Q111442283', [], True)
10.15252/embj.2020104419 ('Q94463039', [], True)
10.1242/jcs.234401 ('Q90637868', [], True)
10.12688/wellcomeopenres.14392.1 ('Q55153827', [], True)
10.1093/jmcb/mjy063 ('Q64447019', [], True)
10.7554/eLife.27574 ('Q42380836', [], True)
10.7554/eLife.27402 ('Q41664870', [], True)
10.7554/eLife.36530 ('Q56529918', [], True)
10.1074/mcp.RA118.000650 ('Q52648051', [], True)
10.15252/embr.201641983 ('Q42319174', [], True)
10.1038/s41586-018-0032-3 ('Q52719957', [], True)
10.7554/eLife.27356 ('Q47164119', [], True)
10.1016/j.cels.2017.06.009 ('Q53188680', [], True)
10.1074/jbc.M116.751024 ('Q39166548', [], True)
10.1016/j.cels.2016.06.011 ('Q28596873', [], True)
10.7554/eLife.04534 ('Q28650498', [], True)
10.1002/anie.201506019 ('Q51582435', 

# Federico Pelisch

In [14]:
create_or_get_wd(getDois("Federico Pelisch[AU]"))

10.7554/eLife.65307 ('Q104563886', [], True)
10.1083/jcb.202011035 ('Q102204015', [], True)
10.1038/s41598-020-72637-9 ('Q99616863', [], True)
10.1242/jcs.232330 ('Q93051383', [], True)
10.1016/j.molcel.2016.11.001 ('Q37574622', [], True)
10.1007/978-1-4939-6358-4_17 (None, ['unknown type: book-chapter'], ValueError('can not create WDItemID with None'))
10.1038/ncomms7352 ('Q43180171', [], True)
10.1038/ncomms6485 ('Q30608755', [], True)
10.1073/pnas.1416858111 ('Q34480743', [], True)
10.4161/cc.26183 ('Q41846179', [], True)
10.1002/jcb.24103 ('Q37590130', [], True)
10.1093/bfgp/els053 ('Q38062297', [], True)
10.1002/iub.1075 ('Q38040017', [], True)
10.1074/jbc.M112.390120 ('Q39309267', [], True)
10.1002/jcb.22595 ('Q39690560', [], True)
10.1073/pnas.1004653107 ('Q34136544', [], True)
10.1016/j.cell.2009.03.010 ('Q39850003', [], True)
10.1002/jcb.22181 ('Q39851741', [], True)
10.1073/pnas.0810666106 ('Q37132771', [], True)
10.1016/j.biocel.2007.04.004 ('Q36824367', [], True)
10.1038/ns

# Gordon G Simpson


In [15]:
create_or_get_wd(getDois("Gordon G Simpson[AU]"))

10.1038/s41467-022-28753-3 ('Q111442295', [], True)
10.7554/eLife.65537 ('Q111442297', [], True)
10.1186/s13059-021-02296-0 ('Q111442298', [], True)
10.7554/eLife.49658 ('Q83224631', [], True)
10.1093/bioinformatics/btz089 (None, [], ValueError("More than one wikidata ID found for P236 1367-4803: [{'item': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q4914910'}}, {'item': {'type': 'uri', 'value': 'http://www.wikidata.org/entity/Q27710219'}}]"))
10.1261/rna.058339.116 ('Q41131980', [], True)
10.1371/journal.pone.0160694 ('Q36101469', [], True)
10.1261/rna.053959.115 ('Q38889056', [], True)
10.1016/j.pbi.2015.05.015 ('Q26825716', [], True)
10.1186/s13059-015-0704-3 ('Q35827992', [], True)
10.1093/jxb/ert439 ('Q45761998', [], True)
10.1371/journal.pone.0094270 ('Q35145066', [], True)
10.1038/srep02866 ('Q42654766', [], True)
10.1126/science.1241602 ('Q43937171', [], True)
10.1371/journal.pgen.1003867 ('Q35034308', [], True)
10.1038/nsmb.2345 ('Q42442592', [], True)
10.1105/tpc

# Stéphane Pagès


In [77]:
create_or_get_wd(getDois("Stéphane Pagès[AU]"))

10.1038/s41598-022-07445-4 ('Q111442023', [], True)
10.3389/fnsyn.2021.643138 ('Q111442026', [], True)
10.1073/pnas.2024920118 ('Q111442027', [], True)
10.1038/s41467-020-17005-x ('Q96765489', [], True)
10.1016/j.celrep.2019.12.019 ('Q92659576', [], True)
10.1038/s41592-019-0554-0 ('Q90135161', [], True)
10.1038/s41593-018-0093-5 ('Q88102934', [], True)
10.1523/JNEUROSCI.2430-15.2016 ('Q35906339', [], True)
10.3389/fnana.2015.00036 ('Q39326592', [], True)
10.3389/fnana.2015.00056 ('Q42560057', [], True)
10.1038/nature13664 ('Q43614842', [], True)
10.3389/fncel.2011.00020 ('Q34053245', [], True)
10.1371/journal.pone.0019928 ('Q27340360', [], True)
10.1021/jp0615252 ('Q83992165', [], True)
10.1021/jp0532216 ('Q50728942', [], True)
10.1021/ic0506512 ('Q80382459', [], True)
10.1063/1.1772362 ('Q45013394', [], True)


# Joerg Bewersdorf

In [78]:
create_or_get_wd(getDois("Joerg Bewersdorf[AU]"))

10.1016/j.molcel.2022.02.025 ('Q111442036', [], True)
10.1016/j.cell.2021.05.008 ('Q111442037', [], True)
10.1364/AO.416585 ('Q111442038', [], True)
10.1038/s41592-021-01149-9 ('Q111442039', [], True)
10.1364/OPTICA.416841 ('Q111442040', [], True)
10.1021/acscentsci.1c00670 ('Q111442042', [], True)
10.1038/s41596-020-00428-7 ('Q111442045', [], True)
10.1016/j.bpj.2020.11.006 ('Q102216689', [], True)
10.1364/OL.397754 ('Q97416381', [], True)
10.1038/s41592-019-0676-4 ('Q92453890', [], True)
10.1038/s41467-020-17523-8 ('Q98184155', [], True)
10.1016/j.chembiol.2019.01.003 ('Q91466729', [], True)
10.1016/j.cell.2019.03.047 ('Q91769186', [], True)
10.1039/c8mh00644j ('Q93202536', [], True)
10.1083/jcb.201809107 ('Q60919736', [], True)
10.1038/s41592-018-0145-5 ('Q57059992', [], True)
10.1016/j.bpj.2018.07.028 ('Q91111775', [], True)
10.1073/pnas.1713845115 ('Q49790305', [], True)
10.1146/annurev-biochem-060815-014801 ('Q47224322', [], True)
10.1091/mbc.E16-07-0522 ('Q49515138', [], True)
1