In [1]:
import pandas as pd
import os
from tqdm import tqdm

# DType warning when importing .csv files with parsed PMIDs. Avoid showing the warning
import warnings
warnings.simplefilter(action='ignore', category=pd.errors.DtypeWarning)

# Set max number of rows displayed
pd.set_option('display.max_rows', 100000)

# Set max column width
pd.set_option("max_colwidth", 500)

In [2]:
## In this case, with the matching Globocan dataset
# Articles' dataset location
DF_input = input().strip()

  C:\Users\svalb\OneDrive\Escritorio\Data_40_years_cancer_studies\parsedXMLs_match_GLOBOCAN\


In [3]:
# Import file names of csvs containint articles' data 
list_dfs_papers = []

for file in os.listdir(DF_input):
    if file[-4:] == ".csv":
        list_dfs_papers.append(file)

list_dfs_papers

['parsedX_100000.csv',
 'parsedX_1000000.csv',
 'parsedX_1100000.csv',
 'parsedX_1200000.csv',
 'parsedX_1300000.csv',
 'parsedX_1400000.csv',
 'parsedX_1500000.csv',
 'parsedX_1600000.csv',
 'parsedX_1700000.csv',
 'parsedX_1800000.csv',
 'parsedX_1900000.csv',
 'parsedX_200000.csv',
 'parsedX_2000000.csv',
 'parsedX_2100000.csv',
 'parsedX_2200000.csv',
 'parsedX_2300000.csv',
 'parsedX_2400000.csv',
 'parsedX_2500000.csv',
 'parsedX_2600000.csv',
 'parsedX_2700000.csv',
 'parsedX_2800000.csv',
 'parsedX_2900000.csv',
 'parsedX_300000.csv',
 'parsedX_3000000.csv',
 'parsedX_3100000.csv',
 'parsedX_3200000.csv',
 'parsedX_3300000.csv',
 'parsedX_3400000.csv',
 'parsedX_3500000.csv',
 'parsedX_3600000.csv',
 'parsedX_3700000.csv',
 'parsedX_3800000.csv',
 'parsedX_3900000.csv',
 'parsedX_400000.csv',
 'parsedX_4000000.csv',
 'parsedX_4100000.csv',
 'parsedX_4200000.csv',
 'parsedX_4300000.csv',
 'parsedX_4400000.csv',
 'parsedX_4454000.csv',
 'parsedX_500000.csv',
 'parsedX_600000.csv'

In [4]:
# Prepare dictionary to store data
country_sources = ['Direct_country', 'Direct_institution', 'Entity_database', 'Manual_correction',
                  'Most_common_list_countries', 'Nominatim', 'Google Maps', 'Regex_institution', 'State_in_US', 
                  'nan', 'no_ner']

counter_sources = {}
for source in country_sources:
    counter_sources[source] = {}

    for csv in list_dfs_papers:
        counter_sources[source][csv] = 0

In [5]:
# Count number of articles with each country source 
for csv in tqdm(list_dfs_papers):
    df = pd.read_csv(DF_input + csv)

    # Count number of articles per csv with each Country_source
    for source in country_sources:
        counter_sources[source][csv] = len(df.loc[df["Country_source"] == source])

    # Count number of articles with no country
    counter_sources['nan'][csv] = len(df.loc[df["Country_source"].isna()])

    # Count number of articles with no institution known
    counter_sources['no_ner'][csv] = len(df.loc[df["NER_lastAuthor"].isna()])
    
    del csv

100%|██████████████████████████████████████████████████████████████████████████████████| 45/45 [02:37<00:00,  3.49s/it]


In [6]:
df_sources = pd.DataFrame.from_dict(counter_sources)

In [7]:
df_sources

Unnamed: 0,Direct_country,Direct_institution,Entity_database,Manual_correction,Most_common_list_countries,Nominatim,Google Maps,Regex_institution,State_in_US,nan,no_ner
parsedX_100000.csv,34576,7110,412,308,427,2033,23159,4576,13436,13955,12144
parsedX_1000000.csv,60845,1533,167,212,1381,831,6591,726,16533,11172,10048
parsedX_1100000.csv,62114,1379,254,165,1577,691,5911,625,16458,10813,9642
parsedX_1200000.csv,63038,1291,233,165,1811,569,5298,622,16476,9752,8699
parsedX_1300000.csv,64191,1438,221,96,1915,554,4995,652,15907,10014,8935
parsedX_1400000.csv,63622,1436,186,118,2038,535,0,698,15956,15318,9253
parsedX_1500000.csv,64576,1274,237,108,1984,543,0,561,16192,14520,9155
parsedX_1600000.csv,64282,1237,215,94,2010,482,0,436,17042,14198,9401
parsedX_1700000.csv,65480,1152,202,90,2158,495,0,474,16613,13325,9136
parsedX_1800000.csv,65201,1410,214,89,2137,420,0,521,16905,13089,8946


In [8]:
df_sources.describe()

Unnamed: 0,Direct_country,Direct_institution,Entity_database,Manual_correction,Most_common_list_countries,Nominatim,Google Maps,Regex_institution,State_in_US,nan,no_ner
count,45.0,45.0,45.0,45.0,45.0,45.0,45.0,45.0,45.0,45.0,45.0
mean,57471.133333,2584.288889,343.555556,128.822222,4300.311111,612.222222,3280.955556,1239.711111,16456.377778,12534.288889,9378.466667
std,13717.422541,1352.773693,167.801094,56.921513,3005.80923,479.549499,4704.636108,909.07382,3592.334998,16278.498164,14638.330667
min,2996.0,667.0,51.0,36.0,36.0,127.0,0.0,379.0,1153.0,1423.0,1144.0
25%,55985.0,1533.0,215.0,96.0,1811.0,340.0,0.0,657.0,15907.0,3392.0,2260.0
50%,62114.0,2396.0,292.0,110.0,3851.0,433.0,2447.0,1039.0,16613.0,10813.0,7571.0
75%,65201.0,3128.0,456.0,143.0,6467.0,554.0,3416.0,1281.0,18320.0,12419.0,9401.0
max,69127.0,7110.0,826.0,314.0,10095.0,2033.0,23159.0,4576.0,21016.0,92132.0,91970.0


## Evaluating correctness of country assignment

Vast majority of countries are assigned via **Direct_country**. Here, 1000 rows of 3 csvs (*parsedX_100000.csv*, *parsedX_2300000.csv*, *parsedX_4400000.csv*) are evaluated. Errors are noted (and corrected in the *otherCorrections.ipynb* file). The goal is to calculate the approximate percentage of errors in each **Country_source**

### Country_source = **Direct_country**

In [9]:
df_parsedX_100000 = pd.read_csv(DF_input + "parsedX_100000.csv")

In [45]:
df_parsedX_100000.loc[df_parsedX_100000["Country_source"] == "Direct_country", ["PMID", "NER_lastAuthor", "Country"]].head(334)

Unnamed: 0,PMID,NER_lastAuthor,Country
0,1279091,"[{'text': 'Department of Obstetrics and Gynaecology', 'label': 'ORG'}, {'text': 'University of Adelaide', 'label': 'ORG'}, {'text': 'Elizabeth Hospital', 'label': 'ORG'}, {'text': 'Woodville', 'label': 'GPE'}, {'text': 'South Australia', 'label': 'GPE'}]",Australia
3,1279148,"[{'text': 'Biometric Centre', 'label': 'ORG'}, {'text': 'Munich', 'label': 'GPE'}, {'text': 'Germany', 'label': 'GPE'}]",Germany
4,1279150,"[{'text': 'Alberta Cancer Foundation', 'label': 'ORG'}, {'text': 'Edmonton', 'label': 'LOC'}, {'text': 'Canada', 'label': 'LOC'}]",Canada
20,1279211,"[{'text': 'Department of Medical Oncology', 'label': 'ORG'}, {'text': 'Medical College', 'label': 'ORG'}, {'text': 'Royal London Hospital', 'label': 'ORG'}, {'text': 'England', 'label': 'GPE'}]",United Kingdom
21,1279212,"[{'text': 'Kyoto', 'label': 'LOC'}, {'text': 'Japan', 'label': 'LOC'}]",Japan
22,1279215,"[{'text': 'Clinique Saint Pierre', 'label': 'ORG'}, {'text': 'Ottignies-Louvain', 'label': 'LOC'}, {'text': 'Neuve', 'label': 'LOC'}, {'text': 'Belgium', 'label': 'LOC'}]",Belgium
27,1279225,"[{'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'South Hospital', 'label': 'ORG'}, {'text': 'Stockholm', 'label': 'GPE'}, {'text': 'Sweden', 'label': 'GPE'}]",Sweden
39,1279257,"[{'text': 'Department of Internal Medicine (Section 3', 'label': 'ORG'}, {'text': 'Sapporo Medical College', 'label': 'ORG'}, {'text': 'Japan', 'label': 'GPE'}]",Japan
49,1279274,"[{'text': 'Department of Pathology', 'label': 'ORG'}, {'text': 'Montreal General Hospital', 'label': 'ORG'}, {'text': 'McGill University', 'label': 'ORG'}, {'text': 'Quebec', 'label': 'GPE'}, {'text': 'Canada', 'label': 'GPE'}]",Canada
54,1279326,"[{'text': 'Medicine, University Hospital', 'label': 'ORG'}, {'text': 'Uppsala', 'label': 'GPE'}, {'text': 'Sweden', 'label': 'GPE'}]",Sweden


No errors found in 334 records for the *parsedX_100000.csv* csv

In [10]:
df_parsedX_2300000 = pd.read_csv(DF_input + "parsedX_2300000.csv")

In [47]:
df_parsedX_2300000.loc[df_parsedX_2300000["Country_source"] == "Direct_country", ["PMID", "NER_lastAuthor", "Country"]].head(333)

Unnamed: 0,PMID,NER_lastAuthor,Country
0,23904052,"[{'text': 'Department of Biochemistry', 'label': 'ORG'}, {'text': 'Faculty of Medicine, University of Porto', 'label': 'ORG'}, {'text': 'Porto', 'label': 'GPE'}, {'text': 'Portugal', 'label': 'GPE'}]",Portugal
1,23904068,"[{'text': 'Division of Clinical Psychology', 'label': 'ORG'}, {'text': 'University of Liverpool', 'label': 'ORG'}, {'text': 'Liverpool', 'label': 'GPE'}, {'text': 'UK', 'label': 'GPE'}]",United Kingdom
5,23904111,"[{'text': 'Department of Neurooncology', 'label': 'ORG'}, {'text': 'Neurology Clinic', 'label': 'ORG'}, {'text': 'National Center for Tumor Disease', 'label': 'ORG'}, {'text': 'University of Heidelberg', 'label': 'ORG'}, {'text': 'German Cancer Research Center', 'label': 'ORG'}, {'text': 'Heidelberg', 'label': 'GPE'}, {'text': 'Germany', 'label': 'GPE'}]",Germany
13,23904126,"[{'text': 'Department of Genetics', 'label': 'ORG'}, {'text': 'University of Texas MD Anderson Cancer Center', 'label': 'ORG'}, {'text': 'University of Texas Graduate School of Biomedical Sciences', 'label': 'ORG'}, {'text': 'Houston', 'label': 'GPE'}, {'text': 'Texas 77030', 'label': 'ORG'}, {'text': 'USA', 'label': 'GPE'}]",United States
14,23904127,"[{'text': 'Department of Radiological Sciences', 'label': 'ORG'}, {'text': 'David Geffen School of Medicine', 'label': 'ORG'}, {'text': 'University of California, Los Angeles', 'label': 'ORG'}, {'text': 'USA', 'label': 'GPE'}]",United States
15,23904143,"[{'text': 'Department of Psychiatry', 'label': 'ORG'}, {'text': 'Chonnam National University Medical School', 'label': 'ORG'}, {'text': 'Depression Clinical Research Center', 'label': 'ORG'}, {'text': 'Chonnam National University Hospital', 'label': 'ORG'}, {'text': 'Gwangju', 'label': 'GPE'}, {'text': 'Korea', 'label': 'GPE'}]",South Korea
18,23904158,"[{'text': 'Laboratory of Tumor Immunology and Biology, Center for Cancer Research', 'label': 'ORG'}, {'text': 'National Cancer Institute', 'label': 'ORG'}, {'text': 'National Institutes of Health', 'label': 'ORG'}, {'text': 'Bethesda', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
19,23904171,"[{'text': 'National Cancer Institute', 'label': 'ORG'}, {'text': 'National Institutes of Health', 'label': 'ORG'}, {'text': 'Bethesda', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
20,23904188,"[{'text': ""Institut d'Investigacions Biomèdiques August Pi i Sunyer"", 'label': 'ORG'}, {'text': 'IDIBAPS', 'label': 'ORG'}, {'text': 'Facultat de Medicina', 'label': 'LOC'}, {'text': 'Universitat de Barcelona', 'label': 'LOC'}, {'text': 'Barcelona', 'label': 'LOC'}, {'text': 'Spain', 'label': 'LOC'}]",Spain
21,23904194,"[{'text': 'Faculty of Medical Sciences', 'label': 'ORG'}, {'text': 'Rotterdam', 'label': 'GPE'}, {'text': 'Netherlands', 'label': 'GPE'}]",Netherlands


No errors found in 333 records for the parsedX_2300000.csv csv

In [11]:
df_parsedX_4400000 = pd.read_csv(DF_input + "parsedX_4400000.csv")

In [49]:
df_parsedX_4400000.loc[df_parsedX_4400000["Country_source"] == "Direct_country", ["PMID", "NER_lastAuthor", "Country"]].head(333)

Unnamed: 0,PMID,NER_lastAuthor,Country
0,38068651,"[{'text': 'Department of Crop Science', 'label': 'ORG'}, {'text': 'Faculty of Agriculture, University of Agricultural Sciences', 'label': 'ORG'}, {'text': 'Veterinary Medicine of Cluj-Napoca', 'label': 'ORG'}, {'text': 'Napoca', 'label': 'GPE'}, {'text': 'Romania', 'label': 'GPE'}]",Romania
1,38068712,"[{'text': 'Department of Physiology, School of Medicine', 'label': 'ORG'}, {'text': 'China Medical University', 'label': 'ORG'}, {'text': 'Taiwan', 'label': 'GPE'}]",China
2,38068715,"[{'text': 'Department of Radiation Oncology', 'label': 'ORG'}, {'text': 'Leuven', 'label': 'GPE'}, {'text': 'Belgium', 'label': 'GPE'}]",Belgium
3,38068717,"[{'text': 'iBiMED-Institute of Biomedicine and Department of Medical Science', 'label': 'ORG'}, {'text': 'Aveiro', 'label': 'GPE'}, {'text': 'Portugal', 'label': 'GPE'}]",Portugal
4,38068727,"[{'text': 'Amity Institute of Biotechnology', 'label': 'ORG'}, {'text': 'Amity University Rajasthan', 'label': 'ORG'}, {'text': 'Jaipur', 'label': 'GPE'}, {'text': 'India', 'label': 'GPE'}]",India
5,38068731,"[{'text': 'Department of Chemical Engineering and Materials Science', 'label': 'ORG'}, {'text': 'Michigan State University', 'label': 'ORG'}, {'text': 'East Lansing', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
6,38068744,"[{'text': 'Department of Neuro-Oncology', 'label': 'ORG'}, {'text': 'Cancer Center', 'label': 'ORG'}, {'text': 'Beijing Tiantan Hospital', 'label': 'ORG'}, {'text': 'Capital Medical University', 'label': 'ORG'}, {'text': 'Beijing', 'label': 'GPE'}, {'text': 'China', 'label': 'GPE'}]",China
7,38068749,"[{'text': 'Department of Nursing', 'label': 'ORG'}, {'text': 'Pharmacology and Physiotherapy', 'label': 'ORG'}, {'text': 'University of Córdoba', 'label': 'ORG'}, {'text': 'Córdoba', 'label': 'GPE'}, {'text': 'Spain', 'label': 'GPE'}]",Spain
8,38068759,"[{'text': 'College of Food Science and Nutritional Engineering', 'label': 'ORG'}, {'text': 'China Agricultural University', 'label': 'ORG'}, {'text': 'Beijing', 'label': 'GPE'}, {'text': 'China', 'label': 'GPE'}]",China
9,38068776,"[{'text': 'Department of Nutrition Sciences', 'label': 'ORG'}, {'text': 'University of Alabama at Birmingham', 'label': 'ORG'}, {'text': 'UAB', 'label': 'GPE'}, {'text': 'Birmingham', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States


No errors found in 333 records for the parsedX_4400000.csv csv

In [12]:
## Overall data for the "Country_source" = "Direct_country"

print(f"Records analyzed: 1000")
print(f"Total records: {df_sources["Direct_country"].sum()}")
print(f"Proportion of records analyzed: {round(1000/df_sources["Direct_country"].sum()*100,5)}%")
print(f"Errors found: 0")
print(f"Proportion of errors found: {round(0/1000*100,2)}%")

Records analyzed: 1000
Total records: 2586201
Proportion of records analyzed: 0.03867%
Errors found: 0
Proportion of errors found: 0.0%


### Country_source = **State_in_US**

In [96]:
df_parsedX_100000.loc[df_parsedX_100000["Country_source"] == "State_in_US", ["PMID", "NER_lastAuthor", "Country"]].head(334)

Unnamed: 0,PMID,NER_lastAuthor,Country
5,1279153,"[{'text': 'Pediatric Branch', 'label': 'ORG'}, {'text': 'National Cancer Institute', 'label': 'ORG'}, {'text': 'Bethesda', 'label': 'GPE'}, {'text': 'Maryland', 'label': 'GPE'}]",United States
8,1279183,"[{'text': 'Laboratory of Developmental Biology', 'label': 'ORG'}, {'text': 'National Institute of Dental Research', 'label': 'ORG'}, {'text': 'Bethesda', 'label': 'GPE'}, {'text': 'Md.', 'label': 'GPE'}]",United States
11,1279186,"[{'text': 'Georgetown University Medical Center', 'label': 'ORG'}, {'text': 'Washington', 'label': 'GPE'}]",United States
12,1279187,"[{'text': 'Laboratory of Biological Chemistry', 'label': 'ORG'}, {'text': 'National Cancer Institute', 'label': 'ORG'}, {'text': 'Bethesda', 'label': 'GPE'}, {'text': 'Md.', 'label': 'GPE'}]",United States
15,1279195,"[{'text': 'Division of Human Retrovirology', 'label': 'ORG'}, {'text': 'Dana-Farber Cancer Institute', 'label': 'ORG'}, {'text': 'Boston', 'label': 'GPE'}, {'text': 'Massachusetts', 'label': 'GPE'}]",United States
16,1279199,"[{'text': 'National Cancer Institute', 'label': 'ORG'}, {'text': 'Bethesda', 'label': 'GPE'}, {'text': 'Maryland', 'label': 'GPE'}]",United States
17,1279200,"[{'text': 'Department of Avian and Aquatic Animal Medicine', 'label': 'ORG'}, {'text': 'College of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Cornell University', 'label': 'ORG'}, {'text': 'Ithaca', 'label': 'GPE'}, {'text': 'New York', 'label': 'GPE'}]",United States
18,1279202,"[{'text': 'Molecular Biology and Virology Laboratory', 'label': 'ORG'}, {'text': 'Salk Institute', 'label': 'ORG'}, {'text': 'San Diego', 'label': 'GPE'}, {'text': 'California', 'label': 'GPE'}]",United States
19,1279205,"[{'text': 'ABL-Basic Research Program', 'label': 'ORG'}, {'text': 'NCI-Frederick Cancer Research and Development Center', 'label': 'ORG'}, {'text': 'Maryland', 'label': 'GPE'}]",United States
28,1279226,"[{'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'Johns Hopkins University School of Medicine', 'label': 'ORG'}, {'text': 'Baltimore', 'label': 'GPE'}, {'text': 'Maryland', 'label': 'GPE'}]",United States


Found errors: 1 in 334 records

In [104]:
df_parsedX_2300000.loc[df_parsedX_2300000["Country_source"] == "State_in_US", ["PMID", "NER_lastAuthor", "Country"]].head(333)

Unnamed: 0,PMID,NER_lastAuthor,Country
3,23904089,"[{'text': 'The Russell H. Morgan Department of Radiology and Radiological Science', 'label': 'ORG'}, {'text': 'Johns Hopkins University School of Medicine', 'label': 'ORG'}, {'text': 'Baltimore', 'label': 'GPE'}, {'text': 'MD', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
7,23904115,"[{'text': 'Division of Cancer Epidemiology', 'label': 'ORG'}, {'text': 'Genetics', 'label': 'ORG'}, {'text': 'National Cancer Institute', 'label': 'ORG'}, {'text': 'Rockville', 'label': 'GPE'}, {'text': 'MD', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
16,23904153,"[{'text': 'Departments of Biochemistry and Molecular Biology', 'label': 'ORG'}, {'text': 'University of Maryland School of Medicine', 'label': 'ORG'}, {'text': 'Baltimore', 'label': 'GPE'}, {'text': 'Maryland', 'label': 'GPE'}, {'text': '21201', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
23,23904210,"[{'text': 'Department of Chemistry and Biochemistry, University of California San Diego', 'label': 'ORG'}, {'text': 'La Jolla', 'label': 'GPE'}, {'text': 'California', 'label': 'GPE'}]",United States
26,23904220,"[{'text': ""Brigham and Women's Hospital"", 'label': 'ORG'}, {'text': 'Harvard Medical School', 'label': 'ORG'}, {'text': 'Boston', 'label': 'GPE'}, {'text': 'Massachusetts', 'label': 'GPE'}]",United States
32,23904248,"[{'text': 'Division of Cancer Prevention', 'label': 'ORG'}, {'text': 'National Cancer Institute', 'label': 'ORG'}, {'text': '9609 Medical Center Drive', 'label': 'ORG'}, {'text': 'Rockville', 'label': 'GPE'}, {'text': 'MD', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
38,23904277,"[{'text': 'Division of Endocrinology', 'label': 'ORG'}, {'text': 'Clinical Nutrition', 'label': 'ORG'}, {'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Oregon Health and Science University', 'label': 'ORG'}, {'text': 'Portland', 'label': 'GPE'}, {'text': 'Oregon', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
43,23904301,"[{'text': 'Department of Pathology', 'label': 'ORG'}, {'text': 'Southern California Permanente Medical Group', 'label': 'ORG'}, {'text': 'Woodland Hills Medical Center', 'label': 'ORG'}, {'text': 'Woodland Hills', 'label': 'GPE'}, {'text': 'CA', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
44,23904307,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'University of Florida Health Science Center', 'label': 'ORG'}, {'text': 'Jacksonville', 'label': 'GPE'}, {'text': 'FL', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
50,23904338,"[{'text': 'Department of Surgery, Section of Hepatobiliary Surgery and Liver Transplantation', 'label': 'ORG'}, {'text': 'New York Presbyterian Hospital', 'label': 'ORG'}, {'text': 'New York', 'label': 'GPE'}, {'text': 'NY', 'label': 'GPE'}]",United States


Found errors: 4 in 333 records

In [105]:
df_parsedX_4400000.loc[df_parsedX_4400000["Country_source"] == "State_in_US", ["PMID", "NER_lastAuthor", "Country"]].head(333)

Unnamed: 0,PMID,NER_lastAuthor,Country
26,38068882,"[{'text': 'Department of Biochemistry, Cancer Biology', 'label': 'ORG'}, {'text': 'Neuroscience', 'label': 'ORG'}, {'text': 'Pharmacology', 'label': 'ORG'}, {'text': 'Meharry Medical College', 'label': 'ORG'}, {'text': 'Nashville', 'label': 'GPE'}, {'text': 'TN', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
42,38068928,"[{'text': 'Department of Biological Sciences', 'label': 'ORG'}, {'text': 'Texas Tech University', 'label': 'ORG'}, {'text': 'Lubbock', 'label': 'GPE'}, {'text': 'TX', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
53,38068980,"[{'text': 'Department of Biology', 'label': 'ORG'}, {'text': 'Howard University', 'label': 'ORG'}, {'text': 'Washington', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
78,38069095,"[{'text': 'Memorial Sloan Kettering Cancer Center', 'label': 'ORG'}, {'text': 'New York', 'label': 'GPE'}, {'text': 'NY', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
163,38069464,"[{'text': 'Institute for Translational Epidemiology', 'label': 'ORG'}, {'text': 'Tisch Cancer Institute', 'label': 'ORG'}, {'text': 'Icahn School of Medicine at Mount Sinai', 'label': 'ORG'}, {'text': 'New York', 'label': 'GPE'}, {'text': 'NY', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
174,38069531,"[{'text': 'Division of Hematology', 'label': 'ORG'}, {'text': 'Medical Oncology', 'label': 'ORG'}, {'text': 'Knight Cancer Institute', 'label': 'ORG'}, {'text': 'Oregon Health & Sciences University', 'label': 'ORG'}, {'text': 'Portland', 'label': 'GPE'}, {'text': 'Oregon', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
189,38069566,"[{'text': 'Department of Otolaryngology-Head', 'label': 'ORG'}, {'text': 'Northwestern University Feinberg School of Medicine', 'label': 'ORG'}, {'text': 'Chicago', 'label': 'GPE'}, {'text': 'Illinois', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
190,38069567,"[{'text': 'Division of Endocrinology', 'label': 'ORG'}, {'text': 'UCLA Geffen School of Medicine', 'label': 'ORG'}, {'text': 'Los Angeles', 'label': 'GPE'}, {'text': 'California', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
191,38069569,"[{'text': 'Kidney Institute', 'label': 'ORG'}, {'text': 'Cleveland Clinic', 'label': 'ORG'}, {'text': 'Cleveland', 'label': 'GPE'}, {'text': 'Ohio', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States
201,38069633,"[{'text': 'Coriell Institute for Medical Research', 'label': 'ORG'}, {'text': 'Camden', 'label': 'GPE'}, {'text': 'NJ', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}]",United States


Found errors: 3 in 333 records

In [13]:
## Overall data for the "Country_source" = "State_in_US"

print(f"Records analyzed: 1000")
print(f"Total records: {df_sources["State_in_US"].sum()}")
print(f"Proportion of records analyzed: {round(1000/df_sources["State_in_US"].sum()*100,5)}%")
print(f"Errors found: 10")
print(f"Proportion of errors found: {round(10/1000*100,2)}%")

Records analyzed: 1000
Total records: 740537
Proportion of records analyzed: 0.13504%
Errors found: 10
Proportion of errors found: 1.0%


One special case was Delaware in State_in_US. There were circa 442 records in the whole dataset with this State_in_US Country_source and containing DE, which could also mean Deutschland. After checking all them and 33 had to be changed (7.4%), not all of them to Germany. These are solved

### Country_source = **Most_common_list_countries**

In [170]:
df_parsedX_100000.loc[df_parsedX_100000["Country_source"] == "Most_common_list_countries", ["PMID", "NER_lastAuthor", "Country"]].head(334)

Unnamed: 0,PMID,NER_lastAuthor,Country
336,1281048,"[{'text': 'Department of Internal Medicine and Radiology', 'label': 'ORG'}, {'text': 'Kaohsiung Medical College', 'label': 'ORG'}, {'text': 'Taiwan', 'label': 'GPE'}, {'text': 'Republic of China', 'label': 'GPE'}]",China
507,1281963,"[{'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Veterans General Hospital', 'label': 'ORG'}, {'text': 'Taipei', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}]",China
641,1283009,"[{'text': 'Calvary Hospital', 'label': 'ORG'}, {'text': 'North Adelaide', 'label': 'GPE'}, {'text': 'SA 5006', 'label': 'ORG'}, {'text': 'Australia', 'label': 'GPE'}, {'text': 'Royal Adelaide Hospital', 'label': 'ORG'}, {'text': 'AdelaideAustralia Department of Anaesthesia', 'label': 'ORG'}, {'text': 'Intensive Care', 'label': 'ORG'}, {'text': 'University of Adelaide', 'label': 'ORG'}, {'text': 'Royal Adelaide Hospital', 'label': 'ORG'}, {'text': 'AdelaideAustralia', 'label': 'ORG'}, {'text'...",Australia
653,1283085,"[{'text': 'Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Kaohsiung Medical College Hospital', 'label': 'ORG'}, {'text': 'Taiwan', 'label': 'GPE'}, {'text': 'Republic of China', 'label': 'GPE'}]",China
1179,1286180,"[{'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Buddhist General Hospital', 'label': 'ORG'}, {'text': 'Hualien', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}, {'text': 'China', 'label': 'GPE'}]",China
1403,1288291,"[{'text': 'Division of Hematology-Oncology', 'label': 'ORG'}, {'text': 'Taipei', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}, {'text': 'Republic of China', 'label': 'GPE'}]",China
1444,1288857,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Kaohsiung', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}, {'text': 'Republic of China', 'label': 'GPE'}]",China
2122,1294635,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Chang Gung Medical College', 'label': 'ORG'}, {'text': 'Kaohsiung Hsien', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}, {'text': 'Republic of China', 'label': 'GPE'}]",China
2264,1295658,"[{'text': 'Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Taipei', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}]",China
2293,1296032,"[{'text': 'Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Kaohsiung Medical College', 'label': 'ORG'}, {'text': 'Taiwan', 'label': 'GPE'}, {'text': 'Republic of China', 'label': 'GPE'}]",China


Found errors: 41 in 334 records

In [171]:
df_parsedX_2300000.loc[df_parsedX_2300000["Country_source"] == "Most_common_list_countries", ["PMID", "NER_lastAuthor", "Country"]].head(333)

Unnamed: 0,PMID,NER_lastAuthor,Country
4,23904094,"[{'text': 'Graduate Institute of Medical Sciences', 'label': 'ORG'}, {'text': 'National Defense Medical Center', 'label': 'ORG'}, {'text': 'Taipei', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}, {'text': 'Republic of China', 'label': 'GPE'}]",China
6,23904113,"[{'text': 'Faculty of Health Sciences and Medicine, Bond University', 'label': 'ORG'}, {'text': 'Australia', 'label': 'GPE'}, {'text': 'Human Potential Centre', 'label': 'ORG'}, {'text': 'AUT University', 'label': 'ORG'}, {'text': 'Auckland', 'label': 'GPE'}, {'text': 'New Zealand', 'label': 'GPE'}, {'text': 'Faculty of Science, Health, Education and Engineering', 'label': 'ORG'}, {'text': 'University of the Sunshine Coast', 'label': 'ORG'}, {'text': 'Australia', 'label': 'GPE'}]",Australia
17,23904154,"[{'text': 'Radiation Medicine Program', 'label': 'ORG'}, {'text': 'Princess Margaret Cancer Center', 'label': 'ORG'}, {'text': 'University Health Network', 'label': 'ORG'}, {'text': 'Toronto', 'label': 'GPE'}, {'text': 'Canada', 'label': 'GPE'}, {'text': 'Department of Radiation Oncology', 'label': 'ORG'}, {'text': 'University of Toronto', 'label': 'ORG'}, {'text': 'Toronto', 'label': 'GPE'}, {'text': 'Canada', 'label': 'GPE'}]",Canada
70,23904418,"[{'text': 'Department of Paediatrics', 'label': 'ORG'}, {'text': ""Women's and"", 'label': 'ORG'}, {'text': 'North Adelaide', 'label': 'GPE'}, {'text': 'South Australia', 'label': 'GPE'}, {'text': 'Australia', 'label': 'GPE'}]",Australia
85,23904509,"[{'text': 'Broad Institute', 'label': 'ORG'}, {'text': '7 Cambridge Center', 'label': 'ORG'}, {'text': 'Cambridge', 'label': 'GPE'}, {'text': 'USA', 'label': 'GPE'}, {'text': 'Massachusetts Institute of Technology', 'label': 'ORG'}, {'text': 'Massachusetts Avenue', 'label': 'ORG'}, {'text': 'Cambridge', 'label': 'GPE'}, {'text': 'MA 02139', 'label': 'ORG'}, {'text': 'USA', 'label': 'GPE'}]",United States
100,23904760,"[{'text': 'Department of Medical Oncology', 'label': 'ORG'}, {'text': 'State Key Laboratory of Oncology', 'label': 'ORG'}, {'text': 'South China', 'label': 'LOC'}, {'text': 'University Cancer Center', 'label': 'ORG'}, {'text': 'Guangzhou', 'label': 'GPE'}, {'text': 'China', 'label': 'GPE'}]",China
113,23904773,"[{'text': 'Cancer Research Centre', 'label': 'ORG'}, {'text': 'Cancer Institute', 'label': 'ORG'}, {'text': 'Tehran University of Medical Sciences', 'label': 'ORG'}, {'text': 'Tehran', 'label': 'GPE'}, {'text': 'Iran', 'label': 'GPE'}, {'text': 'Radiation Oncology Department', 'label': 'ORG'}, {'text': 'Cancer Institute', 'label': 'ORG'}, {'text': 'Tehran University of Medical Sciences', 'label': 'ORG'}, {'text': 'Tehran', 'label': 'GPE'}, {'text': 'Iran', 'label': 'GPE'}]",Iran
146,23905012,"[{'text': 'Université François Rabelais de Tours', 'label': 'LOC'}, {'text': 'Tours', 'label': 'LOC'}, {'text': 'France', 'label': 'LOC'}, {'text': ""Centre d'Etude"", 'label': 'ORG'}, {'text': 'EA6305', 'label': 'LOC'}, {'text': 'Tours', 'label': 'LOC'}, {'text': 'France', 'label': 'LOC'}]",France
228,23905813,"[{'text': 'Liver Research Unit', 'label': 'ORG'}, {'text': 'Chang Gung University College of Medicine', 'label': 'ORG'}, {'text': 'Taipei', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}]",China
231,23905869,"[{'text': 'Edinburgh Urological Cancer Group', 'label': 'ORG'}, {'text': 'University of Edinburgh', 'label': 'ORG'}, {'text': 'Edinburgh', 'label': 'GPE'}, {'text': 'UK', 'label': 'GPE'}, {'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'Western General Hospital', 'label': 'ORG'}, {'text': 'Edinburgh', 'label': 'GPE'}, {'text': 'UK', 'label': 'GPE'}]",United Kingdom


Found errors: 15 in 333 records

In [172]:
df_parsedX_4400000.loc[df_parsedX_4400000["Country_source"] == "Most_common_list_countries", ["PMID", "NER_lastAuthor", "Country"]].head(333)

Unnamed: 0,PMID,NER_lastAuthor,Country
11,38068818,"[{'text': 'Universidade Federal do Espírito Santo', 'label': 'LOC'}, {'text': 'Vitória', 'label': 'LOC'}, {'text': 'ES', 'label': 'LOC'}, {'text': 'Brazil', 'label': 'LOC'}]",Spain
50,38068961,"[{'text': 'Infectious Diseases Department', 'label': 'ORG'}, {'text': 'Clinica Universitaria Colombia', 'label': 'LOC'}, {'text': 'Clínica Colsanitas S.A.', 'label': 'ORG'}, {'text': 'Bogotá', 'label': 'LOC'}, {'text': 'Colombia', 'label': 'LOC'}]",Colombia
51,38068962,"[{'text': 'Institute of Oral Biology', 'label': 'ORG'}, {'text': 'College of Dentistry', 'label': 'ORG'}, {'text': 'Taipei', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}]",China
54,38068984,"[{'text': 'Institute of Oral Biology', 'label': 'ORG'}, {'text': 'College of Dentistry', 'label': 'ORG'}, {'text': 'Taipei', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}]",China
86,38069131,"[{'text': 'State Key Laboratory of Oncology', 'label': 'ORG'}, {'text': 'South China', 'label': 'GPE'}, {'text': 'Guangdong Provincial Clinical Research Center for Cancer', 'label': 'ORG'}, {'text': 'University Cancer Center', 'label': 'ORG'}, {'text': 'Guangzhou', 'label': 'GPE'}, {'text': 'China', 'label': 'GPE'}]",China
97,38069210,"[{'text': 'Laboratorio de Biología Molecular', 'label': 'LOC'}, {'text': 'Departamento de Fibrosis Pulmonar', 'label': 'ORG'}, {'text': 'Instituto Nacional de Enfermedades Respiratorias', 'label': 'ORG'}, {'text': 'Calzada de Tlalpan', 'label': 'LOC'}, {'text': 'Col', 'label': 'LOC'}, {'text': 'Sección XVI', 'label': 'LOC'}, {'text': 'Tlalpan', 'label': 'LOC'}, {'text': 'Ciudad de México 14080', 'label': 'LOC'}, {'text': 'Mexico', 'label': 'LOC'}]",Colombia
130,38069310,"[{'text': 'Department of Medical Research', 'label': 'ORG'}, {'text': 'Taipei Veterans General Hospital', 'label': 'ORG'}, {'text': 'Taipei', 'label': 'GPE'}, {'text': 'Taiwan', 'label': 'GPE'}]",China
149,38069408,"[{'text': 'National Institute of Gastroenterology S. De Bellis', 'label': 'ORG'}, {'text': 'IRCCS Research Hospital', 'label': 'ORG'}, {'text': 'Via Turi 27', 'label': 'ORG'}, {'text': 'BA', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Bosnia and Herzegovina
167,38069495,"[{'text': 'Department of Gastroenterology and Hepatology', 'label': 'ORG'}, {'text': 'Royal Perth Hospital', 'label': 'ORG'}, {'text': 'Perth', 'label': 'GPE'}, {'text': 'Western Australia', 'label': 'LOC'}, {'text': 'Australia', 'label': 'GPE'}]",Australia
178,38069544,"[{'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'Singapore General Hospital', 'label': 'ORG'}, {'text': 'Singapore', 'label': 'GPE'}, {'text': 'Singapore', 'label': 'GPE'}]",Singapore


Found errors: 23 in 333 records

In [14]:
## Overall data for the "Country_source" = "Most_common_list_countries"

print(f"Records analyzed: 1000")
print(f"Total records: {df_sources["Most_common_list_countries"].sum()}")
print(f"Proportion of records analyzed: {round(1000/df_sources["Most_common_list_countries"].sum()*100,5)}%")
print(f"Errors found: 79")
print(f"Proportion of errors found: {round(79/1000*100,2)}%")

Records analyzed: 1000
Total records: 193514
Proportion of records analyzed: 0.51676%
Errors found: 79
Proportion of errors found: 7.9%


In [16]:
import ast

In [17]:
for csv in list_dfs_papers:
    print(f"Parsing csv: {csv}")
    df = pd.read_csv(DF_input + csv)
    temp_list_putative = []
    for row in df.loc[(df["Country_source"] == "Most_common_list_countries") & (df["Country"] == "Peru")].index:
        for el in ast.literal_eval(df.iloc[row]["NER_lastAuthor"]):
            if "Perugia" in el['text']:
                temp_list_putative.append(df.iloc[[row]])
    if len(temp_list_putative) > 0:
        display(pd.concat(temp_list_putative)[["PMID", "NER_lastAuthor", "Country"]])

    del df, temp_list_putative        

Parsing csv: parsedX_100000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
69983,1760815,"[{'text': 'Istituto di Clinica Medica Ia-Policlinico Monteluce', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
70897,1768630,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
71005,1769292,"[{'text': 'Istituto di Anatomia', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Ospedale Civile S. Maria', 'label': 'LOC'}, {'text': 'Terni', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
73722,1794138,"[{'text': 'Institute of Pharmacology, School of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
74628,1803717,"[{'text': 'Istituto di Anatomia', 'label': 'LOC'}, {'text': 'Istologia Patologica', 'label': 'LOC'}, {'text': 'Università degli Studi', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
77064,1827271,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
77684,1831628,"[{'text': 'Ospedale Policlinico', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
83931,1874479,"[{'text': 'Istituto di Clinica Medica I', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
85848,1890459,"[{'text': 'Neurosurgery', 'label': 'ORG'}, {'text': 'University Policlinic Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
85918,1890871,"[{'text': ""Universita' di Perugia"", 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_1000000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
140,11268564,"[{'text': 'Department of Obstetrics and Gynecology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
140,11268564,"[{'text': 'Department of Obstetrics and Gynecology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2996,11290617,"[{'text': 'Division of Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'Department of Clinical and Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15565,11388581,"[{'text': 'Institute of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15789,11390274,"[{'text': 'Department of Experimental', 'label': 'ORG'}, {'text': 'Biochemical Sciences', 'label': 'ORG'}, {'text': 'Section of Anatomy, University of Perugia', 'label': 'ORG'}, {'text': 'Succ', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15789,11390274,"[{'text': 'Department of Experimental', 'label': 'ORG'}, {'text': 'Biochemical Sciences', 'label': 'ORG'}, {'text': 'Section of Anatomy, University of Perugia', 'label': 'ORG'}, {'text': 'Succ', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
28008,11486653,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
28008,11486653,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
30223,11504367,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
31454,11514008,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_1100000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
9665,12189525,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology Section', 'label': 'ORG'}, {'text': 'Department of Clinical and Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9665,12189525,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology Section', 'label': 'ORG'}, {'text': 'Department of Clinical and Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10320,12195161,"[{'text': 'Dipartimento di Scienze Biochimiche', 'label': 'ORG'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Via del Giochetto', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
10320,12195161,"[{'text': 'Dipartimento di Scienze Biochimiche', 'label': 'ORG'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Via del Giochetto', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
17317,12350053,"[{'text': 'Centro Trapianti', 'label': 'LOC'}, {'text': 'Midollo Osseo', 'label': 'LOC'}, {'text': 'Policlinico Monteluce', 'label': 'LOC'}, {'text': 'Universita di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}, {'text': 'aversa@unipg.it', 'label': 'LOC'}]",Peru
22028,12390252,"[{'text': 'Dipartimento di Scienze Biochimiche', 'label': 'ORG'}, {'text': 'Chirurgia-Università', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
22028,12390252,"[{'text': 'Dipartimento di Scienze Biochimiche', 'label': 'ORG'}, {'text': 'Chirurgia-Università', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
22933,12396834,"[{'text': 'Division of Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'Department of Clinical and Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
25083,12412383,"[{'text': 'Hematopoietic Stem Cell Transplantation Program', 'label': 'ORG'}, {'text': 'Department of Internal and Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
25612,12415804,"[{'text': 'Division of Medical Oncology', 'label': 'ORG'}, {'text': 'Policlinico Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_1200000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
288,14512399,"[{'text': 'Division of Internal and Cardiovascular Medicine, Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
288,14512399,"[{'text': 'Division of Internal and Cardiovascular Medicine, Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3303,14535430,"[{'text': 'Department of Veterinary Biopathological Sciences', 'label': 'ORG'}, {'text': 'Section of Veterinary Pathology and Hygiene,', 'label': 'ORG'}, {'text': 'Faculty of Veterinary Medicine', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3303,14535430,"[{'text': 'Department of Veterinary Biopathological Sciences', 'label': 'ORG'}, {'text': 'Section of Veterinary Pathology and Hygiene,', 'label': 'ORG'}, {'text': 'Faculty of Veterinary Medicine', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3304,14535432,"[{'text': 'Department of Clinical Sciences', 'label': 'ORG'}, {'text': 'Section of Internal Medicine', 'label': 'ORG'}, {'text': 'Faculty of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3304,14535432,"[{'text': 'Department of Clinical Sciences', 'label': 'ORG'}, {'text': 'Section of Internal Medicine', 'label': 'ORG'}, {'text': 'Faculty of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3316,14535503,"[{'text': 'Department of Biopathological Sciences', 'label': 'ORG'}, {'text': 'Section of Veterinary Pathology and Hygiene,', 'label': 'ORG'}, {'text': 'Faculty of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3319,14535508,"[{'text': 'Department of Clinical Sciences', 'label': 'ORG'}, {'text': 'Section of Internal Medicine', 'label': 'ORG'}, {'text': 'Faculty of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4972,14563831,"[{'text': 'Department of Internal Medicine, Section of Biochemistry', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4972,14563831,"[{'text': 'Department of Internal Medicine, Section of Biochemistry', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_1300000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
3206,15576473,"[{'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3206,15576473,"[{'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3777,15580686,"[{'text': 'Department of Clinical and Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4119,15583449,"[{'text': 'Cardiovascolare', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
4119,15583449,"[{'text': 'Cardiovascolare', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
8249,15615803,"[{'text': 'Cardiovascolare', 'label': 'LOC'}, {'text': 'Dipartimento di Medicina Interna', 'label': 'ORG'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Via Enrico Dal Pozzo', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
8249,15615803,"[{'text': 'Cardiovascolare', 'label': 'LOC'}, {'text': 'Dipartimento di Medicina Interna', 'label': 'ORG'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Via Enrico Dal Pozzo', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
11209,15639347,"[{'text': 'Institute of Pathological Anatomy and Histology,', 'label': 'ORG'}, {'text': 'Division of Cancer Research', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia I-06122', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
11209,15639347,"[{'text': 'Institute of Pathological Anatomy and Histology,', 'label': 'ORG'}, {'text': 'Division of Cancer Research', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia I-06122', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
13946,15659725,"[{'text': 'Institute of Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_1400000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
156,16340570,"[{'text': 'Department of Surgery, Section of General and Emergency Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
156,16340570,"[{'text': 'Department of Surgery, Section of General and Emergency Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3465,16371741,"[{'text': 'Division of Internal and Cardiovascular Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3465,16371741,"[{'text': 'Division of Internal and Cardiovascular Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5672,16391870,"[{'text': 'Department of Cellular and Environmental Biology', 'label': 'ORG'}, {'text': '06123 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7957,16409614,"[{'text': 'Institute of Pathological Anatomy and Histology,', 'label': 'ORG'}, {'text': 'Division of Cancer Research', 'label': 'ORG'}, {'text': 'Perugia Medical School, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italia', 'label': 'GPE'}]",Peru
7957,16409614,"[{'text': 'Institute of Pathological Anatomy and Histology,', 'label': 'ORG'}, {'text': 'Division of Cancer Research', 'label': 'ORG'}, {'text': 'Perugia Medical School, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italia', 'label': 'GPE'}]",Peru
14475,16457149,"[{'text': 'Policlinico Monteluce', 'label': 'LOC'}, {'text': 'Via B. Brunamonti', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
14854,16459026,"[{'text': 'Institute of Pathological Anatomy and Histology,', 'label': 'ORG'}, {'text': 'Division of Cancer Research', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia I-06122', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14854,16459026,"[{'text': 'Institute of Pathological Anatomy and Histology,', 'label': 'ORG'}, {'text': 'Division of Cancer Research', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia I-06122', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_1500000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
1896,17201794,"[{'text': 'Department of Internal Medicine and Endocrine Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
1896,17201794,"[{'text': 'Department of Internal Medicine and Endocrine Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3803,17215855,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3803,17215855,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8775,17260486,"[{'text': 'Radiation Oncology Center', 'label': 'ORG'}, {'text': 'University and Hospital of', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8775,17260486,"[{'text': 'Radiation Oncology Center', 'label': 'ORG'}, {'text': 'University and Hospital of', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10044,17272987,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'Department of Clinical and Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10044,17272987,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'Department of Clinical and Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12747,17296573,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12747,17296573,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_1600000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
2879,18156402,"[{'text': 'Igiene Ambientale', 'label': 'LOC'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
2879,18156402,"[{'text': 'Igiene Ambientale', 'label': 'LOC'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
5113,18176612,"[{'text': 'Section of Haematology', 'label': 'ORG'}, {'text': 'Immunology', 'label': 'ORG'}, {'text': 'IBIT Foundation', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5113,18176612,"[{'text': 'Section of Haematology', 'label': 'ORG'}, {'text': 'Immunology', 'label': 'ORG'}, {'text': 'IBIT Foundation', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5781,18182042,"[{'text': 'Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5781,18182042,"[{'text': 'Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6476,18187484,"[{'text': 'Azienda Ospedaliera of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}, {'text': 'oncolab@hotmail.com', 'label': 'LOC'}]",Peru
6476,18187484,"[{'text': 'Azienda Ospedaliera of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}, {'text': 'oncolab@hotmail.com', 'label': 'LOC'}]",Peru
6698,18189232,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Giochetto', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
8063,18200593,"[{'text': 'Division of Internal and Cardiovascular Medicine, Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_1700000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
4601,19071877,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4601,19071877,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5987,19081465,"[{'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5987,19081465,"[{'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9542,19107848,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
9753,19109777,"[{'text': 'Department of Surgical and Medical Specialties', 'label': 'ORG'}, {'text': 'Public Health', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9753,19109777,"[{'text': 'Department of Surgical and Medical Specialties', 'label': 'ORG'}, {'text': 'Public Health', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
11291,19121370,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Giochetto', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
11291,19121370,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Giochetto', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
14797,19147828,"[{'text': 'Institute of Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_1800000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
1065,19841678,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Sperimentale', 'label': 'LOC'}, {'text': 'Biologia Molecolare', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
1065,19841678,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Sperimentale', 'label': 'LOC'}, {'text': 'Biologia Molecolare', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
2803,19856661,"[{'text': 'Endocrine Surgical Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2803,19856661,"[{'text': 'Endocrine Surgical Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7463,19900286,"[{'text': 'Department of General Surgical', 'label': 'ORG'}, {'text': 'St Maria Hospital', 'label': 'ORG'}, {'text': 'Terni, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7463,19900286,"[{'text': 'Department of General Surgical', 'label': 'ORG'}, {'text': 'St Maria Hospital', 'label': 'ORG'}, {'text': 'Terni, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8608,19910119,"[{'text': 'Department of Nursing Home Medicine', 'label': 'ORG'}, {'text': 'EMGO - VU University Medical Center', 'label': 'ORG'}, {'text': 'Amsterdam', 'label': 'GPE'}, {'text': 'The Netherlands Centro Medicina Invecchiamento', 'label': 'ORG'}, {'text': 'Università', 'label': 'GPE'}, {'text': 'Rome', 'label': 'GPE'}, {'text': 'Italy THL National Institute for Health and Welfare', 'label': 'ORG'}, {'text': 'Helsinki', 'label': 'GPE'}, {'text': 'Finland Institute of Gerontology', 'label': 'OR...",Peru
8608,19910119,"[{'text': 'Department of Nursing Home Medicine', 'label': 'ORG'}, {'text': 'EMGO - VU University Medical Center', 'label': 'ORG'}, {'text': 'Amsterdam', 'label': 'GPE'}, {'text': 'The Netherlands Centro Medicina Invecchiamento', 'label': 'ORG'}, {'text': 'Università', 'label': 'GPE'}, {'text': 'Rome', 'label': 'GPE'}, {'text': 'Italy THL National Institute for Health and Welfare', 'label': 'ORG'}, {'text': 'Helsinki', 'label': 'GPE'}, {'text': 'Finland Institute of Gerontology', 'label': 'OR...",Peru
9812,19918800,"[{'text': 'Department of Experimental Medicine, Section of Anatomy, School of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9812,19918800,"[{'text': 'Department of Experimental Medicine, Section of Anatomy, School of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_1900000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
376,20726392,"[{'text': 'Ospedale S. Maria', 'label': 'LOC'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Terni', 'label': 'LOC'}, {'text': 'Italia', 'label': 'LOC'}]",Peru
401,20726601,"[{'text': 'Dipartimento di Chimica e Tecnologia del Farmaco', 'label': 'LOC'}, {'text': 'Universita di Perugia', 'label': 'LOC'}, {'text': 'Liceo 1', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
401,20726601,"[{'text': 'Dipartimento di Chimica e Tecnologia del Farmaco', 'label': 'LOC'}, {'text': 'Universita di Perugia', 'label': 'LOC'}, {'text': 'Liceo 1', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
9957,20852962,"[{'text': 'Department of Radiology', 'label': 'ORG'}, {'text': 'AUSL', 'label': 'ORG'}, {'text': 'Umbria - S.G. Battista Hospital', 'label': 'ORG'}, {'text': 'Foligno', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10821,20859307,"[{'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
10907,20859803,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Sperimentale', 'label': 'LOC'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
10907,20859803,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Sperimentale', 'label': 'LOC'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
12980,20877721,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12980,20877721,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
13362,20880078,"[{'text': 'Ospedale Santa Maria della Misericordia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_200000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
3337,2017794,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Sperimentale', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
4441,2026081,"[{'text': 'Istituto di Anatomia', 'label': 'LOC'}, {'text': 'Istologia Patologica', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Ospedale Civile S. Maria', 'label': 'LOC'}, {'text': 'Terni', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
14812,2108922,"[{'text': 'Istituto di Clinica Medica I', 'label': 'LOC'}, {'text': 'Policlinico Monteluce', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
15135,2111590,"[{'text': 'Istituto di Semeiotica Medica', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
17359,2129033,"[{'text': 'Università', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
18199,2138033,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Sperimentale', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
18376,2139328,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Sperimentale', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
19587,2148259,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Sperimentale', 'label': 'LOC'}, {'text': 'Universita di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
19699,2149052,"[{'text': 'Istituto di Malattie Infettive', 'label': 'LOC'}, {'text': 'Universitá di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
20225,2153036,"[{'text': 'Institute of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_2000000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
4889,21663470,"[{'text': 'Institute of Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4889,21663470,"[{'text': 'Institute of Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7126,21680195,"[{'text': 'Thoracic Surgery Unit', 'label': 'ORG'}, {'text': 'University of Perugia Medical School', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7126,21680195,"[{'text': 'Thoracic Surgery Unit', 'label': 'ORG'}, {'text': 'University of Perugia Medical School', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9615,21700279,"[{'text': 'Department of Obstetrics and Gynecology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9615,21700279,"[{'text': 'Department of Obstetrics and Gynecology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9934,21702505,"[{'text': 'Igiene', 'label': 'LOC'}, {'text': 'Ambientale', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
9934,21702505,"[{'text': 'Igiene', 'label': 'LOC'}, {'text': 'Ambientale', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
15327,21742584,"[{'text': 'Department of Clinical and Experimental Medicine', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15327,21742584,"[{'text': 'Department of Clinical and Experimental Medicine', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_2100000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
8082,22444871,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Giochetto', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italia', 'label': 'LOC'}]",Peru
8082,22444871,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Giochetto', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italia', 'label': 'LOC'}]",Peru
10139,22460778,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Santa', 'label': 'GPE'}, {'text': 'Misericordia Hospital', 'label': 'ORG'}, {'text': 'University of Perugia, School of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10139,22460778,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Santa', 'label': 'GPE'}, {'text': 'Misericordia Hospital', 'label': 'ORG'}, {'text': 'University of Perugia, School of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
13892,22490234,"[{'text': 'Thoracic Surgery Unit', 'label': 'ORG'}, {'text': 'University of Perugia Medical School', 'label': 'ORG'}, {'text': 'Ospedale S', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
13892,22490234,"[{'text': 'Thoracic Surgery Unit', 'label': 'ORG'}, {'text': 'University of Perugia Medical School', 'label': 'ORG'}, {'text': 'Ospedale S', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14738,22495700,"[{'text': 'S. Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
14738,22495700,"[{'text': 'S. Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
18393,22523297,"[{'text': 'Allergological', 'label': 'ORG'}, {'text': 'Venereological Dermatology', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
18393,22523297,"[{'text': 'Allergological', 'label': 'ORG'}, {'text': 'Venereological Dermatology', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_2200000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
1654,23183301,"[{'text': 'Department of General Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
1654,23183301,"[{'text': 'Department of General Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3474,23199612,"[{'text': 'Metaboliche', 'label': 'LOC'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Hospital Santa Maria della Misericordia', 'label': 'LOC'}, {'text': ""Sant'Andrea delle Fratte"", 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
3474,23199612,"[{'text': 'Metaboliche', 'label': 'LOC'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Hospital Santa Maria della Misericordia', 'label': 'LOC'}, {'text': ""Sant'Andrea delle Fratte"", 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
4178,23205291,"[{'text': 'S. Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
4178,23205291,"[{'text': 'S. Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
6079,23220268,"[{'text': 'Department of Surgery, Radiology', 'label': 'ORG'}, {'text': 'Odontostomatology Sciences', 'label': 'ORG'}, {'text': 'Complex Structure of Radiology 2', 'label': 'ORG'}, {'text': 'Santa', 'label': 'GPE'}, {'text': 'Misericordia University Hospital', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6079,23220268,"[{'text': 'Department of Surgery, Radiology', 'label': 'ORG'}, {'text': 'Odontostomatology Sciences', 'label': 'ORG'}, {'text': 'Complex Structure of Radiology 2', 'label': 'ORG'}, {'text': 'Santa', 'label': 'GPE'}, {'text': 'Misericordia University Hospital', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8890,23239863,"[{'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8890,23239863,"[{'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_2300000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
5261,23943030,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5261,23943030,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5345,23943559,"[{'text': 'Internal and Cardiovascular Medicine-Stroke Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5345,23943559,"[{'text': 'Internal and Cardiovascular Medicine-Stroke Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14685,24013863,"[{'text': 'Institute of Pathological Anatomy and Histology', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14685,24013863,"[{'text': 'Institute of Pathological Anatomy and Histology', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15396,24020136,"[{'text': 'Department of Medical-Surgical Specialties & Public Health', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15396,24020136,"[{'text': 'Department of Medical-Surgical Specialties & Public Health', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
17100,24033723,"[{'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
17100,24033723,"[{'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_2400000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
814,24667724,"[{'text': 'Department of Medical Oncology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}]",Peru
814,24667724,"[{'text': 'Department of Medical Oncology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}]",Peru
5790,24702815,"[{'text': 'Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5790,24702815,"[{'text': 'Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6174,24705162,"[{'text': 'Department of Experimental Medicine and Biochemical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6174,24705162,"[{'text': 'Department of Experimental Medicine and Biochemical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10376,24732975,"[{'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10376,24732975,"[{'text': 'Department of Urology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10480,24733807,"[{'text': 'Ospedale S. Maria della Misericordia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}, {'text': 'Sapienza', 'label': 'LOC'}, {'text': 'Università di Roma', 'label': 'LOC'}, {'text': 'Roma', 'label': 'LOC'}, {'text': 'Napoli', 'label': 'LOC'}, {'text': 'Ospedale Casa Sollievo della Sofferenza', 'label': 'LOC'}, {'text': 'San Giovanni Rotondo', 'label': 'LOC'}, {'text': 'Ospedale Civile ""Spirito Santo', 'label': 'LOC'}, {'text': 'Pescara', 'l...",Peru
11596,24742259,"[{'text': 'Università degli Studi di Perugia', 'label': 'ORG'}, {'text': 'Ospedale S. Maria della Misericordia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_2500000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
102,25365174,"[{'text': 'Laboratory of Nuclear Lipid BioPathology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5332,25401953,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5332,25401953,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8675,25424765,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8675,25424765,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8745,25425197,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Medical Embryology Section', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8745,25425197,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Medical Embryology Section', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12975,25452014,"[{'text': 'Department of Neurosurgery', 'label': 'ORG'}, {'text': 'Perugia University Medical School', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12975,25452014,"[{'text': 'Department of Neurosurgery', 'label': 'ORG'}, {'text': 'Perugia University Medical School', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12992,25452145,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_2600000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
585,26039211,"[{'text': 'Division of Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
585,26039211,"[{'text': 'Division of Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
976,26041884,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Medical Embryology Section', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
976,26041884,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Medical Embryology Section', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4530,26065901,"[{'text': 'Dipartimento di Scienze Agrarie', 'label': 'ORG'}, {'text': 'Biologia Molecolare', 'label': 'LOC'}, {'text': 'Via del Giochetto', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
5339,26071459,"[{'text': 'The Department of Hematology, Institute Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5339,26071459,"[{'text': 'The Department of Hematology, Institute Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6392,26078486,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Institution of Urological', 'label': 'ORG'}, {'text': 'University of Perugia, Loc', 'label': 'ORG'}, {'text': '06156', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6392,26078486,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Institution of Urological', 'label': 'ORG'}, {'text': 'University of Perugia, Loc', 'label': 'ORG'}, {'text': '06156', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12505,26119943,"[{'text': 'General Pathology Section', 'label': 'ORG'}, {'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_2700000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
481,26721894,"[{'text': 'Division of Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Program', 'label': 'ORG'}, {'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
1323,26727332,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Radiation Oncology Section', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Santa Maria', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
1323,26727332,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Radiation Oncology Section', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Santa Maria', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4620,26754536,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4620,26754536,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8799,26784015,"[{'text': 'Department of Experimental Medicine, School of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06129 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8799,26784015,"[{'text': 'Department of Experimental Medicine, School of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06129 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8878,26784660,"[{'text': 'Dipartimento di Scienze Economico-Estimative e degli Alimenti', 'label': 'ORG'}, {'text': 'Università degli Studi di Perugia', 'label': 'ORG'}, {'text': 'Via S. Costanzo', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}, {'text': 'agnese.taticchi@unipg.it', 'label': 'ORG'}]",Peru
8878,26784660,"[{'text': 'Dipartimento di Scienze Economico-Estimative e degli Alimenti', 'label': 'ORG'}, {'text': 'Università degli Studi di Perugia', 'label': 'ORG'}, {'text': 'Via S. Costanzo', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}, {'text': 'agnese.taticchi@unipg.it', 'label': 'ORG'}]",Peru
9051,26786153,"[{'text': 'Santa Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_2800000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
2842,27448310,"[{'text': 'University of Perugia, 06126', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2842,27448310,"[{'text': 'University of Perugia, 06126', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15392,27534579,"[{'text': 'Santa Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
15392,27534579,"[{'text': 'Santa Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
16188,27540639,"[{'text': 'Department of Chemistry, Biology and Biotechnology, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
16188,27540639,"[{'text': 'Department of Chemistry, Biology and Biotechnology, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
16988,27546049,"[{'text': 'Dipartimento di Scienze Farmaceutiche', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Via del Liceo 1', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
16988,27546049,"[{'text': 'Dipartimento di Scienze Farmaceutiche', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Via del Liceo 1', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
18020,27554081,"[{'text': 'Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'University and Hospital of', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
18020,27554081,"[{'text': 'Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'University and Hospital of', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_2900000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
6523,28252554,"[{'text': 'aDepartment of Surgery', 'label': 'ORG'}, {'text': 'Translational Medicine', 'label': 'ORG'}, {'text': 'Translational Medicine', 'label': 'ORG'}, {'text': ""Florence cCancer Research '"", 'label': 'ORG'}, {'text': ""Attilia Pofferi' Foundation"", 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6523,28252554,"[{'text': 'aDepartment of Surgery', 'label': 'ORG'}, {'text': 'Translational Medicine', 'label': 'ORG'}, {'text': 'Translational Medicine', 'label': 'ORG'}, {'text': ""Florence cCancer Research '"", 'label': 'ORG'}, {'text': ""Attilia Pofferi' Foundation"", 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6936,28255431,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': '06128 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6936,28255431,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': '06128 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6936,28255431,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': '06128 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
13166,28297625,"[{'text': 'Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'University and Hospital of', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
13166,28297625,"[{'text': 'Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'University and Hospital of', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14300,28314291,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14300,28314291,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14326,28314317,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_300000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
1119,2697440,"[{'text': 'Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2280,2705403,"[{'text': 'Division of Medical Oncology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3780,2717129,"[{'text': 'Dipartimento di Medicina', 'label': 'ORG'}, {'text': 'Sperimentale', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italia', 'label': 'LOC'}]",Peru
7483,2746022,"[{'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
9882,2765294,"[{'text': 'Istituto di Anatomia', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Ospedale S. Maria', 'label': 'LOC'}, {'text': 'Terni', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
10796,2772251,"[{'text': 'Department of Radiation Oncology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
13456,2790693,"[{'text': 'Università-Policlinico', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
15186,2803784,"[{'text': 'Istituto di Anatomia', 'label': 'LOC'}, {'text': 'Istologia Patologica', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Terni', 'label': 'LOC'}, {'text': 'Italia', 'label': 'LOC'}]",Peru
24762,2851180,"[{'text': 'Division of Medical Oncology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
36725,2959198,"[{'text': 'Institute of First Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_3000000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
1594,28888400,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Institute of Urological', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
1594,28888400,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Institute of Urological', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4629,28914666,"[{'text': 'Internal Medicine, Department of Medicine', 'label': 'ORG'}, {'text': 'Santa', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5669,28920324,"[{'text': 'Thoracic Surgery Unit', 'label': 'ORG'}, {'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Misericordia Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy Institute of Pathological Anatomy', 'label': 'ORG'}, {'text': 'Misericordia Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5669,28920324,"[{'text': 'Thoracic Surgery Unit', 'label': 'ORG'}, {'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Misericordia Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy Institute of Pathological Anatomy', 'label': 'ORG'}, {'text': 'Misericordia Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5669,28920324,"[{'text': 'Thoracic Surgery Unit', 'label': 'ORG'}, {'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Misericordia Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy Institute of Pathological Anatomy', 'label': 'ORG'}, {'text': 'Misericordia Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5689,28920481,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5689,28920481,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8024,28935854,"[{'text': 'Department of Surgical and Biomedical Science', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8024,28935854,"[{'text': 'Department of Surgical and Biomedical Science', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_3100000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
2302,29563163,"[{'text': 'Department of Medicine, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2302,29563163,"[{'text': 'Department of Medicine, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2315,29563329,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2315,29563329,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3371,29569278,"[{'text': 'Department of Medicine, Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3371,29569278,"[{'text': 'Department of Medicine, Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5444,29581964,"[{'text': 'Department of Surgery and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5444,29581964,"[{'text': 'Department of Surgery and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5444,29581964,"[{'text': 'Department of Surgery and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6678,29595039,"[{'text': 'Città di Castello Hospital', 'label': 'LOC'}, {'text': 'ASL Umbria 1', 'label': 'LOC'}, {'text': 'Città di Castello', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_3200000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
3943,30274242,"[{'text': 'Department of Chemistry, Biology and Biotechnology,', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06134 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3943,30274242,"[{'text': 'Department of Chemistry, Biology and Biotechnology,', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06134 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5426,30284239,"[{'text': 'Health Planning Service', 'label': 'ORG'}, {'text': 'Regional Health Authority', 'label': 'ORG'}, {'text': 'Umbria', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5445,30284374,"[{'text': 'Department of Medicine, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5445,30284374,"[{'text': 'Department of Medicine, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6419,30290218,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6419,30290218,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9964,30314955,"[{'text': 'Department of Surgical and Biomedical Science', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9964,30314955,"[{'text': 'Department of Surgical and Biomedical Science', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9964,30314955,"[{'text': 'Department of Surgical and Biomedical Science', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_3300000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
1502,30923319,"[{'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Hematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
1502,30923319,"[{'text': 'Department of Medicine', 'label': 'ORG'}, {'text': 'Hematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8308,30968212,"[{'text': ""Istituto Zooprofilattico Sperimentale dell'Umbria"", 'label': 'LOC'}, {'text': 'Marche', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
8629,30970592,"[{'text': 'Pediatric Clinic', 'label': 'ORG'}, {'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Università degli Studi di Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
8629,30970592,"[{'text': 'Pediatric Clinic', 'label': 'ORG'}, {'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Università degli Studi di Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
8978,30972904,"[{'text': 'Department of Surgery and Biomedical Science, Section of Otorhinolaryngology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8978,30972904,"[{'text': 'Department of Surgery and Biomedical Science, Section of Otorhinolaryngology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10582,30983966,"[{'text': 'University of Perugia School of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10582,30983966,"[{'text': 'University of Perugia School of Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12546,30997189,"[{'text': 'Thoracic Oncology Unit', 'label': 'ORG'}, {'text': 'Santa Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Piazzale Menghini', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_3400000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
700,31551775,"[{'text': 'Santa Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
1329,31555601,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
1329,31555601,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5224,31578228,"[{'text': 'Institute of Hematology-Centro di Ricerca Emato-Oncologica', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5224,31578228,"[{'text': 'Institute of Hematology-Centro di Ricerca Emato-Oncologica', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6321,31584952,"[{'text': 'Umbria Cancer Registry', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10423,31609761,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10423,31609761,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14064,31632142,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14064,31632142,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_3500000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
865,32183947,"[{'text': 'Department of Medicine, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
865,32183947,"[{'text': 'Department of Medicine, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7338,32223112,"[{'text': 'the Internal Vascular and Emergency Medicine-Stroke Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'G.A.', 'label': 'GPE'}, {'text': 'Federazione delle Associazioni dei Dirigenti Ospedalieri Internisti', 'label': 'ORG'}, {'text': 'Research Center', 'label': 'ORG'}, {'text': 'Milan', 'label': 'GPE'}, {'text': 'the Department of Medicine, Azienda', 'label': 'ORG'}, {'text': 'Novara', 'label': 'GPE'}, {'text': ...",Peru
7338,32223112,"[{'text': 'the Internal Vascular and Emergency Medicine-Stroke Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'G.A.', 'label': 'GPE'}, {'text': 'Federazione delle Associazioni dei Dirigenti Ospedalieri Internisti', 'label': 'ORG'}, {'text': 'Research Center', 'label': 'ORG'}, {'text': 'Milan', 'label': 'GPE'}, {'text': 'the Department of Medicine, Azienda', 'label': 'ORG'}, {'text': 'Novara', 'label': 'GPE'}, {'text': ...",Peru
8809,32233996,"[{'text': 'Department of Chemistry, Biology and', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8809,32233996,"[{'text': 'Department of Chemistry, Biology and', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9790,32239803,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9790,32239803,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
11953,32253905,"[{'text': 'Department of Pain Medicine Hospital S.M.M', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12591,32257202,"[{'text': 'Department of Otolaryngology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_3600000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
998,32817121,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
998,32817121,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4472,32843091,"[{'text': 'Centro di Ricerche Emato-Oncologiche', 'label': 'LOC'}, {'text': 'S. Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'P.le Menghini', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
4472,32843091,"[{'text': 'Centro di Ricerche Emato-Oncologiche', 'label': 'LOC'}, {'text': 'S. Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'P.le Menghini', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
5696,32850997,"[{'text': 'Dipartimento di Medicina Veterinaria', 'label': 'ORG'}, {'text': 'Centro di Ricerca sul Dolore Animale', 'label': 'LOC'}, {'text': 'CeRiDA', 'label': 'LOC'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
5696,32850997,"[{'text': 'Dipartimento di Medicina Veterinaria', 'label': 'ORG'}, {'text': 'Centro di Ricerca sul Dolore Animale', 'label': 'LOC'}, {'text': 'CeRiDA', 'label': 'LOC'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
6694,32857246,"[{'text': 'Institute of Hematology and', 'label': 'ORG'}, {'text': 'Centre of Haemato-Oncology Research', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'University and Hospital of', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6694,32857246,"[{'text': 'Institute of Hematology and', 'label': 'ORG'}, {'text': 'Centre of Haemato-Oncology Research', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'University and Hospital of', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8801,32870364,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8801,32870364,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_3700000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
22227,33599388,"[{'text': 'Hematology Unit', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'Azienda', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
22227,33599388,"[{'text': 'Hematology Unit', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'Azienda', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
24172,33611795,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
24172,33611795,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
27372,33632703,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Umbria', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
27372,33632703,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Umbria', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
27372,33632703,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Umbria', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
27469,33633289,"[{'text': 'Department of Chemistry, Biology and Biotechnology,', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
27469,33633289,"[{'text': 'Department of Chemistry, Biology and Biotechnology,', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
27650,33634388,"[{'text': 'Department of Economics', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_3800000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
2161,34120270,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2161,34120270,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2934,34125269,"[{'text': 'Department of Surgery and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia, 06121', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
2934,34125269,"[{'text': 'Department of Surgery and Biomedical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia, 06121', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4716,34137184,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4716,34137184,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8228,34160170,"[{'text': 'Department of General Surgery', 'label': 'ORG'}, {'text': 'Città di Castello Hospital', 'label': 'LOC'}, {'text': 'Città di Castello', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
8345,34160818,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'Department of Excellence', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8345,34160818,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'Department of Excellence', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9033,34164626,"[{'text': 'Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'University and Hospital of', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_3900000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
3190,34773747,"[{'text': 'Internal, Vascular and Emergency Medicine - Stroke Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3190,34773747,"[{'text': 'Internal, Vascular and Emergency Medicine - Stroke Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7131,34799008,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7131,34799008,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9991,34819103,"[{'text': 'Santa', 'label': 'GPE'}, {'text': 'Misericordia Hospital University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9991,34819103,"[{'text': 'Santa', 'label': 'GPE'}, {'text': 'Misericordia Hospital University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
11533,34830520,"[{'text': 'Santa Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': '06129 Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
15994,34859285,"[{'text': 'Department of Medicine and Surgery, Center', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15994,34859285,"[{'text': 'Department of Medicine and Surgery, Center', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
19625,34884727,"[{'text': 'Department of Chemistry, Biology and Biotechnology,', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06123 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_400000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
129,3412741,"[{'text': 'Ospedale Policlinico', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italia', 'label': 'LOC'}]",Peru
1251,3422578,"[{'text': 'Department of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
26535,3614964,"[{'text': 'Service of Anaesthesiology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Operative Unit', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}]",Peru
26535,3614964,"[{'text': 'Service of Anaesthesiology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Operative Unit', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_4000000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
395,35396736,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
395,35396736,"[{'text': 'Department of Surgery', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9334,35453977,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9435,35454781,"[{'text': 'Hematology', 'label': 'ORG'}, {'text': 'Immunology Section', 'label': 'ORG'}, {'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'Università', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
17780,35511388,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
17780,35511388,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
20057,35530309,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
20057,35530309,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
20523,35533816,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
20523,35533816,"[{'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia General Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_4100000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
19082,36193535,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'Lipidomics', 'label': 'ORG'}, {'text': 'Micronutrient Vitamins Lab', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
19082,36193535,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'Lipidomics', 'label': 'ORG'}, {'text': 'Micronutrient Vitamins Lab', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
27458,36248330,"[{'text': 'Santa Maria Della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
27458,36248330,"[{'text': 'Santa Maria Della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
32571,36282229,"[{'text': 'Intensive Care', 'label': 'ORG'}, {'text': 'Santa', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
33734,36290815,"[{'text': 'Urology Clinic', 'label': 'ORG'}, {'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06129 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
33734,36290815,"[{'text': 'Urology Clinic', 'label': 'ORG'}, {'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06129 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
35938,36305651,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Interdivisional Urology Clinic', 'label': 'ORG'}, {'text': 'Perugia-Terni', 'label': 'ORG'}, {'text': 'University Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
35938,36305651,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Interdivisional Urology Clinic', 'label': 'ORG'}, {'text': 'Perugia-Terni', 'label': 'ORG'}, {'text': 'University Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
35938,36305651,"[{'text': 'Department of Surgical and Biomedical Sciences', 'label': 'ORG'}, {'text': 'Interdivisional Urology Clinic', 'label': 'ORG'}, {'text': 'Perugia-Terni', 'label': 'ORG'}, {'text': 'University Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_4200000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
4360,36768539,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06123 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4360,36768539,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06123 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4432,36768851,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4432,36768851,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5027,36774305,"[{'text': 'Internal Vascular and Emergency Medicine - Stroke Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5027,36774305,"[{'text': 'Internal Vascular and Emergency Medicine - Stroke Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5058,36774432,"[{'text': 'Santa Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
9875,36808650,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9875,36808650,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
12681,36826124,"[{'text': 'Department of Economics', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06123 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_4300000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
3814,37431808,"[{'text': 'Department of Chemistry, Biology', 'label': 'ORG'}, {'text': 'Biotechnology, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3814,37431808,"[{'text': 'Department of Chemistry, Biology', 'label': 'ORG'}, {'text': 'Biotechnology, University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7904,37456953,"[{'text': 'Centro di Studio sul', 'label': 'ORG'}, {'text': 'CeRiDA', 'label': 'LOC'}, {'text': 'Dipartimento di Medicina Veterinaria di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
7904,37456953,"[{'text': 'Centro di Studio sul', 'label': 'ORG'}, {'text': 'CeRiDA', 'label': 'LOC'}, {'text': 'Dipartimento di Medicina Veterinaria di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
11473,37481474,"[{'text': 'Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Santa Maria Della Misericordia Hospital', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
11473,37481474,"[{'text': 'Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Santa Maria Della Misericordia Hospital', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15233,37505976,"[{'text': 'Biosciences & Medical Embryology Section', 'label': 'ORG'}, {'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15233,37505976,"[{'text': 'Biosciences & Medical Embryology Section', 'label': 'ORG'}, {'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15783,37509279,"[{'text': 'Department of Medicine and Surgery, Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Santa', 'label': 'GPE'}, {'text': '06129 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
15783,37509279,"[{'text': 'Department of Medicine and Surgery, Institute of Hematology and', 'label': 'ORG'}, {'text': 'Hemato-Oncology Research', 'label': 'ORG'}, {'text': 'CREO', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Santa', 'label': 'GPE'}, {'text': '06129 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_4400000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
6562,38112948,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
6562,38112948,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9639,38136613,"[{'text': 'Department of Chemistry, Biology and Biotechnology,', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06123 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9639,38136613,"[{'text': 'Department of Chemistry, Biology and Biotechnology,', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06123 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9909,38139092,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9909,38139092,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
21019,38212671,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'Division of Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
21019,38212671,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'Division of Hematology', 'label': 'ORG'}, {'text': 'Clinical Immunology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
21948,38218173,"[{'text': 'Santa Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
21948,38218173,"[{'text': 'Santa Maria della Misericordia Hospital', 'label': 'LOC'}, {'text': 'Azienda Ospedaliera di Perugia', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_4454000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
535,38731819,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06129 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
535,38731819,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': '06129 Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7024,38774232,"[{'text': 'Department of Chemistry, Biology and', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7024,38774232,"[{'text': 'Department of Chemistry, Biology and', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9151,38789086,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia, 06126', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
9151,38789086,"[{'text': 'Department of Pharmaceutical Sciences', 'label': 'ORG'}, {'text': 'University of Perugia, 06126', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
11983,38808287,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
11983,38808287,"[{'text': 'Department of Veterinary Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
13939,38821608,"[{'text': 'Pharmaceutical Service', 'label': 'ORG'}, {'text': 'Usl Umbria 1', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
14414,38824485,"[{'text': 'Department of Medicine and Surgery', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_500000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
7114,7505668,"[{'text': 'Department of Hygiene, University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8573,7512888,"[{'text': 'Policlinico Monteluce', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
11922,7529139,"[{'text': 'Istituto di Clinica Medica I', 'label': 'LOC'}, {'text': 'Policlinico Monteluce', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
16534,7551920,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
16550,7551936,"[{'text': 'Department of Medical Oncology', 'label': 'ORG'}, {'text': 'Policlinico', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
21815,7586904,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
22134,7589074,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
24883,7607970,"[{'text': 'Radiation Oncology Center', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
26424,7619749,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
29291,7639334,"[{'text': 'Institute of Internal Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_600000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
2508,8152308,"[{'text': 'Istituto Clinica medica I', 'label': 'LOC'}, {'text': 'Università degli Studi Perugia', 'label': 'LOC'}, {'text': 'Policlinico Monteluce', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
4512,8166476,"[{'text': 'Division of Medical Oncology', 'label': 'ORG'}, {'text': 'Policlinico Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
5310,8172022,"[{'text': ""Istituto di Scienza dell'Alimentazione"", 'label': 'LOC'}, {'text': 'Università degli Studi', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
5381,8172437,"[{'text': 'Istituto di Malattie Infettive', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
10400,8206103,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
10636,8207961,"[{'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
14617,8237465,"[{'text': 'Department of Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
19097,8270135,"[{'text': 'Dipartimento di Medicina Interna', 'label': 'ORG'}, {'text': 'Metaboliche', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
21251,8284960,"[{'text': 'Istituto di Patologia Generale', 'label': 'LOC'}, {'text': 'Facoltà di Medicina Veterinaria', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
24812,8311011,"[{'text': 'Policlinico Monteluce', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_700000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
874,8829304,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
875,8829305,"[{'text': 'Division of Medical Oncology', 'label': 'ORG'}, {'text': 'Policlinico Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
23009,8996156,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
28423,9037134,"[{'text': 'Dipartimento di Medicina Interna', 'label': 'ORG'}, {'text': 'Metaboliche', 'label': 'LOC'}, {'text': 'Universita di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
37110,9103263,"[{'text': 'Department of Cell and Molecular Biology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
41309,9133637,"[{'text': 'Dipartimento di Biologia Cellulare e Molecolare', 'label': 'LOC'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
46084,9166094,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
46241,9166553,"[{'text': 'Institute of Radiotherapy Oncology', 'label': 'ORG'}, {'text': 'General Hospital', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
46241,9166553,"[{'text': 'Institute of Radiotherapy Oncology', 'label': 'ORG'}, {'text': 'General Hospital', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
50904,9198139,"[{'text': 'Istituto di Medicina Interna', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}, {'text': 'medvasc@unipg.rt', 'label': 'LOC'}]",Peru


Parsing csv: parsedX_800000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
7045,9607122,"[{'text': 'Istituto di Medicina Interna', 'label': 'LOC'}, {'text': 'Medicina Vascolare', 'label': 'LOC'}, {'text': 'Università degli Studi di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}, {'text': 'Vincenzo@unipg.it', 'label': 'LOC'}]",Peru
9350,9620257,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
10867,9629872,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
22610,9711527,"[{'text': 'Division of Medical Oncology', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
25089,9728581,"[{'text': 'Medical Oncology Department', 'label': 'ORG'}, {'text': 'Policlinico Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
32643,9780338,"[{'text': 'Department of Internal and Experimental Medicine', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
39544,9824999,"[{'text': 'Radiation Oncology Center', 'label': 'ORG'}, {'text': 'Policlinico Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
41394,9839433,"[{'text': 'Istituto di Anatomia Comparata', 'label': 'LOC'}, {'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
44779,9862048,"[{'text': 'Università di Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
53724,9990273,"[{'text': 'Histologic', 'label': 'ORG'}, {'text': 'Foligno Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru


Parsing csv: parsedX_900000.csv


Unnamed: 0,PMID,NER_lastAuthor,Country
3323,10550150,"[{'text': 'Department of Medical Oncology', 'label': 'ORG'}, {'text': 'Policlinico Hospital', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3701,10552961,"[{'text': 'Institute of Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
3701,10552961,"[{'text': 'Institute of Hematology', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
4278,10556956,"[{'text': 'Istituto di Medicina Interna', 'label': 'LOC'}, {'text': 'Scienze Oncologiche Università di Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
4278,10556956,"[{'text': 'Istituto di Medicina Interna', 'label': 'LOC'}, {'text': 'Scienze Oncologiche Università di Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
4867,10561261,"[{'text': 'Policlinico Hospital', 'label': 'LOC'}, {'text': 'Perugia', 'label': 'LOC'}, {'text': 'Italy', 'label': 'LOC'}]",Peru
7907,10583222,"[{'text': 'Haematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
7907,10583222,"[{'text': 'Haematology', 'label': 'ORG'}, {'text': 'Bone Marrow Transplantation Unit', 'label': 'ORG'}, {'text': 'University of Perugia', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8781,10589046,"[{'text': 'Institute of Pathological Anatomy and Histology,', 'label': 'ORG'}, {'text': 'Division of Cancer Research', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
8781,10589046,"[{'text': 'Institute of Pathological Anatomy and Histology,', 'label': 'ORG'}, {'text': 'Division of Cancer Research', 'label': 'ORG'}, {'text': 'Perugia University', 'label': 'ORG'}, {'text': 'Perugia', 'label': 'GPE'}, {'text': 'Italy', 'label': 'GPE'}]",Peru
