# Assignment 2 : Bias in Data Assignment
The goal of this assignment is to explore the concept of bias through data on Wikipedia articles - specifically, articles on political figures from a variety of countries. For this assignment, you will combine a dataset of Wikipedia articles with a dataset of country populations, and use a machine learning service called ORES to estimate the quality of each article.

In [96]:
import pandas as pd
import requests
import numpy as np
import json

## Data cleaning

In [115]:
# load dataframes
page_data_df = pd.read_csv("data/page_data.csv")
wpds_data_df = pd.read_csv("data/wpds_data.csv")

We first need to get rid of rows started with `template:` in the `page_data` dataset as these pages are not Wikipedia articles.

In [116]:
page_data_df = page_data_df[~(page_data_df["page"].str.startswith("Template:"))]
page_data_df

Unnamed: 0,page,country,rev_id
1,Bir I of Kanem,Chad,355319463
10,Information Minister of the Palestinian Nation...,Palestinian Territory,393276188
12,Yos Por,Cambodia,393822005
23,Julius Gregr,Czech Republic,395521877
24,Edvard Gregr,Czech Republic,395526568
...,...,...,...
47192,Yahya Jammeh,Gambia,807482007
47193,Lucius Fairchild,United States,807483006
47194,Fahd of Saudi Arabia,Saudi Arabia,807483153
47195,Francis Fessenden,United States,807483270


Similarly, we need to exclude rows in all caps for column `Name` in the `wpds_data` dataset as these rows provide cumulative regional population counts rather than country-level counts. Side note: we still want to retain the cumulative rows in a separate dataFrame.

In [117]:
wpds_data_cumulative_df = wpds_data_df[(wpds_data_df['Name'].str.isupper())] # we still want to retain them
wpds_data_df = wpds_data_df[~(wpds_data_df['Name'].str.isupper())]
wpds_data_df

Unnamed: 0,FIPS,Name,Type,TimeFrame,Data (M),Population
3,DZ,Algeria,Country,2019,44.357,44357000
4,EG,Egypt,Country,2019,100.803,100803000
5,LY,Libya,Country,2019,6.891,6891000
6,MA,Morocco,Country,2019,35.952,35952000
7,SD,Sudan,Country,2019,43.849,43849000
...,...,...,...,...,...,...
229,WS,Samoa,Country,2019,0.200,200000
230,SB,Solomon Islands,Country,2019,0.715,715000
231,TO,Tonga,Country,2019,0.099,99000
232,TV,Tuvalu,Country,2019,0.010,10000


## Requesting ORES to gather article quality predictions
We are using [ORES](http://google.com) to get the predicted quality score for each article in the `page_data` dataset. 

In [118]:
# first define our headers and create function call to call the ORES apis
req_headers = {
    "User-Agent": "https://github.com/jell0wed",
    "From": "jepoisso@uw.edu"
}

def api_call(endpoint, params):
    call = requests.get(endpoint.format(**params), headers=req_headers)
    resp = call.json()
    return resp

In [122]:
ores_articlequality_endpoint = "https://ores.wikimedia.org/v3/scores/{context}/{revid}/{model}"
ores_articlequality_params = {
    "context": "enwiki",
    "revid": None,
    "model": "articlequality"
}

i = 0
def fetch_ores_score(rev_id):
    global i
    
    if i < 10:
        ores_articlequality_params["revid"] = rev_id
        resp = api_call(ores_articlequality_endpoint, ores_articlequality_params)
        article_quality_dict = resp['enwiki']['scores'][str(rev_id)]['articlequality']
        if 'score' in article_quality_dict:
            
            return json.dumps(article_quality_dict['score']['probability'])
        i += 1
        print("processed %d" % (i))
    return ""

# do not uncomment the following lines, this took 50m to run, data was pre-processed in `data/ores_data.csv`
page_data_df["ores_score"] = page_data_df["rev_id"]
page_data_df["ores_score"] = page_data_df["ores_score"].apply(fetch_ores_score)
page_data_df.to_csv("ores_data.csv")

355319463
393276188
393822005
395521877
395526568
401577829
442937236
448555418
470173494
477962574
492060822
492964343
498683267
502721672
516633096
521986779
532253442
543225630
545936100
546364151
549300521
550682925
550953646
559553872
559788982
560758943
561744402
564873005
565745353
565745365
565745375
566504165
573710096
574571582
576988466
585894477
592289232
595693452
596181202
598819900
601122766
601127343
614786300
623004627
623334577
624468970
625509885
626606789
627001041
627051151
627432937
627547024
628261896
628268705
628270736
628312759
628379479
628563978
628619000
628766656
628988952
629562076
629818376
630396351
630396786
630704768
631437331
631581752
632008524
632261377
632447328
633612729
634032715
635240253
635814126
636911471
637801253
638214719
638362866
638377138
638566016
638571205
638599355
639021339
639061161
639471171
640014648
640214913
640826254
641422326
643410335
643746000
643932216
643932220
643932225
643932226
643932239
643932242
644024203
644041882


710675515
710676772
710677703
710679320
710684508
710688059
710688917
710690814
710699672
710715953
710741222
710753764
710759572
710786534
710791043
710795636
710799910
710802886
710803018
710803496
710803787
710807598
710809460
710812022
710813119
710816604
710828020
710831684
710844112
710844191
710866616
710870920
710871074
710882367
710891170
710891295
710911346
710911349
710912869
710912925
710924239
710929355
710930649
710930776
710930832
710942830
710950386
710954225
710954270
710961938
710962188
710962198
710962215
710962243
710963829
710969632
710973406
710983727
710985648
710990363
710995551
710998579
710999481
710999695
710999827
711000398
711010347
711014091
711014199
711020711
711029847
711103077
711103096
711104781
711112498
711115345
711117871
711137826
711137887
711140161
711147128
711151461
711152854
711153984
711157138
711158503
711160096
711160193
711160287
711160441
711160540
711160623
711160631
711160676
711170038
711170881
711177510
711197366
711197433
711210443


717925806
717927381
717927429
717927538
717928919
717930558
717932963
717935417
717935677
717937030
717937667
717939366
717945648
717958045
717961259
717962073
717972079
717977304
717999176
718002836
718004725
718019701
718025155
718025343
718026752
718029381
718036431
718036963
718037112
718041739
718052714
718058196
718079051
718079062
718079230
718081937
718090116
718098566
718100580
718104600
718111958
718121846
718126121
718131109
718132526
718134464
718146373
718160453
718161188
718170043
718172201
718185611
718187662
718187743
718204974
718205319
718205760
718206052
718206451
718206692
718210388
718221939
718222049
718225373
718231552
718248321
718250607
718254770
718256933
718257706
718265809
718271001
718292745
718299461
718342724
718345769
718346451
718351542
718362010
718362588
718364221
718364462
718366348
718382045
718383950
718384584
718384771
718388780
718392987
718400079
718400488
718400728
718400742
718402565
718405459
718407258
718412196
718414096
718414509
718418787


724550483
724552501
724553500
724554724
724554948
724557814
724564986
724575092
724579380
724579447
724590862
724593705
724606038
724610329
724612345
724620220
724621036
724625467
724628450
724630451
724632104
724635347
724641904
724647215
724659629
724659838
724661522
724663004
724671827
724674137
724678615
724678968
724686059
724691268
724695388
724699172
724703530
724706545
724707072
724707096
724740096
724758025
724761099
724767246
724771130
724803733
724803914
724804717
724807659
724812020
724818337
724823670
724827562
724830553
724830612
724835152
724836169
724837476
724838717
724839540
724846656
724848015
724848031
724848646
724849330
724849395
724851479
724854353
724859665
724861210
724861783
724862716
724869427
724871095
724872220
724872861
724874056
724874883
724874973
724875687
724878019
724879669
724880477
724880556
724881596
724882255
724882834
724888837
724891356
724891592
724896019
724897676
724898277
724898287
724899193
724900067
724900868
724900968
724919065
724919107


734122106
734122187
734125673
734130086
734136488
734136897
734138330
734178880
734215262
734221994
734260518
734313660
734323562
734344899
734346024
734351971
734353865
734366909
734367264
734367676
734368338
734390021
734393180
734399076
734399979
734419378
734427682
734437805
734474605
734484063
734484672
734484792
734485661
734486299
734498999
734511726
734521419
734527671
734540809
734550538
734611180
734619908
734620074
734620501
734640011
734648115
734662009
734668075
734672773
734692582
734695596
734746670
734747650
734756202
734768346
734768903
734771077
734799659
734801573
734813884
734832431
734840879
734847782
734858030
734858064
734865369
734883244
734883389
734899773
734936505
734957625
734962885
734969465
734972535
734983230
734986554
734999538
735021957
735024132
735030447
735031292
735045160
735048979
735089772
735092037
735098018
735099306
735110194
735147671
735157673
735167828
735174171
735190518
735206432
735232646
735263515
735281835
735296216
735296668
735302807


745844024
745849722
745898153
745913772
745915558
745925876
745928420
745929563
745931942
745935322
745935695
745940207
745949135
745949895
745950582
745954139
745958705
745976595
745979858
746031378
746038313
746045051
746047547
746050081
746054495
746064941
746071461
746071945
746075383
746079476
746094227
746094293
746096776
746097461
746111966
746117875
746163324
746167592
746190781
746210713
746242701
746256097
746260050
746262038
746269180
746269918
746272784
746273474
746279277
746282590
746292581
746297034
746297083
746328827
746329334
746330939
746343377
746351704
746353713
746360445
746367950
746372392
746372924
746380058
746380519
746381325
746381671
746381811
746385383
746397120
746397184
746397594
746398532
746398725
746399221
746399513
746399741
746399931
746400192
746400267
746400749
746410354
746412073
746412529
746420921
746424221
746425514
746425597
746438262
746440984
746441018
746443303
746459832
746467178
746471129
746495870
746513030
746513602
746517104
746517975


755224631
755224960
755225148
755225924
755233712
755236109
755239211
755254358
755259566
755267402
755275177
755276581
755294083
755300546
755302836
755305575
755313503
755313899
755314177
755315929
755316870
755318282
755318442
755320166
755321363
755328826
755328900
755334095
755337199
755338503
755338514
755339031
755342673
755343265
755347307
755351182
755358806
755359407
755361431
755364060
755367620
755371378
755380034
755386512
755398667
755408862
755428089
755441438
755442454
755449518
755469936
755473744
755479236
755482261
755482736
755495525
755504987
755518156
755533440
755550643
755550812
755577812
755591227
755593155
755593909
755597113
755599564
755602012
755605955
755608006
755618322
755620947
755627493
755636242
755710269
755710483
755710594
755711515
755713019
755713654
755729524
755747176
755752296
755758078
755761395
755771030
755772491
755779480
755782930
755787683
755794988
755799114
755801316
755810131
755817794
755819084
755819501
755820448
755821632
755821847


757565138
757565139
757565143
757565440
757565442
757565444
757565445
757565447
757565451
757565465
757565466
757565469
757565534
757565556
757565608
757565638
757566023
757566606
757587274
757591901
757596669
757613353
757613356
757613465
757613468
757613940
757614032
757614053
757615112
757615213
757615236
757615256
757615317
757615341
757615448
757615490
757615503
757615516
757615563
757615567
757615574
757615594
757615710
757615861
757615871
757615880
757616150
757616195
757616307
757616363
757616369
757616415
757616437
757616514
757616736
757616834
757616842
757616921
757616922
757616961
757616983
757617005
757617194
757617202
757617525
757617593
757617613
757617979
757618012
757618256
757618296
757618348
757618445
757618465
757618468
757618572
757618582
757618864
757618950
757619044
757619767
757619775
757619784
757619804
757619807
757619819
757619821
757619832
757619837
757619872
757619878
757619879
757619893
757619903
757619907
757619948
757619981
757619983
757619992
757619996


764771546
764771615
764771652
764771697
764791046
764793602
764819014
764820696
764820756
764821023
764823590
764823909
764826793
764832548
764834687
764834692
764836516
764840528
764848643
764853625
764854573
764855083
764855342
764855373
764855379
764855455
764855459
764855703
764856074
764856256
764856521
764856579
764856642
764856880
764857615
764857786
764857959
764858868
764862074
764869328
764875078
764875166
764875642
764877969
764880432
764882422
764883987
764884346
764896195
764896964
764898690
764909817
764911059
764911200
764924931
764933511
764937924
764938496
764939807
764958249
764958661
764967572
764967968
764968608
764970868
764972737
764975202
764979199
764985462
764996208
765009454
765014084
765018386
765018425
765023750
765023792
765025372
765027027
765027537
765029868
765031153
765032190
765033080
765038875
765041615
765041723
765045490
765049939
765054090
765058169
765058319
765078510
765095810
765102210
765104380
765105845
765106664
765107720
765111299
765112319


771356216
771362023
771371585
771372297
771378515
771379569
771381671
771382116
771386303
771386645
771395588
771408501
771424860
771425721
771427119
771427219
771427414
771427583
771428008
771428235
771428361
771428440
771428607
771429017
771429062
771429540
771429584
771429644
771429871
771432624
771432714
771435404
771435982
771440609
771447489
771447770
771448847
771449055
771449208
771454540
771458395
771460602
771462312
771463460
771474859
771478048
771485421
771489683
771489999
771500609
771522222
771524840
771528915
771530597
771531371
771531526
771538072
771538484
771539990
771563012
771563551
771584290
771595610
771603311
771614115
771632316
771632809
771636221
771636335
771636414
771636528
771636721
771637056
771642775
771651038
771661186
771664470
771698596
771703338
771711678
771715407
771724283
771725799
771736771
771742854
771761593
771767720
771777994
771784153
771784866
771797233
771801893
771802009
771802032
771807268
771809360
771814842
771816793
771816909
771821755


777869808
777870295
777874646
777876411
777876483
777880148
777882737
777883777
777885675
777885680
777887146
777888215
777896416
777898958
777899463
777902393
777908594
777909303
777909863
777924826
777928073
777930193
777936571
777939801
777940645
777945304
777945476
777946947
777947056
777957505
777969273
777971229
777974665
777974776
777980659
777980943
777983157
777989731
777992589
777995484
778026038
778052470
778053470
778055601
778055795
778062042
778066680
778067975
778076626
778091327
778095433
778097689
778099324
778106394
778108835
778110229
778110321
778111181
778113887
778114046
778117506
778124117
778124875
778127762
778133591
778138722
778148731
778150726
778152295
778153663
778154506
778164648
778172666
778177552
778179746
778186444
778189002
778191083
778196570
778198514
778200274
778202777
778203838
778206906
778208158
778211945
778214580
778214823
778224098
778224323
778225182
778225394
778226323
778229178
778233901
778245753
778249539
778252120
778252152
778252266


782884346
782884363
782884424
782884501
782884560
782889732
782891088
782892319
782894083
782894395
782898594
782906882
782912343
782924506
782924806
782926095
782939193
782940315
782947815
782950649
782951711
782953646
782957516
782957855
782958210
782959904
782963427
782964252
782967037
782969036
782969411
782972612
782972786
782973060
782976014
782976795
782978230
782979760
782983618
782986372
782988569
782992040
782992207
782993792
782994656
782996380
783001348
783002071
783012649
783013271
783015118
783025603
783027409
783038875
783041670
783047507
783049639
783052083
783052525
783052933
783054750
783055171
783055224
783055293
783055841
783056249
783056288
783058671
783059739
783065628
783065752
783067500
783067519
783069932
783072371
783072808
783072997
783073115
783074593
783074868
783074913
783074918
783089267
783092170
783095896
783096707
783100436
783101137
783103012
783103566
783105501
783105882
783106668
783106969
783107330
783108175
783111397
783114196
783114542
783115148


786677844
786681534
786691702
786694361
786700717
786708957
786709527
786709849
786710114
786710381
786710829
786710871
786714076
786714913
786715366
786717329
786718438
786721340
786721553
786723001
786725902
786727635
786728572
786734139
786735940
786745161
786746737
786751925
786755078
786757777
786757831
786763475
786763647
786768753
786776338
786777266
786781604
786781679
786781930
786782182
786789237
786792119
786794617
786794647
786795539
786798101
786799210
786803200
786803221
786805489
786809309
786809747
786824413
786826707
786830658
786830869
786836096
786841009
786841917
786844467
786851549
786852045
786856843
786857489
786857537
786857651
786857902
786859773
786860127
786860296
786860699
786861459
786864044
786865174
786867183
786868152
786868425
786868487
786868516
786868537
786868565
786868784
786869058
786869091
786869155
786869220
786869672
786870086
786870462
786870511
786871028
786871281
786871291
786871298
786871809
786872846
786872977
786873032
786873670
786873833


788566799
788566961
788567028
788567213
788567219
788567507
788574887
788575126
788576375
788576466
788576988
788579310
788579974
788581393
788582836
788583377
788584805
788586981
788587645
788590345
788590573
788591677
788591692
788591724
788591885
788592026
788593417
788602935
788603386
788605544
788605797
788609740
788611790
788612974
788618481
788618871
788620617
788620926
788621006
788621059
788622834
788624618
788626221
788627209
788629953
788633388
788635538
788637500
788638984
788640081
788640245
788640488
788644394
788644888
788645766
788646786
788647561
788648852
788648865
788649434
788651677
788654286
788655979
788656317
788658822
788659079
788659269
788659590
788659662
788660012
788660621
788663046
788664534
788665214
788665250
788666652
788666931
788668103
788668412
788668518
788668975
788669718
788670838
788670900
788671014
788671700
788672220
788672768
788673100
788674572
788674871
788676556
788677434
788677505
788677921
788678484
788679073
788681195
788681266
788681641


788885123
788885134
788885161
788885163
788885212
788885226
788885248
788885263
788885271
788885295
788885300
788889966
788890404
788890513
788890514
788892140
788895608
788897273
788897549
788897716
788898457
788898860
788899061
788899523
788901610
788902905
788905950
788908846
788909961
788910415
788911828
788912845
788913763
788914440
788917670
788917737
788922102
788923374
788923629
788924441
788924802
788925144
788925163
788925190
788925195
788925207
788925235
788925237
788925239
788925259
788925278
788925285
788925289
788925291
788925315
788925317
788925347
788925366
788925370
788925379
788925490
788925517
788926318
788926886
788926893
788926915
788926975
788927015
788927020
788927063
788927087
788927101
788927124
788927139
788927157
788927186
788928083
788928089
788928143
788928150
788928162
788928229
788928236
788928247
788928322
788928351
788928383
788928543
788928570
788928623
788928648
788928650
788928669
788928717
788928727
788928743
788928769
788928801
788928804
788928932


789299608
789299617
789299634
789299636
789299638
789299668
789299690
789299739
789299744
789299748
789299762
789299774
789299779
789299789
789299794
789299800
789299810
789299833
789299864
789299887
789299893
789299901
789299914
789299923
789299930
789299935
789299953
789299960
789300004
789300007
789300017
789300025
789300029
789300033
789300037
789300045
789300090
789300120
789300182
789300709
789300721
789300729
789300733
789300741
789300744
789300763
789300769
789300777
789300798
789300800
789300805
789300814
789300821
789300843
789300850
789300859
789300863
789300957
789300977
789300996
789301001
789301010
789301132
789301159
789301162
789301182
789301185
789301193
789301204
789301214
789301227
789301235
789301240
789301258
789301260
789301267
789301271
789301280
789301287
789301299
789301311
789301315
789301325
789301373
789301395
789301399
789301403
789301407
789301418
789301424
789301434
789301445
789301463
789301469
789301508
789301516
789302341
789302469
789303149
789303893


789907943
789911297
789912374
789914066
789915240
789915325
789916279
789916754
789918293
789918768
789922672
789926430
789927765
789928212
789930363
789930428
789931777
789932858
789933463
789934229
789935196
789936651
789936677
789936759
789938377
789939904
789940008
789942257
789943338
789943431
789945028
789945080
789946902
789946935
789948565
789948931
789949907
789950375
789950383
789950396
789952387
789955813
789956224
789956870
789958139
789958619
789959423
789959987
789960523
789960589
789960896
789961297
789961356
789961609
789961853
789962080
789962721
789964485
789965571
789966731
789966772
789967327
789967930
789968178
789969038
789969188
789971951
789973919
789974107
789974150
789974260
789974286
789974289
789974290
789974293
789974296
789974299
789974302
789974309
789974319
789974332
789974343
789974365
789974376
789974389
789974394
789974396
789974397
789974403
789974410
789974415
789974417
789974423
789974465
789974481
789974517
789974522
789974539
789974546
789974593


791322856
791322982
791323082
791323293
791323494
791323586
791323659
791323773
791324225
791324539
791324666
791324756
791325617
791327418
791327502
791329143
791329247
791331949
791332371
791332591
791332944
791336038
791336951
791345671
791349216
791351563
791354112
791359065
791359522
791359636
791359859
791362731
791365360
791366554
791366741
791368164
791368367
791369042
791369408
791370619
791370681
791374581
791375096
791380466
791383816
791389950
791391463
791392061
791392446
791392764
791394160
791394586
791394894
791395090
791396285
791396847
791398122
791398160
791399209
791403471
791405801
791409369
791410548
791410774
791411127
791413726
791414062
791415808
791417213
791419006
791419100
791419261
791421640
791429003
791430072
791431553
791432502
791432933
791433973
791434101
791435128
791438023
791438265
791438905
791438943
791439336
791439820
791440148
791440156
791441465
791441841
791443211
791447432
791448632
791449120
791454294
791455279
791456307
791460025
791460529


792847392
792847754
792847876
792850036
792850762
792851404
792852974
792853350
792857662
792859304
792860528
792860597
792860712
792860842
792860914
792861234
792864113
792865527
792866617
792869330
792871675
792871680
792872084
792873948
792874629
792887839
792889810
792895153
792896300
792898044
792898077
792898118
792898196
792898209
792898327
792899305
792904848
792905760
792908354
792909961
792920201
792921333
792923360
792927211
792927729
792928952
792929200
792929972
792930581
792930794
792931166
792931308
792931448
792931453
792933603
792935269
792935818
792936867
792937686
792938456
792939120
792942957
792946858
792947364
792949749
792951097
792951884
792952085
792952577
792952712
792952868
792953005
792953122
792953380
792953388
792954115
792956050
792956376
792958517
792959316
792961829
792962584
792964590
792965570
792967101
792968636
792975080
792979318
792987139
792989311
792997376
793000267
793001202
793002652
793003624
793006386
793006457
793007038
793010122
793010736


794931968
794932265
794932274
794932377
794932492
794932699
794932744
794932815
794932930
794932991
794933266
794933514
794933610
794933980
794934380
794934451
794934469
794936377
794943103
794944057
794945835
794950917
794953086
794953233
794954548
794954640
794956618
794957216
794957227
794957747
794963515
794963852
794963896
794966216
794970677
794970822
794973673
794975445
794975809
794976714
794978216
794979175
794980556
794982022
794982932
794983512
794984897
794984953
794984984
794985040
794985082
794985164
794986162
794986264
794988929
794988963
794989795
794990219
794990669
794990759
794991414
794992433
794994956
794995687
794995967
794996479
794997601
794998321
795000795
795000966
795003371
795003618
795004000
795004281
795004356
795005261
795006340
795006374
795007156
795008531
795008771
795013143
795013335
795015198
795015382
795019096
795022269
795023596
795025304
795030183
795030990
795032397
795032533
795036217
795036630
795036864
795039230
795043601
795044021
795045159


796515512
796515756
796516853
796518216
796518550
796518788
796521226
796523104
796525150
796526625
796527145
796527533
796528257
796531384
796531644
796534231
796537845
796540270
796545469
796547745
796549966
796551681
796552637
796556790
796559611
796559754
796560093
796560137
796560282
796560284
796561883
796561907
796561944
796562123
796562136
796562806
796563167
796563744
796563803
796568339
796569814
796570408
796570553
796572080
796572129
796572283
796575840
796575919
796583345
796583662
796586829
796588111
796589007
796589138
796589729
796590277
796590443
796590890
796591131
796591572
796592041
796594073
796594323
796595787
796597000
796597277
796598334
796598979
796600183
796600327
796600791
796600973
796601365
796601719
796602005
796602038
796603919
796604310
796604721
796604839
796605942
796606187
796606683
796606969
796607480
796608168
796608277
796608492
796609742
796610539
796610579
796610638
796612645
796614256
796615232
796615764
796617753
796619628
796622701
796625602


798464243
798467682
798467708
798467876
798467972
798468363
798468483
798468800
798468815
798470372
798471351
798472672
798473880
798475985
798476253
798476340
798477314
798477571
798478092
798478300
798479185
798479738
798481182
798482202
798483475
798483499
798483512
798483594
798484154
798484893
798484983
798485439
798485601
798485655
798485656
798487557
798487560
798487614
798487858
798488329
798488499
798488670
798488698
798488708
798488988
798489006
798489018
798489070
798489209
798489222
798489264
798489295
798489312
798489373
798489524
798489670
798489798
798489930
798489953
798490261
798490523
798490596
798490704
798490789
798490798
798490838
798490992
798491008
798491134
798491187
798491380
798491633
798491956
798492139
798492544
798492698
798492970
798492985
798493083
798493134
798494245
798494364
798494387
798494662
798494746
798494786
798494973
798495270
798495423
798495427
798495771
798496045
798496573
798497879
798499030
798499769
798502146
798503289
798504820
798505968


799723268
799723377
799723962
799725974
799726429
799728153
799730711
799731471
799732200
799732835
799732897
799733169
799738885
799739992
799741904
799746271
799746777
799747437
799748512
799748848
799749398
799752655
799753102
799754802
799759307
799765055
799766042
799766637
799766793
799766825
799768653
799769621
799769949
799770018
799770060
799770420
799770429
799770436
799770465
799770557
799772448
799774600
799774779
799775821
799777936
799778332
799778786
799779367
799780288
799780899
799781061
799783536
799783967
799785241
799785551
799786611
799787090
799787557
799789640
799790068
799791868
799792556
799792910
799796782
799796850
799797732
799797763
799798443
799798590
799799902
799800490
799800756
799800790
799801004
799801128
799801208
799801427
799801919
799802036
799802326
799802367
799802415
799802471
799803167
799804010
799804694
799807009
799808979
799810308
799810529
799812338
799812614
799813299
799814346
799815864
799817682
799819846
799820691
799821074
799821244


800449771
800450841
800450971
800452152
800453323
800454302
800454849
800454877
800455166
800455710
800455849
800456179
800456189
800456214
800456218
800456228
800456243
800456249
800456260
800456292
800456433
800456480
800456515
800456590
800456605
800456637
800456665
800456675
800456747
800456750
800456765
800456781
800456828
800457795
800457999
800458456
800462642
800463785
800464863
800465717
800466366
800466467
800469500
800470433
800470827
800471126
800471301
800471907
800471924
800472658
800472835
800472892
800473502
800473998
800474837
800474867
800475122
800475735
800478736
800479004
800479351
800479460
800481057
800482341
800483245
800483645
800484604
800486975
800487310
800487611
800487745
800488340
800488513
800488655
800488968
800489745
800491541
800491553
800491560
800492207
800492990
800493379
800493979
800502466
800506490
800507630
800508267
800509427
800512702
800514552
800516402
800518361
800528994
800530186
800534146
800537411
800544510
800546199
800547406
800547979


801312658
801312668
801313140
801313192
801314674
801315125
801316327
801316401
801316718
801317362
801318769
801319110
801321773
801322683
801323063
801323338
801323394
801323508
801323527
801323598
801323798
801323870
801323874
801323936
801323986
801324100
801324153
801324372
801324400
801325005
801325060
801325115
801327382
801328134
801328627
801328695
801328741
801328968
801329937
801330042
801330223
801331000
801331124
801331170
801331826
801332059
801332117
801332183
801332766
801332814
801333359
801333418
801334455
801334767
801335099
801335118
801335158
801335752
801335922
801335999
801339595
801339676
801339711
801339736
801340732
801340733
801341152
801341415
801341902
801342465
801343044
801343171
801343345
801343355
801343430
801344254
801344333
801344575
801344951
801345090
801345425
801346229
801348128
801351302
801354961
801354990
801355934
801356132
801356274
801356638
801356677
801357438
801359286
801360635
801361328
801364087
801364093
801364319
801364357
801364408


802788214
802789644
802789728
802792299
802792491
802792821
802794993
802795254
802795410
802795569
802800084
802800899
802801512
802802085
802805085
802807681
802808387
802808529
802809681
802809688
802811272
802811684
802813656
802813951
802815802
802816894
802817420
802817887
802818350
802818786
802819262
802820876
802821396
802822017
802823064
802824483
802825026
802826483
802827598
802828040
802830023
802830603
802832934
802833118
802833516
802834112
802834867
802834939
802835289
802835310
802835421
802835604
802835768
802835899
802835977
802837499
802839168
802839303
802839704
802841584
802841590
802841606
802841849
802842116
802843828
802844034
802844094
802844100
802844116
802844739
802845430
802846759
802847128
802847173
802850235
802850619
802851430
802852054
802852148
802853349
802853557
802854632
802854777
802855076
802855209
802855423
802855428
802855951
802856852
802856885
802858382
802859459
802859486
802859738
802860340
802860970
802861534
802862968
802863065
802864450


804091882
804092712
804093565
804093651
804093764
804094659
804095077
804095754
804095790
804099267
804099373
804100365
804101492
804103114
804104355
804104931
804105438
804105709
804105984
804106203
804106598
804106609
804106821
804107345
804108433
804109224
804109267
804111013
804111132
804112392
804112500
804112819
804113674
804114360
804115829
804116289
804118645
804118985
804120072
804120185
804122433
804122505
804123422
804124368
804124946
804125853
804126930
804127803
804127877
804128734
804128826
804129698
804130200
804130440
804130858
804131153
804131272
804131604
804131643
804131948
804132298
804132518
804132817
804133123
804133555
804134156
804136596
804136732
804138803
804139010
804139208
804139258
804139515
804139730
804139800
804139868
804140099
804140159
804140314
804140447
804142156
804142444
804142943
804143236
804143605
804145524
804146604
804147118
804147288
804148964
804149674
804151581
804151598
804152406
804152925
804153459
804154484
804155669
804156184
804157350


805241522
805241904
805242667
805243380
805243586
805244157
805244405
805244800
805245515
805246276
805247562
805248573
805248828
805249932
805250547
805250645
805251974
805252877
805253380
805253461
805253801
805254568
805259105
805259264
805259988
805260085
805260550
805260781
805260821
805261222
805261228
805263257
805263542
805264292
805264393
805266750
805267943
805267975
805268117
805268515
805270130
805273109
805273173
805273312
805274848
805275246
805276486
805276516
805276523
805276573
805276645
805276799
805276864
805276899
805277093
805277771
805278526
805279692
805279807
805280492
805281098
805281207
805281416
805281788
805282595
805283153
805284209
805286414
805286973
805287382
805287852
805287882
805287917
805288679
805289045
805289210
805289323
805289352
805289936
805290284
805291334
805291640
805292129
805293256
805294574
805296539
805298454
805299700
805301599
805303117
805304477
805305142
805305263
805305462
805306036
805306238
805306390
805307345
805308710
805313523


806453846
806455331
806455685
806456329
806457259
806460468
806460970
806461725
806461795
806462613
806463880
806464279
806464775
806466645
806467016
806468076
806468208
806469298
806469333
806470353
806470589
806470880
806471954
806472203
806474260
806475926
806476255
806477511
806478058
806478265
806478579
806478787
806478889
806479527
806479564
806481036
806481458
806481551
806482808
806483731
806487145
806489625
806490350
806490518
806490571
806491339
806491599
806491618
806491860
806492485
806492530
806492920
806493000
806493632
806493652
806493972
806494765
806496321
806497393
806497540
806498083
806498397
806499019
806499067
806499431
806499548
806500735
806500816
806501595
806501713
806502951
806502993
806503089
806503132
806503196
806503217
806503337
806503372
806503445
806504184
806504904
806506945
806507288
806507554
806507568
806507570
806508319
806508985
806509038
806509190
806509643
806510585
806510922
806511942
806512047
806512259
806513371
806513415
806513546
806513820


806925410
806927054
806928362
806928457
806928471
806929601
806931313
806931367
806931377
806931864
806932052
806934027
806936953
806938514
806939531
806941754
806941972
806943108
806947297
806947596
806948506
806948949
806949962
806950167
806951645
806952259
806952883
806952931
806955709
806955889
806956559
806956603
806957759
806958416
806958982
806959295
806959484
806961306
806962327
806964376
806964521
806964950
806965618
806972002
806973935
806975039
806975273
806975975
806976735
806977245
806977351
806977386
806978501
806978659
806978680
806980105
806980973
806981371
806982443
806983342
806983705
806984938
806987838
806988271
806988445
806990454
806991055
806991412
806992091
806994136
806994231
806994489
806994641
806994807
806995404
806995881
806996449
806996844
806997382
806997998
806998653
806998805
806999119
806999198
806999239
806999392
806999606
806999753
806999950
807000038
807000149
807000274
807000457
807000784
807000951
807001015
807001216
807001460
807003284
807004352


In [113]:
page_data_df = pd.read_csv("ores_data.csv")
page_data_df

Unnamed: 0.2,Unnamed: 0,Unnamed: 0.1,Unnamed: 0.1.1,Unnamed: 0.1.1.1,Unnamed: 0.1.1.1.1,Unnamed: 0.1.1.1.1.1,page,country,rev_id,ores_scopres,ores_scores
0,0,0,0,0,0,1,Bir I of Kanem,Chad,355319463,,0
1,1,1,1,1,1,10,Information Minister of the Palestinian Nation...,Palestinian Territory,393276188,,1
2,2,2,2,2,2,12,Yos Por,Cambodia,393822005,,2
3,3,3,3,3,3,23,Julius Gregr,Czech Republic,395521877,,3
4,4,4,4,4,4,24,Edvard Gregr,Czech Republic,395526568,,4
...,...,...,...,...,...,...,...,...,...,...,...
46696,46696,46696,46696,46696,46696,47192,Yahya Jammeh,Gambia,807482007,,46696
46697,46697,46697,46697,46697,46697,47193,Lucius Fairchild,United States,807483006,,46697
46698,46698,46698,46698,46698,46698,47194,Fahd of Saudi Arabia,Saudi Arabia,807483153,,46698
46699,46699,46699,46699,46699,46699,47195,Francis Fessenden,United States,807483270,,46699
