In [None]:
"""
This notebook is to collect and download legislation from the 115th Congress
"""
"""
https://www.govinfo.gov/bulkdata/BILLS/115
https://www.govinfo.gov/bulkdata/BILLS/115/1
https://www.govinfo.gov/bulkdata/BILLS/115/1/hconres
https://www.govinfo.gov/bulkdata/BILLS/115/1/hjres
https://www.govinfo.gov/bulkdata/BILLS/115/1/hr
https://www.govinfo.gov/bulkdata/BILLS/115/1/hres
https://www.govinfo.gov/bulkdata/BILLS/115/1/s
https://www.govinfo.gov/bulkdata/BILLS/115/1/sconres
https://www.govinfo.gov/bulkdata/BILLS/115/1/sjres
https://www.govinfo.gov/bulkdata/BILLS/115/1/sres
"""

In [2]:
import boto3

In [3]:
s3_client = boto3.client('s3')
CONGRESS = 114

In [4]:
s3_files = s3_client.list_objects_v2(Bucket="ds-invest", Prefix=f"data_feed_output/{CONGRESS}")

In [5]:
len(s3_files)

9

In [6]:
len(s3_files["Contents"])

1000

In [7]:
bucket = "ds-invest"
prefix = f"data_feed_output/{CONGRESS}"
response = s3_client.list_objects_v2(
        Bucket=bucket,
        MaxKeys=1000,
        Prefix=prefix
    )

paging_token = response.get("NextContinuationToken")
all_contents = response.get("Contents", [])

while len(response.get("Contents", [])) == 1000 and paging_token:
    response = s3_client.list_objects_v2(
        Bucket=bucket,
        MaxKeys=1000,
        Prefix=prefix,
        ContinuationToken=paging_token
    )
    all_contents += response.get("Contents", [])
    paging_token = response.get("NextContinuationToken")

In [8]:
# Filter the contents by xml files that have either 'ih' or 'is' in them which means they are the introduced versions
filtered_contents = []
for s3_file in all_contents:
    if "xml" in s3_file["Key"] and ("ih" in s3_file["Key"] or "is" in s3_file["Key"]):
        filtered_contents.append(s3_file)

In [9]:
len(all_contents)

32153

In [10]:
len(filtered_contents)

11342

In [12]:
total = 0
for s3_file in filtered_contents:
    filename = s3_file["Key"].split("/")[-1]
    total += 1
    print(filename, " ", total)

    s3_client.download_file(bucket,
                            s3_file["Key"],
                            f"/Users/hiancheong/Personal/grad/UMD/comp_ling/topics_evaluation/{CONGRESS}_legislation/{filename}")


BILLS-114hconres100ih.xml   1
BILLS-114hconres101ih.xml   2
BILLS-114hconres103ih.xml   3
BILLS-114hconres105ih.xml   4
BILLS-114hconres106ih.xml   5
BILLS-114hconres108ih.xml   6
BILLS-114hconres109ih.xml   7
BILLS-114hconres10ih.xml   8
BILLS-114hconres110ih.xml   9
BILLS-114hconres111ih.xml   10
BILLS-114hconres112ih.xml   11
BILLS-114hconres113ih.xml   12
BILLS-114hconres114ih.xml   13
BILLS-114hconres115ih.xml   14
BILLS-114hconres116ih.xml   15
BILLS-114hconres117ih.xml   16
BILLS-114hconres118ih.xml   17
BILLS-114hconres119ih.xml   18
BILLS-114hconres11ih.xml   19
BILLS-114hconres120ih.xml   20
BILLS-114hconres121ih.xml   21
BILLS-114hconres122ih.xml   22
BILLS-114hconres123ih.xml   23
BILLS-114hconres124ih.xml   24
BILLS-114hconres126ih.xml   25
BILLS-114hconres127ih.xml   26
BILLS-114hconres128ih.xml   27
BILLS-114hconres129ih.xml   28
BILLS-114hconres12ih.xml   29
BILLS-114hconres130ih.xml   30
BILLS-114hconres131ih.xml   31
BILLS-114hconres132ih.xml   32
BILLS-114hconres133i

BILLS-114hr1010ih.xml   275
BILLS-114hr1011ih.xml   276
BILLS-114hr1012ih.xml   277
BILLS-114hr1013ih.xml   278
BILLS-114hr1014ih.xml   279
BILLS-114hr1015ih.xml   280
BILLS-114hr1016ih.xml   281
BILLS-114hr1017ih.xml   282
BILLS-114hr1018ih.xml   283
BILLS-114hr1019ih.xml   284
BILLS-114hr101ih.xml   285
BILLS-114hr1020ih.xml   286
BILLS-114hr1021ih.xml   287
BILLS-114hr1022ih.xml   288
BILLS-114hr1023ih.xml   289
BILLS-114hr1024ih.xml   290
BILLS-114hr1025ih.xml   291
BILLS-114hr1026ih.xml   292
BILLS-114hr1027ih.xml   293
BILLS-114hr1028ih.xml   294
BILLS-114hr1029ih.xml   295
BILLS-114hr102ih.xml   296
BILLS-114hr1030ih.xml   297
BILLS-114hr1031ih.xml   298
BILLS-114hr1032ih.xml   299
BILLS-114hr1033ih.xml   300
BILLS-114hr1034ih.xml   301
BILLS-114hr1035ih.xml   302
BILLS-114hr1036ih.xml   303
BILLS-114hr1037ih.xml   304
BILLS-114hr1038ih.xml   305
BILLS-114hr1039ih.xml   306
BILLS-114hr103ih.xml   307
BILLS-114hr1040ih.xml   308
BILLS-114hr1041ih.xml   309
BILLS-114hr1042ih.xml  

BILLS-114hr1277ih.xml   569
BILLS-114hr1278ih.xml   570
BILLS-114hr1279ih.xml   571
BILLS-114hr127ih.xml   572
BILLS-114hr1280ih.xml   573
BILLS-114hr1281ih.xml   574
BILLS-114hr1282ih.xml   575
BILLS-114hr1283ih.xml   576
BILLS-114hr1284ih.xml   577
BILLS-114hr1285ih.xml   578
BILLS-114hr1286ih.xml   579
BILLS-114hr1287ih.xml   580
BILLS-114hr1288ih.xml   581
BILLS-114hr1289ih.xml   582
BILLS-114hr128ih.xml   583
BILLS-114hr1290ih.xml   584
BILLS-114hr1291ih.xml   585
BILLS-114hr1292ih.xml   586
BILLS-114hr1293ih.xml   587
BILLS-114hr1294ih.xml   588
BILLS-114hr1295ih.xml   589
BILLS-114hr1296ih.xml   590
BILLS-114hr1297ih.xml   591
BILLS-114hr1298ih.xml   592
BILLS-114hr1299ih.xml   593
BILLS-114hr129ih.xml   594
BILLS-114hr12ih.xml   595
BILLS-114hr1300ih.xml   596
BILLS-114hr1301ih.xml   597
BILLS-114hr1302ih.xml   598
BILLS-114hr1303ih.xml   599
BILLS-114hr1304ih.xml   600
BILLS-114hr1305ih.xml   601
BILLS-114hr1306ih.xml   602
BILLS-114hr1307ih.xml   603
BILLS-114hr1308ih.xml   6

BILLS-114hr1543ih.xml   863
BILLS-114hr1544ih.xml   864
BILLS-114hr1545ih.xml   865
BILLS-114hr1546ih.xml   866
BILLS-114hr1547ih.xml   867
BILLS-114hr1548ih.xml   868
BILLS-114hr1549ih.xml   869
BILLS-114hr154ih.xml   870
BILLS-114hr1550ih.xml   871
BILLS-114hr1551ih.xml   872
BILLS-114hr1552ih.xml   873
BILLS-114hr1553ih.xml   874
BILLS-114hr1554ih.xml   875
BILLS-114hr1555ih.xml   876
BILLS-114hr1556ih.xml   877
BILLS-114hr1557ih.xml   878
BILLS-114hr1558ih.xml   879
BILLS-114hr1559ih.xml   880
BILLS-114hr155ih.xml   881
BILLS-114hr1560ih.xml   882
BILLS-114hr1561ih.xml   883
BILLS-114hr1562ih.xml   884
BILLS-114hr1563ih.xml   885
BILLS-114hr1564ih.xml   886
BILLS-114hr1565ih.xml   887
BILLS-114hr1566ih.xml   888
BILLS-114hr1567ih.xml   889
BILLS-114hr1568ih.xml   890
BILLS-114hr1569ih.xml   891
BILLS-114hr156ih.xml   892
BILLS-114hr1570ih.xml   893
BILLS-114hr1571ih.xml   894
BILLS-114hr1572ih.xml   895
BILLS-114hr1573ih.xml   896
BILLS-114hr1574ih.xml   897
BILLS-114hr1575ih.xml  

BILLS-114hr1806ih.xml   1152
BILLS-114hr1807ih.xml   1153
BILLS-114hr1808ih.xml   1154
BILLS-114hr1809ih.xml   1155
BILLS-114hr180ih.xml   1156
BILLS-114hr1810ih.xml   1157
BILLS-114hr1811ih.xml   1158
BILLS-114hr1812ih.xml   1159
BILLS-114hr1813ih.xml   1160
BILLS-114hr1814ih.xml   1161
BILLS-114hr1815ih.xml   1162
BILLS-114hr1816ih.xml   1163
BILLS-114hr1817ih.xml   1164
BILLS-114hr1818ih.xml   1165
BILLS-114hr1819ih.xml   1166
BILLS-114hr181ih.xml   1167
BILLS-114hr1820ih.xml   1168
BILLS-114hr1821ih.xml   1169
BILLS-114hr1822ih.xml   1170
BILLS-114hr1823ih.xml   1171
BILLS-114hr1824ih.xml   1172
BILLS-114hr1825ih.xml   1173
BILLS-114hr1826ih.xml   1174
BILLS-114hr1827ih.xml   1175
BILLS-114hr1828ih.xml   1176
BILLS-114hr1829ih.xml   1177
BILLS-114hr182ih.xml   1178
BILLS-114hr1830ih.xml   1179
BILLS-114hr1831ih.xml   1180
BILLS-114hr1832ih.xml   1181
BILLS-114hr1833ih.xml   1182
BILLS-114hr1834ih.xml   1183
BILLS-114hr1835ih.xml   1184
BILLS-114hr1836ih.xml   1185
BILLS-114hr1837ih

BILLS-114hr2066ih.xml   1436
BILLS-114hr2067ih.xml   1437
BILLS-114hr2068ih.xml   1438
BILLS-114hr2069ih.xml   1439
BILLS-114hr206ih.xml   1440
BILLS-114hr2070ih.xml   1441
BILLS-114hr2071ih.xml   1442
BILLS-114hr2072ih.xml   1443
BILLS-114hr2073ih.xml   1444
BILLS-114hr2074ih.xml   1445
BILLS-114hr2075ih.xml   1446
BILLS-114hr2076ih.xml   1447
BILLS-114hr2077ih.xml   1448
BILLS-114hr2078ih.xml   1449
BILLS-114hr2079ih.xml   1450
BILLS-114hr207ih.xml   1451
BILLS-114hr2080ih.xml   1452
BILLS-114hr2081ih.xml   1453
BILLS-114hr2082ih.xml   1454
BILLS-114hr2083ih.xml   1455
BILLS-114hr2084ih.xml   1456
BILLS-114hr2085ih.xml   1457
BILLS-114hr2086ih.xml   1458
BILLS-114hr2087ih.xml   1459
BILLS-114hr2088ih.xml   1460
BILLS-114hr2089ih.xml   1461
BILLS-114hr208ih.xml   1462
BILLS-114hr2090ih.xml   1463
BILLS-114hr2091ih.xml   1464
BILLS-114hr2092ih.xml   1465
BILLS-114hr2093ih.xml   1466
BILLS-114hr2094ih.xml   1467
BILLS-114hr2095ih.xml   1468
BILLS-114hr2096ih.xml   1469
BILLS-114hr2097ih

BILLS-114hr2323ih.xml   1720
BILLS-114hr2324ih.xml   1721
BILLS-114hr2325ih.xml   1722
BILLS-114hr2326ih.xml   1723
BILLS-114hr2327ih.xml   1724
BILLS-114hr2328ih.xml   1725
BILLS-114hr2329ih.xml   1726
BILLS-114hr232ih.xml   1727
BILLS-114hr2330ih.xml   1728
BILLS-114hr2331ih.xml   1729
BILLS-114hr2332ih.xml   1730
BILLS-114hr2333ih.xml   1731
BILLS-114hr2334ih.xml   1732
BILLS-114hr2335ih.xml   1733
BILLS-114hr2336ih.xml   1734
BILLS-114hr2337ih.xml   1735
BILLS-114hr2338ih.xml   1736
BILLS-114hr2339ih.xml   1737
BILLS-114hr233ih.xml   1738
BILLS-114hr2340ih.xml   1739
BILLS-114hr2341ih.xml   1740
BILLS-114hr2342ih.xml   1741
BILLS-114hr2343ih.xml   1742
BILLS-114hr2344ih.xml   1743
BILLS-114hr2345ih.xml   1744
BILLS-114hr2346ih.xml   1745
BILLS-114hr2347ih.xml   1746
BILLS-114hr2348ih.xml   1747
BILLS-114hr2349ih.xml   1748
BILLS-114hr234ih.xml   1749
BILLS-114hr2350ih.xml   1750
BILLS-114hr2351ih.xml   1751
BILLS-114hr2352ih.xml   1752
BILLS-114hr2353ih.xml   1753
BILLS-114hr2354ih

BILLS-114hr2582ih.xml   2004
BILLS-114hr2583ih.xml   2005
BILLS-114hr2584ih.xml   2006
BILLS-114hr2585ih.xml   2007
BILLS-114hr2586ih.xml   2008
BILLS-114hr2587ih.xml   2009
BILLS-114hr2588ih.xml   2010
BILLS-114hr2589ih.xml   2011
BILLS-114hr258ih.xml   2012
BILLS-114hr2590ih.xml   2013
BILLS-114hr2591ih.xml   2014
BILLS-114hr2592ih.xml   2015
BILLS-114hr2593ih.xml   2016
BILLS-114hr2594ih.xml   2017
BILLS-114hr2595ih.xml   2018
BILLS-114hr2596ih.xml   2019
BILLS-114hr2597ih.xml   2020
BILLS-114hr2598ih.xml   2021
BILLS-114hr2599ih.xml   2022
BILLS-114hr259ih.xml   2023
BILLS-114hr25ih.xml   2024
BILLS-114hr2600ih.xml   2025
BILLS-114hr2601ih.xml   2026
BILLS-114hr2602ih.xml   2027
BILLS-114hr2603ih.xml   2028
BILLS-114hr2604ih.xml   2029
BILLS-114hr2605ih.xml   2030
BILLS-114hr2606ih.xml   2031
BILLS-114hr2607ih.xml   2032
BILLS-114hr2608ih.xml   2033
BILLS-114hr2609ih.xml   2034
BILLS-114hr260ih.xml   2035
BILLS-114hr2610ih.xml   2036
BILLS-114hr2611ih.xml   2037
BILLS-114hr2612ih.x

BILLS-114hr2845ih.xml   2288
BILLS-114hr2846ih.xml   2289
BILLS-114hr2847ih.xml   2290
BILLS-114hr2848ih.xml   2291
BILLS-114hr2849ih.xml   2292
BILLS-114hr284ih.xml   2293
BILLS-114hr2850ih.xml   2294
BILLS-114hr2851ih.xml   2295
BILLS-114hr2852ih.xml   2296
BILLS-114hr2853ih.xml   2297
BILLS-114hr2854ih.xml   2298
BILLS-114hr2855ih.xml   2299
BILLS-114hr2856ih.xml   2300
BILLS-114hr2857ih.xml   2301
BILLS-114hr2858ih.xml   2302
BILLS-114hr2859ih.xml   2303
BILLS-114hr285ih.xml   2304
BILLS-114hr2860ih.xml   2305
BILLS-114hr2861ih.xml   2306
BILLS-114hr2862ih.xml   2307
BILLS-114hr2863ih.xml   2308
BILLS-114hr2864ih.xml   2309
BILLS-114hr2865ih.xml   2310
BILLS-114hr2866ih.xml   2311
BILLS-114hr2867ih.xml   2312
BILLS-114hr2868ih.xml   2313
BILLS-114hr2869ih.xml   2314
BILLS-114hr286ih.xml   2315
BILLS-114hr2870ih.xml   2316
BILLS-114hr2871ih.xml   2317
BILLS-114hr2872ih.xml   2318
BILLS-114hr2873ih.xml   2319
BILLS-114hr2874ih.xml   2320
BILLS-114hr2875ih.xml   2321
BILLS-114hr2876ih

BILLS-114hr3102ih.xml   2572
BILLS-114hr3103ih.xml   2573
BILLS-114hr3104ih.xml   2574
BILLS-114hr3105ih.xml   2575
BILLS-114hr3106ih.xml   2576
BILLS-114hr3107ih.xml   2577
BILLS-114hr3108ih.xml   2578
BILLS-114hr3109ih.xml   2579
BILLS-114hr310ih.xml   2580
BILLS-114hr3110ih.xml   2581
BILLS-114hr3111ih.xml   2582
BILLS-114hr3112ih.xml   2583
BILLS-114hr3113ih.xml   2584
BILLS-114hr3114ih.xml   2585
BILLS-114hr3115ih.xml   2586
BILLS-114hr3116ih.xml   2587
BILLS-114hr3117ih.xml   2588
BILLS-114hr3118ih.xml   2589
BILLS-114hr3119ih.xml   2590
BILLS-114hr311ih.xml   2591
BILLS-114hr3120ih.xml   2592
BILLS-114hr3121ih.xml   2593
BILLS-114hr3122ih.xml   2594
BILLS-114hr3123ih.xml   2595
BILLS-114hr3124ih.xml   2596
BILLS-114hr3125ih.xml   2597
BILLS-114hr3126ih.xml   2598
BILLS-114hr3127ih.xml   2599
BILLS-114hr3129ih.xml   2600
BILLS-114hr312ih.xml   2601
BILLS-114hr3130ih.xml   2602
BILLS-114hr3131ih.xml   2603
BILLS-114hr3132ih.xml   2604
BILLS-114hr3133ih.xml   2605
BILLS-114hr3134ih

BILLS-114hr335ih.xml   2856
BILLS-114hr3360ih.xml   2857
BILLS-114hr3361ih.xml   2858
BILLS-114hr3362ih.xml   2859
BILLS-114hr3363ih.xml   2860
BILLS-114hr3364ih.xml   2861
BILLS-114hr3365ih.xml   2862
BILLS-114hr3366ih.xml   2863
BILLS-114hr3367ih.xml   2864
BILLS-114hr3368ih.xml   2865
BILLS-114hr3369ih.xml   2866
BILLS-114hr336ih.xml   2867
BILLS-114hr3370ih.xml   2868
BILLS-114hr3371ih.xml   2869
BILLS-114hr3372ih.xml   2870
BILLS-114hr3373ih.xml   2871
BILLS-114hr3374ih.xml   2872
BILLS-114hr3375ih.xml   2873
BILLS-114hr3376ih.xml   2874
BILLS-114hr3377ih.xml   2875
BILLS-114hr3378ih.xml   2876
BILLS-114hr3379ih.xml   2877
BILLS-114hr337ih.xml   2878
BILLS-114hr3380ih.xml   2879
BILLS-114hr3381ih.xml   2880
BILLS-114hr3382ih.xml   2881
BILLS-114hr3383ih.xml   2882
BILLS-114hr3384ih.xml   2883
BILLS-114hr3385ih.xml   2884
BILLS-114hr3386ih.xml   2885
BILLS-114hr3387ih.xml   2886
BILLS-114hr3388ih.xml   2887
BILLS-114hr3389ih.xml   2888
BILLS-114hr338ih.xml   2889
BILLS-114hr3390ih.

BILLS-114hr3618ih.xml   3141
BILLS-114hr3619ih.xml   3142
BILLS-114hr361ih.xml   3143
BILLS-114hr3620ih.xml   3144
BILLS-114hr3621ih.xml   3145
BILLS-114hr3622ih.xml   3146
BILLS-114hr3623ih.xml   3147
BILLS-114hr3624ih.xml   3148
BILLS-114hr3625ih.xml   3149
BILLS-114hr3626ih.xml   3150
BILLS-114hr3627ih.xml   3151
BILLS-114hr3628ih.xml   3152
BILLS-114hr3629ih.xml   3153
BILLS-114hr362ih.xml   3154
BILLS-114hr3630ih.xml   3155
BILLS-114hr3631ih.xml   3156
BILLS-114hr3632ih.xml   3157
BILLS-114hr3633ih.xml   3158
BILLS-114hr3634ih.xml   3159
BILLS-114hr3635ih.xml   3160
BILLS-114hr3636ih.xml   3161
BILLS-114hr3637ih.xml   3162
BILLS-114hr3638ih.xml   3163
BILLS-114hr3639ih.xml   3164
BILLS-114hr363ih.xml   3165
BILLS-114hr3640ih.xml   3166
BILLS-114hr3641ih.xml   3167
BILLS-114hr3642ih.xml   3168
BILLS-114hr3643ih.xml   3169
BILLS-114hr3644ih.xml   3170
BILLS-114hr3645ih.xml   3171
BILLS-114hr3646ih.xml   3172
BILLS-114hr3647ih.xml   3173
BILLS-114hr3648ih.xml   3174
BILLS-114hr3649ih

BILLS-114hr3875ih.xml   3425
BILLS-114hr3876ih.xml   3426
BILLS-114hr3877ih.xml   3427
BILLS-114hr3878ih.xml   3428
BILLS-114hr3879ih.xml   3429
BILLS-114hr387ih.xml   3430
BILLS-114hr3880ih.xml   3431
BILLS-114hr3881ih.xml   3432
BILLS-114hr3882ih.xml   3433
BILLS-114hr3883ih.xml   3434
BILLS-114hr3884ih.xml   3435
BILLS-114hr3885ih.xml   3436
BILLS-114hr3886ih.xml   3437
BILLS-114hr3887ih.xml   3438
BILLS-114hr3888ih.xml   3439
BILLS-114hr3889ih.xml   3440
BILLS-114hr388ih.xml   3441
BILLS-114hr3890ih.xml   3442
BILLS-114hr3891ih.xml   3443
BILLS-114hr3892ih.xml   3444
BILLS-114hr3893ih.xml   3445
BILLS-114hr3894ih.xml   3446
BILLS-114hr3895ih.xml   3447
BILLS-114hr3896ih.xml   3448
BILLS-114hr3897ih.xml   3449
BILLS-114hr3898ih.xml   3450
BILLS-114hr3899ih.xml   3451
BILLS-114hr389ih.xml   3452
BILLS-114hr38ih.xml   3453
BILLS-114hr3900ih.xml   3454
BILLS-114hr3901ih.xml   3455
BILLS-114hr3902ih.xml   3456
BILLS-114hr3903ih.xml   3457
BILLS-114hr3904ih.xml   3458
BILLS-114hr3905ih.x

BILLS-114hr4130ih.xml   3709
BILLS-114hr4131ih.xml   3710
BILLS-114hr4132ih.xml   3711
BILLS-114hr4133ih.xml   3712
BILLS-114hr4134ih.xml   3713
BILLS-114hr4135ih.xml   3714
BILLS-114hr4136ih.xml   3715
BILLS-114hr4137ih.xml   3716
BILLS-114hr4138ih.xml   3717
BILLS-114hr4139ih.xml   3718
BILLS-114hr413ih.xml   3719
BILLS-114hr4140ih.xml   3720
BILLS-114hr4141ih.xml   3721
BILLS-114hr4142ih.xml   3722
BILLS-114hr4143ih.xml   3723
BILLS-114hr4144ih.xml   3724
BILLS-114hr4145ih.xml   3725
BILLS-114hr4146ih.xml   3726
BILLS-114hr4147ih.xml   3727
BILLS-114hr4148ih.xml   3728
BILLS-114hr4149ih.xml   3729
BILLS-114hr414ih.xml   3730
BILLS-114hr4150ih.xml   3731
BILLS-114hr4151ih.xml   3732
BILLS-114hr4152ih.xml   3733
BILLS-114hr4153ih.xml   3734
BILLS-114hr4154ih.xml   3735
BILLS-114hr4155ih.xml   3736
BILLS-114hr4156ih.xml   3737
BILLS-114hr4157ih.xml   3738
BILLS-114hr4158ih.xml   3739
BILLS-114hr4159ih.xml   3740
BILLS-114hr415ih.xml   3741
BILLS-114hr4160ih.xml   3742
BILLS-114hr4161ih

BILLS-114hr4388ih.xml   3994
BILLS-114hr4389ih.xml   3995
BILLS-114hr438ih.xml   3996
BILLS-114hr4390ih.xml   3997
BILLS-114hr4391ih.xml   3998
BILLS-114hr4392ih.xml   3999
BILLS-114hr4393ih.xml   4000
BILLS-114hr4394ih.xml   4001
BILLS-114hr4395ih.xml   4002
BILLS-114hr4396ih.xml   4003
BILLS-114hr4397ih.xml   4004
BILLS-114hr4398ih.xml   4005
BILLS-114hr4399ih.xml   4006
BILLS-114hr439ih.xml   4007
BILLS-114hr43ih.xml   4008
BILLS-114hr4400ih.xml   4009
BILLS-114hr4401ih.xml   4010
BILLS-114hr4402ih.xml   4011
BILLS-114hr4403ih.xml   4012
BILLS-114hr4404ih.xml   4013
BILLS-114hr4405ih.xml   4014
BILLS-114hr4406ih.xml   4015
BILLS-114hr4407ih.xml   4016
BILLS-114hr4408ih.xml   4017
BILLS-114hr4409ih.xml   4018
BILLS-114hr440ih.xml   4019
BILLS-114hr4410ih.xml   4020
BILLS-114hr4411ih.xml   4021
BILLS-114hr4412ih.xml   4022
BILLS-114hr4413ih.xml   4023
BILLS-114hr4414ih.xml   4024
BILLS-114hr4415ih.xml   4025
BILLS-114hr4416ih.xml   4026
BILLS-114hr4417ih.xml   4027
BILLS-114hr4418ih.x

BILLS-114hr4643ih.xml   4278
BILLS-114hr4644ih.xml   4279
BILLS-114hr4645ih.xml   4280
BILLS-114hr4646ih.xml   4281
BILLS-114hr4647ih.xml   4282
BILLS-114hr4648ih.xml   4283
BILLS-114hr4649ih.xml   4284
BILLS-114hr464ih.xml   4285
BILLS-114hr4650ih.xml   4286
BILLS-114hr4651ih.xml   4287
BILLS-114hr4652ih.xml   4288
BILLS-114hr4653ih.xml   4289
BILLS-114hr4654ih.xml   4290
BILLS-114hr4655ih.xml   4291
BILLS-114hr4656ih.xml   4292
BILLS-114hr4657ih.xml   4293
BILLS-114hr4658ih.xml   4294
BILLS-114hr4659ih.xml   4295
BILLS-114hr465ih.xml   4296
BILLS-114hr4660ih.xml   4297
BILLS-114hr4661ih.xml   4298
BILLS-114hr4662ih.xml   4299
BILLS-114hr4663ih.xml   4300
BILLS-114hr4664ih.xml   4301
BILLS-114hr4665ih.xml   4302
BILLS-114hr4666ih.xml   4303
BILLS-114hr4667ih.xml   4304
BILLS-114hr4668ih.xml   4305
BILLS-114hr4669ih.xml   4306
BILLS-114hr466ih.xml   4307
BILLS-114hr4670ih.xml   4308
BILLS-114hr4671ih.xml   4309
BILLS-114hr4672ih.xml   4310
BILLS-114hr4673ih.xml   4311
BILLS-114hr4674ih

BILLS-114hr48ih.xml   4563
BILLS-114hr4900ih.xml   4564
BILLS-114hr4901ih.xml   4565
BILLS-114hr4902ih.xml   4566
BILLS-114hr4903ih.xml   4567
BILLS-114hr4904ih.xml   4568
BILLS-114hr4905ih.xml   4569
BILLS-114hr4906ih.xml   4570
BILLS-114hr4907ih.xml   4571
BILLS-114hr4908ih.xml   4572
BILLS-114hr4909ih.xml   4573
BILLS-114hr490ih.xml   4574
BILLS-114hr4910ih.xml   4575
BILLS-114hr4911ih.xml   4576
BILLS-114hr4912ih.xml   4577
BILLS-114hr4913ih.xml   4578
BILLS-114hr4914ih.xml   4579
BILLS-114hr4915ih.xml   4580
BILLS-114hr4916ih.xml   4581
BILLS-114hr4917ih.xml   4582
BILLS-114hr4918ih.xml   4583
BILLS-114hr4919ih.xml   4584
BILLS-114hr491ih.xml   4585
BILLS-114hr4920ih.xml   4586
BILLS-114hr4921ih.xml   4587
BILLS-114hr4922ih.xml   4588
BILLS-114hr4923ih.xml   4589
BILLS-114hr4924ih.xml   4590
BILLS-114hr4925ih.xml   4591
BILLS-114hr4926ih.xml   4592
BILLS-114hr4927ih.xml   4593
BILLS-114hr4928ih.xml   4594
BILLS-114hr4929ih.xml   4595
BILLS-114hr492ih.xml   4596
BILLS-114hr4930ih.x

BILLS-114hr5159ih.xml   4847
BILLS-114hr515ih.xml   4848
BILLS-114hr5160ih.xml   4849
BILLS-114hr5161ih.xml   4850
BILLS-114hr5162ih.xml   4851
BILLS-114hr5163ih.xml   4852
BILLS-114hr5164ih.xml   4853
BILLS-114hr5165ih.xml   4854
BILLS-114hr5166ih.xml   4855
BILLS-114hr5167ih.xml   4856
BILLS-114hr5168ih.xml   4857
BILLS-114hr5169ih.xml   4858
BILLS-114hr516ih.xml   4859
BILLS-114hr5170ih.xml   4860
BILLS-114hr5171ih.xml   4861
BILLS-114hr5172ih.xml   4862
BILLS-114hr5173ih.xml   4863
BILLS-114hr5174ih.xml   4864
BILLS-114hr5175ih.xml   4865
BILLS-114hr5176ih.xml   4866
BILLS-114hr5177ih.xml   4867
BILLS-114hr5178ih.xml   4868
BILLS-114hr5179ih.xml   4869
BILLS-114hr517ih.xml   4870
BILLS-114hr5180ih.xml   4871
BILLS-114hr5181ih.xml   4872
BILLS-114hr5182ih.xml   4873
BILLS-114hr5183ih.xml   4874
BILLS-114hr5184ih.xml   4875
BILLS-114hr5185ih.xml   4876
BILLS-114hr5186ih.xml   4877
BILLS-114hr5187ih.xml   4878
BILLS-114hr5188ih.xml   4879
BILLS-114hr5189ih.xml   4880
BILLS-114hr518ih.

BILLS-114hr5418ih.xml   5131
BILLS-114hr5419ih.xml   5132
BILLS-114hr541ih.xml   5133
BILLS-114hr5420ih.xml   5134
BILLS-114hr5421ih.xml   5135
BILLS-114hr5422ih.xml   5136
BILLS-114hr5423ih.xml   5137
BILLS-114hr5424ih.xml   5138
BILLS-114hr5425ih.xml   5139
BILLS-114hr5426ih.xml   5140
BILLS-114hr5427ih.xml   5141
BILLS-114hr5428ih.xml   5142
BILLS-114hr5429ih.xml   5143
BILLS-114hr542ih.xml   5144
BILLS-114hr5430ih.xml   5145
BILLS-114hr5431ih.xml   5146
BILLS-114hr5432ih.xml   5147
BILLS-114hr5433ih.xml   5148
BILLS-114hr5434ih.xml   5149
BILLS-114hr5435ih.xml   5150
BILLS-114hr5436ih.xml   5151
BILLS-114hr5437ih.xml   5152
BILLS-114hr5438ih.xml   5153
BILLS-114hr5439ih.xml   5154
BILLS-114hr543ih.xml   5155
BILLS-114hr5440ih.xml   5156
BILLS-114hr5441ih.xml   5157
BILLS-114hr5442ih.xml   5158
BILLS-114hr5443ih.xml   5159
BILLS-114hr5444ih.xml   5160
BILLS-114hr5445ih.xml   5161
BILLS-114hr5446ih.xml   5162
BILLS-114hr5447ih.xml   5163
BILLS-114hr5448ih.xml   5164
BILLS-114hr5449ih

BILLS-114hr5677ih.xml   5415
BILLS-114hr5678ih.xml   5416
BILLS-114hr5679ih.xml   5417
BILLS-114hr567ih.xml   5418
BILLS-114hr5680ih.xml   5419
BILLS-114hr5681ih.xml   5420
BILLS-114hr5682ih.xml   5421
BILLS-114hr5683ih.xml   5422
BILLS-114hr5684ih.xml   5423
BILLS-114hr5685ih.xml   5424
BILLS-114hr5686ih.xml   5425
BILLS-114hr5687ih.xml   5426
BILLS-114hr5688ih.xml   5427
BILLS-114hr5689ih.xml   5428
BILLS-114hr568ih.xml   5429
BILLS-114hr5690ih.xml   5430
BILLS-114hr5691ih.xml   5431
BILLS-114hr5692ih.xml   5432
BILLS-114hr5693ih.xml   5433
BILLS-114hr5694ih.xml   5434
BILLS-114hr5695ih.xml   5435
BILLS-114hr5696ih.xml   5436
BILLS-114hr5697ih.xml   5437
BILLS-114hr5698ih.xml   5438
BILLS-114hr5699ih.xml   5439
BILLS-114hr569ih.xml   5440
BILLS-114hr56ih.xml   5441
BILLS-114hr5700ih.xml   5442
BILLS-114hr5701ih.xml   5443
BILLS-114hr5702ih.xml   5444
BILLS-114hr5703ih.xml   5445
BILLS-114hr5704ih.xml   5446
BILLS-114hr5705ih.xml   5447
BILLS-114hr5706ih.xml   5448
BILLS-114hr5707ih.x

BILLS-114hr5935ih.xml   5700
BILLS-114hr5936ih.xml   5701
BILLS-114hr5937ih.xml   5702
BILLS-114hr5938ih.xml   5703
BILLS-114hr5939ih.xml   5704
BILLS-114hr593ih.xml   5705
BILLS-114hr5940ih.xml   5706
BILLS-114hr5941ih.xml   5707
BILLS-114hr5942ih.xml   5708
BILLS-114hr5943ih.xml   5709
BILLS-114hr5944ih.xml   5710
BILLS-114hr5945ih.xml   5711
BILLS-114hr5946ih.xml   5712
BILLS-114hr5947ih.xml   5713
BILLS-114hr5948ih.xml   5714
BILLS-114hr5949ih.xml   5715
BILLS-114hr594ih.xml   5716
BILLS-114hr5950ih.xml   5717
BILLS-114hr5951ih.xml   5718
BILLS-114hr5952ih.xml   5719
BILLS-114hr5953ih.xml   5720
BILLS-114hr5954ih.xml   5721
BILLS-114hr5955ih.xml   5722
BILLS-114hr5956ih.xml   5723
BILLS-114hr5957ih.xml   5724
BILLS-114hr5958ih.xml   5725
BILLS-114hr5959ih.xml   5726
BILLS-114hr595ih.xml   5727
BILLS-114hr5960ih.xml   5728
BILLS-114hr5961ih.xml   5729
BILLS-114hr5962ih.xml   5730
BILLS-114hr5963ih.xml   5731
BILLS-114hr5964ih.xml   5732
BILLS-114hr5965ih.xml   5733
BILLS-114hr5966ih

BILLS-114hr6191ih.xml   5985
BILLS-114hr6192ih.xml   5986
BILLS-114hr6193ih.xml   5987
BILLS-114hr6194ih.xml   5988
BILLS-114hr6195ih.xml   5989
BILLS-114hr6196ih.xml   5990
BILLS-114hr6197ih.xml   5991
BILLS-114hr6198ih.xml   5992
BILLS-114hr6199ih.xml   5993
BILLS-114hr619ih.xml   5994
BILLS-114hr61ih.xml   5995
BILLS-114hr6200ih.xml   5996
BILLS-114hr6201ih.xml   5997
BILLS-114hr6202ih.xml   5998
BILLS-114hr6203ih.xml   5999
BILLS-114hr6204ih.xml   6000
BILLS-114hr6205ih.xml   6001
BILLS-114hr6206ih.xml   6002
BILLS-114hr6207ih.xml   6003
BILLS-114hr6208ih.xml   6004
BILLS-114hr6209ih.xml   6005
BILLS-114hr620ih.xml   6006
BILLS-114hr6210ih.xml   6007
BILLS-114hr6211ih.xml   6008
BILLS-114hr6212ih.xml   6009
BILLS-114hr6213ih.xml   6010
BILLS-114hr6214ih.xml   6011
BILLS-114hr6215ih.xml   6012
BILLS-114hr6216ih.xml   6013
BILLS-114hr6217ih.xml   6014
BILLS-114hr6218ih.xml   6015
BILLS-114hr6219ih.xml   6016
BILLS-114hr621ih.xml   6017
BILLS-114hr6220ih.xml   6018
BILLS-114hr6221ih.x

BILLS-114hr6448ih.xml   6270
BILLS-114hr6449ih.xml   6271
BILLS-114hr644ih.xml   6272
BILLS-114hr6450ih.xml   6273
BILLS-114hr6451ih.xml   6274
BILLS-114hr6452ih.xml   6275
BILLS-114hr6453ih.xml   6276
BILLS-114hr6454ih.xml   6277
BILLS-114hr6455ih.xml   6278
BILLS-114hr6456ih.xml   6279
BILLS-114hr6457ih.xml   6280
BILLS-114hr6458ih.xml   6281
BILLS-114hr6459ih.xml   6282
BILLS-114hr645ih.xml   6283
BILLS-114hr6460ih.xml   6284
BILLS-114hr6461ih.xml   6285
BILLS-114hr6462ih.xml   6286
BILLS-114hr6463ih.xml   6287
BILLS-114hr6464ih.xml   6288
BILLS-114hr6465ih.xml   6289
BILLS-114hr6466ih.xml   6290
BILLS-114hr6467ih.xml   6291
BILLS-114hr6468ih.xml   6292
BILLS-114hr6469ih.xml   6293
BILLS-114hr646ih.xml   6294
BILLS-114hr6470ih.xml   6295
BILLS-114hr6471ih.xml   6296
BILLS-114hr6472ih.xml   6297
BILLS-114hr6473ih.xml   6298
BILLS-114hr6474ih.xml   6299
BILLS-114hr6475ih.xml   6300
BILLS-114hr6476ih.xml   6301
BILLS-114hr6478ih.xml   6302
BILLS-114hr6479ih.xml   6303
BILLS-114hr647ih.

BILLS-114hr828ih.xml   6561
BILLS-114hr829ih.xml   6562
BILLS-114hr82ih.xml   6563
BILLS-114hr830ih.xml   6564
BILLS-114hr831ih.xml   6565
BILLS-114hr832ih.xml   6566
BILLS-114hr833ih.xml   6567
BILLS-114hr834ih.xml   6568
BILLS-114hr835ih.xml   6569
BILLS-114hr836ih.xml   6570
BILLS-114hr837ih.xml   6571
BILLS-114hr838ih.xml   6572
BILLS-114hr839ih.xml   6573
BILLS-114hr83ih.xml   6574
BILLS-114hr840ih.xml   6575
BILLS-114hr841ih.xml   6576
BILLS-114hr842ih.xml   6577
BILLS-114hr843ih.xml   6578
BILLS-114hr844ih.xml   6579
BILLS-114hr845ih.xml   6580
BILLS-114hr846ih.xml   6581
BILLS-114hr847ih.xml   6582
BILLS-114hr848ih.xml   6583
BILLS-114hr849ih.xml   6584
BILLS-114hr84ih.xml   6585
BILLS-114hr850ih.xml   6586
BILLS-114hr851ih.xml   6587
BILLS-114hr852ih.xml   6588
BILLS-114hr853ih.xml   6589
BILLS-114hr854ih.xml   6590
BILLS-114hr855ih.xml   6591
BILLS-114hr856ih.xml   6592
BILLS-114hr857ih.xml   6593
BILLS-114hr858ih.xml   6594
BILLS-114hr859ih.xml   6595
BILLS-114hr85ih.xml   6

BILLS-114hres205ih.xml   6849
BILLS-114hres206ih.xml   6850
BILLS-114hres207ih.xml   6851
BILLS-114hres208ih.xml   6852
BILLS-114hres209ih.xml   6853
BILLS-114hres210ih.xml   6854
BILLS-114hres211ih.xml   6855
BILLS-114hres213ih.xml   6856
BILLS-114hres214ih.xml   6857
BILLS-114hres215ih.xml   6858
BILLS-114hres216ih.xml   6859
BILLS-114hres217ih.xml   6860
BILLS-114hres218ih.xml   6861
BILLS-114hres21ih.xml   6862
BILLS-114hres220ih.xml   6863
BILLS-114hres221ih.xml   6864
BILLS-114hres222ih.xml   6865
BILLS-114hres224ih.xml   6866
BILLS-114hres225ih.xml   6867
BILLS-114hres226ih.xml   6868
BILLS-114hres227ih.xml   6869
BILLS-114hres228ih.xml   6870
BILLS-114hres22ih.xml   6871
BILLS-114hres230ih.xml   6872
BILLS-114hres232ih.xml   6873
BILLS-114hres233ih.xml   6874
BILLS-114hres234ih.xml   6875
BILLS-114hres235ih.xml   6876
BILLS-114hres236ih.xml   6877
BILLS-114hres237ih.xml   6878
BILLS-114hres238ih.xml   6879
BILLS-114hres239ih.xml   6880
BILLS-114hres23ih.xml   6881
BILLS-114hres

BILLS-114hres511ih.xml   7123
BILLS-114hres513ih.xml   7124
BILLS-114hres514ih.xml   7125
BILLS-114hres515ih.xml   7126
BILLS-114hres516ih.xml   7127
BILLS-114hres518ih.xml   7128
BILLS-114hres519ih.xml   7129
BILLS-114hres51ih.xml   7130
BILLS-114hres520ih.xml   7131
BILLS-114hres521ih.xml   7132
BILLS-114hres522ih.xml   7133
BILLS-114hres523ih.xml   7134
BILLS-114hres524ih.xml   7135
BILLS-114hres525ih.xml   7136
BILLS-114hres527ih.xml   7137
BILLS-114hres528ih.xml   7138
BILLS-114hres52ih.xml   7139
BILLS-114hres530ih.xml   7140
BILLS-114hres532ih.xml   7141
BILLS-114hres533ih.xml   7142
BILLS-114hres534ih.xml   7143
BILLS-114hres535ih.xml   7144
BILLS-114hres536ih.xml   7145
BILLS-114hres537ih.xml   7146
BILLS-114hres538ih.xml   7147
BILLS-114hres53ih.xml   7148
BILLS-114hres540ih.xml   7149
BILLS-114hres541ih.xml   7150
BILLS-114hres543ih.xml   7151
BILLS-114hres544ih.xml   7152
BILLS-114hres545ih.xml   7153
BILLS-114hres547ih.xml   7154
BILLS-114hres548ih.xml   7155
BILLS-114hres

BILLS-114hres823ih.xml   7397
BILLS-114hres824ih.xml   7398
BILLS-114hres825ih.xml   7399
BILLS-114hres828ih.xml   7400
BILLS-114hres829ih.xml   7401
BILLS-114hres82ih.xml   7402
BILLS-114hres830ih.xml   7403
BILLS-114hres831ih.xml   7404
BILLS-114hres832ih.xml   7405
BILLS-114hres833ih.xml   7406
BILLS-114hres834ih.xml   7407
BILLS-114hres835ih.xml   7408
BILLS-114hres836ih.xml   7409
BILLS-114hres837ih.xml   7410
BILLS-114hres838ih.xml   7411
BILLS-114hres839ih.xml   7412
BILLS-114hres83ih.xml   7413
BILLS-114hres840ih.xml   7414
BILLS-114hres842ih.xml   7415
BILLS-114hres845ih.xml   7416
BILLS-114hres846ih.xml   7417
BILLS-114hres847ih.xml   7418
BILLS-114hres848ih.xml   7419
BILLS-114hres849ih.xml   7420
BILLS-114hres84ih.xml   7421
BILLS-114hres850ih.xml   7422
BILLS-114hres851ih.xml   7423
BILLS-114hres852ih.xml   7424
BILLS-114hres853ih.xml   7425
BILLS-114hres854ih.xml   7426
BILLS-114hres855ih.xml   7427
BILLS-114hres856ih.xml   7428
BILLS-114hres857ih.xml   7429
BILLS-114hres

BILLS-114s1144is.xml   7682
BILLS-114s1145is.xml   7683
BILLS-114s1146is.xml   7684
BILLS-114s1147is.xml   7685
BILLS-114s1148is.xml   7686
BILLS-114s1149is.xml   7687
BILLS-114s114is.xml   7688
BILLS-114s1150is.xml   7689
BILLS-114s1151is.xml   7690
BILLS-114s1152is.xml   7691
BILLS-114s1153is.xml   7692
BILLS-114s1154is.xml   7693
BILLS-114s1155is.xml   7694
BILLS-114s1156is.xml   7695
BILLS-114s1157is.xml   7696
BILLS-114s1158is.xml   7697
BILLS-114s1159is.xml   7698
BILLS-114s115is.xml   7699
BILLS-114s1160is.xml   7700
BILLS-114s1161is.xml   7701
BILLS-114s1162is.xml   7702
BILLS-114s1163is.xml   7703
BILLS-114s1164is.xml   7704
BILLS-114s1165is.xml   7705
BILLS-114s1166is.xml   7706
BILLS-114s1167is.xml   7707
BILLS-114s1168is.xml   7708
BILLS-114s1169is.xml   7709
BILLS-114s116is.xml   7710
BILLS-114s1170is.xml   7711
BILLS-114s1171is.xml   7712
BILLS-114s1172is.xml   7713
BILLS-114s1173is.xml   7714
BILLS-114s1174is.xml   7715
BILLS-114s1175is.xml   7716
BILLS-114s1176is.xml   

BILLS-114s1416is.xml   7976
BILLS-114s1418is.xml   7977
BILLS-114s1419is.xml   7978
BILLS-114s141is.xml   7979
BILLS-114s1420is.xml   7980
BILLS-114s1421is.xml   7981
BILLS-114s1422is.xml   7982
BILLS-114s1423is.xml   7983
BILLS-114s1424is.xml   7984
BILLS-114s1425is.xml   7985
BILLS-114s1426is.xml   7986
BILLS-114s1427is.xml   7987
BILLS-114s1428is.xml   7988
BILLS-114s1429is.xml   7989
BILLS-114s142is.xml   7990
BILLS-114s1430is.xml   7991
BILLS-114s1431is.xml   7992
BILLS-114s1432is.xml   7993
BILLS-114s1433is.xml   7994
BILLS-114s1434is.xml   7995
BILLS-114s1435is.xml   7996
BILLS-114s1436is.xml   7997
BILLS-114s1437is.xml   7998
BILLS-114s1438is.xml   7999
BILLS-114s1439is.xml   8000
BILLS-114s143is.xml   8001
BILLS-114s1440is.xml   8002
BILLS-114s1441is.xml   8003
BILLS-114s1442is.xml   8004
BILLS-114s1443is.xml   8005
BILLS-114s1444is.xml   8006
BILLS-114s1445is.xml   8007
BILLS-114s1446is.xml   8008
BILLS-114s1447is.xml   8009
BILLS-114s1448is.xml   8010
BILLS-114s1449is.xml   

BILLS-114s168is.xml   8270
BILLS-114s1690is.xml   8271
BILLS-114s1691is.xml   8272
BILLS-114s1692is.xml   8273
BILLS-114s1693is.xml   8274
BILLS-114s1694is.xml   8275
BILLS-114s1696is.xml   8276
BILLS-114s1697is.xml   8277
BILLS-114s1699is.xml   8278
BILLS-114s169is.xml   8279
BILLS-114s16is.xml   8280
BILLS-114s1700is.xml   8281
BILLS-114s1701is.xml   8282
BILLS-114s1702is.xml   8283
BILLS-114s1703is.xml   8284
BILLS-114s1704is.xml   8285
BILLS-114s1706is.xml   8286
BILLS-114s1707is.xml   8287
BILLS-114s1708is.xml   8288
BILLS-114s1709is.xml   8289
BILLS-114s170is.xml   8290
BILLS-114s1710is.xml   8291
BILLS-114s1711is.xml   8292
BILLS-114s1712is.xml   8293
BILLS-114s1713is.xml   8294
BILLS-114s1714is.xml   8295
BILLS-114s1715is.xml   8296
BILLS-114s1716is.xml   8297
BILLS-114s1717is.xml   8298
BILLS-114s1718is.xml   8299
BILLS-114s1719is.xml   8300
BILLS-114s171is.xml   8301
BILLS-114s1720is.xml   8302
BILLS-114s1721is.xml   8303
BILLS-114s1722is.xml   8304
BILLS-114s1723is.xml   830

BILLS-114s1962is.xml   8564
BILLS-114s1963is.xml   8565
BILLS-114s1964is.xml   8566
BILLS-114s1965is.xml   8567
BILLS-114s1966is.xml   8568
BILLS-114s1967is.xml   8569
BILLS-114s1968is.xml   8570
BILLS-114s1969is.xml   8571
BILLS-114s196is.xml   8572
BILLS-114s1970is.xml   8573
BILLS-114s1971is.xml   8574
BILLS-114s1972is.xml   8575
BILLS-114s1973is.xml   8576
BILLS-114s1974is.xml   8577
BILLS-114s1975is.xml   8578
BILLS-114s1976is.xml   8579
BILLS-114s1977is.xml   8580
BILLS-114s1978is.xml   8581
BILLS-114s1979is.xml   8582
BILLS-114s197is.xml   8583
BILLS-114s1980is.xml   8584
BILLS-114s1981is.xml   8585
BILLS-114s1982is.xml   8586
BILLS-114s1983is.xml   8587
BILLS-114s1984is.xml   8588
BILLS-114s1985is.xml   8589
BILLS-114s1986is.xml   8590
BILLS-114s1987is.xml   8591
BILLS-114s1988is.xml   8592
BILLS-114s1989is.xml   8593
BILLS-114s198is.xml   8594
BILLS-114s1990is.xml   8595
BILLS-114s1991is.xml   8596
BILLS-114s1992is.xml   8597
BILLS-114s1993is.xml   8598
BILLS-114s1994is.xml   

BILLS-114s2247is.xml   8859
BILLS-114s2248is.xml   8860
BILLS-114s2249is.xml   8861
BILLS-114s224is.xml   8862
BILLS-114s2250is.xml   8863
BILLS-114s2251is.xml   8864
BILLS-114s2252is.xml   8865
BILLS-114s2253is.xml   8866
BILLS-114s2254is.xml   8867
BILLS-114s2255is.xml   8868
BILLS-114s2256is.xml   8869
BILLS-114s2257is.xml   8870
BILLS-114s2258is.xml   8871
BILLS-114s2259is.xml   8872
BILLS-114s225is.xml   8873
BILLS-114s2260is.xml   8874
BILLS-114s2261is.xml   8875
BILLS-114s2262is.xml   8876
BILLS-114s2263is.xml   8877
BILLS-114s2264is.xml   8878
BILLS-114s2265is.xml   8879
BILLS-114s2266is.xml   8880
BILLS-114s2267is.xml   8881
BILLS-114s2268is.xml   8882
BILLS-114s2269is.xml   8883
BILLS-114s226is.xml   8884
BILLS-114s2270is.xml   8885
BILLS-114s2271is.xml   8886
BILLS-114s2272is.xml   8887
BILLS-114s2273is.xml   8888
BILLS-114s2274is.xml   8889
BILLS-114s2275is.xml   8890
BILLS-114s2276is.xml   8891
BILLS-114s2277is.xml   8892
BILLS-114s2278is.xml   8893
BILLS-114s2279is.xml   

BILLS-114s251is.xml   9153
BILLS-114s2520is.xml   9154
BILLS-114s2521is.xml   9155
BILLS-114s2522is.xml   9156
BILLS-114s2523is.xml   9157
BILLS-114s2524is.xml   9158
BILLS-114s2525is.xml   9159
BILLS-114s2526is.xml   9160
BILLS-114s2527is.xml   9161
BILLS-114s2528is.xml   9162
BILLS-114s2529is.xml   9163
BILLS-114s252is.xml   9164
BILLS-114s2530is.xml   9165
BILLS-114s2531is.xml   9166
BILLS-114s2532is.xml   9167
BILLS-114s2533is.xml   9168
BILLS-114s2534is.xml   9169
BILLS-114s2535is.xml   9170
BILLS-114s2536is.xml   9171
BILLS-114s2537is.xml   9172
BILLS-114s2538is.xml   9173
BILLS-114s2539is.xml   9174
BILLS-114s253is.xml   9175
BILLS-114s2540is.xml   9176
BILLS-114s2541is.xml   9177
BILLS-114s2542is.xml   9178
BILLS-114s2543is.xml   9179
BILLS-114s2544is.xml   9180
BILLS-114s2545is.xml   9181
BILLS-114s2546is.xml   9182
BILLS-114s2547is.xml   9183
BILLS-114s2548is.xml   9184
BILLS-114s2549is.xml   9185
BILLS-114s254is.xml   9186
BILLS-114s2550is.xml   9187
BILLS-114s2551is.xml   9

BILLS-114s2788is.xml   9447
BILLS-114s2789is.xml   9448
BILLS-114s278is.xml   9449
BILLS-114s2790is.xml   9450
BILLS-114s2791is.xml   9451
BILLS-114s2792is.xml   9452
BILLS-114s2793is.xml   9453
BILLS-114s2794is.xml   9454
BILLS-114s2795is.xml   9455
BILLS-114s2796is.xml   9456
BILLS-114s2797is.xml   9457
BILLS-114s2798is.xml   9458
BILLS-114s2799is.xml   9459
BILLS-114s279is.xml   9460
BILLS-114s27is.xml   9461
BILLS-114s2800is.xml   9462
BILLS-114s2801is.xml   9463
BILLS-114s2802is.xml   9464
BILLS-114s2803is.xml   9465
BILLS-114s2805is.xml   9466
BILLS-114s2807is.xml   9467
BILLS-114s2808is.xml   9468
BILLS-114s2809is.xml   9469
BILLS-114s280is.xml   9470
BILLS-114s2810is.xml   9471
BILLS-114s2811is.xml   9472
BILLS-114s2812is.xml   9473
BILLS-114s2813is.xml   9474
BILLS-114s2814is.xml   9475
BILLS-114s2815is.xml   9476
BILLS-114s2816is.xml   9477
BILLS-114s2817is.xml   9478
BILLS-114s2818is.xml   9479
BILLS-114s2819is.xml   9480
BILLS-114s281is.xml   9481
BILLS-114s2820is.xml   948

BILLS-114s3064is.xml   9741
BILLS-114s3065is.xml   9742
BILLS-114s3066is.xml   9743
BILLS-114s3069is.xml   9744
BILLS-114s306is.xml   9745
BILLS-114s3070is.xml   9746
BILLS-114s3071is.xml   9747
BILLS-114s3072is.xml   9748
BILLS-114s3073is.xml   9749
BILLS-114s3074is.xml   9750
BILLS-114s3075is.xml   9751
BILLS-114s3076is.xml   9752
BILLS-114s3077is.xml   9753
BILLS-114s3078is.xml   9754
BILLS-114s3079is.xml   9755
BILLS-114s307is.xml   9756
BILLS-114s3080is.xml   9757
BILLS-114s3081is.xml   9758
BILLS-114s3082is.xml   9759
BILLS-114s3083is.xml   9760
BILLS-114s3084is.xml   9761
BILLS-114s3085is.xml   9762
BILLS-114s3086is.xml   9763
BILLS-114s3087is.xml   9764
BILLS-114s3088is.xml   9765
BILLS-114s3089is.xml   9766
BILLS-114s308is.xml   9767
BILLS-114s3090is.xml   9768
BILLS-114s3091is.xml   9769
BILLS-114s3092is.xml   9770
BILLS-114s3093is.xml   9771
BILLS-114s3094is.xml   9772
BILLS-114s3095is.xml   9773
BILLS-114s3096is.xml   9774
BILLS-114s3097is.xml   9775
BILLS-114s3098is.xml   

BILLS-114s3341is.xml   10034
BILLS-114s3342is.xml   10035
BILLS-114s3343is.xml   10036
BILLS-114s3344is.xml   10037
BILLS-114s3345is.xml   10038
BILLS-114s3346is.xml   10039
BILLS-114s3347is.xml   10040
BILLS-114s3349is.xml   10041
BILLS-114s334is.xml   10042
BILLS-114s3350is.xml   10043
BILLS-114s3351is.xml   10044
BILLS-114s3352is.xml   10045
BILLS-114s3353is.xml   10046
BILLS-114s3354is.xml   10047
BILLS-114s3355is.xml   10048
BILLS-114s3356is.xml   10049
BILLS-114s3357is.xml   10050
BILLS-114s3358is.xml   10051
BILLS-114s3359is.xml   10052
BILLS-114s335is.xml   10053
BILLS-114s3360is.xml   10054
BILLS-114s3361is.xml   10055
BILLS-114s3362is.xml   10056
BILLS-114s3363is.xml   10057
BILLS-114s3364is.xml   10058
BILLS-114s3365is.xml   10059
BILLS-114s3366is.xml   10060
BILLS-114s3367is.xml   10061
BILLS-114s3368is.xml   10062
BILLS-114s3369is.xml   10063
BILLS-114s336is.xml   10064
BILLS-114s3370is.xml   10065
BILLS-114s3371is.xml   10066
BILLS-114s3372is.xml   10067
BILLS-114s3373is.

BILLS-114s411is.xml   10320
BILLS-114s412is.xml   10321
BILLS-114s413is.xml   10322
BILLS-114s414is.xml   10323
BILLS-114s415is.xml   10324
BILLS-114s416is.xml   10325
BILLS-114s417is.xml   10326
BILLS-114s418is.xml   10327
BILLS-114s419is.xml   10328
BILLS-114s41is.xml   10329
BILLS-114s420is.xml   10330
BILLS-114s421is.xml   10331
BILLS-114s422is.xml   10332
BILLS-114s423is.xml   10333
BILLS-114s424is.xml   10334
BILLS-114s425is.xml   10335
BILLS-114s426is.xml   10336
BILLS-114s427is.xml   10337
BILLS-114s428is.xml   10338
BILLS-114s429is.xml   10339
BILLS-114s42is.xml   10340
BILLS-114s430is.xml   10341
BILLS-114s431is.xml   10342
BILLS-114s432is.xml   10343
BILLS-114s433is.xml   10344
BILLS-114s434is.xml   10345
BILLS-114s435is.xml   10346
BILLS-114s436is.xml   10347
BILLS-114s437is.xml   10348
BILLS-114s438is.xml   10349
BILLS-114s439is.xml   10350
BILLS-114s43is.xml   10351
BILLS-114s440is.xml   10352
BILLS-114s441is.xml   10353
BILLS-114s442is.xml   10354
BILLS-114s443is.xml   1

BILLS-114s67is.xml   10614
BILLS-114s680is.xml   10615
BILLS-114s681is.xml   10616
BILLS-114s682is.xml   10617
BILLS-114s683is.xml   10618
BILLS-114s684is.xml   10619
BILLS-114s685is.xml   10620
BILLS-114s686is.xml   10621
BILLS-114s687is.xml   10622
BILLS-114s688is.xml   10623
BILLS-114s689is.xml   10624
BILLS-114s68is.xml   10625
BILLS-114s690is.xml   10626
BILLS-114s691is.xml   10627
BILLS-114s692is.xml   10628
BILLS-114s693is.xml   10629
BILLS-114s694is.xml   10630
BILLS-114s695is.xml   10631
BILLS-114s696is.xml   10632
BILLS-114s697is.xml   10633
BILLS-114s698is.xml   10634
BILLS-114s699is.xml   10635
BILLS-114s69is.xml   10636
BILLS-114s6is.xml   10637
BILLS-114s700is.xml   10638
BILLS-114s701is.xml   10639
BILLS-114s702is.xml   10640
BILLS-114s703is.xml   10641
BILLS-114s704is.xml   10642
BILLS-114s705is.xml   10643
BILLS-114s706is.xml   10644
BILLS-114s707is.xml   10645
BILLS-114s708is.xml   10646
BILLS-114s709is.xml   10647
BILLS-114s70is.xml   10648
BILLS-114s710is.xml   1064

BILLS-114s961is.xml   10908
BILLS-114s962is.xml   10909
BILLS-114s963is.xml   10910
BILLS-114s964is.xml   10911
BILLS-114s965is.xml   10912
BILLS-114s966is.xml   10913
BILLS-114s967is.xml   10914
BILLS-114s968is.xml   10915
BILLS-114s969is.xml   10916
BILLS-114s96is.xml   10917
BILLS-114s970is.xml   10918
BILLS-114s971is.xml   10919
BILLS-114s972is.xml   10920
BILLS-114s973is.xml   10921
BILLS-114s974is.xml   10922
BILLS-114s975is.xml   10923
BILLS-114s976is.xml   10924
BILLS-114s977is.xml   10925
BILLS-114s978is.xml   10926
BILLS-114s979is.xml   10927
BILLS-114s97is.xml   10928
BILLS-114s980is.xml   10929
BILLS-114s981is.xml   10930
BILLS-114s982is.xml   10931
BILLS-114s983is.xml   10932
BILLS-114s985is.xml   10933
BILLS-114s986is.xml   10934
BILLS-114s987is.xml   10935
BILLS-114s988is.xml   10936
BILLS-114s989is.xml   10937
BILLS-114s98is.xml   10938
BILLS-114s990is.xml   10939
BILLS-114s991is.xml   10940
BILLS-114s992is.xml   10941
BILLS-114s993is.xml   10942
BILLS-114s994is.xml   1

BILLS-114sres361is.xml   11175
BILLS-114sres362is.xml   11176
BILLS-114sres365is.xml   11177
BILLS-114sres368is.xml   11178
BILLS-114sres36is.xml   11179
BILLS-114sres370is.xml   11180
BILLS-114sres372is.xml   11181
BILLS-114sres373is.xml   11182
BILLS-114sres375is.xml   11183
BILLS-114sres376is.xml   11184
BILLS-114sres378is.xml   11185
BILLS-114sres37is.xml   11186
BILLS-114sres380is.xml   11187
BILLS-114sres381is.xml   11188
BILLS-114sres383is.xml   11189
BILLS-114sres385is.xml   11190
BILLS-114sres386is.xml   11191
BILLS-114sres387is.xml   11192
BILLS-114sres388is.xml   11193
BILLS-114sres391is.xml   11194
BILLS-114sres392is.xml   11195
BILLS-114sres394is.xml   11196
BILLS-114sres396is.xml   11197
BILLS-114sres397is.xml   11198
BILLS-114sres399is.xml   11199
BILLS-114sres39is.xml   11200
BILLS-114sres403is.xml   11201
BILLS-114sres404is.xml   11202
BILLS-114sres405is.xml   11203
BILLS-114sres406is.xml   11204
BILLS-114sres40is.xml   11205
BILLS-114sres410is.xml   11206
BILLS-114sre

In [18]:
"""
Parse out the bills XML into a single processed file
"""
import os
import re

import spacy
import spacy.lang
from spacy.lang.en import English
nlp = spacy.lang.en.English()
tokenizer = nlp.Defaults.create_tokenizer(nlp)

open(f"/Users/hiancheong/Personal/grad/UMD/comp_ling/topics_evaluation/{CONGRESS}_legislation_lines2.txt", "w+")
file_writer = open(f"/Users/hiancheong/Personal/grad/UMD/comp_ling/topics_evaluation/{CONGRESS}_legislation_lines2.txt", "a+")

def valid_token(token):
    if token.is_stop:
        return False
    if token.is_punct:
        return False
    if not token.is_alpha:
        return False
    if "@" in token.text:
        return False

    if token.text:
        return True
    return False

path = f"/Users/hiancheong/Personal/grad/UMD/comp_ling/topics_evaluation/{CONGRESS}_legislation/"
for (dirname, directories, files) in os.walk(path):
    for fname in files:
        filename = f"{dirname}/{fname}"
        reader = open(filename)
        original_file_text =  reader.read()
        file_text =  re.sub('<[^<]+>', "", original_file_text)
        file_text = file_text.replace("\n", " ")
    
        doc = tokenizer(file_text)
        tokens = [token for token in doc]
        final_text = " ".join([d.text.lower() for d in tokens if valid_token(d)])
        file_writer.write(f"{final_text} \n")

        

In [33]:
tokens[7].is_alpha

False

In [17]:
import json
import os
import re

import spacy
import spacy.lang
from spacy.lang.en import English
nlp = spacy.lang.en.English()
tokenizer = nlp.Defaults.create_tokenizer(nlp)

"""
Example code for converting wikipedia dump to a parsed line sentence file
"""
def valid_token(token):
    if token.is_stop:
        return False
    if token.is_punct:
        return False
    if not token.is_alpha:
        return False
    if "@" in token.text:
        return False

    if token.text:
        return True
    return False

def format_line_text(file_text, tokenizer, file_writer):
    
    file_text =  re.sub('<[^<]+>', "", file_text)
    file_text = file_text.replace("\n", " ")
    
    doc = tokenizer(file_text)
    tokens = [token for token in doc]
    final_text = " ".join([d.text.lower() for d in tokens if valid_token(d)])
    file_writer.write(f"{final_text} \n")
    
files = [
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_00",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_01",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_02",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_03",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_04",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_05",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_06",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_07",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_08",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_09",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_10",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_11",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_12",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_13",
    "/fs/clip-political/andrewhc/clean_wiki_text/wiki_14"
]

#files = [
#    "/Users/hiancheong/Personal/grad/UMD/comp_ling/wikiextractor/clean_articles/AA/wiki_00",
#    "/Users/hiancheong/Personal/grad/UMD/comp_ling/wikiextractor/clean_articles/AA/wiki_01"
#]
segment = 0
lines = 0
for file in files:
    print(f"Processing {file}")
    # Wipe the file but then open in append mode properly
    file_reader = open(file, "r")
    file_writer = open(f"/fs/clip-political/andrewhc/wiki_lines/wiki_{segment}", "w+")
    file_writer = open(f"/fs/clip-political/andrewhc/wiki_lines/wiki_{segment}", "a")
    
    #file_writer = open(f"/Users/hiancheong/Personal/grad/UMD/comp_ling/wikiextractor/wiki_{segment}", "w+")
    #file_writer = open(f"/Users/hiancheong/Personal/grad/UMD/comp_ling/wikiextractor/wiki_{segment}", "a")
    for line in file_reader.readlines():
        json_line = json.loads(line)
        format_line_text(json_line["text"], tokenizer, file_writer)
        lines += 1
        
    if (lines % 10000) == 0:
        print(f"Segement {segment}, lines {lines}")
    segment += 1
    file_writer.close()

    


Processing /Users/hiancheong/Personal/grad/UMD/comp_ling/wikiextractor/clean_articles/AA/wiki_00
Processing /Users/hiancheong/Personal/grad/UMD/comp_ling/wikiextractor/clean_articles/AA/wiki_01


KeyboardInterrupt: 