In [1]:
import pandas as pd
import requests
import json
from tqdm import tqdm
import time
import os
import traceback
import geopandas as gpd
from shapely.geometry import Point

In [2]:
state = 'va'

In [3]:
with open('../data/state_county.json', 'r') as f:
    scj = json.load(f)
len(scj)

1585

In [4]:
state_files = [v for v in scj if v.split('_')[0] == state]
len(state_files)

133

In [5]:
state_files

['va_accomack',
 'va_albemarle',
 'va_alexandria_city',
 'va_alleghany',
 'va_amelia',
 'va_amherst',
 'va_appomattox',
 'va_arlington',
 'va_augusta',
 'va_bath',
 'va_bedford',
 'va_bland',
 'va_botetourt',
 'va_bristol_city',
 'va_brunswick',
 'va_buchanan',
 'va_buckingham',
 'va_buena_vista_city',
 'va_campbell',
 'va_caroline',
 'va_carroll',
 'va_charles_city',
 'va_charlotte',
 'va_charlottesville_city',
 'va_chesapeake_city',
 'va_chesterfield',
 'va_clarke',
 'va_colonial_heights_city',
 'va_covington_city',
 'va_craig',
 'va_culpeper',
 'va_cumberland',
 'va_danville_city',
 'va_dickenson',
 'va_dinwiddie',
 'va_emporia_city',
 'va_essex',
 'va_fairfax',
 'va_fairfax_city',
 'va_falls_church_city',
 'va_fauquier',
 'va_floyd',
 'va_fluvanna',
 'va_franklin',
 'va_franklin_city',
 'va_frederick',
 'va_fredericksburg_city',
 'va_galax_city',
 'va_giles',
 'va_gloucester',
 'va_goochland',
 'va_grayson',
 'va_greene',
 'va_greensville',
 'va_halifax',
 'va_hampton_city',
 'va_h

In [6]:
county_fips = pd.read_csv('../data/fips_county.csv.xz', dtype={'fips':object}) # read fips as a string
county_fips

Unnamed: 0,fips,county
0,01000,alabama
1,01001,autauga_county
2,01003,baldwin_county
3,01005,barbour_county
4,01007,bibb_county
...,...,...
3190,56037,sweetwater_county
3191,56039,teton_county
3192,56041,uinta_county
3193,56043,washakie_county


In [7]:
test_fips = county_fips

In [8]:
test_fips['county'] = test_fips['county'].apply(lambda x: x.replace('_county',''))
test_fips['county'] = test_fips['county'].apply(lambda x: x.replace('_city',''))
test_fips[test_fips['county'].duplicated()==True]

Unnamed: 0,fips,county
114,05001,arkansas
120,05013,calhoun
124,05021,clay
125,05023,cleburne
133,05039,dallas
...,...,...
3183,56023,lincoln
3186,56029,park
3187,56031,platte
3188,56033,sheridan


In [9]:
def get_fips(county_name, county_fips):
    # county_name = county_name.replace('_county', '') # because cities also match
    matched_fips = county_fips[county_fips['county'].str.contains(county_name)]
    if len(matched_fips) > 1:
        return matched_fips
    if len(matched_fips) <= 0:
        return None
    return matched_fips['fips'].values[0]

In [10]:
get_fips('williamsburg_county', county_fips)

In [11]:
get_fips('williamsburg_city', county_fips)

In [12]:
get_fips('williamsburg', county_fips)

Unnamed: 0,fips,county
2400,45089,williamsburg
3000,51830,williamsburg


In [13]:
print(get_fips('blah', county_fips))

None


# Remove non virginia fips from selection

In [14]:
state_fips = pd.read_csv('../data/fips_state.csv', dtype={'fips':object})
state_fips

Unnamed: 0,fips,state,abbr
0,1,alabama,al
1,2,alaska,ak
2,4,arizona,az
3,5,arkansas,ar
4,6,california,ca
5,8,colorado,co
6,9,connecticut,ct
7,10,delaware,de
8,11,district_of_columbia,dc
9,12,florida,fl


In [15]:
state_fip = state_fips[state_fips['abbr']==state]['fips'].values[0]
state_fip

'51'

In [16]:
county_fips['state_fip'] = county_fips['fips'].apply(lambda x: x[:2])
county_fips

Unnamed: 0,fips,county,state_fip
0,01000,alabama,01
1,01001,autauga,01
2,01003,baldwin,01
3,01005,barbour,01
4,01007,bibb,01
...,...,...,...
3190,56037,sweetwater,56
3191,56039,teton,56
3192,56041,uinta,56
3193,56043,washakie,56


In [17]:
county_fips = county_fips[county_fips['state_fip'] == state_fip]
county_fips

Unnamed: 0,fips,county,state_fip
2865,51000,virginia,51
2866,51001,accomack,51
2867,51003,albemarle,51
2868,51005,alleghany,51
2869,51007,amelia,51
...,...,...,...
2997,51800,suffolk,51
2998,51810,virginia_beach,51
2999,51820,waynesboro,51
3000,51830,williamsburg,51


# Import state shape files

In [18]:
fp = "../data/shapefiles/tl_2020_51_tabblock20/tl_2020_51_tabblock20.shp"
block_df = gpd.read_file(fp)
block_df

Unnamed: 0,STATEFP20,COUNTYFP20,TRACTCE20,BLOCKCE20,GEOID20,NAME20,MTFCC20,UR20,UACE20,UATYPE20,FUNCSTAT20,ALAND20,AWATER20,INTPTLAT20,INTPTLON20,HOUSING20,POP20,geometry
0,51,065,020101,1027,510650201011027,Block 1027,G5040,R,,,S,1547604,0,+37.8704905,-078.2665116,18,40,"POLYGON ((-78.27375 37.87051, -78.27324 37.870..."
1,51,197,050101,1061,511970501011061,Block 1061,G5040,U,97453,U,S,15055,0,+36.9409610,-081.0882937,6,8,"POLYGON ((-81.08860 36.94152, -81.08830 36.941..."
2,51,197,050101,3063,511970501013063,Block 3063,G5040,R,,,S,11611,0,+36.9412795,-080.9753199,0,0,"POLYGON ((-80.97608 36.94150, -80.97607 36.941..."
3,51,197,050301,1036,511970503011036,Block 1036,G5040,R,,,S,166245,0,+36.8857859,-081.2774449,3,4,"POLYGON ((-81.28102 36.88490, -81.28071 36.885..."
4,51,199,050500,2052,511990505002052,Block 2052,G5040,R,,,S,292731,0,+37.2259510,-076.5020127,0,0,"POLYGON ((-76.50644 37.22507, -76.50640 37.225..."
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
163486,51,159,040100,3037,511590401003037,Block 3037,G5040,R,,,S,4561610,48673,+37.8986088,-076.7515189,18,38,"POLYGON ((-76.76612 37.88520, -76.76576 37.885..."
163487,51,109,950500,3014,511099505003014,Block 3014,G5040,R,,,S,43464,0,+37.8490036,-077.7906355,3,19,"POLYGON ((-77.79179 37.84769, -77.79164 37.848..."
163488,51,109,950102,1008,511099501021008,Block 1008,G5040,R,,,S,0,4267,+38.0630940,-077.8308694,0,0,"POLYGON ((-77.83180 38.06289, -77.83098 38.063..."
163489,51,650,011800,4009,516500118004009,Block 4009,G5040,U,90892,U,S,81063,0,+37.0129132,-076.3642622,30,188,"POLYGON ((-76.36596 37.01361, -76.36514 37.014..."


In [19]:
block_df['county_fip'] = block_df['STATEFP20'] + block_df['COUNTYFP20']
block_df

Unnamed: 0,STATEFP20,COUNTYFP20,TRACTCE20,BLOCKCE20,GEOID20,NAME20,MTFCC20,UR20,UACE20,UATYPE20,FUNCSTAT20,ALAND20,AWATER20,INTPTLAT20,INTPTLON20,HOUSING20,POP20,geometry,county_fip
0,51,065,020101,1027,510650201011027,Block 1027,G5040,R,,,S,1547604,0,+37.8704905,-078.2665116,18,40,"POLYGON ((-78.27375 37.87051, -78.27324 37.870...",51065
1,51,197,050101,1061,511970501011061,Block 1061,G5040,U,97453,U,S,15055,0,+36.9409610,-081.0882937,6,8,"POLYGON ((-81.08860 36.94152, -81.08830 36.941...",51197
2,51,197,050101,3063,511970501013063,Block 3063,G5040,R,,,S,11611,0,+36.9412795,-080.9753199,0,0,"POLYGON ((-80.97608 36.94150, -80.97607 36.941...",51197
3,51,197,050301,1036,511970503011036,Block 1036,G5040,R,,,S,166245,0,+36.8857859,-081.2774449,3,4,"POLYGON ((-81.28102 36.88490, -81.28071 36.885...",51197
4,51,199,050500,2052,511990505002052,Block 2052,G5040,R,,,S,292731,0,+37.2259510,-076.5020127,0,0,"POLYGON ((-76.50644 37.22507, -76.50640 37.225...",51199
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
163486,51,159,040100,3037,511590401003037,Block 3037,G5040,R,,,S,4561610,48673,+37.8986088,-076.7515189,18,38,"POLYGON ((-76.76612 37.88520, -76.76576 37.885...",51159
163487,51,109,950500,3014,511099505003014,Block 3014,G5040,R,,,S,43464,0,+37.8490036,-077.7906355,3,19,"POLYGON ((-77.79179 37.84769, -77.79164 37.848...",51109
163488,51,109,950102,1008,511099501021008,Block 1008,G5040,R,,,S,0,4267,+38.0630940,-077.8308694,0,0,"POLYGON ((-77.83180 38.06289, -77.83098 38.063...",51109
163489,51,650,011800,4009,516500118004009,Block 4009,G5040,U,90892,U,S,81063,0,+37.0129132,-076.3642622,30,188,"POLYGON ((-76.36596 37.01361, -76.36514 37.014...",51650


# Print example address file

In [20]:
eaf = pd.read_csv('../data/va_craig.csv.xz')
eaf

Unnamed: 0,state,county,zip,longitude,latitude,address,id
0,va,craig,24127,-80.346633,37.376760,"758 valley roller mill rd,new castle,va,24127",va_craig
1,va,craig,24128,-80.346100,37.385808,"447 allen hill dr,newport,va,24128",va_craig
2,va,craig,24128,-80.357049,37.386491,"106 allen hill dr,newport,va,24128",va_craig
3,va,craig,24128,-80.367980,37.378768,"477 olde glade trl,newport,va,24128",va_craig
4,va,craig,24128,-80.367238,37.360939,"3923 northside rd,newport,va,24128",va_craig
...,...,...,...,...,...,...,...
3290,va,craig,24131,-80.256852,37.569588,"16068 paint bank rd,paint bank,va,24131",va_craig
3291,va,craig,24128,-80.366784,37.371116,"1039 olde glade trl,newport,va,24128",va_craig
3292,va,craig,24127,-80.136663,37.445012,"1025 waltons mountain rd,new castle,va,24127",va_craig
3293,va,craig,24131,-80.244443,37.570810,"935 hidden meadow ln,paint bank,va,24131",va_craig


In [21]:
eaf.columns

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id'], dtype='object')

In [22]:
import warnings
warnings.filterwarnings("ignore")

# You can map fips using the geometry 

In [29]:
# pbar = tqdm(state_files)

for sc in tqdm(state_files):
    save_file = '../data/state_county/%s.csv.xz'%sc        
    scdf = pd.read_csv(save_file)       
    
    # skip if already parsed
    if 'geoid20' in scdf.columns:
        continue
        
    # if upper case, but otherwise parsed
    if 'GEOID20' in scdf.columns:
        scdf = scdf.rename(columns={'GEOID20': 'geoid20'})
        scdf.to_csv(save_file, index=False)
        continue
            
    # convert the state county address file into a geopandas data frame
    gdf = gpd.GeoDataFrame(scdf, geometry=gpd.points_from_xy(scdf.longitude, scdf.latitude))

    # Spatial join the address with points and the virginia block with polygons
    
    county_with_fips = block_df.sjoin(gdf, how='inner',predicate='intersects')
    county_with_fips = county_with_fips[['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id','GEOID20']]
    
    county_with_fips = county_with_fips.rename(columns={'GEOID20': 'geoid20'})
    
    if (len(scdf)-len(county_with_fips) > len(scdf)*0.05): # losing up to 5% addresses in join is acceptable
        raise Exception('Margins larger 5%% (%s out of %s)' % (len(scdf)-len(county_with_fips), len(scdf)))
    else:
        county_with_fips.to_csv(save_file, index=False)

  0%|                                                                                                          | 0/133 [00:00<?, ?it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  1%|▋                                                                                                 | 1/133 [00:01<02:29,  1.13s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  2%|█▍                                                                                                | 2/133 [00:02<03:18,  1.52s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  2%|██▏                                                                                               | 3/133 [00:04<03:22,  1.55s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  3%|██▉                                                                                               | 4/133 [00:04<02:17,  1.06s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  4%|███▋                                                                                              | 5/133 [00:05<01:39,  1.29it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  5%|████▍                                                                                             | 6/133 [00:05<01:31,  1.39it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  5%|█████▏                                                                                            | 7/133 [00:06<01:15,  1.67it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  6%|█████▉                                                                                            | 8/133 [00:08<02:11,  1.05s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  8%|███████▎                                                                                         | 10/133 [00:09<01:47,  1.15it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


  9%|████████▊                                                                                        | 12/133 [00:11<01:39,  1.22it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 10%|█████████▍                                                                                       | 13/133 [00:12<01:31,  1.32it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 11%|██████████▏                                                                                      | 14/133 [00:12<01:16,  1.55it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 11%|██████████▉                                                                                      | 15/133 [00:12<01:07,  1.75it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 12%|███████████▋                                                                                     | 16/133 [00:13<01:06,  1.75it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 14%|█████████████▏                                                                                   | 18/133 [00:13<00:44,  2.59it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 14%|█████████████▊                                                                                   | 19/133 [00:15<01:23,  1.36it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 15%|██████████████▌                                                                                  | 20/133 [00:16<01:18,  1.45it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 17%|████████████████                                                                                 | 22/133 [00:17<01:02,  1.78it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 17%|████████████████▊                                                                                | 23/133 [00:17<00:52,  2.10it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 18%|█████████████████▌                                                                               | 24/133 [00:18<00:59,  1.82it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 19%|██████████████████▏                                                                              | 25/133 [00:23<03:24,  1.89s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 20%|██████████████████▉                                                                              | 26/133 [00:31<06:44,  3.78s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 20%|███████████████████▋                                                                             | 27/133 [00:31<04:48,  2.72s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 22%|█████████████████████▏                                                                           | 29/133 [00:32<02:30,  1.45s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 23%|█████████████████████▉                                                                           | 30/133 [00:32<01:48,  1.05s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 24%|███████████████████████▎                                                                         | 32/133 [00:33<01:14,  1.35it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 25%|████████████████████████                                                                         | 33/133 [00:34<01:19,  1.25it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 26%|████████████████████████▊                                                                        | 34/133 [00:34<01:06,  1.49it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 27%|██████████████████████████▎                                                                      | 36/133 [00:35<00:45,  2.13it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 28%|██████████████████████████▉                                                                      | 37/133 [00:35<00:38,  2.51it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 29%|███████████████████████████▋                                                                     | 38/133 [00:52<08:26,  5.33s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 30%|█████████████████████████████▏                                                                   | 40/133 [00:52<04:13,  2.73s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 31%|█████████████████████████████▉                                                                   | 41/133 [00:53<03:29,  2.27s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 32%|██████████████████████████████▋                                                                  | 42/133 [00:54<02:34,  1.70s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 32%|███████████████████████████████▎                                                                 | 43/133 [00:54<01:59,  1.33s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 34%|████████████████████████████████▊                                                                | 45/133 [00:56<01:24,  1.05it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 35%|█████████████████████████████████▌                                                               | 46/133 [00:57<01:41,  1.17s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 36%|███████████████████████████████████                                                              | 48/133 [00:58<00:59,  1.43it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 37%|███████████████████████████████████▋                                                             | 49/133 [00:58<00:49,  1.69it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 38%|████████████████████████████████████▍                                                            | 50/133 [00:59<00:51,  1.60it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 38%|█████████████████████████████████████▏                                                           | 51/133 [00:59<00:48,  1.69it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 39%|█████████████████████████████████████▉                                                           | 52/133 [01:00<00:45,  1.79it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 41%|███████████████████████████████████████▍                                                         | 54/133 [01:00<00:31,  2.53it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 41%|████████████████████████████████████████                                                         | 55/133 [01:01<00:40,  1.93it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 42%|████████████████████████████████████████▊                                                        | 56/133 [01:04<01:39,  1.29s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 43%|█████████████████████████████████████████▌                                                       | 57/133 [01:06<01:55,  1.52s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 44%|██████████████████████████████████████████▎                                                      | 58/133 [01:07<01:40,  1.34s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 44%|███████████████████████████████████████████                                                      | 59/133 [01:13<03:29,  2.83s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 45%|███████████████████████████████████████████▊                                                     | 60/133 [01:15<02:55,  2.41s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 47%|█████████████████████████████████████████████▏                                                   | 62/133 [01:15<01:40,  1.41s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 47%|█████████████████████████████████████████████▉                                                   | 63/133 [01:16<01:27,  1.25s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 49%|███████████████████████████████████████████████▍                                                 | 65/133 [01:18<01:10,  1.04s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 50%|████████████████████████████████████████████████▏                                                | 66/133 [01:19<00:58,  1.14it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 50%|████████████████████████████████████████████████▊                                                | 67/133 [01:19<00:47,  1.39it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 51%|█████████████████████████████████████████████████▌                                               | 68/133 [01:19<00:39,  1.67it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 53%|███████████████████████████████████████████████████                                              | 70/133 [01:20<00:27,  2.29it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 53%|███████████████████████████████████████████████████▊                                             | 71/133 [01:26<02:17,  2.21s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 54%|████████████████████████████████████████████████████▌                                            | 72/133 [01:27<01:48,  1.77s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 55%|█████████████████████████████████████████████████████▏                                           | 73/133 [01:27<01:19,  1.32s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 56%|█████████████████████████████████████████████████████▉                                           | 74/133 [01:29<01:19,  1.35s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 56%|██████████████████████████████████████████████████████▋                                          | 75/133 [01:29<00:59,  1.02s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 58%|████████████████████████████████████████████████████████▏                                        | 77/133 [01:30<00:38,  1.45it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 59%|█████████████████████████████████████████████████████████▌                                       | 79/133 [01:30<00:24,  2.20it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 60%|██████████████████████████████████████████████████████████▎                                      | 80/133 [01:31<00:31,  1.66it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 61%|███████████████████████████████████████████████████████████                                      | 81/133 [01:31<00:26,  1.97it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 62%|███████████████████████████████████████████████████████████▊                                     | 82/133 [01:33<00:47,  1.07it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 62%|████████████████████████████████████████████████████████████▌                                    | 83/133 [01:34<00:39,  1.28it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 63%|█████████████████████████████████████████████████████████████▎                                   | 84/133 [01:34<00:33,  1.48it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 64%|█████████████████████████████████████████████████████████████▉                                   | 85/133 [01:38<01:21,  1.69s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 65%|██████████████████████████████████████████████████████████████▋                                  | 86/133 [01:42<01:49,  2.32s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 65%|███████████████████████████████████████████████████████████████▍                                 | 87/133 [01:42<01:19,  1.73s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 66%|████████████████████████████████████████████████████████████████▏                                | 88/133 [01:43<00:59,  1.33s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 68%|█████████████████████████████████████████████████████████████████▋                               | 90/133 [01:43<00:34,  1.25it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 68%|██████████████████████████████████████████████████████████████████▎                              | 91/133 [01:44<00:32,  1.30it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 69%|███████████████████████████████████████████████████████████████████                              | 92/133 [01:44<00:28,  1.44it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 70%|███████████████████████████████████████████████████████████████████▊                             | 93/133 [01:45<00:25,  1.58it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 71%|████████████████████████████████████████████████████████████████████▌                            | 94/133 [01:45<00:23,  1.63it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 72%|██████████████████████████████████████████████████████████████████████                           | 96/133 [01:47<00:23,  1.55it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 73%|██████████████████████████████████████████████████████████████████████▋                          | 97/133 [01:49<00:34,  1.03it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 74%|███████████████████████████████████████████████████████████████████████▍                         | 98/133 [01:49<00:27,  1.25it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 74%|████████████████████████████████████████████████████████████████████████▏                        | 99/133 [01:49<00:23,  1.47it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 75%|████████████████████████████████████████████████████████████████████████▏                       | 100/133 [01:50<00:21,  1.54it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 76%|████████████████████████████████████████████████████████████████████████▉                       | 101/133 [01:59<01:38,  3.07s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 77%|█████████████████████████████████████████████████████████████████████████▌                      | 102/133 [01:59<01:13,  2.36s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 78%|███████████████████████████████████████████████████████████████████████████                     | 104/133 [02:00<00:36,  1.26s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 79%|███████████████████████████████████████████████████████████████████████████▊                    | 105/133 [02:00<00:25,  1.08it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 80%|████████████████████████████████████████████████████████████████████████████▌                   | 106/133 [02:05<00:55,  2.07s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 80%|█████████████████████████████████████████████████████████████████████████████▏                  | 107/133 [02:07<00:52,  2.02s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 81%|█████████████████████████████████████████████████████████████████████████████▉                  | 108/133 [02:09<00:53,  2.16s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 82%|██████████████████████████████████████████████████████████████████████████████▋                 | 109/133 [02:10<00:39,  1.66s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 83%|███████████████████████████████████████████████████████████████████████████████▍                | 110/133 [02:11<00:38,  1.69s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 83%|████████████████████████████████████████████████████████████████████████████████                | 111/133 [02:12<00:29,  1.36s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 84%|████████████████████████████████████████████████████████████████████████████████▊               | 112/133 [02:12<00:23,  1.10s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 85%|█████████████████████████████████████████████████████████████████████████████████▌              | 113/133 [02:13<00:18,  1.08it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 86%|██████████████████████████████████████████████████████████████████████████████████▎             | 114/133 [02:14<00:17,  1.08it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 86%|███████████████████████████████████████████████████████████████████████████████████             | 115/133 [02:15<00:15,  1.19it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 87%|███████████████████████████████████████████████████████████████████████████████████▋            | 116/133 [02:15<00:11,  1.43it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 88%|████████████████████████████████████████████████████████████████████████████████████▍           | 117/133 [02:17<00:20,  1.25s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 89%|█████████████████████████████████████████████████████████████████████████████████████▏          | 118/133 [02:20<00:23,  1.56s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 89%|█████████████████████████████████████████████████████████████████████████████████████▉          | 119/133 [02:20<00:17,  1.28s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 91%|███████████████████████████████████████████████████████████████████████████████████████▎        | 121/133 [02:22<00:13,  1.09s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')
Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 92%|████████████████████████████████████████████████████████████████████████████████████████        | 122/133 [02:23<00:09,  1.21it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 92%|████████████████████████████████████████████████████████████████████████████████████████▊       | 123/133 [02:24<00:08,  1.19it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 93%|█████████████████████████████████████████████████████████████████████████████████████████▌      | 124/133 [02:32<00:29,  3.25s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 94%|██████████████████████████████████████████████████████████████████████████████████████████▏     | 125/133 [02:33<00:19,  2.47s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 95%|██████████████████████████████████████████████████████████████████████████████████████████▉     | 126/133 [02:34<00:14,  2.08s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 95%|███████████████████████████████████████████████████████████████████████████████████████████▋    | 127/133 [02:35<00:09,  1.59s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 96%|████████████████████████████████████████████████████████████████████████████████████████████▍   | 128/133 [02:35<00:06,  1.26s/it]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 97%|█████████████████████████████████████████████████████████████████████████████████████████████   | 129/133 [02:36<00:03,  1.04it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 98%|█████████████████████████████████████████████████████████████████████████████████████████████▊  | 130/133 [02:36<00:02,  1.21it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 98%|██████████████████████████████████████████████████████████████████████████████████████████████▌ | 131/133 [02:37<00:01,  1.22it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


 99%|███████████████████████████████████████████████████████████████████████████████████████████████▎| 132/133 [02:37<00:00,  1.31it/s]

Index(['state', 'county', 'zip', 'longitude', 'latitude', 'address', 'id',
       'GEOID20'],
      dtype='object')


100%|████████████████████████████████████████████████████████████████████████████████████████████████| 133/133 [02:39<00:00,  1.20s/it]
