## Sobre

Este notebook tem como finalidade alterar o arquivo *city.list.json* fornecido pelo OpenWeather. Esse arquivo contém informações sobre  todas as cidades do mundo e seus respectivos IDs na API. As alterações foram feitas feitas para que a leitura do arquivo e a busca por uma cidade seja feita mais rapidamente. Para tal, o arquivo foi convertido em um hashmap (ou dict em python), usando o nome como chave, e informações como país pertencente e coordenadas da cidade foram removidas.

Com essas alterações a busca por uma cidade que era feita em **O(n)** agora é feita em **O(1)**, e o tamanho do arquivo foi reduzido cerca de **5,8 vezes** de 28,3MB para 4,82MB.

## Lê arquivo JSON

In [63]:
import json

with open('city.list.json', 'r', encoding="utf8") as f:
    data = json.load(f)

## Verifica formato dos dados

In [64]:
data[0]

{'id': 707860,
 'name': 'Hurzuf',
 'country': 'UA',
 'coord': {'lon': 34.283333, 'lat': 44.549999}}

## Exclui informações desnecessárias

In [65]:
cidades = {}

for cidade in data:
    #if(cidade['country'] == 'BR'):
    nome_cidade = cidade['name'].lower()
    del cidade['name']
    del cidade['country']
    del cidade['coord']
    cidades[nome_cidade] = cidade

## Verifica dict gerado

In [66]:
cidades

{'hurzuf': {'id': 707860},
 'novinki': {'id': 519212},
 'gorkhā': {'id': 1283379},
 'state of haryāna': {'id': 1270260},
 'holubynka': {'id': 708546},
 'bāgmatī zone': {'id': 1283710},
 'mar’ina roshcha': {'id': 529335},
 'republic of india': {'id': 1269750},
 'kathmandu': {'id': 1283241},
 'laspi': {'id': 703363},
 'merida': {'id': 1699827},
 'vinogradovo': {'id': 473535},
 'qarah gawl al ‘ulyā': {'id': 384848},
 'cherkizovo': {'id': 569144},
 'alupka': {'id': 713514},
 'lichtenrade': {'id': 2878044},
 'zavety il’icha': {'id': 464192},
 '‘azriqam': {'id': 295582},
 'ghūra': {'id': 1271231},
 'tyuzler': {'id': 690856},
 'zaponor’ye': {'id': 464737},
 'il’ichëvka': {'id': 707716},
 'partyzans’ke': {'id': 697959},
 'yurevichi': {'id': 619536},
 'gumist’a': {'id': 614371},
 'ptitsefabrika': {'id': 874560},
 'orekhovo': {'id': 874652},
 'birim': {'id': 2347078},
 'priiskovyy': {'id': 1494190},
 'dzhaga': {'id': 563692},
 'tret’ya rota': {'id': 481725},
 'ruislip': {'id': 2638976},
 'karow'

In [67]:
cidades['mogi guacu']

{'id': 3457000}

## Salva arquivo em um JSON

In [68]:
with open('cidades_ids.json', 'w', encoding='utf8') as outfile:
    json.dump(cidades, outfile, ensure_ascii=False)