In [1]:
import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

In [2]:
df = pd.read_csv('indice-cidades-empreendedoras.csv', index_col=0).fillna(0)
df

Unnamed: 0,UF,Tempo de Viabilidade de Localização,"Tempo de Registro, Cadastro e Viabilidade de Nome",Taxa de Congestionamento em Tribunais,Soma de Tempo de Processos,Índice de Tempo de Processos,Alíquota Interna do ICMS,Alíquota Interna do IPTU,Alíquota Interna do ISS,Qualidade da Gestão Fiscal,...,Conhecimento sobre Processos de Abertura de Negócios,Conhecimento de Riscos na Abertura de Novos Negócios,Grau de Esforço para se Tornar Empreendedor,Pesquisas sobre Empreendedorismo,Soma de Cultura,Índice de Cultura,ice1,ice2,ice1 + ice2,ICE 2020
Determinante,UF,Ambiente Regulatório,Ambiente Regulatório,Ambiente Regulatório,Ambiente Regulatório,Ambiente Regulatório,Ambiente Regulatório,Ambiente Regulatório,Ambiente Regulatório,Ambiente Regulatório,...,Cultura,Cultura,Cultura,Cultura,Cultura,Cultura,Índice,Índice,Índice,Índice
Subdeterminante,UF,Tempo de Processos,Tempo de Processos,Tempo de Processos,Tempo de Processos,Tempo de Processos,Tributação,Tributação,Tributação,Tributação,...,Imagem do Empreendedorismo,Imagem do Empreendedorismo,Imagem do Empreendedorismo,Imagem do Empreendedorismo,Soma de Cultura,Índice de Cultura,Índice,Índice,Índice,Índice
Fonte,UF,REDESIM,REDESIM,CNJ,0,0,Siconfi e IBGE,Siconfi e IBGE,Siconfi e IBGE,Firjan,...,Mind Miners,Mind Miners,Mind Miners,Google Trends,0,0,ice1,ice2,ice1 + ice2,ICE 2020
São Paulo,SP,13,40,11,20,20,12,92,95,22,...,21,60,32,53,59,59,2,1,1,1
Florianópolis,SC,92,18,16,17,17,50,95,89,56,...,49,89,83,54,86,86,1,55,2,2
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
Olinda,PE,79,75,85,89,89,72,25,80,57,...,10,14,5,54,6,6,67,98,96,96
Vitória da Conquista,BA,68,97,60,99,99,78,37,60,60,...,54,10,11,54,14,14,63,99,97,97
Paulista,PE,78,75,87,90,90,72,59,21,64,...,10,14,5,54,6,6,73,97,98,98
Jaboatão dos Guararapes,PE,72,75,36,56,56,72,52,30,65,...,10,14,5,54,6,6,90,91,99,99


# Atividade 1
## Pergunta 1.1: Quais as três cidades com melhor posição geral?

In [3]:
ICE2020 = pd.to_numeric(df['ICE 2020'], errors='coerce')
ICE2020.sort_values(inplace=True)
for cidade in ICE2020.index[:3]:
    print(cidade)

São Paulo
Florianópolis
Osasco


## Pergunta 1.2: Quais as três cidades que apresentam os maiores índices para cada um dos 7 determinantes?

In [4]:
subdeterminantes = [column for column in df.columns if column.startswith('Índice')]

subdeterminantes

['Índice de Tempo de Processos',
 'Índice de Tributação',
 'Índice de Complexidade Burocrática',
 'Índice de Ambiente Regulatório',
 'Índice de Transporte Interurbano',
 'Índice de Condições Urbanas',
 'Índice de Infraestrutura',
 'Índice de Desenvolvimento Humano ',
 'Índice de Desenvolvimento Econômico',
 'Índice de Clientes Potenciais ',
 'Índice de Mercado',
 'Índice de Acesso a Capital',
 'Índice de Inputs',
 'Índice de Outputs',
 'Índice de Inovação',
 'Índice de Acesso e Qualidade da Mão de Obra Básica',
 'Índice de Acesso e Qualidade da Mão de Obra Qualificada ',
 'Índice de Capital Humano',
 'Índice de Cultura']

In [8]:
determinantes = ['Índice de ' + determinante for determinante in df.loc['Determinante'].unique()[1:-1]]

determinantes

['Índice de Ambiente Regulatório',
 'Índice de Infraestrutura',
 'Índice de Mercado',
 'Índice de Acesso a Capital',
 'Índice de Inovação',
 'Índice de Capital Humano',
 'Índice de Cultura']

In [20]:
for determinante in determinantes:
    print(f"Determinante: {determinante}")
    série = pd.to_numeric(df[determinante], errors='coerce')
    série.sort_values(inplace=True)
    for index, cidade in enumerate(série.index[1:4]):
        print(f"{index + 1}: {cidade}")
    print('\n')

Determinante: Índice de Ambiente Regulatório
1: Macapá
2: Vitória
3: São Gonçalo


Determinante: Índice de Infraestrutura
1: São Paulo
2: Recife
3: Limeira


Determinante: Índice de Mercado
1: Jundiaí
2: Canoas
3: Brasília


Determinante: Índice de Acesso a Capital
1: São Paulo
2: Osasco
3: Porto Alegre


Determinante: Índice de Inovação
1: Florianópolis
2: Caxias do Sul
3: Campinas


Determinante: Índice de Capital Humano
1: Florianópolis
2: Vitória
3: Niterói


Determinante: Índice de Cultura
1: Porto Velho
2: Manaus
3: Rio Branco




## Pergunta 1.3: Quais as três Unidades Federativas (UFs) com mais cidades no Ranking?

In [22]:
for index, UF in enumerate(df["UF"].value_counts()[:3].index):
    print(f"{index + 1}: {UF}")

1: SP
2: RJ
3: MG


# Atividades 2 e 3
## Interface para acessar dados de uma cidade

In [25]:
def getDados(cidade):
    print(f"Dados para {cidade}")
    for determinante in determinantes:
        print(f"\t{determinante}: {df.loc[cidade][determinante]}")
    print()
    
getDados("São Paulo")
getDados("Recife")
getDados("Goiânia")

Dados para São Paulo
	Índice de Ambiente Regulatório: 4
	Índice de Infraestrutura: 1
	Índice de Mercado: 7
	Índice de Acesso a Capital: 1
	Índice de Inovação: 16
	Índice de Capital Humano: 60
	Índice de Cultura: 59

Dados para Recife
	Índice de Ambiente Regulatório: 86
	Índice de Infraestrutura: 2
	Índice de Mercado: 76
	Índice de Acesso a Capital: 13
	Índice de Inovação: 21
	Índice de Capital Humano: 15
	Índice de Cultura: 5

Dados para Goiânia
	Índice de Ambiente Regulatório: 35
	Índice de Infraestrutura: 22
	Índice de Mercado: 78
	Índice de Acesso a Capital: 14
	Índice de Inovação: 47
	Índice de Capital Humano: 33
	Índice de Cultura: 25

