# Análise exploratória cidades digitais



## Fonte de dados:
> [Cidades Digitais](https://dados.gov.br/dataset/cidades-digitais) 

## Introdução
Análise exploratória do dataframe e entendimento dos dados

## Importação e carga dos dados

In [1]:
import numpy as np
import pandas as pd

In [2]:
dados = pd.read_csv('cidades_digitais.csv', sep=';', encoding='latin-1')

## Primeiras visualizações

### Primeiros Registros

In [3]:
dados.head()

Unnamed: 0,UF,CIDADE,IBGE,POPULAÇÃO,VALOR_TOTAL_PREVISTO,STATUS,PONTOS_ATENDIDOS,VALOR_INVESTIDO
0,AC,Tarauacá,1200609,38819,"484.547,53",Sem Previsão,8,0
1,AL,Delmiro Gouveia,2702405,51997,"1.169.381,70",Sem Previsão,43,0
2,AL,Estrela de Alagoas,2702553,18306,"527.206,83",Sem Previsão,39,0
3,AM,Autazes,1300300,37033,"1.171.151,92",Sem Previsão,51,0
4,AM,Benjamin Constant,1300607,39484,"844.586,48",Sem Previsão,12,0


### Últimos registros

In [4]:
dados.tail()

Unnamed: 0,UF,CIDADE,IBGE,POPULAÇÃO,VALOR_TOTAL_PREVISTO,STATUS,PONTOS_ATENDIDOS,VALOR_INVESTIDO
333,SP,Vargem Grande do Sul,3556404,41807,"1.525.640,54",Sem Previsão,47,0
334,TO,Paraíso do Tocantins,1716109,49076,"1.872.693,90",Sem Previsão,49,0
335,TO,Ponte Alta do Bom Jesus,1717800,4649,"251.266,44",Sem Previsão,9,"23.969,90"
336,TO,Porto Nacional,1718204,52182,"1.101.168,76",Sem Previsão,61,0
337,TO,São Miguel do Tocantins,1720200,11597,"592.549,70",Sem Previsão,20,0


### Números de linhas e colunas

In [5]:
dados.shape

(338, 8)

### Nome das variáveis observáveis


In [6]:
list(dados.columns)

['UF',
 'CIDADE',
 'IBGE',
 'POPULAÇÃO',
 'VALOR_TOTAL_PREVISTO',
 'STATUS',
 'PONTOS_ATENDIDOS',
 'VALOR_INVESTIDO']

### Tipo de dados por coluna

In [7]:
dados.dtypes

UF                      object
CIDADE                  object
IBGE                     int64
POPULAÇÃO                int64
VALOR_TOTAL_PREVISTO    object
STATUS                  object
PONTOS_ATENDIDOS         int64
VALOR_INVESTIDO         object
dtype: object

## Tendencias de centralidade

In [8]:
dados.describe(include='all')

Unnamed: 0,UF,CIDADE,IBGE,POPULAÇÃO,VALOR_TOTAL_PREVISTO,STATUS,PONTOS_ATENDIDOS,VALOR_INVESTIDO
count,338,338,338.0,338.0,338,338,338.0,338.0
unique,27,338,,,331,3,,100.0
top,SP,Japonvar,,,"674.932,84",Sem Previsão,,0.0
freq,35,1,,,2,258,,238.0
mean,,,2860567.0,32202.497041,,,22.494083,
std,,,965864.8,36054.136101,,,9.881867,
min,,,1100106.0,2249.0,,,5.0,
25%,,,2206854.0,14991.5,,,15.0,
50%,,,2805505.0,25129.0,,,21.0,
75%,,,3506588.0,38931.5,,,27.0,


### Tipos de STATUS

In [9]:
set(dados['STATUS'])

{'Concluída', 'Em andamento', 'Sem Previsão'}

## Distribuição de cidades por UF

###   Os dez estados com mais cidades atendidas

In [10]:
grupos_uf = dados.groupby(['UF'])
grupos_uf.size().sort_values(ascending=False)[0:10]

UF
SP    35
BA    33
MG    28
MA    26
CE    26
PA    24
PI    18
PB    18
PR    17
PE    16
dtype: int64

### Os dez estados com a menor quantidade de cidades atendidas pelo programa

In [11]:
grupos_uf.size().sort_values(ascending=True)[0:10]

UF
AC    1
RR    1
DF    1
AL    2
RO    2
MS    3
SE    4
MT    4
TO    4
ES    4
dtype: int64

## Visualizar os dados por UF e STATUS

In [12]:
df = dados.set_index(['UF','STATUS'])

In [13]:
df.groupby(level=['UF', 'STATUS'])

<pandas.core.groupby.DataFrameGroupBy object at 0x7f1fe8b3e208>

In [14]:
df

Unnamed: 0_level_0,Unnamed: 1_level_0,CIDADE,IBGE,POPULAÇÃO,VALOR_TOTAL_PREVISTO,PONTOS_ATENDIDOS,VALOR_INVESTIDO
UF,STATUS,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
AC,Sem Previsão,Tarauacá,1200609,38819,"484.547,53",8,0
AL,Sem Previsão,Delmiro Gouveia,2702405,51997,"1.169.381,70",43,0
AL,Sem Previsão,Estrela de Alagoas,2702553,18306,"527.206,83",39,0
AM,Sem Previsão,Autazes,1300300,37033,"1.171.151,92",51,0
AM,Sem Previsão,Benjamin Constant,1300607,39484,"844.586,48",12,0
AM,Sem Previsão,Careiro,1301100,36435,"748.797,08",17,0
AM,Concluída,Coari,1301209,83078,"814.954,75",27,0
AM,Sem Previsão,Codajás,1301308,26777,"757.706,74",36,0
AM,Sem Previsão,Iranduba,1301852,45984,"800.655,02",30,0
AM,Concluída,Manacapuru,1302504,94175,"892.096,87",31,"763.009,30"
