### Licenciamento Urbanístico na Cidade do Recife: Análise de Dados

#### Introdução
O conjunto de dados “Licenciamento Urbanístico na Cidade do Recife” oferece informações valiosas sobre os processos de licenciamento relacionados ao desenvolvimento urbano na região.

#### Sobre o Conjunto de Dados
- **Nome do Conjunto de Dados:** Licenciamento Urbanístico na Cidade do Recife
- **Fonte:** Dados Recife
- **Descrição:** Contém informações sobre os processos de licenciamento urbanístico na cidade do Recife, incluindo detalhes sobre projetos, solicitações, aprovações e outras etapas relacionadas ao desenvolvimento urbano.

#### Importância e Aplicações
- **Planejamento Urbano:** Crucial para o planejamento e gestão do crescimento da cidade.
- **Transparência e Participação Cidadã:** Promove a transparência e permite que os cidadãos compreendam as decisões relacionadas ao desenvolvimento urbano.
- **Análise de Tendências:** Revela tendências ao longo do tempo, como mudanças nos tipos de projetos e áreas de maior concentração de licenciamentos.

#### Próximos Passos
- Identificar áreas com maior atividade de licenciamento.
- Avaliar o tempo médio de aprovação de projetos.
- Investigar possíveis correlações entre licenciamentos e indicadores socioeconômicos.


In [38]:
import pandas as pd

url = "http://dados.recife.pe.gov.br/dataset/e2bd8f0b-1d62-4323-8159-8ebd6ed9eb4a/resource/77c885c4-76ca-45eb-9209-06c5d217122d/download/licenciamento_urbanistico.csv"

data = pd.read_csv(url, sep=';')




In [39]:
data

Unnamed: 0,﻿areatotalconstruida,assunto,bairro,categoria_empreendimento,cnpj,data_conclusao,data_emissao_licenca,data_entrada,data_pagamento,data_validade_licenca,...,processo_automatizado,situacao_processo,tipo_mercantil,tipo_processo,tipo_proc_licenciamento,uso_imovel,valor_taxa,valor_pago,latitude,longitude
0,100,APROVACAO DE PROJETO INICIAL,AREIAS,Obra,2.088921e+13,2017-05-29,2017-05-29,2017-05-29,,2018-05-29,...,Sim,DEFERIDO,MEI,,Urbanístico,,,,-8.089069,-34.934006
1,,OBRA DE ARTE,BRASILIA TEIMOSA,Obra,2.088921e+13,2017-05-30,,2017-05-30,,,...,Sim,INDEFERIDO,MEI,,Urbanístico,,,,-8.089069,-34.934006
2,,OBRA DE ARTE,BRASILIA TEIMOSA,Obra,2.088921e+13,2017-06-01,,2017-05-30,,,...,Sim,INDEFERIDO,MEI,,Urbanístico,,,,-8.089069,-34.934006
3,50,APROVACAO DE PROJETO INICIAL,AREIAS,Obra,2.088921e+13,2017-07-21,,2017-05-29,,,...,Sim,CANCELADO,MEI,,Urbanístico,,,,-8.089069,-34.934006
4,100,APROVACAO DE PROJETO INICIAL,AREIAS,Obra,2.088921e+13,2017-07-21,,2017-05-29,,,...,Sim,CANCELADO,MEI,,Urbanístico,,,,-8.089069,-34.934006
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
74962,,ALVARA DE LOCALIZACAO E FUNCIONAMENTO,ENCRUZILHADA,Atividade,1.396503e+13,2024-01-15,2024-01-15,2024-01-08,2024-01-12,2029-01-15,...,Sim,DEFERIDO,CONVENCIONAL,DEFINITIVO,Urbanístico,SEDE DE EMPRESA(ATIVIDADE FIM),48842,48842,-8.034127,-34.893248
74963,,ALVARA DE LOCALIZACAO E FUNCIONAMENTO,IBURA,Atividade,2.363575e+13,,,2024-01-08,2024-01-11,,...,Sim,EM EXIGÊNCIA,CONVENCIONAL,CONDICIONADO,Urbanístico,UNIDADE PRODUTIVA,97685,97685,-8.124990,-34.915317
74964,19052,APROVACAO DE PROJETO INICIAL,CORDEIRO,Obra,,,,2024-01-08,,,...,Sim,SOLICITADA,AUTÔNOMO NÍVEL UNIVERSITÁRIO,,Urbanístico,SEDE DE EMPRESA(ATIVIDADE FIM),,,-8.044701,-34.925125
74965,,ALVARA DE LOCALIZACAO E FUNCIONAMENTO,COHAB,Atividade,4.364800e+12,,,2024-01-08,2024-01-15,,...,Sim,EM TRAMITAÇÃO,CONVENCIONAL,DEFINITIVO,Urbanístico,SEDE DE EMPRESA(ATIVIDADE FIM),48842,48842,,


In [41]:
# Verificar as primeiras linhas do conjunto de dados
print("Primeiras linhas do conjunto de dados:")
print(data.head())

Primeiras linhas do conjunto de dados:
  ﻿areatotalconstruida                       assunto            bairro  \
0                  100  APROVACAO DE PROJETO INICIAL            AREIAS   
1                  NaN                  OBRA DE ARTE  BRASILIA TEIMOSA   
2                  NaN                  OBRA DE ARTE  BRASILIA TEIMOSA   
3                   50  APROVACAO DE PROJETO INICIAL            AREIAS   
4                  100  APROVACAO DE PROJETO INICIAL            AREIAS   

  categoria_empreendimento          cnpj data_conclusao data_emissao_licenca  \
0                     Obra  2.088921e+13     2017-05-29           2017-05-29   
1                     Obra  2.088921e+13     2017-05-30                  NaN   
2                     Obra  2.088921e+13     2017-06-01                  NaN   
3                     Obra  2.088921e+13     2017-07-21                  NaN   
4                     Obra  2.088921e+13     2017-07-21                  NaN   

  data_entrada data_pagamento data_

In [42]:
# Verificar o número de registros e variáveis
print("\nNúmero de registros e variáveis:")
print("Número de registros:", data.shape[0])
print("Número de variáveis:", data.shape[1])


Número de registros e variáveis:
Número de registros: 74967
Número de variáveis: 33


In [43]:
# Verificar os nomes das variáveis
print("\nNomes das variáveis:")
print(data.columns)


Nomes das variáveis:
Index(['﻿areatotalconstruida', 'assunto', 'bairro', 'categoria_empreendimento',
       'cnpj', 'data_conclusao', 'data_emissao_licenca', 'data_entrada',
       'data_pagamento', 'data_validade_licenca', 'dsqfl',
       'empreendimento_de_impacto', 'endereco_empreendimento',
       'inscricao_mercantil', 'licenciamento_ambiental',
       'licenciamento_sanitario', 'licenciamento_urbanistico', 'razao_social',
       'razao_social_mercantil', 'num_licenca', 'num_processo',
       'porte_empreendimento', 'potencial_empreendimento',
       'processo_automatizado', 'situacao_processo', 'tipo_mercantil',
       'tipo_processo', 'tipo_proc_licenciamento', 'uso_imovel', 'valor_taxa',
       'valor_pago', 'latitude', 'longitude'],
      dtype='object')


In [44]:
# Verificar o resumo estatístico das variáveis numéricas
print("\nResumo estatístico das variáveis numéricas:")
print(data.describe())


Resumo estatístico das variáveis numéricas:
               cnpj  inscricao_mercantil   num_licenca  num_processo  \
count  4.706600e+04         4.698200e+04  2.608000e+04  7.496700e+04   
mean   2.355505e+13         5.177830e+06  8.065508e+09  8.066063e+09   
std    1.673818e+13         1.774020e+06  3.878192e+07  3.926145e+07   
min    4.535790e+05         1.000000e+00  8.000001e+09  8.000001e+09   
25%    9.579604e+12         3.921107e+06  8.034009e+09  8.034300e+09   
50%    2.192082e+13         5.533182e+06  8.064845e+09  8.065726e+09   
75%    3.403399e+13         6.456784e+06  8.093285e+09  8.094276e+09   
max    9.755232e+13         8.247625e+06  8.155891e+09  8.155891e+09   

       porte_empreendimento  potencial_empreendimento      latitude  \
count                   0.0                       0.0  66124.000000   
mean                    NaN                       NaN     -8.069836   
std                     NaN                       NaN      0.034043   
min                   

In [45]:
# Verificar informações sobre as variáveis, como tipos de dados e quantidade de valores não nulos
print("\nInformações sobre as variáveis:")
print(data.info())


Informações sobre as variáveis:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 74967 entries, 0 to 74966
Data columns (total 33 columns):
 #   Column                     Non-Null Count  Dtype  
---  ------                     --------------  -----  
 0   ﻿areatotalconstruida       16132 non-null  object 
 1   assunto                    74967 non-null  object 
 2   bairro                     74967 non-null  object 
 3   categoria_empreendimento   74967 non-null  object 
 4   cnpj                       47066 non-null  float64
 5   data_conclusao             72619 non-null  object 
 6   data_emissao_licenca       22859 non-null  object 
 7   data_entrada               74967 non-null  object 
 8   data_pagamento             37031 non-null  object 
 9   data_validade_licenca      22842 non-null  object 
 10  dsqfl                      74537 non-null  object 
 11  empreendimento_de_impacto  30688 non-null  object 
 12  endereco_empreendimento    74541 non-null  object 
 13  inscricao_mer

In [46]:
# Verificar a quantidade de valores ausentes por variável
print("\nQuantidade de valores ausentes por variável:")
print(data.isnull().sum())


Quantidade de valores ausentes por variável:
﻿areatotalconstruida         58835
assunto                          0
bairro                           0
categoria_empreendimento         0
cnpj                         27901
data_conclusao                2348
data_emissao_licenca         52108
data_entrada                     0
data_pagamento               37936
data_validade_licenca        52125
dsqfl                          430
empreendimento_de_impacto    44279
endereco_empreendimento        426
inscricao_mercantil          27985
licenciamento_ambiental      12806
licenciamento_sanitario      12806
licenciamento_urbanistico    12806
razao_social                 27901
razao_social_mercantil       27985
num_licenca                  48887
num_processo                     0
porte_empreendimento         74967
potencial_empreendimento     74967
processo_automatizado            0
situacao_processo                0
tipo_mercantil               13111
tipo_processo                22336
tipo_proc

In [3]:
import pandas as pd

url = "http://dados.recife.pe.gov.br/dataset/e2bd8f0b-1d62-4323-8159-8ebd6ed9eb4a/resource/77c885c4-76ca-45eb-9209-06c5d217122d/download/licenciamento_urbanistico.csv"

data = pd.read_csv(url, sep=';')

# Converta as colunas de data para o formato datetime
data['data_entrada'] = pd.to_datetime(data['data_entrada'])
data['data_conclusao'] = pd.to_datetime(data['data_conclusao'])

# Calcule a diferença entre as datas de entrada e conclusão em dias
data['tempo_aprovacao_dias'] = (data['data_conclusao'] - data['data_entrada']).dt.days

# Calcule o tempo médio de aprovação
tempo_medio_aprovacao = data['tempo_aprovacao_dias'].mean()

print(f"O tempo médio de aprovação de projetos é de aproximadamente {tempo_medio_aprovacao:.2f} dias.")


O tempo médio de aprovação de projetos é de aproximadamente 44.33 dias.
