# Projeto Final - Codenation Data Science - JOINVILLE

# SQUAD 1 - Objetivo

O objetivo deste produto é fornecer um serviço automatizado que recomenda leads para um usuário dado sua atual lista de clientes (Portfólio).

# Contextualização
Algumas empresas gostariam de saber quem são as demais empresas em um determinado mercado (população) que tem maior probabilidade se tornarem seus próximos clientes. Ou seja, a solução deve encontrar no mercado quem são os leads mais aderentes dado as características dos clientes presentes no portfólio do usuário.

Além disso, a solução deve ser agnóstica ao usuário. Qualquer usuário com uma lista de clientes que queira explorar esse mercado pode extrair valor do serviço.

Para o desafio, deverão ser consideradas as seguintes bases:

Mercado: Base com informações sobre as empresas do Mercado a ser considerado. Portfolio 1: Ids dos clientes da empresa 1 Portfolio 2: Ids dos clientes da empresa 2 Portfolio 3: Ids dos clientes da empresa 3

Obs: todas as empresas(ids) dos portfolios estão contidos no Mercado(base de população).

As bases de portfólio poderão ser utilizadas para testar a aderência da solução. Além disso, se a equipe desejar, poderá simular portfólios por meio de amostragens no mercado.

In [1]:
#Importando as bibliotecas
import pandas as pd
import statsmodels.api as sm
import matplotlib.pyplot as plt
import numpy as np
import scipy.stats as sct
import seaborn as sns

In [2]:
from IPython.core.pylabtools import figsize

figsize(12, 8)

sns.set()

## Importando os Arquivos

In [3]:
#Importando o Dataframe de Mercado
mercado = pd.read_csv('estaticos_market.csv')

In [4]:
#Importando o Dataframe de Portfolio1
portfolio1 = pd.read_csv('estaticos_portfolio1.csv')

In [5]:
#estaticos_portfolio1 o Dataframe de Portfolio2
portfolio2 = pd.read_csv('estaticos_portfolio2.csv')

In [6]:
#Importando o Dataframe de Portfolio3
portfolio3 = pd.read_csv('estaticos_portfolio3.csv')

## Iniciando as Análises dos Arquivos

Nesse momento avaliaremos os dados do dataframe

In [8]:
# 5 Primeiras Linhas
mercado.head()

Unnamed: 0.1,Unnamed: 0,id,fl_matriz,de_natureza_juridica,sg_uf,natureza_juridica_macro,de_ramo,setor,idade_empresa_anos,idade_emp_cat,...,media_meses_servicos,max_meses_servicos,min_meses_servicos,qt_funcionarios,qt_funcionarios_12meses,qt_funcionarios_24meses,tx_crescimento_12meses,tx_crescimento_24meses,tx_rotatividade,qt_filiais
0,0,a6984c3ae395090e3bee8ad63c3758b110de096d5d8195...,True,SOCIEDADE EMPRESARIA LIMITADA,RN,ENTIDADES EMPRESARIAIS,INDUSTRIA DA CONSTRUCAO,CONSTRUÇÃO CIVIL,14.457534,10 a 15,...,43.738462,93.266667,19.166667,26.0,26.0,27.0,0.0,-3.703704,0.0,0
1,1,6178f41ade1365e44bc2c46654c2c8c0eaae27dcb476c4...,True,EMPRESARIO INDIVIDUAL,PI,OUTROS,SERVICOS DE ALOJAMENTO/ALIMENTACAO,SERVIÇO,1.463014,1 a 5,...,,,,,,,,,,0
2,2,4a7e5069a397f12fdd7fd57111d6dc5d3ba558958efc02...,True,EMPRESARIO INDIVIDUAL,AM,OUTROS,"TRANSPORTE, ARMAZENAGEM E CORREIO",SERVIÇO,7.093151,5 a 10,...,,,,,,,,,,0
3,3,3348900fe63216a439d2e5238c79ddd46ede454df7b9d8...,True,EMPRESARIO INDIVIDUAL,AM,OUTROS,SERVICOS DIVERSOS,SERVIÇO,6.512329,5 a 10,...,,,,,,,,,,0
4,4,1f9bcabc9d3173c1fe769899e4fac14b053037b953a1e4...,True,EMPRESARIO INDIVIDUAL,RN,OUTROS,"SERVICOS PROFISSIONAIS, TECNICOS E CIENTIFICOS",SERVIÇO,3.2,1 a 5,...,,,,,,,,,,0


In [9]:
#Verificando Quantidade de Colunas e Observações
mercado.shape

(462298, 182)

In [10]:
#Verificando estatisticas
mercado.describe()

Unnamed: 0.1,Unnamed: 0,idade_empresa_anos,vl_total_tancagem,vl_total_veiculos_antt,vl_total_veiculos_leves,vl_total_veiculos_pesados,qt_art,vl_total_veiculos_pesados_grupo,vl_total_veiculos_leves_grupo,vl_total_tancagem_grupo,...,media_meses_servicos,max_meses_servicos,min_meses_servicos,qt_funcionarios,qt_funcionarios_12meses,qt_funcionarios_24meses,tx_crescimento_12meses,tx_crescimento_24meses,tx_rotatividade,qt_filiais
count,462298.0,462298.0,280.0,176.0,30684.0,30684.0,6590.0,460371.0,460371.0,1760.0,...,76261.0,76261.0,76261.0,103574.0,103574.0,103574.0,73888.0,74014.0,103574.0,462298.0
mean,231148.5,9.948677,32.014286,3.818182,2.244329,1.177813,5.769044,3.591801,48.699177,134.597159,...,58.060498,96.661983,36.258851,12.32457,12.178529,14.343329,3.097607,-5.834288,9.510699,28.737044
std,133454.08171,9.615664,81.280168,6.797555,9.572536,6.589059,25.45095,72.600352,1206.696804,683.774506,...,142.951278,279.541243,123.41137,222.456579,222.584458,239.885359,163.581549,443.825819,27.918737,468.626094
min,0.0,0.016438,1.0,0.0,0.0,0.0,1.0,0.0,0.0,1.0,...,1.933333,1.933333,1.933333,0.0,0.0,0.0,-100.0,-100.0,0.0,0.0
25%,115574.25,2.756164,15.0,1.0,0.0,0.0,1.0,0.0,0.0,15.0,...,25.203704,33.333333,6.966667,0.0,0.0,0.0,0.0,-44.444444,0.0,0.0
50%,231148.5,6.70411,15.0,2.0,1.0,0.0,2.0,0.0,0.0,15.0,...,43.533333,61.766667,23.2,2.0,2.0,2.0,0.0,0.0,0.0,0.0
75%,346722.75,14.465753,30.0,4.0,2.0,1.0,4.0,0.0,0.0,66.25,...,68.883333,96.266667,46.5,5.0,5.0,6.0,0.0,0.0,0.0,0.0
max,462297.0,106.432877,1215.0,50.0,489.0,363.0,1017.0,9782.0,122090.0,11922.0,...,5099.066667,5099.066667,5099.066667,51547.0,51547.0,54205.0,27800.0,87300.0,1400.0,9647.0
