# MVP - Análise Exploratória de Dados - NYC Collisions 2023

## 1. Definição do Problema

Este projeto tem como objetivo realizar uma análise exploratória detalhada do dataset de colisões de trânsito na cidade de Nova York, com foco na identificação de padrões, tendências e possíveis insights para apoio na tomada de decisão.

## 2. Premissas e Hipóteses

- Hipótese 1: Determinados bairros possuem maior número de acidentes.
- Hipótese 2: Existe correlação entre condições climáticas e volume de acidentes.
- Hipótese 3: Certos dias da semana concentram maior número de ocorrências.

## 3. Descrição do Dataset

**Fonte:** NYC Open Data (simulado para fins acadêmicos)

**Link:** [NYC_Collisions_2023.csv](https://raw.githubusercontent.com/RobertoSacoman/Estudos/main/NYC_Collisions_2023.csv)

### Principais Atributos:
- Date
- Borough
- Street Name
- Persons Injured
- Persons Killed
- Contributing Factor
- Vehicle Type

### Leitura Inicial dos Dados:

In [None]:
import pandas as pd
url = 'https://raw.githubusercontent.com/RobertoSacoman/Estudos/main/NYC_Collisions_2023.csv'
df = pd.read_csv(url)
df.head()

## 4. Análise Exploratória de Dados (EDA)

### 4.1 Estatísticas Descritivas

In [None]:
df.describe(include='all')

### 4.2 Tipos de Dados

In [None]:
df.dtypes

### 4.3 Análise de Valores Nulos

In [None]:
df.isnull().sum()

### 4.4 Análise de Outliers

In [None]:
import matplotlib.pyplot as plt
import seaborn as sns
sns.boxplot(data=df[['Persons Injured', 'Persons Killed']])
plt.show()

### 4.5 Análise de Distribuição das Variáveis

In [None]:
df['Borough'].value_counts().plot(kind='bar')
plt.title('Distribuição por Borough')
plt.show()

## 5. Pré-processamento de Dados

### 5.1 Tratamento de Valores Faltantes

### 5.2 Normalização / Padronização

### 5.3 Codificação de Variáveis Categóricas

### 5.4 Feature Engineering (se aplicável)

In [None]:
df_clean = df.dropna(subset=['Borough'])
df_clean.shape

## 6. Novas Análises Pós-Tratamento (Opcional)

In [None]:
# Exemplo: Nova análise após pré-processamento

## 7. Conclusões Finais

- Principais insights observados.
- Possíveis recomendações.
- Limitações da análise.
- Próximos passos sugeridos.