# Bibliotecas e base de dados

In [None]:
# Importar as bibliotecas
import pandas as pd
import numpy as np

In [None]:
# Carregar a base de dados
df = pd.read_excel('/content/dados.xlsx', sheet_name='Linchamento (AC)')

# Tabelas

### Número de casos, número de pessoas linchadas e número de mortes relatados nos últimos dez anos nos jornais A CRÍTICA, D24am, DEZ MINUTOS, PORTAL DO HOLANDA, EM TEMPO

In [None]:
# Casos por ano
casosAno = df.groupby(['ano']).agg({'id':'count'})
casosAno

Unnamed: 0_level_0,id
ano,Unnamed: 1_level_1
2010.0,2
2011.0,5
2012.0,7
2013.0,1
2014.0,11
2015.0,23
2016.0,25
2017.0,67
2018.0,82
2019.0,74


In [None]:
# Estatísticas descritivas (casos por ano)
casosAno.describe().round(2)

Unnamed: 0,id
count,11.0
mean,34.91
std,34.94
min,1.0
25%,6.0
50%,23.0
75%,70.5
max,87.0


In [None]:
# Linchados por ano
linchadosAno = df.groupby(['ano']).agg({'qtdLinchado': sum})
linchadosAno

Unnamed: 0_level_0,qtdLinchado
ano,Unnamed: 1_level_1
2010.0,3.0
2011.0,5.0
2012.0,8.0
2013.0,1.0
2014.0,11.0
2015.0,24.0
2016.0,27.0
2017.0,75.0
2018.0,98.0
2019.0,91.0


In [None]:
# Mortes por ano
mortesAno = df.pivot_table(values = 'id', index = 'ano', columns = 'morte', aggfunc = 'count', fill_value=0,                   
               margins=True, margins_name='Total'
               )
mortesAno['Sim']

ano
2010.0      0
2011.0      4
2012.0      2
2013.0      1
2014.0      4
2015.0     12
2016.0     16
2017.0     26
2018.0     30
2019.0     20
2020.0     30
Total     145
Name: Sim, dtype: int64

###Zonas e locais de maior incidência de linchamento em Manaus


In [None]:
# Casos por zonas
zonas = df.groupby(['zona']).agg({'id': 'count'})
zonas.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
zona,Unnamed: 1_level_1
Norte,120
Leste,114
Sul,76
Oeste,35
Centro-Sul,20
Centro-Oeste,9
Não informado,9
Rural,1


In [None]:
# Casos por local
local = df.groupby(['local']).agg({'id': 'count'})
local.sort_values(by='id', ascending= False).head(10)

Unnamed: 0_level_0,id
local,Unnamed: 1_level_1
Centro,29
Jorge Teixeira,28
Cidade Nova,18
Cidade de Deus,17
São José,16
Nova Cidade,11
Tarumã,11
Não informado,10
Monte das Oliveiras,9
Tancredo Neves,9


### Quando acontece o linchamento (mês e turno)?


In [None]:
# Casos por mês
mes= df.groupby(['mes']).agg({'id': 'count'})
mes

Unnamed: 0_level_0,id
mes,Unnamed: 1_level_1
1.0,29
2.0,16
3.0,38
4.0,24
5.0,27
6.0,44
7.0,45
8.0,32
9.0,36
10.0,30


In [None]:
# Casos por turno
turno= df.groupby(['turno']).agg({'id': 'count'})
turno.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
turno,Unnamed: 1_level_1
Noturno,162
Vespertino,76
Matutino,70
Não Informado,51
Madrugada,25


### Perfil do linchado (raça, gênero, faixa etária e profissão) 


In [None]:
df2 = pd.read_excel('/content/dados.xlsx', sheet_name='Perfil do linchado')

In [None]:
# Quantidade de casos por raça
racaLinchado = df2.groupby(['racaLinchado']).agg({'id': 'count'})
racaLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
racaLinchado,Unnamed: 1_level_1
Não informada,239
Pardo,99
Dúvida,76
Preto,20
Branco,4
Indígena,1
preto,1


In [None]:
# Quantidade de casos por gênero
generoLinchado = df2.groupby(['generoLinchado']).agg({'id': 'count'})
generoLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
generoLinchado,Unnamed: 1_level_1
Masculino,408
Não informado,24
Feminino,8


In [None]:
# Quantidade de casos por faixa etária
faixaEtariaLinchado = df2.groupby(['faixaEtariaLinchado']).agg({'id': 'count'})
faixaEtariaLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
faixaEtariaLinchado,Unnamed: 1_level_1
Não informado,185
Jovem (18 até 29),147
Adulto (30 até 59),75
Adolescente (até 17),31
Não Informado,2


In [None]:
# Quantidade de casos por profissão
profissaoLinchado = df2.groupby(['profissaoLinchado']).agg({'id': 'count'})
profissaoLinchado.sort_values(by='id', ascending= False).head(10)

Unnamed: 0_level_0,id
profissaoLinchado,Unnamed: 1_level_1
Não informado,185
Autônomo,7
Estudante,6
Detento em regime semiaberto,4
Ex-presidiário,4
Mototaxista,3
Ajudante de pedreiro,3
Industriário,3
Usuário de drogas,3
Catador de recicláveis,2


### Elementos que levaram ao linchamento (evento, arma e vítima)

In [None]:
# Número de casos por motivação 
gatilho= df.groupby(['motivacaoLinchamentoResumo']).agg({'id': 'count'})
gatilho.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
motivacaoLinchamentoResumo,Unnamed: 1_level_1
Roubo,147
Suspeito,62
Tentativa de Crime,53
Não informado,47
Mista,20
Desentendimento,14
Estupro,10
Homicídio,9
Agressão,3
Furto,3


In [None]:
# Número de casos por arma
armaLinchado= df.groupby(['armaLinchadoResumo']).agg({'id': 'count'})
armaLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
armaLinchadoResumo,Unnamed: 1_level_1
Não informado,271
Arma de fogo,45
Arma branca,35
Simulacro,27
Mista,6


In [None]:
# Número de casos por vítima
vitimaLinchado= df.groupby(['vitimaLinchadoResumo']).agg({'id': 'count'})
vitimaLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
vitimaLinchadoResumo,Unnamed: 1_level_1
Não informado,173
Indivíduo,107
Trabalhador em atividade,33
Passageiros,19
Múltiplas,18
Estabelecimento,9
Familiares,7
Comerciante,5
Pedestre,4
Residência,4


### Quem comete o linchamento? 

In [None]:
# Número de casos por linchadores
linchadores = df.groupby(['linchadoresResumo']).agg({'id': 'count'})
linchadores.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
linchadoresResumo,Unnamed: 1_level_1
População,215
Moradores,63
Múltiplos,51
Passageiros,16
Não informado,8
Vizinhos,6
Agressores,5
Suspeitos,4
Assassinos,3
Condutores,3


### Como acontece o linchamento?

In [None]:
# Número de casos por "tipo"
linchamentoResumo= df.groupby(['linchamentoResumo']).agg({'id': 'count'})
linchamentoResumo.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
linchamentoResumo,Unnamed: 1_level_1
Espancamento,232
Espancamento com auxílio de objetos,54
Agressão/espancamento com objetos,44
Espancamento e arma branca,18
Espancamento e arma de fogo,16
Agressão/espancamento com objetos e arma de fogo,6
Espancamento/Apedrejamento,4
Agressão/espancamento com objetos e arma branca,3
Arma de fogo,1
Espancamento com objetos e arma branca,1


In [None]:
# Número de casos por objetos utilizados
objetoResumo= df.groupby(['objetoLinchamentoResumo']).agg({'id': 'count'})
objetoResumo.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
objetoLinchamentoResumo,Unnamed: 1_level_1
Não informado,260
Pedaços de madeira,59
Múltiplo,46
Pedras,8
Faca,3
Barra de ferro,2
Bicicleta,1
Capacete de moto,1
Carro,1
Equipamento,1


### Presença e atuação da polícia

In [None]:
# Número de mortes conforme a presença e atuação da polícia
policia = df.pivot_table(values = 'id', index = 'policia', columns = 'morte', aggfunc = 'count', fill_value=0,                   
               margins=True, margins_name='Total'
               )

policia

morte,Não,Não informado,Sim,Total
policia,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Ausente,8,0,11,19
Não informado,48,1,78,127
Prensente e reagindo,1,0,0,1
Presente e conivente,2,0,0,2
Presente e impotente,23,0,48,71
Presente e reagindo,156,0,8,164
Total,238,1,145,384


### Como a mídia noticia os casos de linchamento? 

In [None]:
# Número de notícias por jornal
jornal= df.groupby(['jornal']).agg({'id': 'count'})
jornal.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
jornal,Unnamed: 1_level_1
emtempo,168
D24am,114
Portal do Holanda,62
Acrítica,40


In [None]:
# Número de notícias com imagens
imagem= df.groupby(['imagem']).agg({'id': 'count'})
imagem.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
imagem,Unnamed: 1_level_1
Sim,190
Nenhuma,169
Não informado,25
