# Bibliotecas e base de dados

In [None]:
# Importar as bibliotecas
import pandas as pd
import numpy as np

In [None]:
# Carregar a base de dados
df = pd.read_excel('/content/dados.xlsx', sheet_name='Linchamento (AC)')

In [None]:
df.columns

Index(['id', 'ano', 'mes', 'turno', 'municipio', 'lat', 'lon', 'local',
       'idadeLinchado', 'faixaEtariaLinchado', 'generoLinchado',
       'caracterizacaoLinchado', 'motivacaoLinchamento',
       'motivacaoLinchamentoResumo', 'instrumentoLinchado',
       'instrumentoLinchadoResumo', 'vitimaLinchado', 'vitimaLinchadoResumo',
       'linchadores', 'linchadoresResumo', 'linchamento', 'linchamentoResumo',
       'objetoLinchamento', 'objetoLinchamentoResumo', 'morte', 'temMorte',
       'policia', 'imagem', 'racaLinchado', 'jornal', 'qtdLinchado'],
      dtype='object')

# Tabelas

### Número de casos de linchamento relatados nos últimos dez anos nos jornais Imirante, G1, O Imparcial	e Jornal Pequeno

In [None]:
# Casos por ano
casosAno = df.groupby(['ano']).agg({'id':'count'})
casosAno

Unnamed: 0_level_0,id
ano,Unnamed: 1_level_1
2012,1
2013,8
2014,17
2015,25
2016,11
2017,24
2018,13
2019,11
2020,12
2021,15


In [None]:
# Estatísticas descritivas (casos por ano)
casosAno.describe().round(2)

Unnamed: 0,id
count,11.0
mean,12.73
std,7.5
min,1.0
25%,9.5
50%,12.0
75%,16.0
max,25.0


In [None]:
# Linchados por ano
linchadosAno = df.groupby(['ano']).agg({'qtdLinchado': sum})
linchadosAno

Unnamed: 0_level_0,qtdLinchado
ano,Unnamed: 1_level_1
2012,1
2013,10
2014,25
2015,28
2016,12
2017,27
2018,13
2019,13
2020,13
2021,20


In [None]:
# Mortes por ano
mortesAno = df.pivot_table(values = 'id', index = 'ano', columns = 'temMorte', aggfunc = 'count', fill_value=0,                   
               margins=True, margins_name='Total'
               )
mortesAno['Sim']

ano
2012      0
2013      3
2014      6
2015      6
2016      8
2017      7
2018      5
2019      1
2020      4
2021      8
2022      1
Total    49
Name: Sim, dtype: int64

###Zonas e locais de maior incidência de linchamento em Manaus


In [None]:
# Casos por municípios
municipios = df.groupby(['municipio']).agg({'id': 'count'})
municipios.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
municipio,Unnamed: 1_level_1
São Luís,112
Paço do Lumiar,13
São José de Ribamar,13
Raposa,2


In [None]:
# Casos por local
local = df.groupby(['local']).agg({'id': 'count'})
local.sort_values(by='id', ascending= False).head(10)

Unnamed: 0_level_0,id
local,Unnamed: 1_level_1
Centro,9
Cidade Operária,8
São Raimundo,5
Maiobão,5
Forquilha,4
Vila Luizão,4
Cohab,4
São Cristóvão,4
Jardim São Cristóvão,3
Anil,3


### Quando acontece o linchamento (mês e turno)?


In [None]:
# Casos por mês
mes= df.groupby(['mes']).agg({'id': 'count'})
mes

Unnamed: 0_level_0,id
mes,Unnamed: 1_level_1
1,16
2,9
3,17
4,11
5,3
6,10
7,23
8,10
9,16
10,11


In [None]:
# Casos por turno
turno= df.groupby(['turno']).agg({'id': 'count'})
turno.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
turno,Unnamed: 1_level_1
Não informado,54
Noturno,44
Matutino,23
Vespertino,19


### Perfil do linchado (raça, gênero, faixa etária e caracterização) 


In [None]:
df2 = pd.read_excel('/content/dados.xlsx', sheet_name='Perfil do linchado')

In [None]:
# Quantidade de casos por raça
racaLinchado = df2.groupby(['racaLinchado']).agg({'id': 'count'})
racaLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
racaLinchado,Unnamed: 1_level_1
Não informada,98
Pardo,40
Preto,25
Branco,6


In [None]:
# Quantidade de casos por gênero
generoLinchado = df2.groupby(['generoLinchado']).agg({'id': 'count'})
generoLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
generoLinchado,Unnamed: 1_level_1
M,161
F,8


In [None]:
# Quantidade de casos por faixa etária
faixaEtariaLinchado = df2.groupby(['faixaEtariaLinchado']).agg({'id': 'count'})
faixaEtariaLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
faixaEtariaLinchado,Unnamed: 1_level_1
Não informado,75
Jovem (18 até 29),53
Adolescente (até 17),21
Adulto (30 até 59),16
Idoso (mais de 59),4


In [None]:
# Quantidade de casos de acordo com a caracterização
caracterizacaoLinchado = df2.groupby(['caracterizacaoLinchado']).agg({'id': 'count'})
caracterizacaoLinchado.sort_values(by='id', ascending= False).head(10)

Unnamed: 0_level_0,id
caracterizacaoLinchado,Unnamed: 1_level_1
Homem,57
Suspeito,31
Assaltante,13
Adolescente,9
Jovem,8
Não informado,7
Vítima,6
Estudante,5
Mulher,5
Dupla,4


### Elementos que levaram ao linchamento (evento, arma e vítima)

In [None]:
# Número de casos por motivação 
gatilho= df.groupby(['motivacaoLinchamentoResumo']).agg({'id': 'count'})
gatilho.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
motivacaoLinchamentoResumo,Unnamed: 1_level_1
Roubo,84
Não informado,11
Suspeito,9
Mista,7
Crime Organizado,5
Estupro,5
Furto,4
Lesão corporal,4
Homicídio,3
Tentativa de crime,3


In [None]:
# Número de casos por arma
armaLinchado= df.groupby(['instrumentoLinchadoResumo']).agg({'id': 'count'})
armaLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
instrumentoLinchadoResumo,Unnamed: 1_level_1
Não informado,95
Arma de fogo,15
Faca,13
Simulacro,9
Arma de fabricação caseira,2
Carro,1
Desarmado,1
Facão,1
Mista,1
Simulou estar armado,1


In [None]:
# Número de casos por vítima
vitimaLinchado= df.groupby(['vitimaLinchadoResumo']).agg({'id': 'count'})
vitimaLinchado.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
vitimaLinchadoResumo,Unnamed: 1_level_1
Não informado,56
Indivíduo,43
Múltiplas,11
Passageiros,8
Residência,6
Estabelecimento Comercial,5
Trabalhador em atividade,5
Familiares,3
Bombeiros,1
Comerciante,1


### Quem comete o linchamento? 

In [None]:
# Número de casos por linchadores
linchadores = df.groupby(['linchadoresResumo']).agg({'id': 'count'})
linchadores.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
linchadoresResumo,Unnamed: 1_level_1
População,76
Múltiplos,24
Moradores,13
Faccionados,9
Não informado,7
Passageiros,2
Tribunal do Crime,2
Bombeiros,1
Funcionários,1
Indivíduo,1


### Como acontece o linchamento?

In [None]:
# Número de casos por "tipo"
linchamentoResumo= df.groupby(['linchamentoResumo']).agg({'id': 'count'})
linchamentoResumo.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
linchamentoResumo,Unnamed: 1_level_1
Espancamento,66
Espancamento com auxílio de objetos,49
Tentativa,12
Amarrou/Espancamento,6
Amarrado,2
Agressão/espancamento com auxílio de objetos,1
Amarrou/Espancamento com auxílio de objetos,1
Amarrou/atirou,1
Tiros,1
Tortura,1


In [None]:
# Número de casos por objetos utilizados
objetoResumo= df.groupby(['objetoLinchamentoResumo']).agg({'id': 'count'})
objetoResumo.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
objetoLinchamentoResumo,Unnamed: 1_level_1
Não informado,92
Múltiplo,18
Pedaço de madeira,11
Arma de fogo,6
Pedras,4
Corda,3
Faca,3
Cadeira,1
Telha,1
Urtiga,1


### Presença e atuação da polícia

In [None]:
# Número de mortes conforme a presença e atuação da polícia
policia = df.pivot_table(values = 'id', index = 'policia', columns = 'temMorte', aggfunc = 'count', fill_value=0,                   
               margins=True, margins_name='Total'
               )

policia

temMorte,Não,Não Informado,Sim,Total
policia,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
Ausente,28,3,40,71
Presente e conivente,3,0,1,4
Presente e reagindo,57,0,8,65
Total,88,3,49,140


### Como a mídia noticia os casos de linchamento? 

In [None]:
# Número de notícias por jornal
jornal= df.groupby(['jornal']).agg({'id': 'count'})
jornal.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
jornal,Unnamed: 1_level_1
Imirante,60
G1,34
O Imparcial,24
Jornal Pequeno,22


In [None]:
# Número de notícias com imagens
imagem= df.groupby(['imagem']).agg({'id': 'count'})
imagem.sort_values(by='id', ascending= False)

Unnamed: 0_level_0,id
imagem,Unnamed: 1_level_1
Não,77
Sim,61
Não,2
