In [5]:
# To support both python 2 and python 3
from __future__ import division, print_function, unicode_literals

# Common imports
import numpy as np
import os

# to make this notebook's output stable across runs
np.random.seed(42)

# To plot pretty figures
%matplotlib inline
import matplotlib
import matplotlib.pyplot as plt
plt.rcParams['axes.labelsize'] = 14
plt.rcParams['xtick.labelsize'] = 12
plt.rcParams['ytick.labelsize'] = 12

# Where to save the figures
PROJECT_ROOT_DIR = "."
CHAPTER_ID = "end_to_end_project"
IMAGES_PATH = os.path.join(PROJECT_ROOT_DIR, "images", CHAPTER_ID)

def save_fig(fig_id, tight_layout=True, fig_extension="png", resolution=300):
    path = os.path.join(IMAGES_PATH, fig_id + "." + fig_extension)
    print("Saving figure", fig_id)
    if tight_layout:
        plt.tight_layout()
    plt.savefig(path, format=fig_extension, dpi=resolution)

# Ignore useless warnings (see SciPy issue #5998)
import warnings
warnings.filterwarnings(action="ignore", module="scipy", message="^internal gelsd")

In [6]:
import pandas as pd

def carregar_dados_abate():
    return pd.read_csv('../input/DadosCompleto.csv', encoding='UTF-8', delimiter='\t')

dados_abate = carregar_dados_abate()
dados_abate.head()

Unnamed: 0,estabelecimento_identificador,identificador_lote,identificador_lote_situacao_lote,identificador_lote_numero_animal,eh_novilho_precoce,classificador,tipificacao,maturidade,acabamento,peso,...,SUPLEMENTAÇÃO A CAMPO - FORNECIMENTO ESTRATÉGICO DE SILAGEM OU FENO,suplementacao_a_campo_proteico,suplementacao_a_campo_proteico_energetico,suplementacao_a_campo_sal_mineral,suplementacao_a_campo_sal_mineral_ureia,fertirrigacao,ifp,ilp,ilpf,nenhum
0,1,20703,INCENTIVADO,1009,SIM,2459,Macho INTEIRO,Dois dentes,Gordura Mediana - acima de 3 a até 6 mm de esp...,385.0,...,SIM,SIM,SIM,SIM,SIM,SIM,NÃO,SIM,NÃO,NÃO
1,1,20703,INCENTIVADO,959,SIM,2459,Macho INTEIRO,Dois dentes,Gordura Escassa - 1 a 3 mm de espessura,336.5,...,SIM,SIM,SIM,SIM,SIM,SIM,NÃO,SIM,NÃO,NÃO
2,1,20703,INCENTIVADO,958,SIM,2459,Macho INTEIRO,Dente de leite,Gordura Mediana - acima de 3 a até 6 mm de esp...,371.0,...,SIM,SIM,SIM,SIM,SIM,SIM,NÃO,SIM,NÃO,NÃO
3,1,20703,INCENTIVADO,957,SIM,2459,Macho INTEIRO,Dente de leite,Gordura Mediana - acima de 3 a até 6 mm de esp...,370.5,...,SIM,SIM,SIM,SIM,SIM,SIM,NÃO,SIM,NÃO,NÃO
4,1,20703,INCENTIVADO,956,SIM,2459,Macho INTEIRO,Dente de leite,Gordura Escassa - 1 a 3 mm de espessura,336.0,...,SIM,SIM,SIM,SIM,SIM,SIM,NÃO,SIM,NÃO,NÃO


In [9]:
dados_abate.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 464463 entries, 0 to 464462
Data columns (total 50 columns):
estabelecimento_identificador                                            464463 non-null int64
identificador_lote                                                       464463 non-null int64
identificador_lote_situacao_lote                                         464463 non-null object
identificador_lote_numero_animal                                         464463 non-null int64
eh_novilho_precoce                                                       464463 non-null object
classificador                                                            464463 non-null int64
tipificacao                                                              464463 non-null object
maturidade                                                               464463 non-null object
acabamento                                                               464463 non-null object
peso                         

In [11]:
dados_abate['tipificacao'].value_counts

<bound method IndexOpsMixin.value_counts of 0          Macho INTEIRO
1          Macho INTEIRO
2          Macho INTEIRO
3          Macho INTEIRO
4          Macho INTEIRO
5          Macho INTEIRO
6          Macho INTEIRO
7          Macho INTEIRO
8          Macho INTEIRO
9          Macho INTEIRO
10         Macho INTEIRO
11         Macho INTEIRO
12         Macho INTEIRO
13         Macho INTEIRO
14         Macho INTEIRO
15         Macho INTEIRO
16         Macho INTEIRO
17         Macho INTEIRO
18         Macho INTEIRO
19         Macho INTEIRO
20         Macho INTEIRO
21         Macho INTEIRO
22         Macho INTEIRO
23         Macho INTEIRO
24         Macho INTEIRO
25         Macho INTEIRO
26         Macho INTEIRO
27         Macho INTEIRO
28         Macho INTEIRO
29         Macho INTEIRO
               ...      
464433             Fêmea
464434             Fêmea
464435    Macho CASTRADO
464436    Macho CASTRADO
464437    Macho CASTRADO
464438    Macho CASTRADO
464439     Macho INTEIRO
464440

In [12]:
dados_abate['tipificacao'].value_counts()

Macho INTEIRO     199430
Fêmea             154094
Macho CASTRADO    110939
Name: tipificacao, dtype: int64

In [13]:
dados_abate['maturidade'].value_counts()

Dois dentes       223546
Dente de leite    171678
Quatro dentes      69239
Name: maturidade, dtype: int64

In [14]:
dados_abate['acabamento'].value_counts()

Gordura Mediana - acima de 3 a até 6 mm de espessura      259207
Gordura Escassa - 1 a 3 mm de espessura                   174516
Gordura Uniforme - acima de 6 e até 10 mm de espessura     30740
Name: acabamento, dtype: int64