In [1]:
# importar biblioteca pandas
import pandas as pd

In [2]:
sergipe_df = pd.read_csv('DNSE2017.csv', encoding='utf-8', dtype=str)
sergipe_df.head(3)

Unnamed: 0,contador,ORIGEM,CODESTAB,CODMUNNASC,LOCNASC,IDADEMAE,ESTCIVMAE,ESCMAE,CODOCUPMAE,QTDFILVIVO,...,TPFUNCRESP,TPDOCRESP,DTDECLARAC,ESCMAEAGR1,STDNEPIDEM,STDNNOVA,CODPAISRES,TPROBSON,PARIDADE,KOTELCHUCK
0,1,1,2415631,230440,1,24,2,4,999992,1.0,...,,0,,12,0,1,,5,1,9
1,2,1,2005050,270030,1,34,5,4,622020,3.0,...,,3,5042017.0,6,0,1,,3,1,3
2,3,1,2005050,270030,1,19,2,4,622020,,...,,3,3042017.0,6,0,1,,11,0,5


In [3]:
sergipe_df.columns

Index(['contador', 'ORIGEM', 'CODESTAB', 'CODMUNNASC', 'LOCNASC', 'IDADEMAE',
       'ESTCIVMAE', 'ESCMAE', 'CODOCUPMAE', 'QTDFILVIVO', 'QTDFILMORT',
       'CODMUNRES', 'GESTACAO', 'GRAVIDEZ', 'PARTO', 'CONSULTAS', 'DTNASC',
       'HORANASC', 'SEXO', 'APGAR1', 'APGAR5', 'RACACOR', 'PESO', 'IDANOMAL',
       'DTCADASTRO', 'CODANOMAL', 'NUMEROLOTE', 'VERSAOSIST', 'DTRECEBIM',
       'DIFDATA', 'DTRECORIGA', 'NATURALMAE', 'CODMUNNATU', 'CODUFNATU',
       'ESCMAE2010', 'SERIESCMAE', 'DTNASCMAE', 'RACACORMAE', 'QTDGESTANT',
       'QTDPARTNOR', 'QTDPARTCES', 'IDADEPAI', 'DTULTMENST', 'SEMAGESTAC',
       'TPMETESTIM', 'CONSPRENAT', 'MESPRENAT', 'TPAPRESENT', 'STTRABPART',
       'STCESPARTO', 'TPNASCASSI', 'TPFUNCRESP', 'TPDOCRESP', 'DTDECLARAC',
       'ESCMAEAGR1', 'STDNEPIDEM', 'STDNNOVA', 'CODPAISRES', 'TPROBSON',
       'PARIDADE', 'KOTELCHUCK'],
      dtype='object')

In [4]:
# Transformar em dados quantitativos continuos - medições
sergipe_df['PESO'] = pd.to_numeric(sergipe_df['PESO'])
sergipe_df['IDADEMAE'] = pd.to_numeric(sergipe_df['IDADEMAE'])
sergipe_df['IDADEPAI'] = pd.to_numeric(sergipe_df['IDADEPAI'])
sergipe_df['APGAR1'] = pd.to_numeric(sergipe_df['APGAR1'])
sergipe_df['APGAR5'] = pd.to_numeric(sergipe_df['APGAR5'])

In [5]:
# Transformar em dados quantitativos discretos - contagem

sergipe_df['QTDFILVIVO'] = pd.to_numeric(sergipe_df['QTDFILVIVO']).astype(pd.Int64Dtype())
sergipe_df['QTDFILMORT'] = pd.to_numeric(sergipe_df['QTDFILMORT']).astype(pd.Int64Dtype())
sergipe_df['SEMAGESTAC'] = pd.to_numeric(sergipe_df['SEMAGESTAC']).astype(pd.Int64Dtype())
sergipe_df['CONSPRENAT'] = pd.to_numeric(sergipe_df['CONSPRENAT']).astype(pd.Int64Dtype())
sergipe_df['SERIESCMAE'] = pd.to_numeric(sergipe_df['SERIESCMAE']).astype(pd.Int64Dtype())
sergipe_df['QTDPARTNOR'] = pd.to_numeric(sergipe_df['QTDPARTNOR']).astype(pd.Int64Dtype())
sergipe_df['QTDGESTANT'] = pd.to_numeric(sergipe_df['QTDGESTANT']).astype(pd.Int64Dtype())

In [62]:
# Filtrando dados

# parto normal
normal = sergipe_df[sergipe_df.PARTO == '1']
cesarea = sergipe_df[sergipe_df.PARTO == '2']

#pre natal
pre_natal_0 = sergipe_df[sergipe_df.CONSULTAS == '1']
pre_natal_1_3 = sergipe_df[sergipe_df.CONSULTAS == '2']
pre_natal_4_6 = sergipe_df[sergipe_df.CONSULTAS == '3']
pre_natal_7 = sergipe_df[sergipe_df.CONSULTAS == '4']

# gravidez
gravidez_1 = sergipe_df[sergipe_df.GRAVIDEZ == '1']
gravidez_2 = sergipe_df[sergipe_df.GRAVIDEZ == '2']
gravidez_3 = sergipe_df[sergipe_df.GRAVIDEZ == '3']

#escolaridade
escolaridade_0 = sergipe_df[sergipe_df.ESCMAE == '1']
escolaridade_1_3 = sergipe_df[sergipe_df.ESCMAE == '2']
escolaridade_4_7 = sergipe_df[sergipe_df.ESCMAE == '3']
escolaridade_8_11 = sergipe_df[sergipe_df.ESCMAE == '4']
escolaridade_12 = sergipe_df[sergipe_df.ESCMAE == '5']

In [63]:
# Compare as idades das mães que fizeram cesárea e das mães que fizeram parto normal


media_normal = normal.IDADEMAE.mean()
media_cesarea = cesarea.IDADEMAE.mean()

media_normal, media_cesarea

(24.98357030015798, 27.634743425919698)

In [64]:
# Desvio Padrão

dp_normal = normal.IDADEMAE.std(ddof=0)
dp_cesarea = cesarea.IDADEMAE.std(ddof=0)

dp_normal, dp_cesarea

(6.7129470762335846, 6.73197416774477)

In [65]:
# Coeficiente da variação

cv_normal = (dp_normal/media_normal) * 100
cv_cesarea = (dp_cesarea/media_cesarea) * 100
cv_normal, cv_cesarea

(26.86944658262529, 24.360545216535613)

In [66]:
# Quartis

q_normal = normal.IDADEMAE.quantile([0.25, 0.75]).values
q_cesarea = cesarea.IDADEMAE.quantile([0.25, 0.75]).values
iqr_normal = q_normal[1] - q_normal[0]
iqr_cesarea = q_cesarea[1] - q_cesarea[0]
iqr_normal, iqr_cesarea

(10.0, 11.0)

In [67]:
#Compare o peso da criança ao nascer das mães que fizeram cesárea e das mães que fizeram parto normal

peso_media_normal = normal.PESO.mean()
peso_media_cesarea = cesarea.PESO.mean()

peso_normal, peso_cesarea

(3192.6047932578354, 3262.2962539511736)

In [68]:
# Desvio Padrão

dp_peso_normal = normal.PESO.std(ddof=0)
dp_peso_cesarea = cesarea.PESO.std(ddof=0)

dp_peso_normal, dp_peso_cesarea

(555.2773218627556, 598.5772249226243)

In [69]:
# Coeficiente da variação

cv_peso_normal = (dp_peso_normal/peso_media_normal) * 100
cv_peso_cesarea = (dp_peso_cesarea/peso_media_cesarea) * 100
cv_peso_normal, cv_peso_cesarea

(17.392610668110066, 18.348340503951764)

In [70]:
# Quartis

q_peso_normal = normal.PESO.quantile([0.25, 0.75]).values
q_peso_cesarea = cesarea.PESO.quantile([0.25, 0.75]).values
iqr_peso_normal = q_peso_normal[1] - q_peso_normal[0]
iqr_peso_cesarea = q_peso_cesarea[1] - q_peso_cesarea[0]
iqr_peso_normal, iqr_peso_cesarea

(610.0, 678.0)

In [71]:
#Compare o peso da criança ao nascer para as diferentes categorias de consultas pré-natal

peso_prenatal_1 = pre_natal_0.PESO.mean()
peso_prenatal_2 = pre_natal_1_3.PESO.mean()
peso_prenatal_3 = pre_natal_4_6.PESO.mean()
peso_prenatal_4 = pre_natal_7.PESO.mean()

peso_prenatal_1, peso_prenatal_2, peso_prenatal_3, peso_prenatal_4


(3085.7057142857143, 3022.836124401914, 3166.4481224417154, 3295.601250066211)

In [72]:
# Desvio Padrão

dp_peso_prenatal_1 = pre_natal_0.PESO.std(ddof=0)
dp_peso_prenatal_2 = pre_natal_1_3.PESO.std(ddof=0)
dp_peso_prenatal_3 = pre_natal_4_6.PESO.std(ddof=0)
dp_peso_prenatal_4 = pre_natal_7.PESO.std(ddof=0)

dp_peso_prenatal_1, dp_peso_prenatal_2, dp_peso_prenatal_3, dp_peso_prenatal_4

(675.3546638377106, 765.3629924592174, 600.658283903296, 500.7320838006726)

In [73]:
# Coeficiente da variação

cv_peso_prenatal_1 = (dp_peso_prenatal_1/peso_prenatal_1) * 100
cv_peso_prenatal_2 = (dp_peso_prenatal_2/peso_prenatal_2) * 100
cv_peso_prenatal_3 = (dp_peso_prenatal_3/peso_prenatal_3) * 100
cv_peso_prenatal_4 = (dp_peso_prenatal_4/peso_prenatal_4) * 100

cv_peso_prenatal_1, cv_peso_prenatal_2, cv_peso_prenatal_3, cv_peso_prenatal_4

(21.886554531466174, 25.31936767199542, 18.9694654918305, 15.193952356663676)

In [74]:
# Quartis

q_peso_prenatal_1 = pre_natal_0.PESO.quantile([0.25, 0.75]).values
q_peso_prenatal_2 = pre_natal_1_3.PESO.quantile([0.25, 0.75]).values
q_peso_prenatal_3 = pre_natal_4_6.PESO.quantile([0.25, 0.75]).values
q_peso_prenatal_4 = pre_natal_7.PESO.quantile([0.25, 0.75]).values

iqr_peso_prenatal_1 = q_peso_prenatal_1[1] - q_peso_prenatal_1[0]
iqr_peso_prenatal_2 = q_peso_prenatal_2[1] - q_peso_prenatal_2[0]
iqr_peso_prenatal_3 = q_peso_prenatal_3[1] - q_peso_prenatal_3[0]
iqr_peso_prenatal_4 = q_peso_prenatal_4[1] - q_peso_prenatal_4[0]

iqr_peso_prenatal_1, iqr_peso_prenatal_2, iqr_peso_prenatal_3, iqr_peso_prenatal_4



(718.0, 737.0, 670.0, 610.0)

In [75]:
#Compare quantidade de filhos vivos e mortos em relação ao tipo de gravidez (única, dupla, tripla ou mais)

# Filhos vivos:

vivos_gravidez_1 = gravidez_1.QTDFILVIVO.mean()
vivos_gravidez_2 = gravidez_2.QTDFILVIVO.mean()
vivos_gravidez_3 = gravidez_3.QTDFILVIVO.mean()

# Filhos mortos:

mortos_gravidez_1 = gravidez_1.QTDFILMORT.mean()
mortos_gravidez_2 = gravidez_2.QTDFILMORT.mean()
mortos_gravidez_3 = gravidez_3.QTDFILMORT.mean()

print(vivos_gravidez_1, mortos_gravidez_1)
print(vivos_gravidez_2, mortos_gravidez_2)
print(vivos_gravidez_3, mortos_gravidez_3)


1.121665538253216 0.3096697499907129
1.197749196141479 0.3501683501683502
0.8333333333333334 0.2222222222222222


In [76]:
# Desvio Padrão

# Filhos vivos:

dp_vivos_gravidez_1 = gravidez_1.QTDFILVIVO.std(ddof=0)
dp_vivos_gravidez_2 = gravidez_2.QTDFILVIVO.std(ddof=0)
dp_vivos_gravidez_3 = gravidez_3.QTDFILVIVO.std(ddof=0)

# Filhos mortos:

dp_mortos_gravidez_1 = gravidez_1.QTDFILMORT.std(ddof=0)
dp_mortos_gravidez_2 = gravidez_2.QTDFILMORT.std(ddof=0)
dp_mortos_gravidez_3 = gravidez_3.QTDFILMORT.std(ddof=0)


print(dp_vivos_gravidez_1, dp_mortos_gravidez_1)
print(dp_vivos_gravidez_2, dp_mortos_gravidez_2)
print(dp_vivos_gravidez_3, dp_mortos_gravidez_3)

1.4171157790369837 0.6470016447822083
1.4066201132093932 0.6528427646546483
1.863389981249825 0.41573970964154905


In [77]:
# Coeficiente da variação

# Filhos vivos:

cv_vivos_gravidez_1 = (dp_vivos_gravidez_1/vivos_gravidez_1) * 100
cv_vivos_gravidez_2 = (dp_vivos_gravidez_2/vivos_gravidez_2) * 100
cv_vivos_gravidez_3 = (dp_vivos_gravidez_3/vivos_gravidez_3) * 100

# Filhos mortos:

cv_mortos_gravidez_1 = (dp_mortos_gravidez_1/mortos_gravidez_1) * 100
cv_mortos_gravidez_2 = (dp_mortos_gravidez_2/mortos_gravidez_2) * 100
cv_mortos_gravidez_3 = (dp_mortos_gravidez_3/mortos_gravidez_3) * 100


print(cv_vivos_gravidez_1, cv_mortos_gravidez_1)
print(cv_vivos_gravidez_2, cv_mortos_gravidez_2)
print(cv_vivos_gravidez_3, cv_mortos_gravidez_3)

126.340315424496 208.93278881828533
117.4386188478178 186.43682798310627
223.60679774997897 187.0828693386971


In [78]:
# Quartis

# Filhos vivos:

q_vivos_gravidez_1 = gravidez_1.QTDFILVIVO.quantile([0.25, 0.75]).values
q_vivos_gravidez_2 = gravidez_2.QTDFILVIVO.quantile([0.25, 0.75]).values
q_vivos_gravidez_3 = gravidez_3.QTDFILVIVO.quantile([0.25, 0.75]).values

iqr_vivos_gravidez_1 = q_vivos_gravidez_1[1] - q_vivos_gravidez_1[0]
iqr_vivos_gravidez_2 = q_vivos_gravidez_2[1] - q_vivos_gravidez_2[0]
iqr_vivos_gravidez_3 = q_vivos_gravidez_3[1] - q_vivos_gravidez_3[0]

# Filhos mortos:

q_mortos_gravidez_1 = gravidez_1.QTDFILVIVO.quantile([0.25, 0.75]).values
q_mortos_gravidez_2 = gravidez_2.QTDFILVIVO.quantile([0.25, 0.75]).values
q_mortos_gravidez_3 = gravidez_3.QTDFILVIVO.quantile([0.25, 0.75]).values

iqr_mortos_gravidez_1 = q_mortos_gravidez_1[1] - q_mortos_gravidez_1[0]
iqr_mortos_gravidez_2 = q_mortos_gravidez_2[1] - q_mortos_gravidez_2[0]
iqr_mortos_gravidez_3 = q_mortos_gravidez_3[1] - q_mortos_gravidez_3[0]


print(iqr_vivos_gravidez_1, iqr_mortos_gravidez_1)
print(iqr_vivos_gravidez_2, iqr_mortos_gravidez_2)
print(iqr_vivos_gravidez_3, iqr_mortos_gravidez_3)


2.0 2.0
2.0 2.0
0.0 0.0


In [80]:
#Compare a quantidade total de gravidez (filhos vivos + filhos mortos) em relação a escolaridade

escolaridade_0['FILHOS'] = escolaridade_0.QTDFILVIVO + escolaridade_0.QTDFILMORT
escolaridade_1_3['FILHOS'] = escolaridade_1_3.QTDFILVIVO + escolaridade_1_3.QTDFILMORT
escolaridade_4_7['FILHOS'] = escolaridade_4_7.QTDFILVIVO + escolaridade_4_7.QTDFILMORT
escolaridade_8_11['FILHOS'] = escolaridade_8_11.QTDFILVIVO + escolaridade_8_11.QTDFILMORT
escolaridade_12['FILHOS'] = escolaridade_12.QTDFILVIVO + escolaridade_12.QTDFILMORT

media_esc_0 = escolaridade_0.FILHOS.mean()
media_esc_1_3 = escolaridade_1_3.FILHOS.mean()
media_esc_4_7 = escolaridade_4_7.FILHOS.mean()
media_esc_8_11 = escolaridade_8_11.FILHOS.mean()
media_esc_12 = escolaridade_12.FILHOS.mean()

media_esc_0, media_esc_1_3, media_esc_4_7, media_esc_8_11, media_esc_12

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  escolaridade_0['FILHOS'] = escolaridade_0.QTDFILVIVO + escolaridade_0.QTDFILMORT
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  escolaridade_1_3['FILHOS'] = escolaridade_1_3.QTDFILVIVO + escolaridade_1_3.QTDFILMORT
A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  escolaridade_4_7['FILHOS'] = escolari

(5.3105590062111805,
 3.5444630872483223,
 1.8571001941167686,
 1.0898249000413622,
 0.7098411297440423)

In [81]:
# Desvio Padrão

dp_escolaridade_0 = escolaridade_0.FILHOS.std(ddof=0)
dp_escolaridade_1_3 = escolaridade_1_3.FILHOS.std(ddof=0)
dp_escolaridade_4_7 = escolaridade_4_7.FILHOS.std(ddof=0)
dp_escolaridade_8_11 = escolaridade_8_11.FILHOS.std(ddof=0)
dp_escolaridade_12 = escolaridade_12.FILHOS.std(ddof=0)

dp_escolaridade_0, dp_escolaridade_1_3, dp_escolaridade_4_7, dp_escolaridade_8_11, dp_escolaridade_12

(3.1252051358156003,
 2.719190355277608,
 1.9058880530303584,
 1.322157837809025,
 0.9863858228552761)