## Introdução

Este arquivo é responsável por criar um arquivo **.csv** contendo os dados de todas as 4 tabelas unidos em uma unica tabela. Este desenvolvimento foi feito no **Google Colab**, uma **IDE** de desenvolvimento de notebooks python fornecida pela **Google**.

Além disso, este arquivo tratou de:
- Excluir linhas de descrição ou legendas;
- Excluir linhas reservadas exclusivamente para separar os alimentos por grupos alimentares;
- Criar uma nova coluna chamada "Grupo Alimentar". Esta coluna irá receber um valor númerico que representa o grupo alimentar do alimento;
- Atualizar o nome das colunas;
- Mesclar todas as tabelas do arquivo **.xlsx**, conforme explicado anteriormente;
- Criar um novo arquivo **.csv** chamado **Tabela_Taco_Atualizada.csv**

## Carregando o arquivo .xlsx

Importando as bibliotecas Pandas e Numpy para o projeto

In [1]:
import pandas as pd

In [2]:
pd.options.mode.copy_on_write = False

- Importando o arquivo ``.xlsx``, excel.
- Removendo as 3 primeiras linhas inicias e as 4 ultimas linhas, pois elas não agregam em nada este trabalho de ciência de dados.
- Adicionando a coluna "Grupo Alimentar"

In [3]:
url = '/content/Tabela_Taco.xlsx'
df_tabela_1 = pd.read_excel(url, skiprows=range(0,3))
df_tabela_1.drop(df_tabela_1.tail(4).index, inplace = True)
df_tabela_1

Unnamed: 0,Código e descrição do alimento,Unnamed: 1,Código e descrição da preparação,Unnamed: 3,Energia (kcal),Proteína\n(g),Lipídios totais\n(g),Carboi-\ndrato\n(g),Fibra alimentar total (g)
0,Cereais e leguminosas,,,,,,,,
1,6300101,"Arroz (polido, parboilizado, agulha, agulhinha...",99.0,Não se aplica,135.622946,2.496113,1.200042,27.784863,1.545702
2,6300201,Arroz integral,99.0,Não se aplica,130.945644,2.562885,1.965797,25.556814,2.72239
3,6300701,Milho (em grão),1.0,Cru(a),160.141,3.32,7.178,25.11,4.25
4,6300701,Milho (em grão),2.0,Cozido(a),160.141,3.32,7.178,25.11,4.25
...,...,...,...,...,...,...,...,...,...
1985,8579003,Maria izabel,99.0,Não se aplica,154,10.8,7.1,11.6,1.5
1986,8579004,Arroz de leite,99.0,Não se aplica,142.422,2.98,4.174,22.622,0.303
1987,8579005,Arroz com mandioca,99.0,Não se aplica,130.311473,1.548056,0.750021,28.942432,1.572851
1988,8579006,Arroz com ovo,99.0,Não se aplica,179.106973,8.085056,9.427021,14.500932,0.772851


Fazendo o mesmo procedimento para as outras tabelas do arquivo excel

In [4]:
df_tabela_2 = pd.read_excel(url, skiprows=range(0,3), sheet_name=1)
df_tabela_2.drop(df_tabela_2.tail(4).index, inplace = True)

df_tabela_3 = pd.read_excel(url, skiprows=range(0,3), sheet_name=2)
df_tabela_3.drop(df_tabela_3.tail(4).index, inplace = True)

df_tabela_4 = pd.read_excel(url, skiprows=range(0,3), sheet_name=3)
df_tabela_4.drop(df_tabela_4.tail(4).index, inplace = True)

Criando um novo dataframe que irá possuir a coluna "Grupo Alimentar"

In [5]:
#df_grupo_alimentar = pd.DataFrame(columns=['Código Grupo Alimentar', 'Descrição Grupo Alimentar'])
df_grupo_alimentar = pd.DataFrame(columns=['Grupo Alimentar'])
desc_grupo_alimentar = [
    'Cereais e leguminosas',
    'Hortaliças tuberosas',
    'Farinhas, féculas e massas',
    'Cocos, castanhas e nozes',
    'Hortaliças folhosas, frutosas e outras',
    'Frutas',
    'Açúcares e produtos de confeitaria',
    'Sais e condimentos',
    'Carnes e vísceras',
    'Pescados e frutos do mar',
    'Enlatados e conservas',
    'Aves e ovos',
    'Laticínios',
    'Panificados',
    'Carnes industrializadas',
    'Bebidas não alcoólicas e infusões',
    'Bebidas alcoólicas',
    'Óleos e gorduras',
    'Miscelâneas'
    ]

## Lidando com os Grupos Alimentares

Atribuindo o valores a coluna **Grupo Alimentar**:
- Cereais e leguminosas: 1
- Hortaliças tuberosas: 2
- Farinhas, féculas e massas: 3
- Cocos, castanhas e nozes: 4
- Hortaliças folhosas, frutosas e outras: 5
- Frutas: 6
- Açúcares e produtos de confeitaria: 7
- Sais e condimentos: 8
- Carnes e vísceras: 9
- Pescados e frutos do mar: 10

In [6]:
id_grupos_alimentar = df_tabela_1[df_tabela_1['Código e descrição da preparação'].isna()].index
for i in range(0,19):
  j = i+1
  aux = 0
  if i != 18:
    aux = df_tabela_1.loc[id_grupos_alimentar[i]+1:id_grupos_alimentar[j]-1]['Código e descrição da preparação'].count()
  else:
    aux = df_tabela_1.loc[id_grupos_alimentar[i]+1:]['Código e descrição da preparação'].count()

  for k in range(0,aux):
    df_grupo_alimentar.loc[len(df_grupo_alimentar)] = {'Grupo Alimentar':desc_grupo_alimentar[i]}

df_grupo_alimentar

Unnamed: 0,Grupo Alimentar
0,Cereais e leguminosas
1,Cereais e leguminosas
2,Cereais e leguminosas
3,Cereais e leguminosas
4,Cereais e leguminosas
...,...
1966,Miscelâneas
1967,Miscelâneas
1968,Miscelâneas
1969,Miscelâneas


Excluindo as linhas que representavam os grupos alimentares

In [7]:
df_tabela_1.drop(id_grupos_alimentar, inplace = True)
df_tabela_2.drop(id_grupos_alimentar, inplace = True)
df_tabela_3.drop(id_grupos_alimentar, inplace = True)
df_tabela_4.drop(id_grupos_alimentar, inplace = True)
df_tabela_1

Unnamed: 0,Código e descrição do alimento,Unnamed: 1,Código e descrição da preparação,Unnamed: 3,Energia (kcal),Proteína\n(g),Lipídios totais\n(g),Carboi-\ndrato\n(g),Fibra alimentar total (g)
1,6300101,"Arroz (polido, parboilizado, agulha, agulhinha...",99.0,Não se aplica,135.622946,2.496113,1.200042,27.784863,1.545702
2,6300201,Arroz integral,99.0,Não se aplica,130.945644,2.562885,1.965797,25.556814,2.72239
3,6300701,Milho (em grão),1.0,Cru(a),160.141,3.32,7.178,25.11,4.25
4,6300701,Milho (em grão),2.0,Cozido(a),160.141,3.32,7.178,25.11,4.25
5,6300701,Milho (em grão),3.0,Grelhado(a)/brasa/churrasco,160.141,3.32,7.178,25.11,4.25
...,...,...,...,...,...,...,...,...,...
1985,8579003,Maria izabel,99.0,Não se aplica,154,10.8,7.1,11.6,1.5
1986,8579004,Arroz de leite,99.0,Não se aplica,142.422,2.98,4.174,22.622,0.303
1987,8579005,Arroz com mandioca,99.0,Não se aplica,130.311473,1.548056,0.750021,28.942432,1.572851
1988,8579006,Arroz com ovo,99.0,Não se aplica,179.106973,8.085056,9.427021,14.500932,0.772851


## Lidando com os nomes das colunas e mesclando as tabelas

In [8]:
list(df_tabela_2.columns)

['Código e descrição do alimento ',
 'Unnamed: 1',
 'Código e descrição da preparação',
 'Unnamed: 3',
 'Coles-\nterol\n(mg)',
 'AG\nSatura-\ndos\n(g)',
 'AG\nMono \n(g)',
 'AG\nPoli \n(g)',
 'AG\nLino-\nléico \n(g)',
 'AG\nLinolê-\nnico \n(g)',
 'AG\nTrans\ntotal\n(g)',
 'Açúcar\ntotal\n(g)',
 'Açúcar\nde\nadição\n(g)']

Alterando o nome das sequintes colunas (de | para):
- **Código e descrição do alimento** - Código do Alimento
- **Unnamed: 1** - Descrição do Alimento
- **Código e descrição da preparação** - Código da Preparação
- **Unnamed: 3** - Descrição da Preparação

In [9]:
cols_rename = {'Código e descrição do alimento ': 'Código do alimento',
           'Unnamed: 1':'Descrição do alimento',
           'Código e descrição da preparação':'Código da preparação',
           'Unnamed: 3':'Descrição da preparação'}

df_tabela_1.rename(cols_rename, axis=1, inplace=True)
df_tabela_2.rename(cols_rename, axis=1, inplace=True)
df_tabela_3.rename(cols_rename, axis=1, inplace=True)
df_tabela_4.rename(cols_rename, axis=1, inplace=True)

df_tabela_1

Unnamed: 0,Código do alimento,Descrição do alimento,Código da preparação,Descrição da preparação,Energia (kcal),Proteína\n(g),Lipídios totais\n(g),Carboi-\ndrato\n(g),Fibra alimentar total (g)
1,6300101,"Arroz (polido, parboilizado, agulha, agulhinha...",99.0,Não se aplica,135.622946,2.496113,1.200042,27.784863,1.545702
2,6300201,Arroz integral,99.0,Não se aplica,130.945644,2.562885,1.965797,25.556814,2.72239
3,6300701,Milho (em grão),1.0,Cru(a),160.141,3.32,7.178,25.11,4.25
4,6300701,Milho (em grão),2.0,Cozido(a),160.141,3.32,7.178,25.11,4.25
5,6300701,Milho (em grão),3.0,Grelhado(a)/brasa/churrasco,160.141,3.32,7.178,25.11,4.25
...,...,...,...,...,...,...,...,...,...
1985,8579003,Maria izabel,99.0,Não se aplica,154,10.8,7.1,11.6,1.5
1986,8579004,Arroz de leite,99.0,Não se aplica,142.422,2.98,4.174,22.622,0.303
1987,8579005,Arroz com mandioca,99.0,Não se aplica,130.311473,1.548056,0.750021,28.942432,1.572851
1988,8579006,Arroz com ovo,99.0,Não se aplica,179.106973,8.085056,9.427021,14.500932,0.772851


Vamos tentar mesclar os dataframes. Vamos utilizar as colunas: **Código do alimento**, **Descrição do alimento**, **Código da preparação**, **Descrição da preparação**;

In [10]:
df_mesclado = pd.merge(df_tabela_1, df_tabela_2, on=['Código do alimento', 'Descrição do alimento', 'Código da preparação', 'Descrição da preparação'])
df_mesclado

Unnamed: 0,Código do alimento,Descrição do alimento,Código da preparação,Descrição da preparação,Energia (kcal),Proteína\n(g),Lipídios totais\n(g),Carboi-\ndrato\n(g),Fibra alimentar total (g),Coles-\nterol\n(mg),AG\nSatura-\ndos\n(g),AG\nMono \n(g),AG\nPoli \n(g),AG\nLino-\nléico \n(g),AG\nLinolê-\nnico \n(g),AG\nTrans\ntotal\n(g),Açúcar\ntotal\n(g),Açúcar\nde\nadição\n(g)
0,6300101,"Arroz (polido, parboilizado, agulha, agulhinha...",99.0,Não se aplica,135.622946,2.496113,1.200042,27.784863,1.545702,-,0.350665,0.222195,0.563118,0.556331,0.066209,0.005194,-,-
1,6300201,Arroz integral,99.0,Não se aplica,130.945644,2.562885,1.965797,25.556814,2.72239,-,0.449685,0.618275,0.860178,0.803881,0.076111,0.005194,-,-
2,6300701,Milho (em grão),1.0,Cru(a),160.141,3.32,7.178,25.11,4.25,-,1.12,1.718,4.009,3.591,0.418,0.031,3.16,-
3,6300701,Milho (em grão),2.0,Cozido(a),160.141,3.32,7.178,25.11,4.25,-,1.12,1.718,4.009,3.591,0.418,0.031,3.16,-
4,6300701,Milho (em grão),3.0,Grelhado(a)/brasa/churrasco,160.141,3.32,7.178,25.11,4.25,-,1.12,1.718,4.009,3.591,0.418,0.031,3.16,-
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1966,8579003,Maria izabel,99.0,Não se aplica,154,10.8,7.1,11.6,1.5,36,3.2,3,0.2,0.16,0.03,-,-,-
1967,8579004,Arroz de leite,99.0,Não se aplica,142.422,2.98,4.174,22.622,0.303,2.744,1.049,0.985,1.885,1.646,0.238,0.048,1.47,-
1968,8579005,Arroz com mandioca,99.0,Não se aplica,130.311473,1.548056,0.750021,28.942432,1.572851,-,0.225333,0.161098,0.331559,0.303165,0.038104,0.002597,-,-
1969,8579006,Arroz com ovo,99.0,Não se aplica,179.106973,8.085056,9.427021,14.500932,0.772851,230.435,2.429833,3.024098,2.817059,2.483165,0.260104,0.0165,0.663,-


In [11]:
df_mesclado = pd.merge(df_mesclado, df_tabela_3, on=['Código do alimento', 'Descrição do alimento', 'Código da preparação', 'Descrição da preparação'])
df_mesclado.head()

Unnamed: 0,Código do alimento,Descrição do alimento,Código da preparação,Descrição da preparação,Energia (kcal),Proteína\n(g),Lipídios totais\n(g),Carboi-\ndrato\n(g),Fibra alimentar total (g),Coles-\nterol\n(mg),...,Mag-\nnésio \n(mg),Man-\nganês \n(mg),Fósforo \n(mg),Ferro \n(mg),Sódio \n(mg),Sódio \nde \nadição \n(mg),Potás-\nsio\n(mg),Co-\nbre \n(mg),Zinco\n(mg),Selê-\nnio\n(mcg)
0,6300101,"Arroz (polido, parboilizado, agulha, agulhinha...",99.0,Não se aplica,135.622946,2.496113,1.200042,27.784863,1.545702,-,...,2.231251,0.293759,17.769139,0.076405,1.1889,382,14.529865,0.014853,0.486616,0.446968
1,6300201,Arroz integral,99.0,Não se aplica,130.945644,2.562885,1.965797,25.556814,2.72239,-,...,58.12672,0.621185,104.815641,0.259922,1.232469,282,74.41518,0.020134,0.676075,0.446968
2,6300701,Milho (em grão),1.0,Cru(a),160.141,3.32,7.178,25.11,4.25,-,...,26.006,0.159,75.0,0.445,244.964,245,212.051,0.047,0.611,2.904
3,6300701,Milho (em grão),2.0,Cozido(a),160.141,3.32,7.178,25.11,4.25,-,...,26.006,0.159,75.0,0.445,244.964,245,212.051,0.047,0.611,2.904
4,6300701,Milho (em grão),3.0,Grelhado(a)/brasa/churrasco,160.141,3.32,7.178,25.11,4.25,-,...,26.006,0.159,75.0,0.445,244.964,245,212.051,0.047,0.611,2.904


In [12]:
df_mesclado = pd.merge(df_mesclado, df_tabela_4, on=['Código do alimento', 'Descrição do alimento', 'Código da preparação', 'Descrição da preparação'])
df_mesclado.head()

Unnamed: 0,Código do alimento,Descrição do alimento,Código da preparação,Descrição da preparação,Energia (kcal),Proteína\n(g),Lipídios totais\n(g),Carboi-\ndrato\n(g),Fibra alimentar total (g),Coles-\nterol\n(mg),...,Tiami-\nna\n(mg),Ribofla-\nvina\n(mg),Niaci-\nna\n(mg),Niaci-\nna\n(NE)\n(mg),Pirido-\nxina\n(mg),Coba-\nlami-\nna\n(mcg),Folato\n(DFE)\n(mcg),Vitami-\nna D\n(mcg),Vitami-\nna E\n(mg),Vitami-\nna C\n(mg)
0,6300101,"Arroz (polido, parboilizado, agulha, agulhinha...",99.0,Não se aplica,135.622946,2.496113,1.200042,27.784863,1.545702,-,...,-,-,-,-,-,-,-,-,0.079782,-
1,6300201,Arroz integral,99.0,Não se aplica,130.945644,2.562885,1.965797,25.556814,2.72239,-,...,0.079216,-,-,-,0.079216,-,-,-,0.079782,-
2,6300701,Milho (em grão),1.0,Cru(a),160.141,3.32,7.178,25.11,4.25,-,...,0.215,0.072,1.614,1.997,0.06,-,46,-,0.572,6.2
3,6300701,Milho (em grão),2.0,Cozido(a),160.141,3.32,7.178,25.11,4.25,-,...,0.215,0.072,1.614,1.997,0.06,-,46,-,0.572,6.2
4,6300701,Milho (em grão),3.0,Grelhado(a)/brasa/churrasco,160.141,3.32,7.178,25.11,4.25,-,...,0.215,0.072,1.614,1.997,0.06,-,46,-,0.572,6.2


Atualizando o nomes de algumas colunas que possuem \n

In [13]:
df_mesclado.columns

Index(['Código do alimento', 'Descrição do alimento', 'Código da preparação',
       'Descrição da preparação', 'Energia (kcal)', 'Proteína\n(g)',
       'Lipídios totais\n(g)', 'Carboi-\ndrato\n(g)',
       'Fibra alimentar total (g)', 'Coles-\nterol\n(mg)',
       'AG\nSatura-\ndos\n(g)', 'AG\nMono \n(g)', 'AG\nPoli \n(g)',
       'AG\nLino-\nléico \n(g)', 'AG\nLinolê-\nnico \n(g)',
       'AG\nTrans\ntotal\n(g)', 'Açúcar\ntotal\n(g)',
       'Açúcar\nde\nadição\n(g)', 'Cálcio \n(mg)', 'Mag-\nnésio \n(mg)',
       'Man-\nganês \n(mg)', 'Fósforo \n(mg)', 'Ferro \n(mg)', 'Sódio \n(mg)',
       'Sódio \nde \nadição \n(mg)', 'Potás-\nsio\n(mg)', 'Co-\nbre \n(mg)',
       'Zinco\n(mg)', 'Selê-\nnio\n(mcg)', 'Reti-\nnol\n(mcg)',
       'Vitami-\nna A\n(RAE)\n(mcg)', 'Tiami-\nna\n(mg)',
       'Ribofla-\nvina\n(mg)', 'Niaci-\nna\n(mg)', 'Niaci-\nna\n(NE)\n(mg)',
       'Pirido-\nxina\n(mg)', 'Coba-\nlami-\nna\n(mcg)',
       'Folato\n(DFE)\n(mcg)', 'Vitami-\nna D\n(mcg)', 'Vitami-\nna E\n(m

In [14]:
cols_rename_mesclado = {
    'Proteína\n(g)' : 'Proteína (g)',
    'Lipídios totais\n(g)' : 'Lipídios totais (g)',
    'Carboi-\ndrato\n(g)' : 'Carboidrato (g)',
    'Coles-\nterol\n(mg)' : 'Colesterol (mg)',
    'AG\nSatura-\ndos\n(g)' : 'AG Saturados (g)',
    'AG\nMono \n(g)' : 'AG Mono (g)',
    'AG\nPoli \n(g)' : 'AG Poli (g)',
    'AG\nLino-\nléico \n(g)' : 'AG Linoléico (g)',
    'AG\nLinolê-\nnico \n(g)' : 'AG Linolênico (g)',
    'AG\nTrans\ntotal\n(g)' : 'AG Trans total(g)',
    'Açúcar\ntotal\n(g)': 'Açúcar total (g)',
    'Açúcar\nde\nadição\n(g)' : 'Açúcar de adição (g)',
    'Cálcio \n(mg)' : 'Cálcio (mg)',
    'Mag-\nnésio \n(mg)' : 'Magnésio (mg)',
    'Man-\nganês \n(mg)' : 'Manganês (mg)',
    'Fósforo \n(mg)' : 'Fósforo (mg)',
    'Ferro \n(mg)' : 'Ferro (mg)',
    'Sódio \n(mg)' : 'Sódio (mg)',
    'Sódio \nde \nadição \n(mg)' : 'Sódio de adição (mg)',
    'Potás-\nsio\n(mg)' : 'Potássio (mg)',
    'Co-\nbre \n(mg)' : 'Cobre (mg)',
    'Zinco\n(mg)' : 'Zinco (mg)',
    'Selê-\nnio\n(mcg)' : 'Selênio (mcg)',
    'Reti-\nnol\n(mcg)' : 'Retinol (mcg)',
    'Vitami-\nna A\n(RAE)\n(mcg)' : 'Vitamina A (RAE) (mcg)',
    'Tiami-\nna\n(mg)' : 'Tiamina (mg)',
    'Ribofla-\nvina\n(mg)' : 'Riboflavina (mg)',
    'Niaci-\nna\n(mg)' : 'Niacina (mg)',
    'Niaci-\nna\n(NE)\n(mg)' : 'Niacina (NE) (mg)',
    'Pirido-\nxina\n(mg)' : 'Piridoxina (mg)',
    'Coba-\nlami-\nna\n(mcg)' : 'Cobalamina (mcg)',
    'Folato\n(DFE)\n(mcg)' : 'Folato (DFE) (mcg)',
    'Vitami-\nna D\n(mcg)' : 'Vitamina D (mcg)',
    'Vitami-\nna E\n(mg)' : 'Vitamina E (mg)',
    'Vitami-\nna C\n(mg)' : 'Vitamina C (mg)'
}

df_mesclado.rename(cols_rename_mesclado, axis=1, inplace=True)
df_mesclado

Unnamed: 0,Código do alimento,Descrição do alimento,Código da preparação,Descrição da preparação,Energia (kcal),Proteína (g),Lipídios totais (g),Carboidrato (g),Fibra alimentar total (g),Colesterol (mg),...,Tiamina (mg),Riboflavina (mg),Niacina (mg),Niacina (NE) (mg),Piridoxina (mg),Cobalamina (mcg),Folato (DFE) (mcg),Vitamina D (mcg),Vitamina E (mg),Vitamina C (mg)
0,6300101,"Arroz (polido, parboilizado, agulha, agulhinha...",99.0,Não se aplica,135.622946,2.496113,1.200042,27.784863,1.545702,-,...,-,-,-,-,-,-,-,-,0.079782,-
1,6300201,Arroz integral,99.0,Não se aplica,130.945644,2.562885,1.965797,25.556814,2.72239,-,...,0.079216,-,-,-,0.079216,-,-,-,0.079782,-
2,6300701,Milho (em grão),1.0,Cru(a),160.141,3.32,7.178,25.11,4.25,-,...,0.215,0.072,1.614,1.997,0.06,-,46,-,0.572,6.2
3,6300701,Milho (em grão),2.0,Cozido(a),160.141,3.32,7.178,25.11,4.25,-,...,0.215,0.072,1.614,1.997,0.06,-,46,-,0.572,6.2
4,6300701,Milho (em grão),3.0,Grelhado(a)/brasa/churrasco,160.141,3.32,7.178,25.11,4.25,-,...,0.215,0.072,1.614,1.997,0.06,-,46,-,0.572,6.2
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1966,8579003,Maria izabel,99.0,Não se aplica,154,10.8,7.1,11.6,1.5,36,...,0.03,-,-,-,0.07,-,-,-,-,-
1967,8579004,Arroz de leite,99.0,Não se aplica,142.422,2.98,4.174,22.622,0.303,2.744,...,0.142,0.068,1.183,1.93,0.077,0.121,35.38,0.274,0.297,0.006
1968,8579005,Arroz com mandioca,99.0,Não se aplica,130.311473,1.548056,0.750021,28.942432,1.572851,-,...,0.03,-,-,-,0.015,-,-,-,-,5.55
1969,8579006,Arroz com ovo,99.0,Não se aplica,179.106973,8.085056,9.427021,14.500932,0.772851,230.435,...,0.036,0.279,0.035,1.4205,0.066,0.6035,23.913,0.6955,0.81,-


Adicionando a coluna **"Grupo Alimentar"** ao DataFrame **df_mesclado**

In [15]:
#pd.concat(df_mesclado, df_grupo_alimentar)
#df_mesclado['Grupo Alimentar'] = df_grupo_alimentar
df_mesclado = pd.concat([df_mesclado, df_grupo_alimentar], axis=1)
df_mesclado

Unnamed: 0,Código do alimento,Descrição do alimento,Código da preparação,Descrição da preparação,Energia (kcal),Proteína (g),Lipídios totais (g),Carboidrato (g),Fibra alimentar total (g),Colesterol (mg),...,Riboflavina (mg),Niacina (mg),Niacina (NE) (mg),Piridoxina (mg),Cobalamina (mcg),Folato (DFE) (mcg),Vitamina D (mcg),Vitamina E (mg),Vitamina C (mg),Grupo Alimentar
0,6300101,"Arroz (polido, parboilizado, agulha, agulhinha...",99.0,Não se aplica,135.622946,2.496113,1.200042,27.784863,1.545702,-,...,-,-,-,-,-,-,-,0.079782,-,Cereais e leguminosas
1,6300201,Arroz integral,99.0,Não se aplica,130.945644,2.562885,1.965797,25.556814,2.72239,-,...,-,-,-,0.079216,-,-,-,0.079782,-,Cereais e leguminosas
2,6300701,Milho (em grão),1.0,Cru(a),160.141,3.32,7.178,25.11,4.25,-,...,0.072,1.614,1.997,0.06,-,46,-,0.572,6.2,Cereais e leguminosas
3,6300701,Milho (em grão),2.0,Cozido(a),160.141,3.32,7.178,25.11,4.25,-,...,0.072,1.614,1.997,0.06,-,46,-,0.572,6.2,Cereais e leguminosas
4,6300701,Milho (em grão),3.0,Grelhado(a)/brasa/churrasco,160.141,3.32,7.178,25.11,4.25,-,...,0.072,1.614,1.997,0.06,-,46,-,0.572,6.2,Cereais e leguminosas
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
1966,8579003,Maria izabel,99.0,Não se aplica,154,10.8,7.1,11.6,1.5,36,...,-,-,-,0.07,-,-,-,-,-,Miscelâneas
1967,8579004,Arroz de leite,99.0,Não se aplica,142.422,2.98,4.174,22.622,0.303,2.744,...,0.068,1.183,1.93,0.077,0.121,35.38,0.274,0.297,0.006,Miscelâneas
1968,8579005,Arroz com mandioca,99.0,Não se aplica,130.311473,1.548056,0.750021,28.942432,1.572851,-,...,-,-,-,0.015,-,-,-,-,5.55,Miscelâneas
1969,8579006,Arroz com ovo,99.0,Não se aplica,179.106973,8.085056,9.427021,14.500932,0.772851,230.435,...,0.279,0.035,1.4205,0.066,0.6035,23.913,0.6955,0.81,-,Miscelâneas


## Criando o arquivo .csv

Verificando se não ficou nenhum dado nulo ou nan

In [16]:
df_mesclado.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1971 entries, 0 to 1970
Data columns (total 42 columns):
 #   Column                     Non-Null Count  Dtype  
---  ------                     --------------  -----  
 0   Código do alimento         1971 non-null   object 
 1   Descrição do alimento      1971 non-null   object 
 2   Código da preparação       1971 non-null   float64
 3   Descrição da preparação    1971 non-null   object 
 4   Energia (kcal)             1971 non-null   object 
 5   Proteína (g)               1971 non-null   object 
 6   Lipídios totais (g)        1971 non-null   object 
 7   Carboidrato (g)            1971 non-null   object 
 8   Fibra alimentar total (g)  1971 non-null   object 
 9   Colesterol (mg)            1971 non-null   object 
 10  AG Saturados (g)           1971 non-null   object 
 11  AG Mono (g)                1971 non-null   object 
 12  AG Poli (g)                1971 non-null   object 
 13  AG Linoléico (g)           1971 non-null   objec

Criando um arquivo **.csv** com os dados mesclados e atualizados.

In [17]:
df_mesclado.to_csv('Tabela_Taco_Atualizada.csv', index=False)