<a href="https://colab.research.google.com/github/SamuelSSan28/Web_Scraping_Python/blob/master/webscraping_pyht_receitas.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#  Webscraping com Python

### O que é webscraping?

Webscraping é uma técnica de extração de dados, com ela podemos coletar dados de sites. Fazemos a 'raspagem' dos dados  que são interessantes para nós.

O processo em si é bem básico, definimos os dados que queremos, escolhemos os sites, montamos o script e recebemos os dados para análise, este é o ciclo de vida do webscraping.

Exemplos: 
*   resgatar os últimos posts que foram escritos em vários blogs. 
*   o site Buscapé varre os sites que vendem os produtos pesquisados em busca dos menores preços.
*   comentários dos usuários de um produto X em 200 e-commerces diferentes para analisa-los e validar se o produto tem aceitação no mercado.

### Referencias:  

Todo o conteúdo se encontra no Github caso queira analisar o código: [ir para o repositório!](https://github.com/matheusbattisti/webscraping_python)


#Requests

Requests é uma biblioteca fazer requisições HTTP, no caso get, nas páginas que queremos extrair dados.

In [0]:
# Importando a Requests
import requests

def request_pag(link):
  # Vamos testar a biblioteca requests
  html = requests.get(link)

 # print(link,end=":  ")
 # print("Status Code:",html.status_code,'\n')

  # Diferente da urllib, usamos text para apresentar o conteudo que o get nos trouxe
  return html.text

#request_pag("https://www.tudogostoso.com.br/")

# BeautifulSoup
Com a BeautifulSoup tudo será mais fácil, esta biblioteca do Python serve para extrairmos dados de HTML e XML, de forma fácil e descomplicada podemos acessar os 'nós' da estrutura do HTML da página ou até mesmo classes e pegar as informações


In [0]:
# Importando a BeautifulSoup
from bs4 import BeautifulSoup

# URL
url = "https://www.tudogostoso.com.br/"

# lendo a URL 
html = requests.get(url)

# Enfim mostrando o poder da bs4
bs = BeautifulSoup(html.text, 'lxml')

# Imprimindo o título da página
print(bs.title)

<title>
TudoGostoso - Onde nascem todas as receitas
</title>


In [0]:
# find_all: todos os elementos encontrados
print(bs.find_all('p'),'\n')

# find: apenas o primeiro resultado ser extraído
print(bs.find('p'))

[<p class="copy">
© Copyright 2005-2020 TudoGostoso Internet Ltda, todos os direitos reservados. Proibida a reprodução sem autorização.
</p>] 

<p class="copy">
© Copyright 2005-2020 TudoGostoso Internet Ltda, todos os direitos reservados. Proibida a reprodução sem autorização.
</p>


#  Categorias de Receitas


In [0]:
categorias = bs.find_all('a',class_='category-item')

for i in categorias:
  print(i.text,"->",i['href'],'\n')

Bolos e  Tortas -> /categorias/1000-bolos-e-tortas-doces 

Carnes -> /categorias/1004-carnes 

Aves -> /categorias/1009-aves 

Peixes e Frutos do Mar -> /categorias/1014-peixes-e-frutos-do-mar 

Saladas e Molhos -> /categorias/1023-saladas-molhos-e-acompanhamentos 

Sopas -> /categorias/1027-sopas 

Massas -> /categorias/1028-massas 

Bebidas -> /categorias/1032-bebidas 

Doces e Sobremesas -> /categorias/1037-doces-e-sobremesas 

Lanches -> /categorias/1044-lanches 

Alimentação Saudável -> /categorias/1334-alimentacao-saudavel 

Vídeos -> /videos 

Todas as Receitas -> /receitas 



# Receitas por Categoria

In [0]:
categorias = bs.find_all('a',class_='category-item')
url = "https://www.tudogostoso.com.br/"

for i in categorias:
  print(i.text,':',)
  categoria = request_pag(url+i['href'])
  categoria_html = BeautifulSoup(categoria, 'lxml')

  receitas = categoria_html.find_all('div', class_="recipe-card")
  for r in receitas:
    print("\t\t",str(r.find('h4',class_="recipe-title").text).replace("\n",""))
    print(str(r.find('a',class_="row")['href']))
    print(str(r.find('img',class_="recipe-card-img")['src']))
  print("\n")

Bolos e  Tortas :
		 Bolo de maçã de liquidificador - o melhor do mundo
/receita/109535-bolo-de-maca-de-liquidificador-o-melhor-do-mundo.html
https://img.itdg.com.br/tdg/images/recipes/000/109/535/216637/216637_original.jpg?mode=crop&width=160&height=160
		 Bolo de fubá com goiabada
/receita/3004-bolo-de-fuba-com-goiabada.html
https://img.itdg.com.br/tdg/images/recipes/000/003/004/332796/332796_original.jpg?mode=crop&width=160&height=160
		 Bolo de banana caramelada
/receita/41516-bolo-de-banana-caramelada.html
https://img.itdg.com.br/tdg/images/recipes/000/041/516/324032/324032_original.jpg?mode=crop&width=160&height=160
		 Bolo de fubá de liquidificador
/receita/25518-bolo-de-fuba-de-liquidificador.html
https://img.itdg.com.br/tdg/images/recipes/000/025/518/38958/38958_original.jpg?mode=crop&width=160&height=160
		 Bolo de milho cremoso
/receita/94018-bolo-de-milho-cremoso.html
https://img.itdg.com.br/tdg/images/recipes/000/094/018/332850/332850_original.jpg?mode=crop&width=160&heigh

## Paginas por Categoria


In [0]:
for i in categorias:
  print(i.text,':',)
  categoria = request_pag(url+i['href'])#Requisitando a pagina da categoria
  categoria_html = BeautifulSoup(categoria, 'lxml') 
  pag_visitadas= []
  paginas = categoria_html.find('div', class_="pagination").find_all(class_='row')
  pagina_atual = 1
  for pag in paginas:
    if pag.find("span",class_="current"):
      pagina_atual = int(pag.span.text)
  
  
        
      
  
    

  break

Bolos e  Tortas :
https://www.tudogostoso.com.br//categorias/1000-bolos-e-tortas-doces:  Status Code: 200 



# Scraping dados de uma Receita

### Informações Iniciais


In [0]:
receita = request_pag("https://www.tudogostoso.com.br/receita/47884-esfiha-de-carne-adaptada-receita-turca.html")
receita_html = BeautifulSoup(receita, 'lxml')

tempo_de_preparo = receita_html.find('time' )
print("Tempo de Preparo:",tempo_de_preparo.text.replace("\n",""))

rendimento = receita_html.find(itemprop="recipeYield")
print("Rendimento:",rendimento.text.replace("\n",""))


https://www.tudogostoso.com.br/receita/47884-esfiha-de-carne-adaptada-receita-turca.html:  Status Code: 200 

Tempo de Preparo: 90MIN
Rendimento: 30 porções


### Ingredientes


In [0]:
receita = request_pag("https://www.tudogostoso.com.br/receita/47884-esfiha-de-carne-adaptada-receita-turca.html")
receita_html = BeautifulSoup(receita, 'lxml')
ingredientes_html = receita_html.find_all('div', class_="ingredients-card")


for i in ingredientes_html:
  ingredientes = i.find_all(["li", "h3"])
  for ingrediente in ingredientes:
    print(ingrediente.text)


https://www.tudogostoso.com.br/receita/47884-esfiha-de-carne-adaptada-receita-turca.html:  Status Code: 200 

1 colher (sopa) bem cheia de fermento para pão (eu usei fermento granulado instantâneo para pão)
2 colheres (sopa) cheias de açúcar refinado
1/2 colher (chá) de sal
1/2 xícara de leite morno (100 ml)
1 xícara de água morna (200 ml)
1 ovo
650 ou 700 g de farinha de trigo
1/2 xícara (chá) de óleo ou 100 ml
Recheio:
1/2 kg de carne moída magra
3 tomates picadinhos
1 cebola picada
1 dente de alho (opcional)
1/2 xícara (chá) de azeitonas picadas
1/2 colher (chá) de noz moscada (opcional)
Salsinha e cebolinha a gosto (opcional)
Gotas de molho de pimenta (opcional)
Para pincelar:
1 gema
Gergelim torrado ou preto para salpicar depois que pincelar


### Modo de Preparo:

In [0]:
preparo_html = receita_html.find('div', class_="instructions")

preparo = str(preparo_html).replace("</li>","\n")
preparo = preparo.replace("<li>","")
preparo = preparo.replace("<ol>","")
preparo = preparo.replace('<span tabindex="0">',"")
preparo = preparo.replace('<div class="instructions e-instructions" itemprop="recipeInstructions">',"")
preparo = preparo.replace('</ol>\n</div>]',"")
preparo = preparo.replace('<h3 class="card-subtitle">',"\n")
preparo = preparo.replace('</h3>',"\n")
preparo = preparo.replace('</ol>',"")
preparo = preparo.replace('</span>',"")

print(preparo)


Em ma tigela grande e larga colocar o fermento em pó, o açúcar e despejar a água morna, o leite morno, o sal e o óleo.
Mexer bem.
Em seguida, acrescentar a metade da farinha de trigo aos poucos e mexer com uma colher de pau ou de plástico.
Colocar o ovo e continuar acrescentando a farinha de trigo.
Antes de finalizar a farinha, comece a trabalhar a massa com uma das mãos para sentir a textura da mesma e ver se precisa colocar realmente toda a farinha.
Dependendo do tamanho do ovo, 650 g de farinha é suficiente, caso contrário, use 700 g, mas atenção, muita farinha pode deixar a massa dura.
Sove a massa por uns 5 minutos na própria tigela com uma das mãos em movimentos de vai e vem.
A massa fica bem maleável, gostosa de trabalhar e não gruda nas mãos.
Coloque a tigela dentro de um saco plástico ou feche-a com um filme plástico.
Deixe descansar por 20 minutos em local que vá favorecer o crescimento da massa.
Eu deixei recebendo a luz do sol através de uma janela, com os vidros fechados.

# Automatização do scrapping

In [0]:
#ENTRAR NA PAGINA INICIAL utilizando os pages 
url = "https://www.tudogostoso.com.br"

pag_inicial = request_pag(url)
pag_inicial_html = BeautifulSoup(pag_inicial, 'lxml')

base_de_dados = {"receita":[],"ingredientes":[],"preparo":[],"tempo_de_preparo":[],"rendimento":[],"categoria":[]}


#Ir nas seções de tipos de receitas
categorias = pag_inicial_html.find_all('a',class_='category-item')

for c in categorias:
  cat_link = url+c['href']
  cat_nome = str(c.text)
  print("Categoria: ",cat_nome)
  categoria = request_pag(cat_link) 
  secao = BeautifulSoup(categoria, 'lxml')
  receitas = secao.find_all('div', class_="recipe-card")
  #Pegar as receitas da seção
  for r in receitas:
    titulo = str(r.find('h4',class_="recipe-title").text).replace("\n","")
    img_link = str(r.find('img',class_="recipe-card-img")['src'])
    receita_link = str(r.find('a',class_="row")['href'])

    receita_html = request_pag(url+receita_link)

    receita = BeautifulSoup(receita_html, 'lxml')

    ingredientes_html = receita.find_all('div', class_="ingredients-card")
    ingredientes_str = ""
    
    #Pegando os ingredientes da receita
    for i in ingredientes_html:
      ingredientes = i.find_all(["li", "h3"])
      for ingrediente in ingredientes:
        ingredientes_str += str(ingrediente.text)+"\n"
    
    #pegando o modo de preparo
    preparo_html = receita.find('div', class_="instructions")
    preparo = str(preparo_html).replace("</li>","\n")
    preparo = preparo.replace("<li>","")
    preparo = preparo.replace("<ol>","")
    preparo = preparo.replace('<span tabindex="0">',"")
    preparo = preparo.replace('<div class="instructions e-instructions" itemprop="recipeInstructions">',"")
    preparo = preparo.replace('</ol>\n</div>]',"")
    preparo = preparo.replace('<h3 class="card-subtitle">',"\n")
    preparo = preparo.replace('</h3>',"\n")
    preparo = preparo.replace('</ol>',"")
    preparo = preparo.replace('<p>',"")
    preparo = preparo.replace('</p>',"")
    preparo = preparo.replace('</div>',"")
    preparo = preparo.replace('</strong>',"")
    preparo = preparo.replace('<strong>',"")
    preparo = preparo.replace('</span>',"")
    
    
    #Informacoes da receita
    tempo_de_preparo = receita.find('time').text.replace("\n","")
    rendimento = receita.find(itemprop="recipeYield").text.replace("\n","")

    
    #Adicionando na lista
    base_de_dados["receita"].append(titulo)
    base_de_dados["ingredientes"].append(ingredientes_str)
    base_de_dados["preparo"].append(preparo)
    base_de_dados["tempo_de_preparo"].append(tempo_de_preparo)
    base_de_dados["rendimento"].append(rendimento)
    base_de_dados["categoria"].append(cat_nome)
    base_de_dados["img"].append(img_link)
    break



Categoria:  Bolos e  Tortas
Categoria:  Carnes
Categoria:  Aves
Categoria:  Peixes e Frutos do Mar
Categoria:  Saladas e Molhos
Categoria:  Sopas
Categoria:  Massas
Categoria:  Bebidas
Categoria:  Doces e Sobremesas
Categoria:  Lanches
Categoria:  Alimentação Saudável
Categoria:  Vídeos
Categoria:  Todas as Receitas


In [0]:
import pandas as pd

df_receitas = pd.DataFrame(data=base_de_dados)

print(len(df_receitas))
df_receitas.head(5)

# Formato 2 do scrap do site

### (DEMORA PRA CARAIO, MAS PEGA AS RECEITA TUDO)

In [0]:
#ENTRAR NA PAGINA INICIAL
url = "https://www.tudogostoso.com.br"

pag_inicial = request_pag(url)
pag_inicial_html = BeautifulSoup(pag_inicial, 'lxml')

base_de_dados = {"receita":[],"ingredientes":[],"preparo":[],"tempo_de_preparo":[],"rendimento":[],"categoria":[],"img":[]}


#Ir nas seções de tipos de receitas
categorias = pag_inicial_html.find_all('a',class_='category-item')

for c in categorias:
  cat_link = url+c['href']

  cat_nome = str(c.text)

  print("Categoria: ",cat_nome)

  for page in range(1,20):
    print(page,end=" ")
    
    categoria = request_pag(cat_link+"?page="+str(page)) 
    secao = BeautifulSoup(categoria, 'lxml')
    receitas = secao.find_all('div', class_="recipe-card")

    #Pegar as receitas da categoria
    for r in receitas:
      titulo = str(r.find('h4',class_="recipe-title").text).replace("\n","")
      
      img_link = str(r.find('img',class_="recipe-card-img")['src'])

      receita_link = str(r.find('a',class_="row")['href'])

      receita_html = request_pag(url+receita_link)

      receita = BeautifulSoup(receita_html, 'lxml')

      ingredientes_html = receita.find_all('div', class_="ingredients-card")
      ingredientes_str = ""
      
      #Pegando os ingredientes da receita
      for i in ingredientes_html:
        ingredientes = i.find_all(["li", "h3"])
        for ingrediente in ingredientes:
          ingredientes_str += str(ingrediente.text)+"\n"
      
      #pegando o modo de preparo
      preparo_html = receita.find('div', class_="instructions")
      preparo = str(preparo_html).replace("</li>","\n")
      preparo = preparo.replace("<li>","")
      preparo = preparo.replace("<ol>","")
      preparo = preparo.replace('<span tabindex="0">',"")
      preparo = preparo.replace('<div class="instructions e-instructions" itemprop="recipeInstructions">',"")
      preparo = preparo.replace('</ol>\n</div>]',"")
      preparo = preparo.replace('<h3 class="card-subtitle">',"\n")
      preparo = preparo.replace('</h3>',"\n")
      preparo = preparo.replace('</ol>',"")
      preparo = preparo.replace('<p>',"")
      preparo = preparo.replace('</p>',"")
      preparo = preparo.replace('</div>',"")
      preparo = preparo.replace('</strong>',"")
      preparo = preparo.replace('<strong>',"")
      preparo = preparo.replace('</span>',"")
      
      
      #Informacoes da receita
      tempo_de_preparo = receita.find('time').text.replace("\n","")
      rendimento = receita.find(itemprop="recipeYield").text.replace("\n","")

      
      #Adicionando na lista
      base_de_dados["receita"].append(titulo)
      base_de_dados["ingredientes"].append(ingredientes_str)
      base_de_dados["preparo"].append(preparo)
      base_de_dados["tempo_de_preparo"].append(tempo_de_preparo)
      base_de_dados["rendimento"].append(rendimento)
      base_de_dados["categoria"].append(cat_nome)
      base_de_dados["img"].append(img_link)



Categoria:  Bolos e  Tortas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Carnes
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Aves
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Peixes e Frutos do Mar
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Saladas e Molhos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Sopas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Massas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Bebidas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Doces e Sobremesas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Lanches
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Alimentação Saudável
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Vídeos
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Categoria:  Todas as Receitas
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 

In [0]:
import pandas as pd

df_receitas = pd.DataFrame(data=base_de_dados)

#index -> True se quiser o index do dataframe no csv, False caso não
#header -> True se quiser o nome das colunas do dataframe no csv, False caso não
df_receitas.to_csv (r'export_receitas_tudoGostoso.csv', index = False, header=True)


print(len(df_receitas))
df_receitas.head(5)

4623


Unnamed: 0,receita,ingredientes,preparo,tempo_de_preparo,rendimento,categoria,img
0,Bolo de maçã de liquidificador - o melhor do m...,2 xícaras de farinha de trigo\n2 xícaras de aç...,\nUnte e polvilhe com farinha um tabuleiro méd...,40MIN,25 porções,Bolos e Tortas,https://img.itdg.com.br/tdg/images/recipes/000...
1,Bolo de fubá com goiabada,1 ovo\n1 copo (americano) de leite\n1 copo (am...,"\nMisture no liquidificador o ovo, o leite, o ...",40MIN,10 porções,Bolos e Tortas,https://img.itdg.com.br/tdg/images/recipes/000...
2,Bolo de banana caramelada,Massa:\n3 ovos\n3 colheres (sopa) de margarina...,\nCobertura:\nDespeje o açúcar em uma forma re...,60MIN,12 porções,Bolos e Tortas,https://img.itdg.com.br/tdg/images/recipes/000...
3,Bolo de fubá de liquidificador,1 copo de óleo\n3 ovos\n1 e 1/2 copo de açúcar...,\nBater tudo no liquidificador.\nColocar em um...,50MIN,15 porções,Bolos e Tortas,https://img.itdg.com.br/tdg/images/recipes/000...
4,Bolo de milho cremoso,1 lata de milho verde\n1 lata de óleo (medida ...,"\nEm um liquidificador, adicione o milho verde...",90MIN,10 porções,Bolos e Tortas,https://img.itdg.com.br/tdg/images/recipes/000...


In [0]:
len(df_receitas)

4623

In [0]:
df_receitas["categoria"].value_counts()

Peixes e Frutos do Mar    380
Doces e Sobremesas        380
Carnes                    380
Alimentação Saudável      380
Lanches                   380
Massas                    380
Sopas                     380
Saladas e Molhos          380
Aves                      380
Bolos e  Tortas           380
Bebidas                   380
Todas as Receitas         285
Vídeos                    158
Name: categoria, dtype: int64

# Analise dados 1


In [0]:
import pandas as pd

dados_1 =pd.read_csv('export_receitas_daninoce.csv')  

In [0]:
dados_1["categoria"] = ["-"]*1020

In [0]:
dados_1

Unnamed: 0,receita,ingredientes,preparo,tempo_de_preparo,rendimento,imagem,categoria
0,Bolo de nutella com apenas 2 ingredientes,Ingredientes\n1 xícara de NUTELLA*\n4 OVOS GRA...,Modo de preparo\nDerreta um pouco a nutella em...,15 minutos,8 pessoas,https://www.daninoce.com.br/wp-content/uploads...,-
1,Brigadeiro Russo aka Kartoshka | Doce Russo,INGREDIENTES\n75 gramas de MANTEIGA\n160 grama...,MODO DE PREPARO\nEm uma leiteira derreta a man...,20 minutos,8 - 10 porções,https://www.daninoce.com.br/wp-content/uploads...,-
2,Pizza de Pão de Queijo,INGREDIENTES: MASSA\n150 gramas de QUEIJO MINA...,MODO DE PREPARO\nRale o queijo e reserve.\nEm ...,30 minutos,4 pessoas,https://www.daninoce.com.br/wp-content/uploads...,-
3,Receita de brigadeiro de chocolate meio amargo,INGREDIENTES\n1 lata de LEITE CONDENSADO\n175 ...,MODO DE PREPARO\nEm uma panela grande coloque ...,20 minutos,2 a 4 pessoas,https://www.daninoce.com.br/wp-content/uploads...,-
4,Receita de brigadeiro de leite ninho,INGREDIENTES\n4 colheres de sopa de LEITE NINH...,"MODO DE PREPARO\nColoque o leite ninho, o leit...",20 minutos,2 a 4 pessoas,https://www.daninoce.com.br/wp-content/uploads...,-
...,...,...,...,...,...,...,...
1015,Bolo de Azeite e Laranja,Ingredientes\n200 gramas de MANTEIGA em temper...,Modo de Preparo\nPré-aqueça o forno a 180°C.\n...,30 minutos,8 pessoas,https://www.daninoce.com.br/wp-content/uploads...,-
1016,Massa para Bolo de Cereja e Uvas Passas,Ingredientes\n300ml de LEITE INTEGRAL\n4 colhe...,Modo de Preparo\nPré-aqueça o forno a 220°C.\n...,30 minutos,8 pessoas,https://www.daninoce.com.br/wp-content/uploads...,-
1017,Massa para Bolo de Chocolate ou Petit Gâteau,Ingredientes\n225 gramas de MANTEIGA\n100 gram...,Modo de Preparo\nDerreta a manteiga com os cho...,20 minutos,10 pessoas,https://www.daninoce.com.br/wp-content/uploads...,-
1018,Massa para Bolo Double Chocolate,Ingredientes\n200 gramas de FARINHA DE TRIGO\n...,Modo de Preparo\nPré-aqueça o forno a 200°C.\n...,15 minutos,8 pessoas,https://www.daninoce.com.br/wp-content/uploads...,-


In [0]:
export_1 = dados_1[["receita","ingredientes",'preparo','tempo_de_preparo','rendimento','categoria','imagem']]
export_1.to_csv (r'export_receitas_daninoce.csv', index = False, header=True)

# Analise de dados 2


In [0]:
import pandas as pd

dados_2 =pd.read_csv('Tudo_Receitas.csv')  

dados_2.head()

Unnamed: 0.1,Unnamed: 0,receita,ingredientes,preparo,tempo_de_preparo,rendimento,serve_como,dificuldade,imagem,categoria
0,0,Receita de Bolo com poucos ingredientes,\n\n\n4 ovos\n\n\n\n\n1½ xícaras de açúcar (24...,Separe as claras das gemas e reserve. Transfir...,45m,6 convidados,Café da manhã,Dificuldade baixa,https://t2.rg.ltmcdn.com/pt/images/3/5/3/bolo_...,Receitas de Pão e bolos
1,1,Receita de Pão de alho caseiro com queijo,\n\n\n2 pães (usei pão ciabatta)\n\n\n\n\n⅓ xí...,Pré-aqueça o forno nos 180ºC. No liquidificado...,15m,4 convidados,Entrada,Dificuldade baixa,https://t1.rg.ltmcdn.com/pt/images/4/4/3/pao_d...,Receitas de Pão e bolos
2,2,Receita de Pão de trigo sarraceno,\n\n\n2 xícaras de farinha de trigo sarraceno ...,Coloque numa tigela as 3 farinhas sem glúten i...,2h 30m,4 convidados,Café da manhã,Dificuldade baixa,https://t1.rg.ltmcdn.com/pt/images/0/6/2/pao_d...,Receitas de Pão e bolos
3,3,Receita de Pão caseiro recheado de liquidificador,\nPara a massa:\n\n\n\n2 ovos\n\n\n\n\n3 colhe...,Separe os ingredientes necessários ao preparo ...,45m,4 convidados,Lanche,Dificuldade baixa,https://t1.rg.ltmcdn.com/pt/images/6/2/3/pao_c...,Receitas de Pão e bolos
4,4,Receita de Pão com ovo na frigideira,\n\n\n1 ovo\n\n\n\n\n1 colher de sopa de mante...,Comece separando os ingredientes - organização...,10m,1 convidado,Café da manhã,Dificuldade muito baixa,https://t1.rg.ltmcdn.com/pt/images/1/2/3/pao_c...,Receitas de Pão e bolos


In [0]:
export_2 = dados_2[["receita","ingredientes",'preparo','tempo_de_preparo','rendimento','categoria','imagem']]
export_2.to_csv (r'export_receitas_tudoReceitas.csv', index = False, header=True)

# Analise de dados 3


In [0]:
import pandas as pd

dados_3 =pd.read_csv('receitas_brogui.csv')  

dados_3.head()

Unnamed: 0,receita,ingredientes,preparo,tempo_de_preparo,rendimento,categoria,foto
0,Bolo de Banana,4 ovos\n3/4 de xícara de óleo \n1 xícara de aç...,"1. Bater no liquidificador adicione os ovos, o...",00:50 min,10 porções,Bolos e Tortas,
1,Abacaxi com creme de leite condensado,1 lata de leite condensado\n1/2 xic de leite \...,Creme belga\n1. Peneire as gemas e misture com...,00:30 min,6 porções,Bolos e Tortas,https://www.anamariabrogui.com.br/assets/uploa...
2,Sacolé de chocolate com coco,1 lata de leite condensado \nAchocolatado ou c...,1. Bata tudo no liquidificador e distribua em ...,02:15 min,10 porções,Bolos e Tortas,
3,Bolo Kufa,2 xícaras de leite\n1/2 xícara de óleo\n2 ovos...,"Bolo\n1. Bater bem a manteiga, as gemas, o óle...",00:50 min,17 porções,Bolos e Tortas,
4,Bolo de Laranja Light Dukan,01 ovo\n02 colheres (sopa) de adoçante forno e...,"1. Bata bem o ovo com um garfo. Em seguida, mi...",00:35 min,10 porções,Bolos e Tortas,https://www.anamariabrogui.com.br/assets/uploa...


In [0]:
dados_3.dropna(axis=0,inplace=True)

In [0]:
dados_3.head()

Unnamed: 0,receita,ingredientes,preparo,tempo_de_preparo,rendimento,categoria,foto
1,Abacaxi com creme de leite condensado,1 lata de leite condensado\n1/2 xic de leite \...,Creme belga\n1. Peneire as gemas e misture com...,00:30 min,6 porções,Bolos e Tortas,https://www.anamariabrogui.com.br/assets/uploa...
4,Bolo de Laranja Light Dukan,01 ovo\n02 colheres (sopa) de adoçante forno e...,"1. Bata bem o ovo com um garfo. Em seguida, mi...",00:35 min,10 porções,Bolos e Tortas,https://www.anamariabrogui.com.br/assets/uploa...
5,Bolo cremoso de fubá,2 xícaras (chá) de leite\n1 pitada de sal\n1 x...,"1. Num liquidificador, coloque leite, leite co...",00:50 min,10 porções,Bolos e Tortas,https://www.anamariabrogui.com.br/assets/uploa...
8,Bolo Com Recheio de Leite Ninho,2 xícaras de açúcar\n4 colheres (sopa) de marg...,Bata as claras em neve e reserve.\n1. Misture ...,01:00 min,10 porções,Bolos e Tortas,https://www.anamariabrogui.com.br/assets/uploa...
11,Bolo de chocolate fácil e barato,1 xícara de óleo\n1 xícara de água\n2 xícaras ...,"1. Bata no liquidificador os ovos, a água, o ó...",00:50 min,12 porções,Bolos e Tortas,https://www.anamariabrogui.com.br/assets/uploa...


In [0]:
export_2.to_csv (r'export_receitas_Brogui.csv', index = False, header=True)