# Automação Web - Preços Carros por Assinatura Movida


Pacotes mais utilizados para web scraping no python:

Documentação: https://beautiful-soup-4.readthedocs.io/en/latest/

Documentação: https://www.selenium.dev/selenium/docs/api/py/api.html

Desenvolvido por Leonardo Mundim como aplicação dos conhecimentos em web Scraping

In [1]:
import pandas as pd
from selenium import webdriver # permite criar o navegador
from selenium.webdriver.chrome.service import Service as ChromeService
from selenium.webdriver.common.keys import Keys  # permite escrever no navegador
from selenium.webdriver.common.by import By # permite selecionar itens no navegador
from selenium.webdriver.support.wait import WebDriverWait # cria tempo de espera no carregamento da página
from selenium.common.exceptions import NoSuchElementException # importa exception para não quebrar o loop com número excessivo de carros

# Configura o Chrome Driver
options = webdriver.ChromeOptions()
service = ChromeService(executable_path=r"C:\Users\leosm\.wdm\drivers\chromedriver\win64\116.0.5845.111\chromedriver.exe")

# abrir navegador
navegador = webdriver.Chrome(service=service, options=options)


# tempo de espera de carregamento da página
navegador.implicitly_wait(15) 

# entrar no site movida
navegador.get('https://movidacarroporassinatura.com.br/assinatura/busca')

# pega a quantidade de carros
#ofertas = navegador.find_element('xpath', '/html/body/app-root/div/div/showcase-all-cars/div/movida-show-result/div/div/div/div[1]/p/strong').text


# pegar a cotação da Movida - loop para 200 carros no site

try:
    lista_cards = []
    for card in range(1,200):
        lista_cards.append(navegador.find_element('xpath', f'/html/body/app-root/div[1]/div/showcase-all-cars/div/movida-show-result/div/div/div/div[6]/div[{card}]/a/movida-card-prod/movida-card-prod-find/div/div[2]').text)

except NoSuchElementException:
    pass
        

navegador.quit()

#lista_cards

In [2]:
# Separa as colunas na lista
lista_cards_1 = []
for card in lista_cards:
    lista_cards_1.append(card.split('\n'))

In [3]:
import re
from datetime import date

# Cria a tabela de preços
tabela = pd.DataFrame(lista_cards_1, columns=['Marca', 'Modelo', 'Característica', 'Preço 1', 'Preço 2', 'Obs'])
tabela['Preço c/ Proteção'] = tabela['Preço 2'].apply(lambda x: [(s.replace('.', '')) for s in re.findall(r'[\d]+[.,\d]+', x)]).\
                                                apply(lambda x: [float(s.replace(',','.')) + 29.70 for s in x])
tabela['Data'] = date.today()
tabela['Hora'] = pd.Timestamp('now').strftime("%H:%M:%S")
tabela['Preço 1'] = tabela['Preço 1'].replace('a partir de', '')
tabela = tabela.sort_values('Preço 2')

tabela

Unnamed: 0,Marca,Modelo,Característica,Preço 1,Preço 2,Obs,Preço c/ Proteção,Data,Hora
41,Renault,Logan,LOGAN Zen Flex 1.0 12V 4p Mec.,,"R$ 1.529,40/mês*",,[1559.1000000000001],2023-09-04,16:38:06
61,Renault,Kwid,KWID ZEN 1.0 FLEX 12V 5P MEC.,,"R$ 1.649,40/mês*",,[1679.1000000000001],2023-09-04,16:38:06
62,Fiat,Mobi,MOBI Like 1.0 Fire Flex 5p.,,"R$ 1.699,50/mês*",,[1729.2],2023-09-04,16:38:06
30,Renault,Kwid,KWID Intense 1.0 Flex 12V 5p Mec.,,"R$ 1.729,50/mês*",,[1759.2],2023-09-04,16:38:06
29,Peugeot,208,208 Like 1.0 Flex 6V 5p Mec.,,"R$ 1.829,70/mês*",,[1859.4],2023-09-04,16:38:06
...,...,...,...,...,...,...,...,...,...
53,Jeep,Compass,COMPASS LIMITED T270 1.3 TB 4x2 Flex Aut,,"R$ 5.549,70/mês*",,[5579.4],2023-09-04,16:38:06
13,Nissan,Frontier,Frontier S CD 4x4 2.3 TB Diesel Mec.,,"R$ 5.569,80/mês*",,[5599.5],2023-09-04,16:38:06
34,Jeep,Commander,Commander Limited T270 1.3 TB Flex Aut.,,"R$ 5.639,70/mês*",,[5669.4],2023-09-04,16:38:06
11,Fiat,500,500e ICON (Elétrico),,"R$ 6.539,70/mês*",,[6569.4],2023-09-04,16:38:06


### Exportar a nova base de preços atualizada para o Google Drive

In [4]:
# Passo 5: Exportar a base de preços atualizada


tabela.to_excel('Precos_MOVIDA.xlsx', index=False)

In [3]:
from googleapiclient.discovery import build
from googleapiclient.http import MediaFileUpload
from google.oauth2 import service_account

# Caminho para o arquivo de credenciais JSON
credentials_path = 'precos-movida-XXXXX.json'

# ID do arquivo existente no Google Drive que você deseja sobrescrever
file_id = '1Nr1r61XXXXXXXX-PYVRQtZ5UslPCXXXX'

# Caminho para o novo arquivo Excel que deseja fazer upload
file_path = 'Precos_MOVIDA.xlsx'

# Configuração da autenticação
credentials = service_account.Credentials.from_service_account_file(credentials_path, scopes=['https://www.googleapis.com/auth/drive'])
service = build('drive', 'v3', credentials=credentials)

# Fazer o upload do novo arquivo para substituir o arquivo existente
media = MediaFileUpload(file_path, mimetype='application/vnd.openxmlformats-officedocument.spreadsheetml.sheet')
updated_file = service.files().update(fileId=file_id, media_body=media).execute()

print(f'O arquivo foi sobrescrito com sucesso. ID do arquivo: {updated_file["id"]}')


O arquivo foi sobrescrito com sucesso. ID do arquivo: 1Nr1r61XXXXXXXX-PYVRQtZ5UslPCXXXX
