# Workana Scrapp

## Scrapping one Job with Selenium 

In [1]:
# Import Lib
import pandas as pd

from selenium import webdriver
from selenium.webdriver.chrome.service import Service as ChromeService
from webdriver_manager.chrome import ChromeDriverManager
from selenium.webdriver.common.by import By
from selenium.common.exceptions import NoSuchElementException

In [2]:
# init session
driver = webdriver.Chrome(service=ChromeService(ChromeDriverManager().install()))

# maximizar a janela do navegador
driver.maximize_window()

In [3]:
# go to workana
driver.get(f'https://www.workana.com/jobs?language=pt&page={1}')

In [4]:
# title
job_title = driver.find_element(By.XPATH, f'//*[@id="projects"]/div[{2}]/div[1]/h2/a/span')
job_title = job_title.get_attribute('title')
print('Tutilo:',job_title)

Tutilo: Desenvolvimento de Ferramenta Para Checkout Web com Integrações com Erp


In [5]:
# date
job_date = driver.find_element(By.XPATH, f'//*[@id="projects"]/div[{2}]/div[1]/h5')
job_date = job_date.get_attribute('title')
print('Publicação:',job_date)

Publicação: 11 de Maio de 2023 12:50


In [6]:
# job_link
job_link = driver.find_element(By.XPATH, f'//*[@id="projects"]/div[{2}]/div[1]/h2/a')
job_link = job_link.get_attribute('href')
print(job_link)

https://www.workana.com/job/desenvolvimento-de-ferramenta-para-checkout-web-com-integracoes-com-erp?ref=projects_1


In [7]:
# bids
job_bids = driver.find_element(By.XPATH, f'//*[@id="projects"]/div[{2}]/div[2]/div[1]/span[2]')
job_bids = job_bids.text.split(' ')[1]
print('Propostas:',job_bids)

Propostas: 1


In [8]:
# budget
job_budget = driver.find_element(By.XPATH, f'//*[@id="projects"]/div[{2}]/div[3]/h4/span')
job_budget = job_budget.text
print('Orçamento:',job_budget)


Orçamento: USD 1.000 - 3.000


In [9]:
# job description
job_desc = driver.find_element(By.XPATH, f'//*[@id="projects"]/div[{2}]/div[2]/div[2]/div')
job_desc = job_desc.text 
print(job_desc)

Procuro dev full stack para projeto de desenvolvimento de ferramenta checkout web (no site do cliente) com integração api em erp.

Categoria: TI e Programação
Subcategoria: Lojas Virtuais (e-commerce)
Qual é o alcance do projeto?: Alteração média
Isso é um projeto ou uma posição de trabalho?: Um projeto
... Ver mais detalhes


In [10]:
# get job skills 
job_sk = []

try:
    skills = driver.find_element(By.XPATH, f'//*[@id="projects"]/div[{2}]/div[2]/div[3]/div')
    skills = skills.find_elements(By.TAG_NAME, 'a')

    for skill in skills:
        s = skill.text
        job_sk.append(skill.text)

    job_sk = ', '.join(job_sk)
    print(job_sk)
except NoSuchElementException:
    s = 'Não informado'
    job_sk.append(s)
    print(job_sk)

Magento, PHP, WordPress


In [11]:
# create data list
data_temp = {'Job': job_title,'Publish Date': job_date, 'Skills': job_sk,  'Budget':job_budget, 
                'Bids': job_bids, 'Summary': job_desc, 'Link': job_link}

data =[]
data.append(data_temp)

In [12]:
print(len(data))
print(type(data))
print(data[0].keys())
print(data[0]['Job'])
print(data)


1
<class 'list'>
dict_keys(['Job', 'Publish Date', 'Skills', 'Budget', 'Bids', 'Summary', 'Link'])
Desenvolvimento de Ferramenta Para Checkout Web com Integrações com Erp
[{'Job': 'Desenvolvimento de Ferramenta Para Checkout Web com Integrações com Erp', 'Publish Date': '11 de Maio de 2023 12:50', 'Skills': 'Magento, PHP, WordPress', 'Budget': 'USD 1.000 - 3.000', 'Bids': '1', 'Summary': 'Procuro dev full stack para projeto de desenvolvimento de ferramenta checkout web (no site do cliente) com integração api em erp.\n\nCategoria: TI e Programação\nSubcategoria: Lojas Virtuais (e-commerce)\nQual é o alcance do projeto?: Alteração média\nIsso é um projeto ou uma posição de trabalho?: Um projeto\n... Ver mais detalhes', 'Link': 'https://www.workana.com/job/desenvolvimento-de-ferramenta-para-checkout-web-com-integracoes-com-erp?ref=projects_1'}]


In [13]:
# create dataframe
df =pd.DataFrame(data)
df

Unnamed: 0,Job,Publish Date,Skills,Budget,Bids,Summary,Link
0,Desenvolvimento de Ferramenta Para Checkout We...,11 de Maio de 2023 12:50,"Magento, PHP, WordPress",USD 1.000 - 3.000,1,Procuro dev full stack para projeto de desenvo...,https://www.workana.com/job/desenvolvimento-de...


### Export CSV


In [14]:
#create csv
df.to_csv('../workana_scraping/data/one_job.csv', index=False)