## Descrição

Notebook de exemplo para extração dos dados do LinkedIn.

## Import bibliotecas

In [1]:
from pathlib import Path
from staffspy import LinkedInAccount, DriverType, BrowserType

## Autenticação

Nesta etapa, você deve autenticar o seu usuário para acessar a API do LinkedIn, altere o path abaixo para o caminho do seu arquivo `session.pkl` que contém os cookies de login (recomendo colocar na pasta `/data`).

Para o primeiro login você precisará utilizar o chromedriver e logar no LinkedIn manualmente, após esse login apertando "enter" você salvará os cookies de login, precisando apenas fornecer o argumento `session_file`.

In [2]:
session_file = (
    Path("D:/Jupyther/UFSC/fcatarina-database/data/session.pkl").resolve().parent
    / "session.pkl"
)

In [3]:
account = LinkedInAccount(
    session_file=str(session_file),
    # driver_type=DriverType( # Necessário para primeiro login com o ChromeDriver
    #     browser_type=BrowserType.CHROME,
    #     executable_path="D:/Jupyther/UFSC/fcatarina-database/chromedriver-win64/chromedriver.exe", # Caminho do ChromeDriver
    # ),
)

## Extração de dados

Primeiro você irá extrair os ids dos usuários do LinkedIn, você poderá alterar os argumentos abaixo para escolher os termos de pesquisa e a quantidade de usuários a serem extraídos, lembrando que já estou usando o ID da UFSC para filtragem apenas de alumni.

In [8]:
staff = account.scrape_staff(
    school_id="17959",  # UFSC id
    search_term='"Conselheiro"',
    max_results=10,  # can go up to 1000
)

In [10]:
staff.head()

Unnamed: 0,search_term,id,profile_id,name,first_name,last_name,location,headline,estimated_age,followers,...,bio,experiences,schools,skills,certifications,emails_in_bio,potential_emails,profile_link,profile_photo,banner_photo
0,"""Conselheiro""",ACoAAD6qlaEBf74JQ7hywZs5mGGpJbbvQosSomo,,Bruno Lessa Heins,,,,Graduando de Engenharia de Materiais - UFSC | ...,,,...,,,,,,,,,,
1,"""Conselheiro""",ACoAAD-lZ2QBhriTPXddUQmMHMv8GlAYpD-nZKs,,Luigi Enrico Argenton,,,,Invest Jr. | Engenharia Civil | UFSC,,,...,,,,,,,,,,
2,"""Conselheiro""",ACoAABijfaEBHAZmeTsY6XIQ9wwAQIyLZpkm1vs,,Alberto Rocha,,,,Iniciação Científica | PROCER / EQA / UFSC,,,...,,,,,,,,,,
3,"""Conselheiro""",ACoAADZVbqkBzIQ3zs0EeekgVp9xJmN_IgeDU-Q,,Lucas Bortoletto,,,,Undergraduate Researcher at LabMat | Ampera Ra...,,,...,,,,,,,,,,
4,"""Conselheiro""",ACoAADgwekcB8IM9f2MfPR7AWxVvmiZ2M8uMlGM,,Lucas Cominetti Marchi,,,,Graduando de Engenharia Mecânica - UFSC | Bols...,,,...,,,,,,,,,,


### Extração de dados de perfil

Aqui iremos extrair os dados completos dos usuários com base nos ids extraídos anteriormente.

In [6]:
users = account.scrape_users(user_ids=staff["id"].head().tolist())

In [7]:
users

Unnamed: 0,search_term,id,profile_id,name,first_name,last_name,location,headline,estimated_age,followers,...,bio,experiences,schools,skills,certifications,emails_in_bio,potential_emails,profile_link,profile_photo,banner_photo
0,manual,ACoAAC1pUeIBJDS8oGqySeRDNtU5tEn0_XjtW_I,luís-eduardo-guollo-bertan,Luís Eduardo Guollo Bertan,Luís Eduardo,Guollo Bertan,"São Paulo, Brazil",Chief of Staff to the CEO at The Bakery,28,386,...,Sou formado em Engenharia de Produção pela Uni...,"[{'start_date': '2024-07-22', 'end_date': None...","[{'start_date': '2018-10-22', 'end_date': '202...","[{'name': 'Microsoft Office', 'endorsements': ...",,,,https://www.linkedin.com/in/luís-eduardo-guoll...,https://media.licdn.com/dms/image/v2/D4D03AQGU...,https://media.licdn.com/dms/image/v2/D4D16AQGq...
1,manual,ACoAAAhgqIgBkIjvzduhydSr-2QCrpKkHCsfBi8,felipe-santos-eberhardt,Felipe Santos Eberhardt,Felipe,Santos Eberhardt,"Santa Catarina, Brazil",CEO at Bix Tech,35,3567,...,,"[{'start_date': '2014-05-22', 'end_date': None...","[{'start_date': '2007-10-22', 'end_date': '201...","[{'name': 'Desenvolvimento de software', 'endo...","[{'title': 'Qlik Sense Data Architect', 'issue...",,,https://www.linkedin.com/in/felipe-santos-eber...,https://media.licdn.com/dms/image/v2/C4D03AQGa...,https://media.licdn.com/dms/image/v2/C4E16AQHS...
2,manual,ACoAAAgmeCoBnjAPQlM2XaQ9WULItfwfybp8Q8E,matheus-valin-34a96339,Matheus Valin,Matheus,Valin,"Santa Catarina, Brazil",CEO da Emusys Tecnologia,27,420,...,,"[{'start_date': '2016-07-22', 'end_date': None...","[{'start_date': '2023-03-22', 'end_date': '202...","[{'name': 'Desenvolvimento de software', 'endo...",,,,https://www.linkedin.com/in/matheus-valin-34a9...,https://media.licdn.com/dms/image/v2/C4D03AQEA...,https://media.licdn.com/dms/image/v2/C4D16AQHP...
3,manual,ACoAABdTeuUBZJq9wUOgWkGJjIEFwpN8G8K9ZGY,artursandrade,artur andrade,artur,andrade,Brazil,ceo @ mobway,32,996,...,"Engenheiro mecânico pela UFSC, com especializa...","[{'start_date': '2021-08-22', 'end_date': None...","[{'start_date': '2017-10-22', 'end_date': '201...","[{'name': 'Veículos elétricos', 'endorsements'...",[{'title': 'Nível B1 de proficiência em francê...,,,https://www.linkedin.com/in/artursandrade,https://media.licdn.com/dms/image/v2/C4D03AQH6...,https://media.licdn.com/dms/image/v2/D4D16AQF2...
4,manual,ACoAAC4VojkBbHudaeptJhPH-j5-36UQOwMj_J8,kevin-voigt-221b24196,Kevin Voigt,Kevin,Voigt,"Santa Catarina, Brazil",CEO at Notus Labs | Advocate for Technological...,27,2196,...,A Physicist Bachelor that fell in love with So...,"[{'start_date': '2023-01-22', 'end_date': None...","[{'start_date': '2015-10-22', 'end_date': '202...","[{'name': 'Agile Methodologies', 'endorsements...",,,,https://www.linkedin.com/in/kevin-voigt-221b24196,https://media.licdn.com/dms/image/v2/D4D03AQGa...,https://media.licdn.com/dms/image/v2/D4D16AQEd...


In [15]:
users.to_csv("users.csv", index=False)