In [25]:
# Importações

from selenium import webdriver
from selenium.webdriver.common.by import By
from selenium.webdriver.common.keys import Keys
from selenium.webdriver.chrome.service import Service
from webdriver_manager.chrome import ChromeDriverManager
import time

import pandas as pd
import re
import warnings


In [26]:
# Suprimir todos os warnings
warnings.filterwarnings('ignore')



In [27]:
# Configurar o driver
driver  = webdriver.Chrome()

driver.get('https://web.whatsapp.com')


In [41]:
# Encontrar todos os elementos <span> com o atributo 'title' preenchido
spans_with_title = driver.find_elements(By.XPATH, '//span[@title]')


In [42]:
# Criar uma lista para armazenar os textos do atributo 'title'
titles = [span.get_attribute('title') for span in spans_with_title]


In [43]:
# Ordenar a lista do maior para o menor tamanho de texto
titles_sorted = sorted(titles, key=len, reverse=True)


In [44]:
# Criar uma lista a partir do conteúdo, dividindo por vírgulas
numbers_list = [item.strip() for item in titles_sorted[0].split(',')]


In [45]:
# Criando dataframe com números
df = pd.DataFrame(numbers_list, columns=['Whatsapp'])


In [46]:
# Tirando substring 'mais'
df = df[~df['Whatsapp'].str.contains('mais', case=False, na=False)]


In [47]:
# Função para limpar o número, removendo caracteres indesejados
def limpar_numero(numero):
    return re.sub(r'[+()\-\s]', '', numero)


In [48]:
# Aplicar a função de limpeza em cada item da lista
df['Numero limpo'] = df['Whatsapp'].apply(limpar_numero)


In [49]:
# Criando link
df['Link'] = df['Numero limpo'].apply(lambda x: f"https://web.whatsapp.com/send?phone={x}")


In [50]:
# Tirando duplicações
df.drop_duplicates(inplace=True)


In [55]:
#Inserir nome grupo 
nome_grupo = 'Data Creators'
df['Grupo'] = nome_grupo

In [56]:
# Conferindo se está tudo certo
df[['Whatsapp','Link','Grupo']]


Unnamed: 0,Whatsapp,Link,Grupo
0,Bruno,https://web.whatsapp.com/send?phone=Bruno,Data Creators
2,Diego,https://web.whatsapp.com/send?phone=Diego,Data Creators
3,Heitor,https://web.whatsapp.com/send?phone=Heitor,Data Creators
5,Ivys,https://web.whatsapp.com/send?phone=Ivys,Data Creators
6,Livia,https://web.whatsapp.com/send?phone=Livia,Data Creators
...,...,...,...
168,+55 92 9130-9432,https://web.whatsapp.com/send?phone=559291309432,Data Creators
169,+55 98 9215-1430,https://web.whatsapp.com/send?phone=559892151430,Data Creators
170,+61 407 311 432,https://web.whatsapp.com/send?phone=61407311432,Data Creators
171,+61 490 471 370,https://web.whatsapp.com/send?phone=61490471370,Data Creators


In [57]:
df[['Whatsapp','Link','Grupo']].to_csv('contatos_whatsapp.csv',index=False)
