In [None]:
!pip install pdfplumber pandas openpyxl

import pdfplumber
import pandas as pd

def extract_and_save_data(pdf_path: str, excel_path: str) -> None:
    """
    Extrai dados de tabelas de um PDF e salva em um arquivo Excel.

    Args:
        pdf_path (str): Caminho do arquivo PDF.
        excel_path (str): Caminho do arquivo Excel onde os dados serão salvos.
    """
    def extract_tables_from_pdf(pdf_path: str) -> list:
        """Extrai tabelas do PDF."""
        tables = []
        with pdfplumber.open(pdf_path) as pdf:
            for page in pdf.pages:
                tables.extend(page.extract_tables())
        return tables

    # Extrair tabelas
    extracted_tables = extract_tables_from_pdf(pdf_path)

    # Printar os dados extraídos no formato desejado
    for i, table in enumerate(extracted_tables):
        print(f"Tabela {i + 1}:")
        for row in table:
            print(row)

    # Salvar as tabelas em um DataFrame e depois no Excel
    with pd.ExcelWriter(excel_path, mode='a', engine='openpyxl') as writer:
        for i, table in enumerate(extracted_tables):
            df = pd.DataFrame(table)
            df.to_excel(writer, sheet_name=f'Tabela_{i + 1}', index=False)

    print(f'Dados salvos no arquivo {excel_path} com as tabelas extraídas.')

# Caminhos dos arquivos
pdf_path = '/content/Dados.pdf'
excel_path = '/content/dados_ibge_cidade.xlsx'

# Chamar a função principal
extract_and_save_data(pdf_path, excel_path)
