In [1]:
import requests 
import pandas as pd

In [2]:
# Função para extrair dados de um endpoint específico com paginação
def extrair_dados(endpoint):
    # Constrói a URL completa para o endpoint especificado
    url = f"https://swapi.dev/api/{endpoint}/"
    # Cria uma uma sessão em cada interação, permitindo que a conexão seja mantida aberta
    ## Envia uma solicitação GET para a URL usando a biblioteca 'requests'
    session = requests.Session()
    response = session.get(url)
    # Verifica se a reposta tem um status code 200 (indicando uma resposta bem sucedida)
    if response.status_code == 200:
        # Extrai os dados da resposta em formato JSON
        data = response.json()
        # Inicializa uma lista chamada 'results' com os resultados extraídos 
        results = data['results']
        # Verifica se há um link para a próxima página nos dados extraídos
        while data['next']:
            # Havendo próxima página, envia uma nova solicitação GET 
            response = session.get(data['next'])
            data = response.json()
            # Adiciona os dados da próxima página à lista 'results'
            results.extend(data['results'])
        # Retorna a lista completa de resultados extraídos
        return results
    else:
        # Se a resposta inicial não for bem-sucedida (status code diferente de 200),
        ## exibe uma mensagem de erro indicando o endpoint e o status code da resposta
        print(f"Erro ao extrair dados do endpoint {endpoint}. Status code: {response.status_code}")
        # Retorna None para indicar que ocorreu um erro na extração dos dados
        return None

In [3]:
def extracao_films():
    # Extração dos dados dos filmes (/films)
    print('Iniciando extração dos dados do endpoint /films...')
    dados_films = extrair_dados('films')
    if dados_films:
        print("Dados dos filmes:")
        films = []
        for film in dados_films:
            # Extrai os campos relevantes de cada filme
            films.append({
                "Título": film['title'],
                "Episódio": film['episode_id'],
                "Diretor": film['director'],
                "Produtor": film['producer'],
                "Data de lançamento": film['release_date'],
                "Personagens": ', '.join(film['characters']),
                "Planetas": ', '.join(film['planets']),
                "Naves estelares": ', '.join(film['starships']),
                "Veículos": ', '.join(film['vehicles']),
                "Espécies": ', '.join(film['species']),
                "URL": film['url'],
                "Criado em": film['created'],
                "Editado em": film['edited']
            })

        print('Extração de dados do endpoint /films concluída!')
        # Cria um DataFrame com os dados dos filmes
        df_filmes = pd.DataFrame(films)
        print(df_filmes)
        print("-----")

        # Exportar DataFrame para CSV
        df_filmes.to_csv('films.csv', index=False)
        print('films.csv criado com sucesso!')

        return films

In [4]:
def extracao_starships():
    # Extração dos dados das naves espaciais (/starships)
    print('Iniciando extração dos dados do endpoint /starships...')
    dados_starships = extrair_dados('starships')
    if dados_starships:
        print("Dados das naves espaciais:")
        starships = []
        for starship in dados_starships:
            # Extrai os campos relevantes de cada nave espacial
            starships.append({
                "Nome": starship['name'],
                "Modelo": starship['model'],
                "Fabricante": starship['manufacturer'],
                "Custo em créditos": starship['cost_in_credits'],
                "Comprimento": starship['length'],
                "Velocidade máxima na atmosfera": starship['max_atmosphering_speed'],
                "Tripulação": starship['crew'],
                "Passageiros": starship['passengers'],
                "Capacidade de carga": starship['cargo_capacity'],
                "Consumíveis": starship['consumables'],
                "Classe de nave espacial": starship['starship_class'],
                "Pilotos": ', '.join(starship['pilots']),
                "Filmes": ', '.join(starship['films']),
                "URL": starship['url'],
                "Criado em": starship['created'],
                "Editado em": starship['edited']
            })

        print('Extração de dados do endpoint /starships concluída!')
        # Cria um DataFrame com os dados das naves espaciais
        df_starships = pd.DataFrame(starships)
        print(df_starships)
        print("-----")

        # Exportar DataFrame para CSV
        df_starships.to_csv('starships.csv', index=False)
        print('starships.csv criado com sucesso!')

        return starships

In [5]:
def main():
    extracao_films()
    extracao_starships()

In [6]:
if __name__ == "__main__":
    main()

Iniciando extração dos dados do endpoint /films...
Dados dos filmes:
Extração de dados do endpoint /films concluída!
                    Título  Episódio           Diretor  \
0               A New Hope         4      George Lucas   
1  The Empire Strikes Back         5    Irvin Kershner   
2       Return of the Jedi         6  Richard Marquand   
3       The Phantom Menace         1      George Lucas   
4     Attack of the Clones         2      George Lucas   
5      Revenge of the Sith         3      George Lucas   

                                           Produtor Data de lançamento  \
0                         Gary Kurtz, Rick McCallum         1977-05-25   
1                         Gary Kurtz, Rick McCallum         1980-05-17   
2  Howard G. Kazanjian, George Lucas, Rick McCallum         1983-05-25   
3                                     Rick McCallum         1999-05-19   
4                                     Rick McCallum         2002-05-16   
5                               