In [2]:
from github import Github
import pandas as pd
import os
import json
import time

# Autenticação na API do GitHub
g = Github("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")  # Substitua pelo seu token

# Lista de tecnologias e arquivos a serem verificados
technologies = ['react', 'angular', 'material-ui', 'vue']
files_to_check = ['package.json', 'package-lock.json', 'yarn.lock', 'webpack.config.js', 'vite.config.js', 'angular.json', 'tsconfig.json', 'babel.config.js', '.babelrc', 'gatsby-config.js', 'nuxt.config.js', '.env']

# Criar a pasta jsonrepository se não existir
os.makedirs('jsonrepository', exist_ok=True)

# Função para verificar a presença de um arquivo e buscar por palavras-chave
def check_files_for_technology(repo, technology):
    try:
        repo_files = [file.path for file in repo.get_contents("")]  # Verifica no nível raiz
        file_present = {file: False for file in files_to_check}
        
        for file in files_to_check:
            if file in repo_files:
                file_present[file] = True
                
                # Se o arquivo estiver presente, buscar por palavras-chave relacionadas à tecnologia
                content = repo.get_contents(file).decoded_content.decode()
                if technology.lower() in content.lower():
                    return True
        return False
    except Exception as e:
        print(f"Erro ao acessar arquivos no repositório {repo.full_name}: {e}")
        return False

# Função para buscar repositórios e verificar tecnologias
def search_repositories(technology):
    repos_with_technology = []
    search_query = f"{technology} in:description"
    
    # Buscar repositórios
    try:
        for page in range(1, 3):  # Ajuste o número máximo de páginas conforme necessário
            print(f"Buscando página {page} para a tecnologia {technology}...")
            repos = g.search_repositories(query=search_query, sort="stars", order="desc", page=page, per_page=10)
            
            if repos.totalCount == 0:
                print(f"Nenhum repositório encontrado para {technology}.")
                break
            
            print(f"Total de repositórios encontrados para {technology}: {repos.totalCount}")
            
            for repo in repos:
                print(f"Verificando repositório: {repo.full_name}")
                try:
                    if check_files_for_technology(repo, technology):
                        repo_data = {
                            'repo_name': repo.full_name,
                            'technology': technology,
                            'description': repo.description,
                            'stars': repo.stargazers_count,
                            'forks': repo.forks_count,
                            'url': repo.html_url,
                            'created_at': repo.created_at.isoformat(),
                            'updated_at': repo.updated_at.isoformat()
                        }
                        repos_with_technology.append(repo_data)
                        print(f"Repositório {repo.full_name} usa a tecnologia {technology}.")
                except Exception as e:
                    print(f"Falha ao acessar o repositório {repo.full_name}: {str(e)}")
                
                time.sleep(1)  # Evitar exceder o limite de taxa da API

    except Exception as e:
        print(f"Falha ao buscar repositórios: {str(e)}")
    
    return repos_with_technology

# Buscar repositórios para cada tecnologia e armazenar os dados
for tech in technologies:
    print(f"Buscando repositórios para a tecnologia: {tech}")
    repos_data = search_repositories(tech)
    
    if repos_data:
        # Salvar os dados em um arquivo JSON dentro da pasta jsonrepository
        file_path = os.path.join('jsonrepository', f'repos_with_{tech}.json')
        with open(file_path, 'w') as f:
            json.dump(repos_data, f, indent=4)
        print(f"Dados para a tecnologia {tech} salvos em {file_path}.")
    else:
        print(f"Nenhum repositório encontrado para a tecnologia {tech}.")

print("Processo de busca concluído.")


Buscando repositórios para a tecnologia: react
Buscando página 1 para a tecnologia react...
Total de repositórios encontrados para react: 1
Verificando repositório: iamTheAvyzit/reactJS-CryptoWatchAPI
Repositório iamTheAvyzit/reactJS-CryptoWatchAPI usa a tecnologia react.
Buscando página 2 para a tecnologia react...
Nenhum repositório encontrado para react.
Dados para a tecnologia react salvos em jsonrepository\repos_with_react.json.
Buscando repositórios para a tecnologia: angular
Buscando página 1 para a tecnologia angular...
Nenhum repositório encontrado para angular.
Nenhum repositório encontrado para a tecnologia angular.
Buscando repositórios para a tecnologia: material-ui
Buscando página 1 para a tecnologia material-ui...
Nenhum repositório encontrado para material-ui.
Nenhum repositório encontrado para a tecnologia material-ui.
Buscando repositórios para a tecnologia: vue
Buscando página 1 para a tecnologia vue...
Nenhum repositório encontrado para vue.
Nenhum repositório encon

In [5]:
from github import Github
import pandas as pd
import os
import time

# Autenticação na API do GitHub
g = Github("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")  # Substitua pelo seu token

# Lista de arquivos a serem verificados
files_to_check = [
    'package.json', 'package-lock.json', 'yarn.lock', 'webpack.config.js', 
    'vite.config.js', 'angular.json', 'tsconfig.json', 'babel.config.js', 
    '.babelrc', 'gatsby-config.js', 'nuxt.config.js', '.env'
]

# Função para verificar a presença dos arquivos no repositório
def check_files_in_repository(repo):
    repo_files = [file.path for file in repo.get_contents("")]  # Listar arquivos do repositório
    found_files = {file: False for file in files_to_check}  # Inicializar todos os arquivos como não encontrados
    
    for file in files_to_check:
        if file in repo_files:
            found_files[file] = True  # Marcar o arquivo como encontrado
    
    return found_files

# Ler o arquivo CSV com os repositórios
input_csv = 'csv/react_repositories.csv'  # Substitua pelo nome do seu arquivo CSV
repos_df = pd.read_csv(input_csv)

# Adicionar colunas para cada arquivo a ser verificado
for file in files_to_check:
    repos_df[file] = False  # Inicializar as colunas como False

# Processar cada repositório
for index, row in repos_df.iterrows():
    repo_name = row['name']  # Nome do repositório no GitHub
    
    try:
        repo = g.get_repo(repo_name)  # Obter repositório pelo nome completo (ex: "usuario/repo")
        found_files = check_files_in_repository(repo)  # Verificar arquivos no repositório
        
        # Atualizar as colunas do DataFrame com os arquivos encontrados
        for file, found in found_files.items():
            repos_df.at[index, file] = found
        
        print(f"Arquivos verificados para o repositório: {repo_name}")
    except Exception as e:
        print(f"Erro ao acessar o repositório {repo_name}: {e}")
    
    time.sleep(1)  # Pausa para evitar exceder o limite de taxa da API

# Garantir que a pasta 'existpackage' exista
output_dir = 'existpackage'
if not os.path.exists(output_dir):
    os.makedirs(output_dir)

# Salvar o resultado em um novo arquivo CSV dentro da pasta 'existpackage'
output_csv = os.path.join(output_dir, 'repos_with_files.csv')
repos_df.to_csv(output_csv, index=False)

print(f"Resultados salvos em {output_csv}")


Arquivos verificados para o repositório: facebook/react
Arquivos verificados para o repositório: typescript-cheatsheets/react
Arquivos verificados para o repositório: duxianwei520/react
Arquivos verificados para o repositório: primer/react
Arquivos verificados para o repositório: discountry/react
Arquivos verificados para o repositório: react-redux-antd-es6/react
Arquivos verificados para o repositório: HackYourFuture/React
Arquivos verificados para o repositório: Cathy0807/react
Arquivos verificados para o repositório: ysymyth/ReAct
Arquivos verificados para o repositório: vercel/next.js
Arquivos verificados para o repositório: formio/react
Arquivos verificados para o repositório: xzlaptt/React
Arquivos verificados para o repositório: facebook/react-native
Arquivos verificados para o repositório: ui-router/react
Arquivos verificados para o repositório: ReactiveCocoa/ReactiveCocoa
Arquivos verificados para o repositório: facebook/create-react-app
Arquivos verificados para o repositório