<a href="https://colab.research.google.com/github/armandossrecife/teste/blob/main/download_files_in_threads.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Teste de downloads em várias Threads

In [20]:
import threading
import urllib.request
import datetime

lista_tempo_conclusao = []
# Faz o download de um arquivo
# url - link do arquivo 
# nome - nome do arquivo 
# lista - lista que guarda o tempo que o download foi iniciado
def meu_download(url, nome, lista):
  try:
    print(f"download {nome} iniciado!")
    filename, headers = urllib.request.urlretrieve(url, filename=nome)
    tempo = datetime.datetime.now()
    print(f"download do arquivo {filename} completo! -> instante: {tempo}")
    elemento = (nome, tempo)
    lista.append(elemento)
  except Exception as ex: 
    print(f"Erro no download: {str(ex)}")

In [21]:
url1 = "https://raw.githubusercontent.com/armandossrecife/teste/main/archive.zip"
qtd_downloads = 10

print("bloco de downloads...")
tempo1 = datetime.datetime.now()

lista_threads = [] # lista que armazena dos threads que vao fazer os downloads
lista_tempo_inicio = [] # lista que vai guardar o instante de inicio de cada thread de download

for i in range(qtd_downloads):
  nome = 'arquivo'+str(i+1)+'.zip'
  tdi = threading.Thread(target=meu_download, args=(url1, nome, lista_tempo_conclusao)) # Thread que inicia cada download
  tdi.name = 'Thread-'+str(i+1) # nome do objeto thread recem criado
  inicio_thread = datetime.datetime.now() # instante que o download inicia
  print(f"Thread {i+1} iniciada em {inicio_thread}")
  lista_threads.append(tdi) # insere a thread recem criada na lista de threads
  elemento = (nome, inicio_thread)
  lista_tempo_inicio.append(elemento)
  tdi.start() # inicia a thread

for each in lista_threads:
  each.join()
  
tempo2 = datetime.datetime.now()
print("")
print(f"Tempo total de {qtd_downloads} downloads: {tempo2-tempo1}s")

for t1 in lista_tempo_inicio:
  for t2 in lista_tempo_conclusao:
    if (t1[0]==t2[0]):
      print(f"Tempo de download do {t1[0]} é: {t2[1]-t1[1]}s")

bloco de downloads...
Thread 1 iniciada em 2023-02-03 21:09:16.293688
download arquivo1.zip iniciado!Thread 2 iniciada em 2023-02-03 21:09:16.294596

download arquivo2.zip iniciado!Thread 3 iniciada em 2023-02-03 21:09:16.298316

download arquivo3.zip iniciado!Thread 4 iniciada em 2023-02-03 21:09:16.300684

download arquivo4.zip iniciado!Thread 5 iniciada em 2023-02-03 21:09:16.301726

download arquivo5.zip iniciado!Thread 6 iniciada em 2023-02-03 21:09:16.304236

download arquivo6.zip iniciado!
Thread 7 iniciada em 2023-02-03 21:09:16.306228
download arquivo7.zip iniciado!
Thread 8 iniciada em 2023-02-03 21:09:16.310403
download arquivo8.zip iniciado!
Thread 9 iniciada em 2023-02-03 21:09:16.314060
download arquivo9.zip iniciado!Thread 10 iniciada em 2023-02-03 21:09:16.317741

download arquivo10.zip iniciado!
download do arquivo arquivo5.zip completo! -> instante: 2023-02-03 21:09:16.759877
download do arquivo arquivo7.zip completo! -> instante: 2023-02-03 21:09:16.802637
download d

# Teste usando clonagem de repositórios em várias Threads

In [22]:
!python3 -m pip install gitpython

Looking in indexes: https://pypi.org/simple, https://us-python.pkg.dev/colab-wheels/public/simple/


In [28]:
from git import Repo

lista_tempo_conclusao = []
def my_clone(git_url, repo_dir, lista):
  try:
    Repo.clone_from(git_url, repo_dir)
    tempo = datetime.datetime.now()
    print(f'Clonagem do repo {git_url} concluída com sucesso! -> instante: {tempo}')
    elemento = (repo_dir, tempo)
    lista.append(elemento)
  except Exception as ex:
    print(f"Erro ao clonar o repo: {git_url}")

In [29]:
lista_urls = ['https://github.com/apache/cassandra.git', 'https://github.com/armandossrecife/teste', 'https://github.com/Technical-Debt-Large-Scale/sysrepoanalysis.git', 'https://github.com/armandossrecife/syspromocity.git']
qtd_repositorios = len(lista_urls)

print("bloco de clonagem...")
tempo1 = datetime.datetime.now()

lista_threads = [] # lista que armazena dos threads que vao fazer os clones
lista_tempo_inicio = [] # lista que vai guardar o instante de inicio de cada thread de clonagem

for i in range(qtd_repositorios):
  nome = 'repositorio'+str(i+1)
  tdi = threading.Thread(target=my_clone, args=(lista_urls[i], nome, lista_tempo_conclusao)) # Thread que inicia cada clonagem
  tdi.name = 'Thread-'+str(i+1) # nome do objeto thread recem criado
  inicio_thread = datetime.datetime.now() # instante que o clone inicia
  print(f"Thread {i+1} iniciada em {inicio_thread}")
  lista_threads.append(tdi) # insere a thread recem criada na lista de threads
  elemento = (nome, inicio_thread)
  lista_tempo_inicio.append(elemento)
  tdi.start() # inicia a thread

for each in lista_threads:
  each.join()
  
tempo2 = datetime.datetime.now()
print("")
print(f"Tempo total de {qtd_repositorios} downloads: {tempo2-tempo1}s")

print(f'Lista de tempos de inicio: {lista_tempo_inicio}')
print(f'Lista de tempos de conclusao: {lista_tempo_conclusao}')

for t1 in lista_tempo_inicio:
  for t2 in lista_tempo_conclusao:
    if (t1[0]==t2[0]):
      print(f"Tempo de download do {t1[0]} é: {t2[1]-t1[1]}s")

bloco de clonagem...
Thread 1 iniciada em 2023-02-03 21:14:25.675549
Thread 2 iniciada em 2023-02-03 21:14:25.684118
Thread 3 iniciada em 2023-02-03 21:14:25.690004
Thread 4 iniciada em 2023-02-03 21:14:25.697944
Clonagem do repo https://github.com/Technical-Debt-Large-Scale/sysrepoanalysis.git concluída com sucesso! -> instante: 2023-02-03 21:14:26.740142
Clonagem do repo https://github.com/armandossrecife/teste concluída com sucesso! -> instante: 2023-02-03 21:14:27.683135
Clonagem do repo https://github.com/armandossrecife/syspromocity.git concluída com sucesso! -> instante: 2023-02-03 21:14:28.786109
Clonagem do repo https://github.com/apache/cassandra.git concluída com sucesso! -> instante: 2023-02-03 21:15:07.630771

Tempo total de 4 downloads: 0:00:41.957212s
Lista de tempos de inicio: [('repositorio1', datetime.datetime(2023, 2, 3, 21, 14, 25, 675549)), ('repositorio2', datetime.datetime(2023, 2, 3, 21, 14, 25, 684118)), ('repositorio3', datetime.datetime(2023, 2, 3, 21, 14, 25

In [27]:
!rm -rf repositorio*