# Evitando o 7x1 com Python e SQL

Aprenda na prática a prever o campeão da Copa do Mundo usando ciência de dados, mesmo que você não entenda nada sobre o assunto. Todo código estará disponível neste link do GitHub: 

**[github.com/digitalinnovationone/live-coding-evitando-o-7x1-com-python-e-sql](https://github.com/digitalinnovationone/live-coding-evitando-o-7x1-com-python-e-sql)**

Acesse nossa [*landing page*](https://lp.dio.me/evitando-7x1-com-python-e-sql/) para saber todos os detalhes do evento.

## 1. Estrutura com os [Grupos e Seleções](https://global.discourse-cdn.com/nubank/original/4X/d/d/b/ddb82274a8785b60d1a19df8aeee768e87091292.jpeg), além de seus respectivos scores ([Ranking FIFA](https://www.ogol.com.br/ranking_fifa.php))

In [None]:
%pip install pandas 

In [3]:
import pandas as pd

df = pd.read_csv('https://raw.githubusercontent.com/digitalinnovationone/live-coding-evitando-o-7x1-com-python-e-sql/main/data.csv')
df.head()

Unnamed: 0,A,B,C,D,E,F,G,H
0,CAT|1442.0,EUA|1635.0,ARG|1770.7,AUS|1483.7,ALE|1659.0,BEL|1821.9,BRA|1837.6,COR|1526.0
1,EQU|1463.7,ING|1737.5,ARA|1435.7,DIN|1665.5,COS|1500.1,CAN|1473.8,CAM|1485.0,GAN|1393.5
2,HOL|1679.4,IRA|1558.6,MEX|1649.6,FRA|1764.9,ESP|1716.9,CRO|1632.2,SUI|1621.4,POR|1678.7
3,SEN|1584.6,GAL|1582.1,POL|1546.2,TUN|1507.9,JAP|1554.7,MAR|1558.4,SER|1549.5,URU|1641.0


##2. Classe que representa um time, com suas características e comportamentos:

In [4]:
import random

class Team:
  best_score = 1837.6 # Brasil (BRA)

  # TODO: Definir um construtor com os atributos adequados (tendo em vista o conteúdo de uma célula do CSV)
  def __init__(self, cellData):
    teamData = cellData.split('|')
    self.name = teamData[0]
    self.score = float(teamData[1])

  def motivate(self):
    """ 
    A pior seleção da copa (GAN, segundo a FIFA) têm 1393.5 de score, o qual equivale a 75% do melhor score (BRA).
    Sendo assim, para que a aleatoriedade não seja tão determinante, podemos definir um intervalo inicial próximo de 75.
    Por exemplo, GAN poderia ter valores entre 70~75 (aproximadamente). Por outro lado, BRA teria 70~100 (maior chance de vitória).

    1837.6 (BRA) ------ 100%
    1393.5 (GAN) ------  X
    """
    # TODO: Com base no comentário/insight acima, criar uma lógica para atribuir a motivação ao time.

    self.last_motivation = random.uniform(70, (self.score * 100)/ Team.best_score)


    return self.last_motivation

##3. Simulando a Fase de Grupos:

In [15]:
# Mapa em que a chave será a letra do grupo e o valor as seleções (que ordenaremos pelas "melhores").
bestTeamsByGroup = {}
# Percorre o dataframe (dados do CSV) para criar nossos objetos/seleções.
for label, content in df.items():
  # print(label)
  # print(content)
  # TODO: Instanciar as 4 seleções do grupo, com seus respectivos nomes e score.

  team1 = Team(content[0])
  # inserindo os dados da tabela na variável
  team2 = Team(content[1])
  team3 = Team(content[2])
  team4 = Team(content[3])

  # TODO: Simular os melhores do grupo com base na motivação de cada seleção. 
  #       Calculada a partir do seu ranking FIFA aliado a uma pitada de aleatoriedade.

  bestTeamsByGroup[label] = sorted([team1, team2, team3, team4], key=Team.motivate, reverse=True)

# TODO: Imprimir os grupos, ordenados pelas melhores seleções de cada (apenas 2 se classificam)

for group, motivated_teams in bestTeamsByGroup.items():
  print(f'Grupo {group}: ', end='')
  for team in motivated_teams:
    print(f'{team.name} ({team.last_motivation:.2f}) ', end='')
  print()



Grupo A: HOL (84.68) SEN (81.69) EQU (78.17) CAT (75.78) 
Grupo B: ING (84.12) IRA (82.60) EUA (80.62) GAL (76.38) 
Grupo C: ARA (77.87) MEX (77.82) POL (71.57) ARG (70.16) 
Grupo D: FRA (86.37) DIN (83.88) AUS (72.30) TUN (72.04) 
Grupo E: ESP (92.46) ALE (83.13) JAP (76.48) COS (72.58) 
Grupo F: BEL (94.82) CRO (84.01) MAR (75.99) CAN (73.04) 
Grupo G: BRA (98.11) SUI (85.05) SER (77.37) CAM (76.14) 
Grupo H: POR (81.16) COR (75.29) GAN (74.74) URU (70.35) 


## 4. Simulando as Oitavas de Final (16 melhores seleções)


In [50]:
# Criando vaiáveis para as 2 melhores seleções de cada grupo:
team1A = bestTeamsByGroup['A'][0]
team2A = bestTeamsByGroup['A'][1]
team1B = bestTeamsByGroup['B'][0]
team2B = bestTeamsByGroup['B'][1]
team1C = bestTeamsByGroup['C'][0]
team2C = bestTeamsByGroup['C'][1]
team1D = bestTeamsByGroup['D'][0]
team2D = bestTeamsByGroup['D'][1]
team1E = bestTeamsByGroup['E'][0]
team2E = bestTeamsByGroup['E'][1]
team1F = bestTeamsByGroup['F'][0]
team2F = bestTeamsByGroup['F'][1]
team1G = bestTeamsByGroup['G'][0]
team2G = bestTeamsByGroup['G'][1]
team1H = bestTeamsByGroup['H'][0]
team2H = bestTeamsByGroup['H'][1]

# TODO: Simular os confrontos das Oitavas de Final (randomizando novamente suas respectivas motivações).
#       Além disso, também definir os classificados para as quartas de final em novas vaiáveis:

quarter1 = team1A if team1A.motivate() > team2B.motivate() else team2B
# cria a variavel para um participante das quartas, se a motivação for maior que a do outro
quarter2 = team1C if team1C.motivate() > team2D.motivate() else team2D
quarter3 = team1E if team1E.motivate() > team2F.motivate() else team2F
quarter4 = team1G if team1G.motivate() > team2H.motivate() else team2H
quarter5 = team2A if team2A.motivate() > team1B.motivate() else team1B
quarter6 = team2C if team2C.motivate() > team1D.motivate() else team1D
quarter7 = team2E if team2E.motivate() > team1F.motivate() else team1F
quarter8 = team2G if team2G.motivate() > team1H.motivate() else team1H


#print(quarter1.name)
# vendo se funciona
# TODO: Imprimir os "resultados" dos confrontos realizados nas Oitavas de Final:

print(f'{team1A.name} ({team1A.last_motivation:.2f}) x {team2B.name} ({team2B.last_motivation:.2f})')
print(f'{team1C.name} ({team1C.last_motivation:.2f}) x {team2D.name} ({team2D.last_motivation:.2f})')
print(f'{team1E.name} ({team1E.last_motivation:.2f}) x {team2F.name} ({team2F.last_motivation:.2f})')
print(f'{team1G.name} ({team1G.last_motivation:.2f}) x {team2H.name} ({team2H.last_motivation:.2f})')
print(f'{team2A.name} ({team2A.last_motivation:.2f}) x {team1B.name} ({team1B.last_motivation:.2f})')
print(f'{team2C.name} ({team2C.last_motivation:.2f}) x {team1D.name} ({team1D.last_motivation:.2f})')
print(f'{team2E.name} ({team2G.last_motivation:.2f}) x {team1F.name} ({team1F.last_motivation:.2f})')
print(f'{team2G.name} ({team2E.last_motivation:.2f}) x {team1H.name} ({team1H.last_motivation:.2f})')



HOL (72.74) x IRA (78.01)
ARA (77.41) x DIN (90.10)
ESP (89.98) x CRO (77.79)
BRA (84.35) x COR (71.25)
SEN (75.28) x ING (94.34)
MEX (75.91) x FRA (92.15)
ALE (77.57) x BEL (85.46)
SUI (75.55) x POR (81.44)
84.34929246640553


## 5. Simulando as Quartas de Final (8 melhores seleções)

In [206]:
# TODO: Simular os confrontos das Quartas de Final (randomizando novamente suas respectivas motivações).
#       Além disso, também definir os classificados para as semifinais em novas vaiáveis:

semi1 = quarter1 if quarter1.motivate() > quarter2.motivate() else quarter2
semi2 = quarter3 if quarter3.motivate() > quarter4.motivate() else quarter4
semi3 = quarter5 if quarter5.motivate() > quarter6.motivate() else quarter6
semi4 = quarter7 if quarter7.motivate() > quarter8.motivate() else quarter8


# TODO: Imprimir os "resultados" dos confrontos realizados nas Quartas de Final:

print(f'{quarter1.name} ({quarter1.last_motivation:.2f}) x {quarter2.name} ({quarter2.last_motivation:.2f})')
print(f'{quarter3.name} ({quarter3.last_motivation:.2f}) x {quarter4.name} ({quarter4.last_motivation:.2f})')
print(f'{quarter5.name} ({quarter5.last_motivation:.2f}) x {quarter6.name} ({quarter6.last_motivation:.2f})')
print(f'{quarter7.name} ({quarter7.last_motivation:.2f}) x {quarter8.name} ({quarter8.last_motivation:.2f})')


IRA (79.59) x DIN (78.81)
ESP (80.88) x BRA (91.77)
ING (82.42) x FRA (81.76)
BEL (73.85) x POR (80.97)


## 6. Simulando as Semifinais (4 melhores seleções)

In [247]:
# TODO: Simular os confrontos das Semifinais (randomizando novamente suas respectivas motivações).
#       Além disso, também definir os classificados para a final e disputa de 3º e 4º em novas vaiáveis:

final1 = semi1 if semi1.motivate() > semi2.motivate() else semi2
final2 = semi3 if semi3.motivate() > semi4.motivate() else semi4

losers1 = semi1 if semi1.last_motivation < semi2.last_motivation else semi2
losers2 = semi3 if semi3.last_motivation < semi4.last_motivation else semi4

# TODO: Imprimir os "resultados" dos confrontos realizados nas Semifinais:

print(f'{semi1.name} ({semi1.last_motivation:.2f}) x {semi2.name} ({semi2.last_motivation:.2f})')
print(f'{semi3.name} ({semi3.last_motivation:.2f}) x {semi4.name} ({semi4.last_motivation:.2f})')

IRA (75.20) x BRA (98.74)
ING (70.66) x POR (85.21)


## 7. Simulando a Final (2 melhores seleções)

In [257]:
# TODO: Simular os confrontos das Finais (randomizando novamente suas respectivas motivações).
#       Além disso, também definir os 4 primeiros colocamos da Copa do Mundo de 2022:

champion = final1 if final1.motivate() > final2.motivate() else final2
second = final1 if final1.last_motivation < final2.last_motivation else final2
third = losers1 if losers1.motivate() > losers2.motivate() else losers2
fourth = losers1 if losers1.last_motivation < losers2.last_motivation else losers2

# TODO: Imprimir os "resultados" dos confrontos realizados nas Finais:

print(f'GRANDE FINAL - {final1.name} ({final1.last_motivation:.2f}) x {final2.name} ({final2.last_motivation:.2f})')
print(f'TERCEIRO LUGAR - {losers1.name} ({losers1.last_motivation:.2f}) x {losers2.name} ({losers2.last_motivation:.2f})')

print(f'1º - {champion.name}\n2º - {second.name}\n3º - {third.name}\n4º - {fourth.name}')


GRANDE FINAL - BRA (89.83) x POR (70.37)
TERCEIRO LUGAR - IRA (77.89) x ING (92.66)
1º - BRA
2º - POR
3º - ING
4º - IRA
