# Analisis del mundial de rugby en etapa de zona

In [5]:
import pandas as pd
import csv

## Carga de Datos

In [37]:
# carga de datos
def cargar_paises(archivo):
    paises_participantes = []

    with open(archivo, mode='r', newline='') as file:
        reader = csv.DictReader(file)

        for row in reader:
            zona = row['zona']
            pais = row['pais']
            score = float(row['score'])

            paises_participantes.append({"zona": zona, "pais": pais, "score": score})
        
        return paises_participantes
    
archivo = "../data/paises.csv"
paises_participantes = cargar_paises(archivo)

[{'zona': 'A', 'pais': 'France', 'score': 89.22}, {'zona': 'A', 'pais': 'Italy', 'score': 75.63}, {'zona': 'A', 'pais': 'Namibia', 'score': 61.61}, {'zona': 'A', 'pais': 'Uruguay', 'score': 66.63}, {'zona': 'A', 'pais': 'New Zeland', 'score': 89.06}, {'zona': 'B', 'pais': 'Irland', 'score': 91.82}, {'zona': 'B', 'pais': 'Romania', 'score': 64.56}, {'zona': 'B', 'pais': 'Scotland', 'score': 84.01}, {'zona': 'B', 'pais': 'South Africa', 'score': 91.08}, {'zona': 'B', 'pais': 'Tonga', 'score': 70.29}, {'zona': 'C', 'pais': 'Australia', 'score': 79.87}, {'zona': 'C', 'pais': 'Fiji', 'score': 80.28}, {'zona': 'C', 'pais': 'Georgia', 'score': 76.23}, {'zona': 'C', 'pais': 'Portugal', 'score': 68.61}, {'zona': 'C', 'pais': 'Wales', 'score': 78.26}, {'zona': 'D', 'pais': 'Argentina', 'score': 80.86}, {'zona': 'D', 'pais': 'Chile', 'score': 60.49}, {'zona': 'D', 'pais': 'England', 'score': 79.95}, {'zona': 'D', 'pais': 'Japon', 'score': 73.29}, {'zona': 'D', 'pais': 'Samoa', 'score': 76.19}]


## Lista de paises, ordenados por score

In [45]:
def mostrar_paises_por_score(paises_participantes):
    paises_ordenados = sorted(paises_participantes, key=lambda x: x["score"], reverse=True)
    lista_paises = []

    for pais in paises_ordenados:
        print(f"{pais['pais']}, Score: {pais['score']}, Zona: {pais['zona']}")
        lista_paises.append({"zona": pais['zona'], "pais": {pais['pais']}, "score": {pais['score']}})
    
    return lista_paises

In [46]:
mostrar_paises_por_score(paises_participantes)

Irland, Score: 91.82, Zona: B
South Africa, Score: 91.08, Zona: B
France, Score: 89.22, Zona: A
New Zeland, Score: 89.06, Zona: A
Scotland, Score: 84.01, Zona: B
Argentina, Score: 80.86, Zona: D
Fiji, Score: 80.28, Zona: C
England, Score: 79.95, Zona: D
Australia, Score: 79.87, Zona: C
Wales, Score: 78.26, Zona: C
Georgia, Score: 76.23, Zona: C
Samoa, Score: 76.19, Zona: D
Italy, Score: 75.63, Zona: A
Japon, Score: 73.29, Zona: D
Tonga, Score: 70.29, Zona: B
Portugal, Score: 68.61, Zona: C
Uruguay, Score: 66.63, Zona: A
Romania, Score: 64.56, Zona: B
Namibia, Score: 61.61, Zona: A
Chile, Score: 60.49, Zona: D


[{'zona': 'B', 'pais': {'Irland'}, 'score': {91.82}},
 {'zona': 'B', 'pais': {'South Africa'}, 'score': {91.08}},
 {'zona': 'A', 'pais': {'France'}, 'score': {89.22}},
 {'zona': 'A', 'pais': {'New Zeland'}, 'score': {89.06}},
 {'zona': 'B', 'pais': {'Scotland'}, 'score': {84.01}},
 {'zona': 'D', 'pais': {'Argentina'}, 'score': {80.86}},
 {'zona': 'C', 'pais': {'Fiji'}, 'score': {80.28}},
 {'zona': 'D', 'pais': {'England'}, 'score': {79.95}},
 {'zona': 'C', 'pais': {'Australia'}, 'score': {79.87}},
 {'zona': 'C', 'pais': {'Wales'}, 'score': {78.26}},
 {'zona': 'C', 'pais': {'Georgia'}, 'score': {76.23}},
 {'zona': 'D', 'pais': {'Samoa'}, 'score': {76.19}},
 {'zona': 'A', 'pais': {'Italy'}, 'score': {75.63}},
 {'zona': 'D', 'pais': {'Japon'}, 'score': {73.29}},
 {'zona': 'B', 'pais': {'Tonga'}, 'score': {70.29}},
 {'zona': 'C', 'pais': {'Portugal'}, 'score': {68.61}},
 {'zona': 'A', 'pais': {'Uruguay'}, 'score': {66.63}},
 {'zona': 'B', 'pais': {'Romania'}, 'score': {64.56}},
 {'zona': '

# Top 5 de los mayores candidatos segun el score de la IRB antes de comenzar el mundial

In [81]:
def obtener_top_paises(paises_participantes, n=5):
    paises_ordenados = sorted(paises_participantes, key=lambda x: x['score'], reverse=True)

    top_paises = paises_ordenados[:n]

    return top_paises

In [82]:
top_5_paises = obtener_top_paises(paises_participantes, n=5)

print("Top 5 paises segun su score:")
for idx, pais in enumerate(top_5_paises, start=1):
    print(f"{idx}. {pais['pais']} - Score: {pais['score']}")

Top 5 paises segun su score:
1. Irland - Score: 91.82
2. South Africa - Score: 91.08
3. France - Score: 89.22
4. New Zeland - Score: 89.06
5. Scotland - Score: 84.01


## Lista de paises, agrupados por zonas y ordenados por score

In [43]:
def mostrar_paises_por_zona(paises_participantes):
    zonas = {}

    for pais in paises_participantes:
        zona = pais["zona"]
        if zona not in zonas:
            zonas[zona] = []
        zonas[zona].append(pais)

    for zona, paises in zonas.items():
        paises_ordenados = sorted(paises, key=lambda x: x["score"], reverse=True)

        print(f"Zona {zona}")
        for pais in paises_ordenados:
            print(f"{pais['pais']}: {pais['score']} puntos")

In [44]:
mostrar_paises_por_zona(paises_participantes)

Zona A
France: 89.22 puntos
New Zeland: 89.06 puntos
Italy: 75.63 puntos
Uruguay: 66.63 puntos
Namibia: 61.61 puntos
Zona B
Irland: 91.82 puntos
South Africa: 91.08 puntos
Scotland: 84.01 puntos
Tonga: 70.29 puntos
Romania: 64.56 puntos
Zona C
Fiji: 80.28 puntos
Australia: 79.87 puntos
Wales: 78.26 puntos
Georgia: 76.23 puntos
Portugal: 68.61 puntos
Zona D
Argentina: 80.86 puntos
England: 79.95 puntos
Samoa: 76.19 puntos
Japon: 73.29 puntos
Chile: 60.49 puntos


## Lista de paises que posiblemente pasen de ronda segun score (los dos mejores de cada zona)

In [52]:
def mostrar_primeros_dos_paises_por_zona(paises_participantes):
    zonas = {}

    for pais in paises_participantes:
        zona = pais["zona"]
        if zona not in zonas:
            zonas[zona] = []
        zonas[zona].append(pais)

    for zona, paises in zonas.items():
        paises_ordenados = sorted(paises, key=lambda x: x["score"], reverse=True)

        print(f"Zonas {zona}")
        for pais in paises_ordenados[:2]:
            print(f"{pais['pais']}: {pais['score']} puntos")

In [53]:
mostrar_primeros_dos_paises_por_zona(paises_participantes)

Zonas A
France: 89.22 puntos
New Zeland: 89.06 puntos
Zonas B
Irland: 91.82 puntos
South Africa: 91.08 puntos
Zonas C
Fiji: 80.28 puntos
Australia: 79.87 puntos
Zonas D
Argentina: 80.86 puntos
England: 79.95 puntos


## Promedio de cada zona segun el score

In [54]:
def calcular_promedio_score_por_zona(paises_participantes):
    zonas = {}

    for pais in paises_participantes:
        zona = pais['zona']
        if zona not in zonas:
            zonas[zona] = {"scores": [], "promedio": 0.0}
        zonas[zona]["scores"].append(pais["score"])

    for zona, data in zonas.items():
        scores = data["scores"]
        if scores:
            promedio = sum(scores) / len(scores)
            data["promedio"] = promedio

    return zonas

In [55]:
promedio_por_zona = calcular_promedio_score_por_zona(paises_participantes)
for zona, data in promedio_por_zona.items():
    print(f"Zona {zona}: promedio de Score = {data['promedio']:.2f} puntos")

Zona A: promedio de Score = 76.43 puntos
Zona B: promedio de Score = 80.35 puntos
Zona C: promedio de Score = 76.65 puntos
Zona D: promedio de Score = 74.16 puntos


## zonas mas variables a zonas mas parejas

In [71]:
import statistics

def calcular_varianza_zonas(paises_participantes):
    zonas = {}

    for pais in paises_participantes:
        zona = pais["zona"]
        score = pais["score"]
        if zona not in zonas:
            zonas[zona] = []
        zonas[zona].append(score)

    varianzas = {}
    for zona, scores in zonas.items():
        varianza = statistics.variance(scores)
        varianzas[zona] = varianza

    zonas_ordenadas = sorted(varianzas.items(), key=lambda x: x[1], reverse=True)

    return zonas_ordenadas

In [77]:
zonas_con_varianzas = calcular_varianza_zonas(paises_participantes)

print("Zonas ordenadas por varianza de mayor a menor:")
for zona, varianza in zonas_con_varianzas:
    print(f"Zona {zona}: Varianza = {round(varianza, 2)}")

Zonas ordenadas por varianza de mayor a menor:
Zona A: Varianza = 159.85
Zona B: Varianza = 152.65
Zona D: Varianza = 67.54
Zona C: Varianza = 22.74


## zona mas dificil a zona mas facil

In [79]:
def calcular_dificultad_zonas(paises_participantes):
    zonas = {}

    for pais in paises_participantes:
        zona = pais["zona"]
        score = pais["score"]

        if zona not in zonas:
            zonas[zona] = {"scores": [], "promedio": 0.0, "inversa_varianza": 0.0}

        zonas[zona]["scores"].append(score)

    for zona, datos_zona in zonas.items():
        scores = datos_zona["scores"]

        if len(scores) > 0:
            promedio = sum(scores) / len(scores)
            varianza = statistics.variance(scores)
            inversa_varianza = 1 / varianza if varianza > 0 else 0

            datos_zona["promedio"] = promedio
            datos_zona["inversa_varianza"] = inversa_varianza
    
    zonas_ordenadas = sorted(
        zonas.items(),
        key=lambda x: (x[1]["promedio"], -x[1]["inversa_varianza"]),
        reverse=True
    )

    return zonas_ordenadas

In [80]:
zonas_dificultad = calcular_dificultad_zonas(paises_participantes)

print("Zonas ordenadas por dificultad (mayor promedio y menor inversa de varianza): ")
for zona, datos_zona in zonas_dificultad:
    print(f"Zona {zona}: Promedio = {datos_zona['promedio']}, Inversa de Varianza = {datos_zona['inversa_varianza']}")

Zonas ordenadas por dificultad (mayor promedio y menor inversa de varianza): 
Zona B: Promedio = 80.352, Inversa de Varianza = 0.006550750267254238
Zona C: Promedio = 76.65, Inversa de Varianza = 0.04397759781167471
Zona A: Promedio = 76.42999999999999, Inversa de Varianza = 0.006255733770984467
Zona D: Promedio = 74.156, Inversa de Varianza = 0.014806001405385655
