# Tarea 3: Espejismo de la Mayoría

La ilusión de la mayoría se refiere a la diferencia que ocurre entre la proporción real de una percepción u opinión en una red social y el cómo lo perciben los miembros de esta.
Debido a la naturaleza de una red social, los nodos sólo tendrán visión de una porción de esta. Algunos nodos tendrán más o menos conexiones, y si bien cada uno tenga en primera instancia una opinión o percepción, el hecho de que perciba una mayoría contraria a su posición en la red puede provocar un sesgo en su opinión final. 

La paradoja se hace presente cuando la percepción de la mayor parte de los nodos es que hay una preferencia mayoritaria de una que es realmente la minoría. Esta mayoría se identificaría con el que más de la mitad de los vecinos que estén conectados al nodo tengan dicha preferencia.

![Espejismo de la mayoría](mayoria.png "Espejismo de la mayoría")


Para probar esta ilusión, se propone realizar simulaciones sobre redes que se asemejen a las de una red social, en las que esta ilusión se hace presente y tiene más efectos a la hora de sesgar una opinión.



Se utilizaron modelos de configuración ya probados por la biblioteca SNAP, con el objetivo de crear una red con una secuencia de grados específica $ p(k) ~ k^{-\alpha} $ donde $p_k$ es la probabilidad que haya un nodo de grado k.
Para generar redes de tipo erdos-renyi se conectan nodos con una probabilidad fija, se tuvieron 10000 nodos y se conectaron hasta que la distribución de grado se acercara a una red de tipo scale-free. A partir de las redes generadas, se crearon nuevas redes con distinto índice de correlación de pearson r, con el objetivo de mantener la misma distribución de grado de los nodos. 

A partir de esto, se llegó a medir la paradoja de la mayoría en cada red, lo que arrojó que se realiza más fuerte este efecto cuando la red es disasortativa ( r< 0) y aumenta cuanto más pequeño es la correlación de pearson. 

 
 
**(b)** Otro experimento para estudiar este fenómeno sería revisar lo que sucedió en chile con el plebiscito del 25 de octubre del presente año. La mayoría de los expertos y encuestas en línea apuntaban a una menor diferencia entre las opciones de apruebo y rechazo. Es por esto que se podría estudiar el espejismo de la mayoría en las redes sociales que realizaban estas encuestas.


## Parte 2: Implementación

El objetivo es realizar simulaciones para comprobar cómo afectan algunas propiedades de las redes al espejismo de la mayoría. Específicamente vamos a comparar con:\

- Redes Asortativas
- Redes Disasortativas

Para ello, generaremos redes a partir de 2 tipos:

- Barabasi Albert
- Erdos Renyi

Se usarán 500 nodos por red, con cada red conexa.

In [2]:
import networkx as nx

In [71]:
G_erdos = nx.erdos_renyi_graph(500, 0.02)
G_barabasi = nx.barabasi_albert_graph(500, 10)


In [72]:
print(nx.is_connected(G_erdos))
print(nx.is_connected(G_barabasi))
print(nx.degree_pearson_correlation_coefficient(G_erdos))


True
True
0.014314365998386225


In [5]:
def asortatividad(G, objetivo):
    r=nx.degree_pearson_correlation_coefficient(G)
    while (r > objetivo if objetivo < 0   else r < objetivo):
        #print(r, '>' if objetivo <0 else '<', objetivo)
        r=nx.degree_pearson_correlation_coefficient(G)
        GO = G.copy()
        nx.connected_double_edge_swap(GO)
        r0=nx.degree_pearson_correlation_coefficient(GO)
        if objetivo < 0:
            if r > r0:
                G = GO.copy()
        else:
            if r < r0:
                G = GO.copy()
    print(nx.degree_pearson_correlation_coefficient(G))
    return G

A partir de las 2 redes generadas, se modificarán las conexiones para obtener 5 variantes con distinto valor del coeficiente de correlación de pearson: 2 negativos (redes disasortativas), 2 positivas (redes asortativas) y una cercana a 0.

Activaremos el 1, 5 y 10% de los nodos de la red.

In [74]:
 
def crear_redes(G_inicial, asortatividades):
    redes_retorno = {}
    G2 = G_inicial.copy()

    for obj in asortatividades:
        G2 = asortatividad(G2, obj)
        redes_retorno[nx.degree_pearson_correlation_coefficient(G2)] = G2.copy()
    return redes_retorno


asortatividades = [-0.20, -0.30, 0.0, 0.10, 0.2]
redes_barabasi = crear_redes(G_barabasi, asortatividades)
redes_erdos = crear_redes(G_erdos, asortatividades)

A partir de las variantes, seleccionaremos un porcentaje de los nodos y los "activaremos" para medir finalmente la percepción promedio de los nodos de la red.

In [79]:
porcentajes = [0.01, 0.05, 0.1, 0.25]
cantidades = [500 * p for p in porcentajes]
activos_erdos = { p: [] for p in cantidades }
activos_barabasi = { p: [] for p in cantidades }
from random import choice

# Activa los nodos que estén en una lista determinada
def activar_lista(G1, lista):
    dic = {key: { "activo" : True } for key in lista }
    nx.set_node_attributes(G1, dic)
    return G1  

def generar_redes_activas(G1, porcentajes):
    cantidades = [len(list(G1.nodes())) * p for p in porcentajes]
    activos = { p: [] for p in cantidades } 
    redes = {p: [] for p in cantidades}  
    for key,value in activos.items():
        while(len(activos[key]) < key):
            seleccionado = choice(list(G1.nodes()))
            if seleccionado not in activos[key]:
                activos[key].append(seleccionado)
        redes[key] = activar_lista(G1.copy(), activos[key])
    return redes



# Calcula la percepción promedio del grafo que se inserta
def percepcion(G1):
    prom = 0
    # Por cada nodo en la red
    for nodo in list(G1.nodes()):
        porcentaje = 0
        activos = 0
        # Se cuentan los vecinos activos de cada nodo
        for vecino in G1.neighbors(nodo):
            activos = activos + (1 if 'activo' in G1.nodes[vecino] else 0)
        # Se calcula el porcentaje = activos/total
        porcentaje = activos / len(list(G1.neighbors(nodo)))
        # Se agrega el porcentaje para finalmente retornar el promedio
        prom = prom + porcentaje
    return prom / len(list(G1.nodes()))

In [80]:
# la lista con las redes asortativas/disasortativas
def calcula_percepciones(lista_redes, porcentajes):
    percepciones_totales = {}
    aux = 0
    for red in lista_redes:
        activadas = generar_redes_activas(red.copy(), porcentajes)
        percepciones_totales[aux] = {}
        print(len(activadas.values()))
        for porc in porcentajes:
            percepciones_totales[aux][porc * len(list(red.nodes))] = percepcion(activadas[porc * len(list(red.nodes))])
        aux = aux + 1
    return percepciones_totales
todas_barabasi = {}
todas_erdos = {}
for key, val in redes_barabasi.items():
    todas_barabasi[key] = {}
    todas_barabasi[key] = generar_redes_activas(val.copy(), porcentajes)
for key, val in redes_erdos.items():
    todas_erdos[key] = {}
    todas_erdos[key] = generar_redes_activas(val.copy(), porcentajes)

barabasi_activadas = generar_redes_activas(G_barabasi.copy(), porcentajes)
erdos_activadas = generar_redes_activas(G_erdos.copy(), porcentajes)


In [81]:
def graficar_percepciones(diccionario, porcentaje, nombre):
    porc = {}
    percepciones = []
    for key in sorted(list(diccionario.keys()), key=float):
        porc[key] = diccionario[key][porcentaje]
        #print('r= ', key, ' || percepcion= ', percepcion(cincop[key]))
        percepciones.append(percepcion(porc[key]))
    import plotly.graph_objects as go
    import numpy as np
    erres = sorted(list(diccionario.keys()), key=float)
    fig = go.Figure(data=go.Scatter(x=erres, y=percepciones))
    fig.update_layout(title=str(porcentaje/500*100) + '% de casos activos en redes ' + nombre)
    fig.show()
for p in cantidades:
    graficar_percepciones(todas_barabasi, p, 'de tipo barabasi albert')

In [82]:
for p in cantidades:
    graficar_percepciones(todas_erdos, p, 'de tipo erdos-renyi')

## Parte 3: Paradoja de la Amistad

La distribución de grado $p_k$ expresa la probabilidad que un nodo seleccionado al azar tenga $k$ vecinos. Sin embargo, si escogemos una arista al azar, la probabilidad que un nodo se conecte a un nodo de grado $k$ es $q_k = Akp_k$, donde $A$ es un factor de normalización.



**(a)** Determinar el factor de normalización A asumiendo una red que sigue una ley de potencia con $ 2 < \gamma < 3$ y grado mínimo $k_{min}$ y grado máximo $k_{max}$


Podemos comenzar considerando la propiedad de una red.

\begin{equation}

\int_{k_{min}}^{k_{max}} p(k) dk = 1

\end{equation}

y usando la propiedad en la ecuación inicial:

\begin{equation}

\int_{k_{min}}^{k_{max}} q(k) dk = A \int_{k_{min}}^{k_{max}} k p(k) dk

\end{equation}


Resolviendo las integrales:

\begin{equation}
1 = A \frac{1}{k_{max} - k_{min} }

\end{equation}

por lo que el valor de A sería:

\begin{equation}

A = k_{max} - k_{min}

\end{equation}

**(b)** En el modelo generador llamado "Configuration model", $q_k$ corresponde a la probabilidad que un nodo escogido al azar tenga un vecino de grado $k$. Cuál es el grado promedio de los vecinos de un nodo escogido al azar?

Para esto usaremos la propiedad:


\begin{equation}

\langle k^n \rangle = \sum_{k_{min}}^{k_{max}} k^n p_k \approx C \frac{k_{max}^{n - \gamma - 1} - k_{min}^{n - \gamma + 1}}{n - \gamma + 1}
\end{equation}


Usando el momento $(n=1)$


\begin{equation}

\approx C \frac{k_{max}^{\gamma - 1} - k_{min}^{\gamma + 1}}{\gamma + 1}

\end{equation}


y con:

\begin{equation}

C = ( \gamma - 1 ) k_{min}^{\gamma -1}

\end{equation}

Finalmente, el grado promedio estaría determinado por la expresión:


\begin{equation}

\langle k \rangle = (\gamma-1)k_{min}^{\gamma-1}\frac{k_{max}^{\gamma - 1} - k_{min}^{\gamma + 1}}{\gamma + 1}

\end{equation}

**(c)** Calcule el grado promedio de los nodos de un nodo escogido al azar en una red con $N = 104$, $\gamma = 2.3$, $k_{min} = 1$ y $k_{max} = 1000$. Compare el resultado con el grado promedio de la red $\langle k \rangle$.


Considerando el resultado de la pregunta anterior y reemplazando los datos de la pregunta:

\begin{equation}

\langle k \rangle = (2.3 - 1)1^{2.3-1}\frac{1000^{2.3 - 1} - 1^{2.3 + 1}}{2.3 + 1} \approx 3128.78

\end{equation}