# Gráficas bipartitas, emparejamientos y teorema de Hall

**Matemáticas Discretas para Ciencias de Datos**

Prof. Leonardo Ignacio Martínez Sandoval

## Introducción

## Gráficas bipartitas

**Definición.** Una gráfica $G$ es **bipartita** si se puede dar una partición de su conjunto de vértices $V$ en dos conjuntos $A$ y $B$ tales que las aristas de $G$ únicamente conectan vértices de $A$ con vértices de $B$. En otras palabras, no existen aristas entre elementos de $A$, ni entre elementos de $B$.

**Ejemplo.** Consideremos la siguiente gráfica.

![title](img/ej-bipartita.svg)

Esta es una gráfica bipartita. Demos una partición de sus vértices para mostrar esto. Para ello, pintaremos algunos de rojo y otros de azul. Lo que tenemos que lograr es que no haya aristas entre dos vértices rojos, ni aristas entre dos vértices azules. Una forma de hacer esto es la siguiente:

![title](img/ej-bipartita-2.svg)

<div style="text-align:right;">$\square$</div>

**Ejemplo.** La siguiente gráfica es parecida a la anterior, sin embargo no es bipartita.

![title](img/no-bipartita.svg)

Para convencernos de que no lo es, podemos comenzar pintando algún vértice de rojo (por ejemplo, el de la esquina superior izquierda). Sus vecinos deben de ser azules. Los vecinos de sus vecinos rojos, y así sucesivamente. Sin importar dónde empecemos, siempre los colores están forzados y llegaremos a un problema, como en la siguiente figura, en donde el vértice gris ya no puede ser ni rojo ni azul.

![title](img/no-bipartita-2.svg)

<div style="text-align:right">$\square$</div>




En el ejemplo anterior hay una forma sencilla de convencernos de que no será posible dar una partición de los vértices que muestre que la gráfica es bipartita. Consideremos los vértices marcados en negro en la siguiente figura:

![title](img/ciclo-impar.svg)

Estos vértices forman un ciclo de tamaño $7$. Si la gráfica fuera bipartita, podríamos colorear estos vértices de rojo y azul sin tener aristas entre vértices del mismo color. Pero esto es imposible: sobre el ciclo se tienen que alternar los colores y el ciclo tiene una cantidad impar de vértices, así que al final hay un conflicto.

Este es el único tipo de problemas que pueden aparecer cuando estamos intentando ver si una gráfica es bipartita o no. Formalizamos esto mediante el siguiente resultado.

**Proposición.** Sea $G$ una gráfica con $n\geq 2$ vértices. La gráfica $G$ es bipartita si y sólo si no hay dentro de ella ciclos de longitud impar.

*Demostración.* Si $G$ tiene un ciclo de longitud impar, digamos $v_1,v_2,\ldots,v_{2k+1}$, entonces es imposible que sea bipartita pues de serlo los vértices de dicho ciclo deberían estar en conjuntos diferentes de la partición de manera alternada. Pero entonces $v_1$ y $v_{2k+1}$ quedarían en el mismo conjunto y la arista $v_1v_{2k+1}$ nos daría una contradicción.

Supongamos ahora que $G$ no tiene ciclos de longitud impar. Veremos que la gráfica es bipartita. Primero nos enfocaremos en cada una de las compontentes conexas de $G$.

Tomemos una componente conexa $H$ de $G$. Esta componente tampoco tiene ciclos de longitud impar. Tomemos un vértice $v$ de $H$ y consideremos los siguientes conjuntos:

\begin{align*}
A_H&=\text{vértices a distancia par de $v$}\\
B_H&=\text{vértices a distancia impar de $v$}.
\end{align*}

Como $H$ es compontente conexa, la distancia de cada vértice de $H$ a $v$ está bien definida y siempre es o par, o impar (pero no ambas). De esta manera, $A_H$ y $B_H$ tienen en conjunto a todos los vértices de $H$ y además $$A\cap B = \emptyset.$$ Afirmamos que además no hay aristas entre los vértices de $A_H$, ni entre los vértices de $B_H$.

Si hubiera, por ejemplo, una arista entre vértices $w$ y $z$ de $A_H$, tendríamos un camino $C_1$ de longiud par de $v$ a $w$, luego la arista $wz$ y luego un camino $C_2$ de longitud par de $z$ a $v$. Al concatenar estos caminos, tendríamos un camino cerrado de longitud impar de $v$ a sí mismo. 

Se puede mostrar **(tarea moral)** que la existencia de un camino cerrado de longitud impar implica la existencia de un ciclo de longitud impar y esto daría una contradicción. De manera análoga, se ve que no hay aristas entre vértices de $B_H$.

Consideremos ahora todos los conjuntos $A_H$ y $B_H$ (variando la componente conexa $H$) para construir los siguientes conjuntos:

\begin{align*}
A&=\bigcup_{\text{$H$ c.c. de $G$}} A_H\\
B&=\bigcup_{\text{$H$ c.c. de $G$}} B_H.
\end{align*}

Todos los vértices de $G$ están en alguna compontente conexa (y sólo una) y por lo tanto en algún $A_H$ ó $B_H$ (y sólo uno). De este modo, $A\cup B$ tiene todos los vértices de $G$ y $A\cap B=\emptyset$.

Lo único que nos falta para ver que $A$ y $B$ son una partición es verificar que no son vacíos. Claramente $A$ no es vacío pues $G$ tiene al menos una componente conexa.

Si alguna componente conexa tiene al menos dos vértices, entonces algún $B_H$ es no vacío y por lo tanto $B$ también sería no vacío.

Así, la única forma en la que todos los $B_H$ sean vacíos es si todas las componentes conexas de $G$ son vértices aislados. En ese caso, como tenemos por lo menos dos vértices $u$ y $v$, hacemos una excepción y declaramos que uno de ellos esté en $A$, el otro en $B$ y los demás en cualquiera de los queramos.

<div style="text-align:right">$\square$</div>

Si una gráfica es bipartita, usualmente la representamos en dos columnas, una por cada conjunto de su partición de vértices. Así, queda algo como en el siguiente dibujo:

![title](img/bip-columnas.svg)

Tenemos una versión particular del "lema de los saludos de Euler" para el caso en el que una gráfica sea bipartita. 

**Proposición.** Sea $G$ una gráfica bipartita con $m$ aristas y partición de vértices $A$ y $B$. Se tiene que:

$$\sum_{v\in A} \text{deg}(v)=m=\sum_{v\in B} \text{deg}(v).$$

Por ejemplo, en la gráfica de arriba los grados de $A$ son $3, 3, 3, 2, 2$ y los de $B$ son $2, 4,3,1,2$ y en ambos casos su suma es $13$.

*Demostración.* La clave es la igualdad con el número de aristas. Cada arista usa exactamente un vértice de $A$. Así, $\sum_{v\in A} \text{deg}(v)$ debe ser $m$. Análogamente $\sum_{v\in B}\text{deg}(v)$ también debe ser $m$.

<div style="text-align:right">$\square$</div>





## Emparejamientos

**Definición.** Un emparejamiento en una gráfica $G$ es un subconjunto de sus aristas de modo que no haya dos de ellas que compartan vértices.

**Ejemplo.** Las aristas marcadas en azul en la siguiente figura conforman un emparejamiento de la gráfica, pues estas aristas no comparten vértices.

![title](img/emparejamiento.svg)

<div style="text-align:right">$\square$</div>

**Definición.** Un emparejamiento de una gráfica es **maximal** si no hay ninguna forma de extenderlo de modo que siga siendo emparejamiento. Es decir, es un emparejamiento que no es subconjunto propio de otro emparejamiento.

**Definición.** Un emparejamiento de una gráfica es **máximo** si tiene la mayor cantidad de aristas de entre todos los emparejamientos posibles en la gráfica.

Si un emparejamiento es máximo, en particular no puede ser subconjunto propio de otro emparejamiento. De este modo, los emparejamientos máximos son maximales. Pero el converso no es cierto.

**Ejemplo.** El emparejamiento del ejemplo de arriba no es maximal pues comenzando con él todavía podemos añadir aristas. Una forma de hacerlo es la siguiente:

![title](img/emp-maximal.svg)

Este emparejamiento es maximal. Puedes verificar que es imposible agregar cualquier otra arista de modo que sigamos teniendo aristas que no compartan vértice. Sin embargo, este emparejamiento no es máximo, pues hay emparejamientos con más aristas, por ejemplo, el siguiente:

![title](img/emp-maximo.svg)

Aquí tenemos $5$ aristas. Una vez más, este emparejamiento es maximal, pues es imposible agregar más aristas. ¿Será un emparejamiento máximo? Necesitamos un argumento contundente para asegurar que ninguna otra forma de elegir aristas disjuntas nos da $6$ aristas o más.

Un argumento que funciona en este ejemplo particular es el siguiente: si tuviéramos $6$ aristas disjuntas, necesitaríamos al menos $12$ vértices. Pero la gráfica sólo tiene $11$ vértices. Así, no hay emparejamientos con $6$ o más aristas.

Este argumento muestra que el emparejamiento de arriba, además de ser máximo, también es maximal.

<div style="text-align:right">$\square$</div>

Las nociones de arriba nos ayudan a saber cuáles son los emparejamientos "grandes" en distintos sentidos. Otra forma de caracterizar a los emparejamientos es mediante los vértices a los que llegan.

**Definición.** Sea $G$ una gráfica y $X$ un subconjunto de sus vértices. Un emparejamiento **cubre a $X$** o **satura a $X$** si sus aristas pasan por todos los vértices de $X$.

**Ejemplo.** En la siguiente figura el emparejamiento de aristas azules cubre al subconjunto de vértices azules.

![title](img/emp-cubre.svg)

<div style="text-align:right">$\square$</div>

Lo "mejor" que nos puede pasar en términos de emparejamientos es que pasen por todos los vértices de la gráfica. Por esta razón, le damos un nombre especial a éstos.

**Definición.** Sea $G$ una gráfica. Un **emparejamiento perfecto** de $G$ es un emparejamiento que cubre a todos sus vértices.

**Ejemplo.** El emparejamiento de arriba no es perfecto, pues hay vértices que no son cubiertos por él. De hecho, es imposible que haya un emparejamiento perfecto en esta gráfica pues tiene una cantidad impar de vértices.

Sin embargo, a continuación mostramos una gráfica que sí tiene un emparejamiento perfecto.

![title](img/emp-perfecto.svg)

## Paréntesis de aplicaciones

Una pregunta teórica que lleva a muchas aplicaciones es la siguiente: ¿cuándo hay un emparejamiento en una gráfica bipartita? Para entender un poco el tipo de aplicaciones, consideremos la siguiente gráfica:

![title](img/bip-columnas.svg)

De manera abstracta, aquí sólo tenemos vértices y aristas. Sin embargo, podría ser que esta gráfica venga de un contexto particular. Por ejemplo, del lado izquierdo podemos tener los miembros de un equipo de trabajo en ciencia de datos. Del lado derecho podemos tener una lista de actividades que pueden realizar. Y puede que una arista de una persona a una tarea signifique que "sabe hacerla muy bien".

![title](img/bip-aplicacion.svg)

Así, Abi sabe trabajar muy bien con bases de datos, construir variables y escribir código, Bob sabe trabajar muy bien con bases de datos, construir variables y hacer estadística, etc.

Al encontrar un emparejamiento, podemos asignar a cada uno de ellos una tarea que sepan hacer muy bien de modo que no le toque más de una tarea a cada quien y de modo que ninguna tarea esté hecha por más de una persona.

![title](img/emp-aplicacion.svg)

Este emparejamiento es bastante bueno pues quedan 4 personas trabajando en 4 tareas. De hecho es un emparejamiento maximal. Sin embargo, sería ideal encontrar un emparejamiento con $5$ aristas. Este sería un emparejamiento perfecto y haría que todas las tareas y todas las personas quedaran cubiertas.

Así como esta aplicación hay muchas más. El lado izquierdo pueden ser personas, el derecho potenciales empresas a donde pueden aplicar y una arista la intención de aplicar ahí. El lado izquierdo pueden ser perros por adoptar, el derecho personas y una arista que hay compatibilidad de adopción.

## Teorema de Hall

Con esto en mente, ¿cuándo podemos encontrar buenos emparejamientos en gráficas bipartitas? El resultado clave es el teorema de Hall.

Como preámbulo, tenemos el siguiente resultado, que nos da una condición necesaria "obvia" para que pueda existir un emparejamiento que cubra a todos los vértices de un lado de una gráfica bipartita.

**Proposición.** Si una gráfica bipartita con partición de vértices en $A$ y $B$ tiene un emparejamiento que cubre a $A$, entonces para cualquier $X\subseteq A$ se tiene que $$|X|\leq |N(X)|.$$

Recuerda que $N(X)$ es el conjunto de vértices que son vecinos de por lo menos un vértice en $X$. La demostración de esta proposición queda de tarea moral.

Resulta que esta condición necesaria "obvia" también es una condición suficiente. Este es un resultado demostrado por Philip Hall, en 1935. A continuación presentamos una versión moderna.

**Teorema (de Hall).** Sea $G$ una gráfica bipartita con partición de vértices en $A$ y $B$. Si para cualquier $X\subseteq A$ se tiene que $$|X|\leq |N(X)|,$$
entonces $G$ tiene un emparejamiento que cubre a $A$.

Hay varias formas de demostrar este resultado. A continuación damos una que combina ideas de contradicción y principio extremo.

*Demostración.* Para buscar una contradicción, supongamos que bajo las hipótesis dadas la gráfica $G$ no tiene un emparejamiento que cubra a $A$. Tomemos un emparejamiento $M$ de $G$ que cubra a la mayor cantidad de vértices posibles de $A$. Hay por lo menos un vértice $v$ de $A$ que $M$ no cubre.

Diremos que una trayectoria es **alternante** si comienza en $v$ y de manera alternante usa aristas fuera y dentro de $M$.

Definimos los siguientes dos conjuntos:

\begin{align*}
X&=\{x \in A:\text{hay $vx$-trayectoria alternante\}}, \\
Y&=\{y \in B:\text{hay $vy$-trayectoria alternante\}}.
\end{align*}

Notemos que $v\in X$. Probaremos las siguientes dos afirmaciones:

- El emparejamiento $M$ da una biyección $\varphi: X\setminus\{v\} \to Y$ dada por $\varphi(x)$ es el vértice de $Y$ conectado con $x$ en $M$.
- Se tiene que $N(X)\subseteq Y$.

Para la primer afirmación:

- La función $\varphi$ está bien definida pues para llegar a un vértice de $X\setminus \{v\}$ tiene que ser en una arista de la trayectoria "de $B$ a $A$" que corresponde a las aristas de $M$. Así, cada vértice en $X\setminus \{v\}$ está conectado mediante $M$ con un elemento de $Y$.
- La función $\varphi$ es inyectiva pues $M$ es emparejamiento.
- La función $\varphi$ es suprayectiva pues de no serlo, tendríamos una trayectoria alternante a un vértice $y$ en $Y$ que no se puede continuar (no hay arista de $M$ en $y$). Pero en este caso el emparejamiento $M$ podría agrandarse quitando las aristas de esta trayectoria en $M$ y poniendo las que no estén en $M$. Esto sería una contradicción a la maximalidad de $M$.

Para la segunda afirmación, tomemos un vecino $y$ de un vértice $x$ en $X$. Si $x=v$, claramente $y$ está en $Y$ pues $vy$ es una trayectoria alternante (de una arista). Si $x\neq v$, tenemos dos casos. Si la arista $xy$ no está en $M$, entonces podemos tomar una trayectoria alternante hasta $x$ y alargarla con la arista $xy$ para llegar a $y$, obteniendo $y\in Y$. Si la arista $xy$ está en $M$, entonces la trayectoria alternante que llega a $x$ pasa por $y$ y entonces $y\in Y$.

Usemos ambas afirmaciones para encontrar nuestra contradicción final. Tenemos la siguiente cadena de igualdades/desigualdades:

$$|N(X)|\leq |Y| = |X\setminus \{v\}| < |X|.$$

La primer desigualdad es por la segunda afirmación. La primer igualdad es por la biyección de la primer afirmación. La segunda desigualdad es por que $X$ tiene a $v$ y el otro conjunto no. Así, tenemos $|N(X)|<|X|$ y esto contradice las hipótesis del teorema.

De esta manera, debe existir un emparejamiento que cubre a $A$.

<div style="text-align:right">$\square$</div>







**Corolario.** Sea $G$ una gráfica bipartita. Si para cualquier subconjunto de vértices $X$ se tiene que $$|X|\leq |N(X)|,$$
entonces $G$ tiene un emparejamiento perfecto.

## Tarea moral

Los siguientes problemas te ayudarán a practicar lo visto en esta entrada. Para resolverlos, necesitarás usar herramientas matemáticas, computacionales o ambas.

1. Encuentra todos los emparejamientos con cuatro aristas de la gráfica de la sección "Emparejamientos".
2. Encuentra un emparejamiento perfecto en la gráfica de la sección "Paréntesis de aplicaciones"
3. Muestra la proposición "obvia" de la sección "Teorema de Hall".
4. Demuestra el corolario de la sección "Teorema de Hall".
5. Sea $G$ una gráfica bipartita en donde los grados de todos los vértices son iguales a un mismo entero $r\geq 1$.
  - Demuestra que ambos lados de la partición en vértices tendrán la misma cantidad de vértices.
  - Demuestra que la gráfica tiene un emparejamiento perfecto.