Antonio Merino Gallardo

# Códigos Lineales

Fijado $\mathbb{F}_q$ un cuerpo finito, un $[n,k]_q$-código lineal es un subespacio vectorial de $\mathbb{F}_q^n$ de dimensión $k$ a cuyos elementos llamaremos palabras código y que tienen longitud $n$. La idea será codificar palabras de longitud $k$, esto es, elementos de $\mathbb{F}_q^k$, en palabras de un $[n,k]$-código lineal $\mathcal{C}$.

### Matriz Generadora

La aplicación lineal que realiza la codificación $\mathbb{F}_q^k \to \mathcal{C} \subseteq \mathbb{F}_q^n$ se representará por una matriz $k \times n$ de rango $k$ llamada matriz generadora.

En este sentido, podemos definir un código lineal a partir de su matriz generadora.

In [1]:
F = GF(2)
M = matrix(F, [[1, 1, 0, 1, 0, 0],\
               [1, 0, 0, 0, 1, 1],\
               [0, 1, 1, 0, 1, 0],\
               [0, 0, 1, 0, 1, 1]])
C = codes.LinearCode(M)

In [2]:
C

[6, 4] linear code over GF(2)

In [3]:
C.generator_matrix()

[1 1 0 1 0 0]
[1 0 0 0 1 1]
[0 1 1 0 1 0]
[0 0 1 0 1 1]

In [4]:
C.generator_matrix() == M

True

Las filas de la matriz generadora $M$ pueden verse como los elementos de una base de $\mathcal{C}$, por ser $M$ de rango máximo.

In [5]:
C.basis()

[
(1, 1, 0, 1, 0, 0),
(1, 0, 0, 0, 1, 1),
(0, 1, 1, 0, 1, 0),
(0, 0, 1, 0, 1, 1)
]

Cabe notar que está permitido proporcionar al constructor de un código lineal una matriz de dimensión $k\times n$  con rango menor que $k$. En este caso, dicha matriz es transformada automáticamente a una escalonada por filas reducida, eliminándose las filas nulas para que tenga rango máximo.

In [6]:
M2 = matrix(F, [[1, 1, 0, 1, 0, 0],\
               [1, 0, 0, 0, 1, 1],\
               [0, 1, 1, 0, 1, 0],\
               [0, 0, 1, 0, 1, 1],\
               [1, 0, 1, 0, 0, 0]])
rank(M2)

4

In [7]:
C2 = codes.LinearCode(M2); C2

[6, 4] linear code over GF(2)

In [8]:
C2.generator_matrix()

[1 0 0 0 1 1]
[0 1 0 0 0 1]
[0 0 1 0 1 1]
[0 0 0 1 1 0]

Vemos como efectivamente coincide con la que se obtiene al reducir M2 y eliminar filas nulas.

In [9]:
M2.rref()

[1 0 0 0 1 1]
[0 1 0 0 0 1]
[0 0 1 0 1 1]
[0 0 0 1 1 0]
[0 0 0 0 0 0]

### Códigos equivalentes

Se dice que dos $[n,k]_q$-códigos lineales $\mathcal{C}_1$ y $\mathcal{C}_2$ son equivalentes si $\mathcal{C}_2$ se obtiene a partir de $\mathcal{C}_1$ aplicando una permutación fija a todas sus palabras código. En este sentido, si se intercambian columnas de la matriz generadora, el código resultante generado es equivalente al inicial. Además, si se realizan operaciones por filas a la matriz generadora solo se está cambiando la base del código considerado, pero el código visto como subespacio vectorial sigue siendo el mismo.

Por lo tanto, los códigos generados por dos matrices son equivalentes si, y solo si, una se puede obtener a partir de la otra mediante operaciones por filas e intercambio de columnas.

In [10]:
M1 = matrix(GF(7), [[3, 1, 0, 1, 0, 6],\
                    [1, 0, 2, 3, 0, 4],\
                    [0, 1, 4, 0, 1, 0],\
                    [0, 3, 4, 0, 5, 3]])
C1 = codes.LinearCode(M1)
C1 #

[6, 4] linear code over GF(7)

In [11]:
I1 = elementary_matrix(GF(7),6,col1=2,col2=4); I1 #Intercambia columnas 2 y 4

[1 0 0 0 0 0]
[0 1 0 0 0 0]
[0 0 0 0 1 0]
[0 0 0 1 0 0]
[0 0 1 0 0 0]
[0 0 0 0 0 1]

In [12]:
I2 = elementary_matrix(GF(7),4,row1=1,row2=3,scale=3); I2 #Fila1 = Fila1 + 3*Fila3

[1 0 0 0]
[0 1 0 3]
[0 0 1 0]
[0 0 0 1]

In [13]:
M2 = I2*M1*I1; M2

[3 1 0 1 0 6]
[1 2 1 3 0 6]
[0 1 1 0 4 0]
[0 3 5 0 4 3]

In [14]:
C2 = codes.LinearCode(M2); C2

[6, 4] linear code over GF(7)

In [15]:
C2.is_permutation_equivalent(C1)

True

### Códigos Sistemáticos

Un $[n,k]_q$-código lineal es sistemático si admite una matriz generadora de la forma $\left(Id_k \, \middle\vert \,  A\right)$ con $A \in M_{k \times (n-k)}(\mathbb{F}_q)$.

Un resultado importante es que todo código lineal es equivalente a uno sistemático. En este sentido, todo $[n,k]_q$-código lineal admite una matriz de la forma $\left(Id_k \, \middle\vert \,  A\right)$ con $A \in M_{k \times (n-k)}(\mathbb{F}_q)$ salvo la permutación de sus columnas. Es esta matriz la que sage permite obtener con el método *systematic_generator_matrix*.

In [16]:
M = matrix(GF(2), [[1, 1, 0, 1, 0, 0],\
               [1, 1, 1, 0, 0, 0],\
               [0, 0, 0, 0, 1, 0],\
               [0, 0, 1, 0, 0, 1]])
C = codes.LinearCode(M)
C.systematic_generator_matrix()

[1 1 0 0 0 1]
[0 0 1 0 0 1]
[0 0 0 1 0 1]
[0 0 0 0 1 0]

Podemos obtener el código sistemático equivalente a $\mathcal{C}$ mediante el método *standard_form*, que además nos devuelve la reordenación apropiada de las posiciones de las columnas para obtenerlo.

In [17]:
Cs = C.standard_form(); Cs

([6, 4] linear code over GF(2), [1, 3, 4, 5, 2, 6])

In [18]:
Cs[0].systematic_generator_matrix()

[1 0 0 0 1 1]
[0 1 0 0 0 1]
[0 0 1 0 0 1]
[0 0 0 1 0 0]

In [19]:
Cs[0].is_permutation_equivalent(C)

True

### Código dual y matriz de paridad

Un $[n,k]_q$-código lineal $\mathcal{C}$ puede también representarse a partir de su complemento ortogonal $\mathcal{C}^\perp$ en $\mathbb{F}_q^n$:
$$\mathcal{C}^\perp:= \{y \in \mathbb{F}_q^n \; | \; \langle x,y \rangle = 0 \; \forall x \in \mathcal{C}\}.$$
Al tratarse de un subespacio vectorial de dimensión $(n-k)$, se tiene que $\mathcal{C}^\perp$ es un $[n,n-k]_q$-código lineal, denominado el código dual de $\mathcal{C}$. A las matrices generadoras de $\mathcal{C}^\perp$ se las conoce como matrices de paridad de $\mathcal{C}$.

In [20]:
M = matrix(GF(2), [[1, 1, 0, 1, 0, 0],\
               [1, 0, 0, 0, 1, 1],\
               [0, 1, 1, 0, 1, 0],\
               [0, 0, 1, 0, 1, 1]])

C = codes.LinearCode(M); C

[6, 4] linear code over GF(2)

In [21]:
Cd = C.dual_code(); Cd

[6, 2] linear code over GF(2)

In [22]:
C.parity_check_matrix()

[1 0 1 1 1 0]
[0 1 0 1 1 1]

In [23]:
Cd.generator_matrix()

[1 0 1 1 1 0]
[0 1 0 1 1 1]

### Distancia de Hamming

Al espacio vectorial $\mathbb{F}_q^n$ se le dota de una estructura de espacio métrico con la distancia de Hamming, que cuenta el número de posiciones en que dos palabras difieren. Esta distancia está directamente relacionada con el peso de Hamming de una palabra, que es el número de posiciones no nulas que contiene.

La importancia de dicha distancia es que para decodificar una palabra recibida $x \in \mathbb{F}_q^n$ se busca aquella palabra código $c \in \mathcal{C}$ que esté a menor distancia de $x$.

Dado un $[n,k]_q$-código lineal, podemos obtener su distribución de pesos, esto es, una lista $A_0,A_1,...,A_n$ donde $A_i$ es el número de palabras código de peso $i$.

In [24]:
M = matrix(GF(2), [[1, 1, 0, 1, 0, 1, 1, 0],\
               [1, 1, 1, 0, 0, 0, 0, 0],\
               [0, 0, 0, 0, 1, 0, 0, 1],\
               [0, 0, 1, 0, 0, 1, 1, 1]])
C = codes.LinearCode(M); C

[8, 4] linear code over GF(2)

In [25]:
C.weight_distribution()

[1, 0, 3, 1, 3, 6, 1, 1, 0]

In [26]:
M = matrix(GF(5), [[1, 1, 0, 1, 0],\
               [1, 0, 0, 1, 1]])
C = codes.LinearCode(M); C

[5, 2] linear code over GF(5)

In [27]:
C.weight_distribution()

[1, 0, 4, 8, 12, 0]

Una de los aspectos más importantes de un código lineal es su distancia mínima, esto es, la distancia mínima que hay entre cualesquiera dos palabras suyas. Por tratarse de un código lineal, esta coincide con el peso mínimo de su palabras no nulas.

In [28]:
M = matrix(GF(2), [[1, 1, 0, 1, 0, 1, 1],\
               [1, 1, 1, 0, 0, 0, 0],\
               [0, 0, 1, 0, 1, 0, 0],\
               [1, 0, 1, 0, 0, 1, 1]])
C = codes.LinearCode(M); C

[7, 4] linear code over GF(2)

In [29]:
C.minimum_distance()

2

In [30]:
C.weight_distribution()

[1, 0, 2, 5, 5, 2, 0, 1]

In [31]:
M = matrix(GF(11), [[2, 1, 0, 1, 0, 10, 0],\
               [3, 1, 1, 4, 0, 0, 0],\
               [0, 0, 7, 0, 1, 0, 5]])
C = codes.LinearCode(M); C

[7, 3] linear code over GF(11)

In [32]:
C.minimum_distance()

3

In [33]:
C.weight_distribution()

[1, 0, 0, 10, 50, 110, 430, 730]

### Codificación

Sea $\mathcal{C}$ un $[n,k]_q$-código lineal $C$ con matriz generadora $M$. La matriz $M$ representa la codificación en el sentido de que para cifrar una palabra $x \in \mathbb{F}_q^k$ bastará con multiplicarla por $M$.

In [2]:
M = matrix(GF(2), [[1, 1, 0, 1, 0, 0],\
               [1, 0, 0, 0, 1, 1],\
               [0, 1, 1, 0, 1, 0],\
               [0, 0, 1, 0, 1, 1]])
C = codes.LinearCode(M); C

[6, 4] linear code over GF(2)

In [3]:
M == C.generator_matrix()

True

In [4]:
x = vector(GF(2), [0, 1, 0, 1]); x

(0, 1, 0, 1)

In [5]:
x*M

(1, 0, 1, 0, 0, 0)

Alternativamente, podemos aplicar el método *encode* que el código lineal incorpora por defecto.

In [6]:
C.encode(x)

(1, 0, 1, 0, 0, 0)

También tenemos la opción de construir un codificador a partir del código.

In [39]:
E = codes.encoders.LinearCodeGeneratorMatrixEncoder(C); E

Generator matrix-based encoder for [6, 4] linear code over GF(2)

In [40]:
E.generator_matrix()

[1 1 0 1 0 0]
[1 0 0 0 1 1]
[0 1 1 0 1 0]
[0 0 1 0 1 1]

In [41]:
E.encode(x)

(1, 0, 1, 0, 0, 0)

### Decodificación

La tarea de decodificación consiste en partir de una palabra recibida $w \in \mathbb{F}_q^n$ y buscar la palabra código $c \in \mathcal{C} \subseteq \mathbb{F}_q^n$ tal que la distancia entre $w$ y $c$ sea mínima.

In [42]:
M = matrix(GF(2), [[1, 1, 0, 0, 0, 0, 0, 1],\
               [0, 0, 1, 1, 0, 0, 1, 0],\
               [0, 0, 0, 0, 1, 1, 0, 1]])
C = codes.LinearCode(M); C

[8, 3] linear code over GF(2)

In [43]:
w = VectorSpace(GF(2), 8)([1,0,0,1,1,0,0,1]); w

(1, 0, 0, 1, 1, 0, 0, 1)

In [44]:
w in C

False

In [45]:
c = C.decode_to_code(w); c

(0, 0, 0, 0, 1, 1, 0, 1)

In [46]:
c in C

True

Alternativamente, podemos construir un decodificador a partir del código $\mathcal{C}$.

In [47]:
D = codes.decoders.LinearCodeNearestNeighborDecoder(C); D

Nearest neighbor decoder for [8, 3] linear code over GF(2)

In [48]:
D.decode_to_code(w)

(1, 1, 0, 0, 0, 0, 0, 1)

Al descifrar, tratamos de *corregir* los errores que se han producido en la transmisión de una palabra código, obteniendo así la palabra código original como la más cercana a la que tenemos. En este sentido, una propiedad importante en un código es el número de errores que puede corregir correctamente. Este número es el que nos proporciona el método *decoding_radius* del descifrador.

In [49]:
D.decoding_radius()

1

De hecho, sabemos que dicho número se puede obtener directamente a partir de la distancia mínima $d$ del código como $\left[\frac{d-1}{2}\right]$, con $[\cdot]$ representando la parte entera.

In [50]:
C.minimum_distance()

3

En este caso, como su capacidad de corrección de errores es $1$, significa que si modificamos en una sola posición una palabra código, el decodificador será capaz de calcular la palabra código original. Sin embargo, si modificamos más posiciones, no está garantizado que el decodificador nos devuelva la palabra código de la que partimos, pues podría haber otra a menor distancia.

In [51]:
x = vector(GF(2),[1,1,0]); x

(1, 1, 0)

In [52]:
c = C.encode(x); c

(1, 1, 1, 1, 0, 0, 1, 1)

In [53]:
w = copy(c)
w[2] = 0 # Modificamos una posición de c
w

(1, 1, 0, 1, 0, 0, 1, 1)

In [54]:
c2 = D.decode_to_code(w); c2

(1, 1, 1, 1, 0, 0, 1, 1)

In [55]:
c2 == c

True

In [56]:
w2 = copy(c)
w2[2]=0; w2[3]=0 # Modificamos dos posiciones de c
w2

(1, 1, 0, 0, 0, 0, 1, 1)

In [57]:
c3 = D.decode_to_code(w2); c3

(1, 1, 0, 0, 0, 0, 0, 1)

In [58]:
c3 == c

False

También tenemos a nuestra disposición otro decodificador, pero que se basa en el cálculo de los síndromes.

El síndrome de una palabra es el resultado de multiplicar la matriz de paridad del código por la palabra. Las palabras código tienen síndrome 0.

In [59]:
H = C.parity_check_matrix(); H

[1 0 0 0 0 1 0 1]
[0 1 0 0 0 1 0 1]
[0 0 1 0 0 0 1 0]
[0 0 0 1 0 0 1 0]
[0 0 0 0 1 1 0 0]

In [60]:
r = vector(GF(2), (1,0,0,0,1,0,1,0)); r

(1, 0, 0, 0, 1, 0, 1, 0)

In [61]:
r in C

False

In [62]:
H*r

(1, 0, 1, 1, 1)

In [63]:
C.syndrome(r)

(1, 0, 1, 1, 1)

In [64]:
r2 = vector(GF(2), (1,1,1,1,1,1,1,0)); r2

(1, 1, 1, 1, 1, 1, 1, 0)

In [65]:
r2 in C

True

In [66]:
H*r2

(0, 0, 0, 0, 0)

In [67]:
C.syndrome(r2)

(0, 0, 0, 0, 0)

El concepto de síndrome da pié a la decodificación por síndrome. Esta se basa en calcular el síndrome de la palabra $x$ a decodificar y considerar que el patrón de error $e$ que ha ocurrido es el de menor peso cuyo síndrome coincide con el de $x$. A partir de $e$, la palabra original se calcula restando $e$ a $x$.

En este sentido, podemos tomar un decodificador que tenga dicho comportamiento. Este construirá primero la tabla de síndromes (con los distintos síndromes y el patrón de error de menor peso asociado) lo que tarda un tiempo exponencial en la longitud del código y el tamaño del cuerpo base del código. Sin embargo, después las decodificaciones individuales son rápidas.

In [68]:
D = codes.decoders.LinearCodeSyndromeDecoder(C); D

Syndrome decoder for [8, 3] linear code over GF(2) handling errors of weight up to 3

In [69]:
D.maximum_error_weight()

3

In [70]:
D.syndrome_table()

{(0, 0, 0, 0, 0): (0, 0, 0, 0, 0, 0, 0, 0),
 (1, 0, 0, 0, 0): (1, 0, 0, 0, 0, 0, 0, 0),
 (0, 1, 0, 0, 0): (0, 1, 0, 0, 0, 0, 0, 0),
 (0, 0, 1, 0, 0): (0, 0, 1, 0, 0, 0, 0, 0),
 (0, 0, 0, 1, 0): (0, 0, 0, 1, 0, 0, 0, 0),
 (0, 0, 0, 0, 1): (0, 0, 0, 0, 1, 0, 0, 0),
 (1, 1, 0, 0, 1): (0, 0, 0, 0, 0, 1, 0, 0),
 (0, 0, 1, 1, 0): (0, 0, 0, 0, 0, 0, 1, 0),
 (1, 1, 0, 0, 0): (0, 0, 0, 0, 0, 0, 0, 1),
 (1, 0, 1, 0, 0): (1, 0, 1, 0, 0, 0, 0, 0),
 (1, 0, 0, 1, 0): (1, 0, 0, 1, 0, 0, 0, 0),
 (1, 0, 0, 0, 1): (1, 0, 0, 0, 1, 0, 0, 0),
 (0, 1, 0, 0, 1): (1, 0, 0, 0, 0, 1, 0, 0),
 (1, 0, 1, 1, 0): (1, 0, 0, 0, 0, 0, 1, 0),
 (0, 1, 1, 0, 0): (0, 1, 1, 0, 0, 0, 0, 0),
 (0, 1, 0, 1, 0): (0, 1, 0, 1, 0, 0, 0, 0),
 (0, 1, 1, 1, 0): (0, 1, 0, 0, 0, 0, 1, 0),
 (0, 0, 1, 0, 1): (0, 0, 1, 0, 1, 0, 0, 0),
 (1, 1, 1, 0, 1): (0, 0, 1, 0, 0, 1, 0, 0),
 (1, 1, 1, 0, 0): (0, 0, 1, 0, 0, 0, 0, 1),
 (0, 0, 0, 1, 1): (0, 0, 0, 1, 1, 0, 0, 0),
 (1, 1, 0, 1, 1): (0, 0, 0, 1, 0, 1, 0, 0),
 (1, 1, 0, 1, 0): (0, 0, 0, 1, 0

In [71]:
r = vector(GF(2), (1,0,0,0,1,0,1,0)); r

(1, 0, 0, 0, 1, 0, 1, 0)

In [72]:
C.syndrome(r)

(1, 0, 1, 1, 1)

In [73]:
D.decode_to_code(r)

(0, 0, 0, 0, 0, 0, 0, 0)

Para la realización de este cuaderno se ha hecho uso de la documentación de SageMath sobre teoría de códigos accesible en:

https://doc.sagemath.org/html/en/reference/coding/sage/coding.