# Tipos de dato de texto y arreglos

En este _notebook_ veremos los tipos de dato utilizados por Julia para trabajar con texto y conjuntos de datos.

## Tipos de datos de texto

Al programar, poder trabajar con texto siempre es deseable, pues esta funcionalidad es necesaria para, por ejemplo, poder interactuar con la persona que usará el programa, imprimiendo instrucciones en pantalla de qué hacer o pidiéndole que ingrese algunos datos en algún punto de la ejecución del programa.

### `Char`

El tipo de dato de texto primitivo en Julia es `Char`. Cualquier símbolo envuelto en comillas ' ' será considerado como un dato de tipo `Char`:

In [None]:
'a'

In [None]:
typeof('a')

La primera celda nos revela que Julia interpreta el símbolo `a` según su clave de [Unicode](https://en.wikipedia.org/wiki/Unicode), el cual es un estándar mundial que asigna una clave única a 144,697 caracteres en alrededor de 159 idiomas.

Muchos símbolos con clave Unicode que pueden ser escritos con un comando de $\LaTeX$ también se pueden escribir en Julia con el mismo comando usando "auto completación" con la tecla TAB. Por ejemplo, para escribir $\alpha$ en el REPL de Julia o en una celda de Jupyter, basta escribir el comando de $\LaTeX$ `\alpha` y luego presionar la tecla TAB:

In [None]:
 #¡Escribe α al inicio de esta celda (sin copiar y pegar)!

La "auto completación" significa que si escribimos un comando parcial de $\LaTeX$ que Julia puede representar con un caracter Unicode y presionamos la tecla `Tab`, aparecerá una lista con todos los comandos de $\LaTeX$ que empiezan con esas mismas letras y que pueden ser representados por un caracter Unicode.

In [None]:
\al #Mira las opciones presionando la tecla TAB

Los caracteres que pueden ser representados de esta manera se pueden consultar en la [documentación de Julia](https://docs.julialang.org/en/v1/manual/unicode-input/#Unicode-Input).

Es importante recordar que todo símbolo que escribamos entre commillas ' ' será interpretado por Julia como un dato de tipo `Char` por lo que, por ejemplo, el siguiente código no funcionará

In [None]:
'5' + '3' #Julia los interpreta como Char, no como Int

pues el operador **`+`** no está definido para datos de tipo `Char`.

### `print` y `println`

Las principales funciones para imprimir caracteres en Julia son `print` y `println`. La diferencia entre ellas es que `println` crea una _nueva línea_ después de haber impreso el caracter de su argumento.

In [None]:
print('a')
print(' ')
print('b')
#Compara el resultado de esta celda...

In [None]:
#...con el de ésta.
println('a')
print(' ')
print('b')

### `String`

Trabajar texto siempre a nivel de caracteres resulta impráctico. Para escribir secuencias de caracteres, existe un tipo de dato llamado `String`. Para escribir un dato de tipo `String`, debemos envolver símbolos entre dobles comillas " ":

In [None]:
"¡Hola, mundo!"

In [None]:
typeof("¡Hola, mundo!")

Podemos utilizar las funciones `print` y `println` con datos de tipo `String` como lo hacíamos con los de tipo `Char`.

In [None]:
print("¡Hola, mundo!")
#=Este programa es típicamente lo primero que alguien aprende a hacer
  cuando conoce un nuevo lenguaje de programación de alto nivel=#

Observamos que los operadores aritméticos tampoco funcionan con datos de tipo `String`:

In [None]:
"2.0" - "73.1" #Julia los interpreta como String, no como Float

## Arreglos

A menudo es deseable procesar conjuntos de datos en vez de datos por separado; por ejemplo, cuando queremos trabajar con vectores y matrices, graficar y analizar datos, o manipular imágenes. Para ello existen los **arreglos** de datos, una estructura que permite agrupar datos para que la información que contienen sea fácil de accesar y operar.

En Julia, un arreglo se crea cuando un conjunto de datos separados por un espacio es delimitado con corchetes `[]`:

In [16]:
[ 1 2 3 4 5 6 7 8 ]

1×8 Matrix{Int64}:
 1  2  3  4  5  6  7  8

Vemos que surge un nuevo tipo de dato compuesto para el arreglo anterior: `Matrix{Int64}`. Además, Julia nos informa que nuestra matriz de enteros es de `1` renglón y `8` columnas. Más aún, si le aplicamos la función `typeof()` al arreglo anterior

In [17]:
typeof([ 1 2 3 4 5 6 7 8 ])

Matrix{Int64}[90m (alias for [39m[90mArray{Int64, 2}[39m[90m)[39m

Podemos ver que `Matrix{Int64}` es simplemente un alias para el tipo de dato (compuesto) `Array{Int64, 2}`. `Int64` se refiere al tipo de los datos contenidos en el arreglo y `2` se refiere al número de dimensiones del arreglo (como Julia lo considera una matriz de un renglón y ocho columnas, tiene dos).

### Matrices

En el _notebook_ [`1.1-Operadores_aritméticos_y_tipos_de_datos_numéricos.ipynb`](./1.1-Operadores_aritméticos_y_tipos_de_datos_numéricos.ipynb) vimos cómo hacer operaciones entre números. Sin embargo, dada la utilidad de acomodar números en arreglos -como vectores y matrices- y hacer operaciones entre ellos, existe una implementación de lo anterior en Julia.

Para escribir una matriz de más de un renglón, separamos a los vectores renglón utilizando el símbolo `;`:

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9]

Podemos usar los operadores aritméticos **`+`**, **`-`** y **`*`** para hacer operaciones entre matrices, siempre que las dimensiones coincidan de tal forma que la operacion esté bien definida:

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9] + [1 0 0 ; 0 0 0 ; 0 1 1]

In [None]:
[1 2 3 ; 4 5 6] - [1 0 0 ; 0 0 0 ; 0 1 1]
#Obtenemos un error porque las dimensiones no coindicen

In [None]:
[1 2 3 ; 4 5 6] * [1 2 ; 3 4 ; 5 6]
#=En este ejemplo, a pesar de que las dimensiones difieran, ¡lo hacen de
  tal forma que la multiplicación de las matrices esté bien definida!=#

Más aún, el operador **`*`** se puede usar para multiplicar una matriz por un escalar:

In [None]:
5 * [1 2 3 ; 4 5 6 ; 7 8 9]

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9] * 5

Sin embargo, esto falla para otros tipos de operaciones:

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9] + 5 #Esto nos devuelve un mensaje de error

Si queremos aplicar un operador a _cada una de las entradas de un arreglo_, generalmente funciona colocar un punto **`.`** antes del operador, como en los siguientes ejemplos:

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9] .+ 5 #Esto suma 5 a cada entrada de la matriz

In [None]:
[6.0 3.5 7.2] .- 1 #Esto resta el flotante 1.0 a cada entrada del vector

**Nota** A pesar de que en este caso utilicemos los operadores aritméticos para hacer operaciones entre _arreglos de números_ en vez de sólo números, estos tienen la misma precedencia y asociatividad que discutimos en el _notebook_ [`1.1-Operadores_aritméticos_y_tipos_de_datos_numéricos.ipynb`](./1.1-Operadores_aritméticos_y_tipos_de_datos_numéricos.ipynb).

**Ejercicio** ¿Qué tipo de dato tiene la matriz `[1 2 3 ; 4 5 6 ; 7 8 9]`? ¿Es un tipo de dato primitivo o compuesto?

In [None]:
 #¿Recuerdas qué función usar para averiguar esto?

**Nota** Es importante separar las entradas de las matrices con espacios pues, de lo contario, Julia las intentará interpretar como cifras de un mismo número. Sin embargo, el separador de renglones `;` no necesita que dejemos espacios antes ni después de él; aún así, recomendamos esta práctica para tener mayor claridad y legibilidad. 

### Vectores

Siguiendo la discusión anterior, la forma de escribir vectores tal que podamos aplicarles matrices usando el operador **`*`** es escribiéndolos como _vectores columna_, es decir, como matrices de una sola columna.

In [None]:
[1 ; 2 ; 3]

In [None]:
[1 0 0 ; 0 1 0 ; 0 0 1] * [1 ; 2 ; 3] #Aplicando la matriz identidad de 3x3 a (1, 2, 3) ∈ R^3

Una forma equivalente de escribir vectores columna es separando cada entrada con un símbolo de coma `,`:

In [None]:
[1, 2, 3]

In [None]:
[1 0 0 ; 0 1 0 ; 0 0 1] * [1, 2, 3]

Es decir, si escribimos un arreglo de números separados por comas como `[a, b, c, d]`, Julia lo interpretará como el vector columna con entradas `a`, `b`, `c` y `d`, equivalente a la matriz de una sola columna `[a ; b ; c ; d]`.

Esto es reminiscente de cómo, en matemáticas, normalmente escribimos vectores de algún espacio $K^n$ (donde $K$ es un campo) como $(a, b, c, \dots)$ pero, al multiplicarlos por una matriz, por conveniencia preferimos escribirlos como

$$\begin{pmatrix} a \\ b \\ c \\ \dots \end{pmatrix},$$

lo cual implica una equivalencia entre este vector columna y la $n$-tupla separada por comas anterior.

**Ejercicio** ¿Qué tipo de dato tiene el vector `[6.0, 3.5, 7.2]`? Verifícalo.

### Índices y subarreglos

¿Qué hacemos si queremos acceder al valor de alguna entrada específica de un vector? Julia le asigna a cada entrada de un vector un **índice** que _empieza por el número `1`_. Para acceder a la $i$-ésima entrada de un vector, debemos escribir `[i]` a la derecha del vector _sin dejar espacio_: 

In [None]:
[10, 8, 5][1]

In [None]:
[10, 8, 5][2]

In [None]:
[10, 8, 5] [3] #Obtenemos un error -inicialmente- por haber dejado un espacio

**Ejercicio** Averigua qué sucede cuando intentamos acceder a la $i$-ésima entrada de la siguiente matriz:

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9]

Una manera más sencilla de acceder a la entrada del renglón $i$ y columna $j$ de una matriz es utilizando la sintáxis `[i,j]`:

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9][2,2]

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9][3,1]

Nuestra siguiente pregunta es: ¿qué hacemos si queremos acceder a algún _vector renglón_ o _vector columna_ de una matriz? Para acceder al $i$-ésimo vector renglón, utilizamos la sintáxis `[i,:]`:

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9][3]   #Compara el resultado de esta celda...

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9][3,:] #...con el de ésta.

Análogamente, para acceder al `j`-ésimo vector columna, utilizamos la sintáxis `[:,j]`:

In [None]:
[1 2 3 ; 4 5 6 ; 7 8 9][:,3]

Puedes pensar que el símbolo `:` significa "todos los valores posibles" para el índice correspondiente. La razón de esto quedará clara más adelante cuando veamos _rangos_.

Los ejemplos anteriores muestran que un arreglo contiene **subarreglos** a los cuales podemos acceder. Más generalmente, para obtener un arreglo con las entradas $i$, $j$ y $k$ de otro arreglo, podemos utilizar la sintáxis `[[i,j,k]]`:

In [None]:
[1, 3, 5, 7, 9][[1,3,5]]

Notamos que en este caso en vez de escribir un sólo índice dentro de los corchetes `[]`, escribimos un _arreglo de índices_, obteniendo como resultado el _subarreglo_ que se obtiene con las entradas correspondientes a esos índices.

### `String` como arreglos de `Char`

Los datos de tipo `String` en realidad son arreglos de datos de tipo `Char`, por lo que podemos acceder a cualquiera de sus entradas (que serán datos de tipo `Char`) o de sus subarreglos (que serán de tipo `String`):

In [None]:
"¡Hola, mundo!"

**Ejercicio** ¿Cuántas palabras puedes formar con las letras de la frase "¡Hola, mundo!"? Obten los _Strings_ correspondientes accediendo a subarreglos del `String` `"¡Hola, mundo!"`.

### `length`

## Recursos complementarios

Documentación de Julia:
* [Manual de arreglos](https://docs.julialang.org/en/v1/manual/arrays/),
* [Manual de `String`s](https://docs.julialang.org/en/v1/manual/strings/),
* [Documentación de arreglos](https://docs.julialang.org/en/v1/base/arrays/#Concatenation-and-permutation).