# Tipos de dato de texto y arreglos

En este _notebook_ veremos algunos conceptos fundamentales de programación presentes en la mayoría de los lenguajes de alto nivel.

## Tipos de datos de texto

Poder trabajar con texto siempre es deseable, pues esta funcionalidad es necesaria para, por ejemplo, poder interactuar con la persona que esté usando el programa, imprimiendo instrucciones en pantalla de qué hacer o pidiéndole que ingrese algunos datos en algún punto de la ejecución del programa.

### `Char`

El tipo de dato de texto primitivo en Julia es `Char`. Cualquier símbolo envuelto en comillas ' ' será considerado como un dato de tipo `Char`:

In [None]:
'a'

In [None]:
typeof('a')

La primera celda nos revela que Julia interpreta el símbolo `a` según su clave de [Unicode](https://en.wikipedia.org/wiki/Unicode), el cual es un estándar mundial que asigna una clave única a 144,697 caracteres en alrededor de 159 idiomas.

Muchos símbolos con clave Unicode que pueden ser escritos con un comando de LaTeX también se pueden escribir en Julia con el mismo comando usando "auto completación" con la tecla TAB. Por ejemplo, para escribir $\alpha$ en el REPL de Julia o en una celda de Jupyter, basta escribir el comando de LaTeX `\alpha` y luego presionar la tecla TAB:

In [1]:
 α # ¡Escribe α al inicio de esta celda (sin copiar y pegar)!

LoadError: UndefVarError: α not defined

La "auto completación" significa que si escribimos un comando parcial de LaTeX que Julia puede representar con un caracter Unicode y presionamos la tecla TAB, aparecerá una lista con todos los comandos de LaTeX que empiezan con esas mismas letras y que pueden ser representados por un caracter Unicode.

In [None]:
\al # Mira las opciones presionando la tecla TAB

Los caracteres que pueden ser representados de esta manera se pueden consultar en la [documentación de Julia](https://docs.julialang.org/en/v1/manual/unicode-input/#Unicode-Input).

Es importante recordar que todo símbolo que escribamos entre commillas ' ' será interpretado por Julia como un dato de tipo `Char` por lo que, por ejemplo, el siguiente código no funcionará

In [None]:
'5' + '3' # Julia los interpreta como Char, no como Int

pues el operador `+` no está definido para datos de tipo `Char`.

### `print` y `println`

Las principales funciones para imprimir caracteres en Julia son `print` y `println`. La diferencia entre ellas es que `println` crea una _nueva línea_ después de haber impreso el caracter de su argumento.

In [2]:
print('a')
print(' ')
print('b')
# Compara el resultado de esta celda...

a b

In [4]:
# ...con el de ésta.
println('a')
print('b')

a
b

### `String`

Trabajar texto siempre a nivel de caracteres resulta impráctico. Para escribir secuencias de caracteres, existe un tipo de dato llamado `String`. Para escribir un dato de tipo `String`, debemos envolver símbolos entre dobles comillas " ":

In [5]:
"¡Hola, mundo!"

"¡Hola, mundo!"

In [6]:
typeof("¡Hola, mundo!")

String

Podemos utilizar las funciones `print` y `println` con datos de tipo `String` como lo hacíamos con los de tipo `Char`.

In [7]:
print("¡Hola, mundo!")
#= Este programa es típicamente lo primero que alguien aprende a hacer
   cuando conoce un nuevo lenguaje de programación de alto nivel =#

¡Hola, mundo!

Observamos que los operadores aritméticos tampoco funcionan con datos de tipo `String`:

In [None]:
"2.0" - "73.1" # Julia los interpreta como String, no como Float

## Arreglos

### Matrices

En el _notebook_ `1.1-Operadores_aritméticos_y_tipos_de_datos_numéricos.ipynb` vimos cómo hacer operaciones entre números. Sin embargo, dada la utilidad de acomodar números en arreglos -como vectores y matrices- y hacer operaciones entre ellos, existe una implementación de lo anterior en Julia.

Un arreglo en Julia es delimitado por corchetes `[]`. Para escribir una matriz, escribimos las entradas de un _vector renglón_ separadas por un espacio y utilizamos el símbolo `;` para crear la siguiente línea e introducir el siguiente vector renglón:

In [10]:
[1 2 3 ; 4 5 6 ; 7 8 9]

3×3 Matrix{Int64}:
 1  2  3
 4  5  6
 7  8  9

Podemos usar los operadores aritméticos `+`, `-` y `*` para hacer operaciones entre matrices, siempre que las dimensiones coincidan de tal forma que la operacion esté bien definida:

In [11]:
[1 2 3 ; 4 5 6 ; 7 8 9] + [1 0 0 ; 0 0 0 ; 0 1 1]

3×3 Matrix{Int64}:
 2  2   3
 4  5   6
 7  9  10

In [12]:
[1 2 3 ; 4 5 6] - [1 0 0 ; 0 0 0 ; 0 1 1]
# Obtenemos un error porque las dimensiones no coindicen

LoadError: DimensionMismatch("dimensions must match: a has dims (Base.OneTo(2), Base.OneTo(3)), b has dims (Base.OneTo(3), Base.OneTo(3)), mismatch at 1")

In [13]:
[1 2 3 ; 4 5 6] * [1 2 ; 3 4 ; 5 6]
#= En este ejemplo, a pesar de que las dimensiones difieran, ¡lo hacen de
   tal forma que la multiplicación de las matrices esté bien definida! =#

2×2 Matrix{Int64}:
 22  28
 49  64

Más aún, el operador `*` se puede usar para multiplicar una matriz por un escalar:

In [14]:
5 * [1 2 3 ; 4 5 6 ; 7 8 9]

3×3 Matrix{Int64}:
  5  10  15
 20  25  30
 35  40  45

In [15]:
[1 2 3 ; 4 5 6 ; 7 8 9] * 5

3×3 Matrix{Int64}:
  5  10  15
 20  25  30
 35  40  45

Sin embargo, esto falla para otros tipos de operaciones:

In [16]:
[1 2 3 ; 4 5 6 ; 7 8 9] + 5 # Esto nos devolverá un mensaje de error

LoadError: MethodError: no method matching +(::Matrix{Int64}, ::Int64)
For element-wise addition, use broadcasting with dot syntax: array .+ scalar
[0mClosest candidates are:
[0m  +(::Any, ::Any, [91m::Any[39m, [91m::Any...[39m) at C:\Users\c-lop\AppData\Local\Programs\Julia-1.7.2\share\julia\base\operators.jl:655
[0m  +([91m::T[39m, ::T) where T<:Union{Int128, Int16, Int32, Int64, Int8, UInt128, UInt16, UInt32, UInt64, UInt8} at C:\Users\c-lop\AppData\Local\Programs\Julia-1.7.2\share\julia\base\int.jl:87
[0m  +([91m::Rational[39m, ::Integer) at C:\Users\c-lop\AppData\Local\Programs\Julia-1.7.2\share\julia\base\rational.jl:311
[0m  ...

Si queremos aplicar un operador a _cada una de las entradas de un arreglo_, generalmente funciona colocar un punto `.` antes del operador, como en los ejemplos siguientes:

In [17]:
[1 2 3 ; 4 5 6 ; 7 8 9] .+ 5 # Esto suma 5 a cada entrada de la matriz

3×3 Matrix{Int64}:
  6   7   8
  9  10  11
 12  13  14

In [18]:
[6.0 3.5 7.2] .- 1 # Esto resta el flotante 1.0 a cada entrada del vector

1×3 Matrix{Float64}:
 5.0  2.5  6.2

**Nota** A pesar de que en este caso utilicemos los operadores aritméticos para hacer operaciones entre _arreglos de números_ en vez de sólo números, estos tienen la misma precedencia y asociatividad que discutimos en el _notebook_ 

`1.1-Operadores_aritméticos_y_tipos_de_datos_numéricos.ipynb`.

**Ejercicio** ¿Qué tipo de dato tiene la matriz `[1 2 3 ; 4 5 6 ; 7 8 9]`? ¿Es un tipo de dato primitivo o compuesto?

In [19]:
typeof([1 2 3 ; 4 5 6 ; 7 8 9]) # ¿Recuerdas qué función usar para averiguar esto?

Matrix{Int64} (alias for Array{Int64, 2})

**Nota** Es importante separar las entradas de las matrices con espacios pues, de lo contario, Julia las intentará interpretar como cifras de un mismo número. Sin embargo, el separador de renglones `;` no necesita que dejemos espacios antes ni después de él; aún así, recomendamos esta práctica para tener mayor claridad y legibilidad. 

### Vectores

Siguiendo la discusión anterior, si quisiéramos escribir a un vector al cual le podamos aplicar una matriz con el operador `*`, tendríamos que escribirlo como un _vector columna_, es decir, una matriz de una sola columna.

In [20]:
[1 ; 2 ; 3]

3-element Vector{Int64}:
 1
 2
 3

In [21]:
[1 0 0 ; 0 1 0 ; 0 0 1] * [1 ; 2 ; 3] # Aplicando la matriz identidad de 3x3

3-element Vector{Int64}:
 1
 2
 3

Una forma equivalente de escribir vectores es separando cada entrada con un símbolo de coma `,`:

In [22]:
[1, 2, 3]

3-element Vector{Int64}:
 1
 2
 3

In [23]:
[1 0 0 ; 0 1 0 ; 0 0 1] * [1, 2, 3]

3-element Vector{Int64}:
 1
 2
 3

Es decir, si escribimos un arreglo de números separados por comas como `[a, b, c, d]`, Julia lo interpretará como el vector columna con entradas `a`, `b`, `c` y `d`, equivalente a la matriz de una sola columna `[a ; b ; c ; d]`.

**Ejercicio** ¿Qué tipo de dato tiene el vector `[6.0, 3.5, 7.2]`?

In [24]:
[6.0, 3.5, 7.2]

3-element Vector{Float64}:
 6.0
 3.5
 7.2

In [25]:
typeof([6.0, 3.5, 7.2])

Vector{Float64} (alias for Array{Float64, 1})

In [26]:
[1 2 3 ; 4 5 6 ; 7 8 9]

3×3 Matrix{Int64}:
 1  2  3
 4  5  6
 7  8  9

In [27]:
typeof([1 2 3 ; 4 5 6 ; 7 8 9])

Matrix{Int64} (alias for Array{Int64, 2})

### Índices y subarreglos

¿Qué hacemos si queremos acceder al valor de alguna entrada específica de un vector? Julia le asigna a cada entrada de un vector un _índice_ que **empieza por el número `1`**. Para acceder a la $i$-ésima entrada de un vector, debemos escribir `[i]` a la derecha del vector _sin dejar espacio_: 

In [28]:
[10, 8, 5][1]

10

In [29]:
[10, 8, 5][2]

8

In [30]:
[10, 8, 5] [3] # Obtenemos un error inicialmente por haber dejado un espacio

LoadError: syntax: space before "[" not allowed in "[10, 8, 5] [" at In[30]:1

**Ejercicio** Averigua qué sucede cuando intentamos acceder a la $i$-ésima entrada de la siguiente matriz:

In [36]:
[1 2 3 ; 4 5 6 ; 7 8 9][7]

3

Una manera más sencilla de acceder a la entrada del renglón $i$ y columna $j$ de una matriz es utilizando la sintáxis `[i,j]`:

In [37]:
[1 2 3 ; 4 5 6 ; 7 8 9][2,2]

5

In [38]:
[1 2 3 ; 4 5 6 ; 7 8 9][3,1]

7

Nuestra siguiente pregunta es: ¿qué hacemos si queremos acceder a algún _vector renglón_ o _vector columna_ de una matriz? Para acceder al $i$-ésimo vector renglón, utilizamos la sintáxis `[i,:]`:

In [39]:
[1 2 3 ; 4 5 6 ; 7 8 9][3]   # Compara el resultado de esta celda...

7

In [40]:
[1 2 3 ; 4 5 6 ; 7 8 9][3,:] # ...con el de ésta.

3-element Vector{Int64}:
 7
 8
 9

Análogamente, para acceder al `j`-ésimo vector columna, utilizamos la sintáxis `[:,j]`:

In [41]:
[1 2 3 ; 4 5 6 ; 7 8 9][:,3]

3-element Vector{Int64}:
 3
 6
 9

Puedes pensar que el símbolo `:` significa "todos los valores posibles" en la entrada correspondiente de `[i,j]`. La razón de esto quedará clara cuando veamos _rangos_.

Los ejemplos anteriores muestran que un arreglo contiene _subarreglos_ a los cuales podemos acceder. Más generalmente, para obtener un arreglo con las entradas $i$, $j$ y $k$ de otro arreglo, podemos utilizar la sintáxis `[[i,j,k]]`:

In [42]:
[1, 3, 5, 7, 9][[1,3,5]]

3-element Vector{Int64}:
 1
 5
 9

Notamos que en este caso en vez de escribir un sólo índice dentro de los corchetes `[]`, escribimos un _arreglo de índices_, obteniendo como resultado el _subarreglo_ que se obtiene con las entradas correspondientes a esos índices.

### `String` como arreglos de `Char`

Los datos de tipo `String` en realidad son arreglos de datos de tipo `Char`, por lo que podemos acceder a cualquiera de sus entradas (que serán datos de tipo `Char`) o de sus subarreglos (que serán de tipo `String`):

In [47]:
"¡Hola, mundo!"[1]

'¡': Unicode U+00A1 (category Po: Punctuation, other)

**Ejercicio** ¿Cuántas palabras puedes formar con las letras de la frase "¡Hola, mundo!"? Obten los _Strings_ correspondientes accediendo a subarreglos del `String` `"¡Hola, mundo!"`.

In [53]:
"¡Hola, mundo!"[[4,5,6]]

"ola"

In [54]:
"¡Hola, mundo!"[[5,6]]

"la"

In [61]:
"¡Hola, mundo!"[[9,6,11,12,13]]

"mando"

In [62]:
"¡Hola, mundo!"[[3,4,11,12,13]]

"Hondo"

In [67]:
"¡Hola, mundo!"[[9,6,5,4]]

"malo"

In [99]:
"¡Hola, mundo!"[[9,10,5,6]]

"mula"

In [68]:
"¡Hola, mundo!"[[5,6,9,4]]

"lamo"

In [70]:
"¡Hola, mundo!"[[9,10,12,13]]

"mudo"

In [71]:
"¡Hola, mundo!"[[9,10,12,6]]

"muda"

In [73]:
"¡Hola, mundo!"[[9,4,11,13]]

"mono"

In [74]:
"¡Hola, mundo!"[[9,4,11,6]]

"mona"

In [76]:
"¡Hola, mundo!"[[5,6,12,13]]

"lado"

In [78]:
"¡Hola, mundo!"[[9,6,11,13]]

"mano"

In [80]:
"¡Hola, mundo!"[[12,6,5,13]]

"dalo"

In [81]:
"¡Hola, mundo!"[[9,6,11,13,5,4]]

"manolo"

In [82]:
"¡Hola, mundo!"[[5,4,12,13]]

"lodo"

In [83]:
"¡Hola, mundo!"[[11,10,12,13]]

"nudo"

In [85]:
"¡Hola, mundo!"[[6,11,13]]

"ano"

In [86]:
"¡Hola, mundo!"[[6,9,13]]

"amo"

In [87]:
"¡Hola, mundo!"[[9,4,3,13]]

"moHo"

In [88]:
"¡Hola, mundo!"[[9,4,12,13]]

"modo"

In [89]:
"¡Hola, mundo!"[[9,4,12,6]]

"moda"

In [90]:
"¡Hola, mundo!"[[10,11,13]]

"uno"

In [91]:
"¡Hola, mundo!"[[10,11,6]]

"una"

In [92]:
"¡Hola, mundo!"[[5,10,11,6]]

"luna"

In [93]:
"¡Hola, mundo!"[[12,10,11,6]]

"duna"

In [94]:
"¡Hola, mundo!"[[12,13,11,6]]

"dona"

In [96]:
"¡Hola, mundo!"[[5,13,11,6]]

"lona"

In [100]:
"¡Hola, mundo!"[[13,11,12,6]]

"onda"

In [101]:
"¡Hola, mundo!"[[11,6,12,13]]

"nado"

In [103]:
"¡Hola, mundo!"[[12,13,11]]

"don"

In [104]:
"¡Hola, mundo!"[[11,13]]

"no"

In [105]:
"¡Hola, mundo!"[[9,13,5,6]]

"mola"

In [106]:
"¡Hola, mundo!"[[9,13,5]]

"mol"

In [107]:
"¡Hola, mundo!"[[11,13]]

"no"

In [109]:
"¡Hola, mundo!"[[12,13]]

"do"

In [111]:
"¡Hola, mundo!"[[3,10,9,13]]

"Humo"

In [113]:
"¡Hola, mundo!"[[5,4,9,13]]

"lomo"

In [114]:
"¡Hola, mundo!"[[5,4,9,6]]

"loma"

In [115]:
"¡Hola, mundo!"[[12,4,9,6]]

"doma"

In [116]:
"¡Hola, mundo!"[[6,5,12,13]]

"aldo"

In [118]:
"¡Hola, mundo!"[[11,4,12,13]]

"nodo"

In [121]:
"¡Hola, mundo!"[[12,13,11,4]]

"dono"

In [122]:
"¡Hola, mundo!"[[4,5,9,13]]

"olmo"

In [123]:
"¡Hola, mundo!"[[9,6,5]]

"mal"

In [124]:
"¡Hola, mundo!"[[12,13,9,4]]

"domo"

In [125]:
"¡Hola, mundo!"[[10,11]]

"un"

In [126]:
"¡Hola, mundo!"[[11,10,5,13]]

"nulo"

In [127]:
"¡Hola, mundo!"[[11,10,5,6]]

"nula"

## Recursos complementarios

Documentación de Julia:
* [Manual de arreglos](https://docs.julialang.org/en/v1/manual/arrays/),
* [Manual de `String`s](https://docs.julialang.org/en/v1/manual/strings/),
* [Documentación de arreglos](https://docs.julialang.org/en/v1/base/arrays/#Concatenation-and-permutation).