![TheBridge_Numpy_v0.png](attachment:TheBridge_Numpy_v0.png)

## Numpy: Atributos y tipos de los array

## Contenidos

* [Atributos y dimensiones](#Atributos-y-dimensiones)  
* [Tipos en Numpy](#Tipos-en-Numpy)  
* [Diferencias con las listas](#Diferencias-con-las-listas)  


### Atributos y dimensiones  
[al indice](#Contenidos)  



Hay ciertos atributos de los array  que debemos conocer. Estos atributos son:
* `ndim`: es el numero de dimensiones. Número de niveles que tiene el array de `numpy`.
* `shape`: tamaño de cada una de las dimensiones. Devuelve el resultado en formato `tupla`
* `size`: cantidad de elementos del array.
* `dtype`: nos dice el tipo (numpy) de los elementos que contiene un array.

Veamos los atributos anteriores sobre el ejemplo que te dejo aquí:

In [None]:
import numpy as np

array_multi = np.array([[1,2,3],
                         [4,5,6], 
                         [7,8,9]])


In [None]:
print("Dimensiones:", array_multi.ndim)
print("Shape o forma:", array_multi.shape)
print("size:", array_multi.size)

Aquí es donde empezamos a "liarnos", porque vemos unas dimensiones (2) que no se parece a lo que hemos llamado dimensiones de la matriz 3x3, que más bien parece eso que hemos llamado shape o forma. 

Esto es así porque estamos tratando atributos del tipo array de numpy, no de las características matemáticas de su interpretación como una matriz.

Pausalo por un momento y empecemos por lo fácil: **size**. Este nos dice el número de elementos individuales que tiene el array. En este caso 9.

Vayamos ahora con las dimensiones (**ndim**): 2. Porque tiene 2 anidaciones.

In [None]:
array_1D = np.array([2,-4,5,7,13])
array_3D = np.array([[[1,10], [2, 20], [3, 30]],
                          [[4, 40], [5, 50], [6, 60]],
                          [[7, 70], [8, 80], [9, 90]]])

¿Cuál es la dimensión del array_1D?¿Y la de array_3D?

In [None]:
print("Dimension array_1D:", array_1D.ndim)
print("Dimension_array_3D:", array_3D.ndim)

Básicamente nos dice cuantas listas anidadas, como ya hemos dicho... Y entonces shape, ¿Qué es? Pues el número de listas o elementos que puede haber por anidación...

In [None]:
print("ARRAY (ojo no lo veas ahora como matriz):", array_multi)
print("Shape:", array_multi.shape)

El shape nos dice que el array está formado por tres listas de tres elementos cada uno.

Repitamos con el array_3D

In [None]:
print("ARRAY:", array_3D)
print("Shape:", array_3D.shape)

¿Qué nos dice el shape? Que este array está formado por 3 listas que tienen 3 listas con 2 elementos cada lista. 

¿Y por que esto es así? Porque los array son un tipo genérico, la interpretación que hagamos nosotros de lo que contienen es libre. Por ejemplo, array_3D lo puedes ver como una colección de 3 matrices de dimensión (ahora sí, matemática,) 3x2... o como una matriz de 3x3 en la que cada elemento no es un número sino un vector de 2 componentes. 

Eso lo decides tú y en función de esa interpretación deberás acceder a los elementos del mismo. Y es por lo que cuando el tipo array tiene dimensión (ojo ahora no matemática sino la de ndim) mayor o igual a 3, se les llama de una forma especial, en concreto: TENSORES. 

Esto es probablemente uno de los elementos más potentes y flexibles de numpy y también uno de los que más confusión genera a la hora usar los array de numpy cuando nos vamos más alla de 2 dimensiones (de numpy :-)

Tan claro.... como el barro.

Vale, otro ejemplo de lo que hemos dicho

![image.png](attachment:image.png)

In [None]:
# Si consideramos array_3D una colección de matrices de 3x2
# Accederemos a los elementos de la siguiente manera:
matriz_1 = array_3D[0]
matriz_2 = array_3D[1]
matriz_3 = array_3D[2]

print(matriz_1, matriz_2, matriz_3, sep = "\n\n")

In [None]:
# Y el primer indice siempre será para referirnos a la matriz
matriz_suma = sum(array_3D)
print(matriz_suma)
print(matriz_1 + matriz_2 + matriz_3)

![image.png](attachment:image.png)

In [None]:
# Tratandolo como una matrix 3x3 con vectores como elementos
print(array_3D)
print("Elemento (2,2) de la matriz")
elemento_2_2 = array_3D[1,1]
print(elemento_1_1)
elemento_3_1 = array_3D[2,0]
print("Elemento (3,1) de la matriz")
print(elemento_3_1)

Veamos ahora el tamaño del array multidimensional antes de pasar al atributo dtype

In [None]:
print(array_3D.size)

Fíjate que el tamaño, como el resto de atributos, es independiente de la forma en la que interpretemos el array (lista de matrices, matriz de vectores, etc). En el caso del tamaño es el número de elementos individuales (números, cadenas, etc)

Para terminar con los atributos, recordemos **dtype**.

In [None]:
print(array_3D.dtype)

### Tipos en Numpy
  
[al indice](#Contenidos)  

En `numpy` también hay **que tener en cuenta los tipos de datos con los que trabajamos**, para no cometer el error de *mezclar peras con manzanas*. Es más, **`numpy` es mucho más variado en cuanto a tipos**, que el propio intérprete de Python. 

En el caso de `numpy`, hay que pensar en el factor tamaño cuando especifiquemos los tipos de los datos. No es lo mismo el numero 12, que el 120000000000. Desde el punto de vista del intérprete de Python, son dos `int`s, pero para numpy son un `int32` o un `int64`. Ese número es la cantidad de bits que se necesita para representar el valor. Cuanto más grande sea el valor, mayor cantidad de bits utilizaremos.

[En la documentación tienes el detalle de todos los tipos de datos.](https://numpy.org/devdocs/user/basics.types.html)

Por ejemplo, valores numéricos

In [None]:
# Valores normales
x = np.array([1,2,3,4])
print(x)
print(x.dtype)

# Valores mas grandes
x = np.array([100000000000000000])
print(x)
print(x.dtype)

In [None]:
# Floats
x = np.array([1.])
print(x)
print(x.dtype)

Si tenemos booleanos

In [None]:
x = np.array([True, False, True])
print(x.dtype)

Cadenas de texto. La `U` viene de unicode, que es la codificación que sigue `numpy`. Y el número de al lado es la longitud de la cadena de texto más larga del array.

In [None]:
x = np.array(['aaa', 'b', 'c'])
print(x.dtype)

Podemos mezclar varios tipos de datos, pero `numpy` forzará un solo tipo. ¿Cómo lo hace? Realiza las conversiones de tal manera que no pierda información en la conversión. En la conversión prima el siguiente orden: String -> Float -> Int -> Boolean

In [None]:
print(np.array(['a', True]))
print(np.array([1, True]))
print(np.array([1, 1.]))

### Diferencias con las listas  
[al indice](#Contenidos)  


De las dos diferencias principales en términos de manejo, ya hemos visto que los arrays tienen un único tipo que fuerzan. La otra es que tienen un tamaño fijo y homogéneo. 

In [None]:
# Ejemplo homogeneídad

lista_ejemplo = [[1,2],[3,4],[1]]

lista_np = np.array(lista_ejemplo)

print(lista_np)


In [None]:

# Ejemplo tamaño fijo
lista_ejemplo = [[1,2],[3,4],[3,2]]

lista_ejemplo.remove([3,2]) # Ahora es una matriz de 2x2

matriz_np = np.array([[1,2],[3,4],[3,3]]

# No existe remove... Si quiero otra matriz puedo hacer un slice con copia... ya lo veremos más adelante


Las principales diferencias entre los arrays NumPy y las listas de Python son las siguientes:

1. Tipos de Datos Homogéneos:
   - Las listas de Python pueden contener elementos de diferentes tipos de datos en la misma lista, mientras que los arrays NumPy están diseñados para contener elementos del mismo tipo de datos, lo que proporciona un rendimiento más eficiente para operaciones numéricas.

2. Eficiencia en el Rendimiento:
   - Los arrays NumPy están altamente optimizados y están implementados en C, lo que los hace más rápidos y eficientes en términos de rendimiento en comparación con las listas de Python para operaciones numéricas y científicas.

3. Capacidad de Cálculos Matemáticos:
   - NumPy proporciona un conjunto completo de funciones y operaciones matemáticas que se pueden aplicar de manera eficiente a todos los elementos de un array. Esto facilita la realización de operaciones matriciales, estadísticas y algebraicas.

4. Tamaño Fijo:
   - Los arrays NumPy tienen un tamaño fijo una vez creados, lo que significa que no pueden crecer o reducirse como las listas de Python. Para cambiar el tamaño de un array NumPy, debes crear uno nuevo.

5. Facilidades de Indexación:
   - Los arrays NumPy ofrecen una variedad de técnicas de indexación avanzada, incluyendo la indexación booleana y de matriz, lo que facilita la manipulación de datos en arrays multidimensionales.

6. Uso de Memoria:
   - Los arrays NumPy utilizan menos memoria que las listas de Python, ya que almacenan elementos de manera más compacta y eficiente.

7. Funciones Específicas para Operaciones Numéricas:
   - NumPy proporciona funciones específicas para realizar operaciones numéricas, como la suma, la multiplicación, la media, la desviación estándar, etc., de manera eficiente en arrays, lo que simplifica el trabajo con datos numéricos.

En resumen, si estás trabajando con datos numéricos y realizando operaciones matemáticas o científicas en Python, los arrays NumPy son la elección preferida debido a su eficiencia y funcionalidad específica. Sin embargo, las listas de Python siguen siendo versátiles y adecuadas para una amplia gama de tareas generales de manipulación de datos y estructuras de datos heterogéneas.