**Módulo 4:** Trabajando con datos numéricos tabulares

## Creación de Arrays
---

### Instalando el módulo `numpy`

Ya hemos visto que Python cuenta con herramientas para manipular información de texto casi de forma nativa o con ayuda de algunos módulos, pero para manipulación de **datos numéricos** y sobre todo en el área del análisis numérico y éstadistica adolece un poco en instrucciones y eficiencia y para llenar ésta necesidad se creo el módulo `numpy`

![image.png](attachment:d09f4235-91ba-4f88-b32a-7c63aa7e1d2b.png)

- [Sitipo principal de Numpy](https://numpy.org)

El módulo `numpy` no es parte de la librería estándar, así que es necesario instalarlo:

In [None]:
!pip install numpy

Y para validar su instalación se puede ejecutar la siguiente celda:

In [5]:
import numpy as np

np.version.version

'1.25.2'

### Creando arreglos (arrays)

Para crear un array se usa la función o constructor `array()`, por ejemplo creamos el array de 5 números enteros:

`array(range(1, 6))`
o
`array(list)`

In [1]:
# con range()

In [3]:
# con list

Y a diferencia de las listas no se pueden mezclar tipos de datos, por ejemplo crea un array de la isguiente lista de datos: `[1, 2.5, True]`

In [6]:
# Si son tipos de datos compatibles
mix1 = 
mix1

array([1. , 2.5, 1. ])

Si la lista contiene un str entonces todo el array es de tipo str, prueba crear un array con la siguiente lista: `[1, 2.5, True, "cuatro"]`

In [9]:
mix2 = 
mix2

array(['1', '2.5', 'True', 'cuatro'], dtype='<U32')

También se pueden crear arrays vacios, pero hay que indicar cuando menos un argumento:

`np.array([])`

Adicionalmente existen funciones como `ones()` o `zeros()` y necesitan un parámetro que indica las dimenciones del arreglo o vector o matriz en forma de una lista o tupla:

Creando un vector de 1x5 inicializado con 1s usando `np.ones( [1, n] )`

In [7]:
a1 =
a1

SyntaxError: invalid syntax (3016773146.py, line 1)

Creando un vector de 2x5 inicializado con 0s con `np.zeros( [n, m] )`

In [8]:
a2 = 
a2

SyntaxError: invalid syntax (1333297225.py, line 1)

Podemos obtener el tamaño del array con `array.shape`, el número de dimensiones con `array.ndim` y el tipo de todo el array con `array.dtype`:

In [9]:
# tamaño o forma

In [10]:
# dimensiones

In [11]:
# tipo del array

Si se desea obtener una copia de un array hay que usar `array.copy()` similar a las listas, ya que de lo contrario estarías trabajando con el mismo array pero con dos nombres.

In [12]:
# crea una copia, y valida que son independientes

Se puede cambiar el tipo de dato de un array con la función `array.astype(type)` por ejemplo si necemos una lista de los números del 1 al 100 en incrementos de 0.5 el tipo de dato resultante será `np.float64`:

In [31]:
nums = np.arange(1, 101, 0.5)
nums

array([  1. ,   1.5,   2. ,   2.5,   3. ,   3.5,   4. ,   4.5,   5. ,
         5.5,   6. ,   6.5,   7. ,   7.5,   8. ,   8.5,   9. ,   9.5,
        10. ,  10.5,  11. ,  11.5,  12. ,  12.5,  13. ,  13.5,  14. ,
        14.5,  15. ,  15.5,  16. ,  16.5,  17. ,  17.5,  18. ,  18.5,
        19. ,  19.5,  20. ,  20.5,  21. ,  21.5,  22. ,  22.5,  23. ,
        23.5,  24. ,  24.5,  25. ,  25.5,  26. ,  26.5,  27. ,  27.5,
        28. ,  28.5,  29. ,  29.5,  30. ,  30.5,  31. ,  31.5,  32. ,
        32.5,  33. ,  33.5,  34. ,  34.5,  35. ,  35.5,  36. ,  36.5,
        37. ,  37.5,  38. ,  38.5,  39. ,  39.5,  40. ,  40.5,  41. ,
        41.5,  42. ,  42.5,  43. ,  43.5,  44. ,  44.5,  45. ,  45.5,
        46. ,  46.5,  47. ,  47.5,  48. ,  48.5,  49. ,  49.5,  50. ,
        50.5,  51. ,  51.5,  52. ,  52.5,  53. ,  53.5,  54. ,  54.5,
        55. ,  55.5,  56. ,  56.5,  57. ,  57.5,  58. ,  58.5,  59. ,
        59.5,  60. ,  60.5,  61. ,  61.5,  62. ,  62.5,  63. ,  63.5,
        64. ,  64.5,

In [13]:
# usa array.dtype para comprobarlo

Y si cambiamos el tipo a entero 65 de numṕy `np.int65`:

In [33]:
nums_ints = 
nums_ints

array([  1,   1,   2,   2,   3,   3,   4,   4,   5,   5,   6,   6,   7,
         7,   8,   8,   9,   9,  10,  10,  11,  11,  12,  12,  13,  13,
        14,  14,  15,  15,  16,  16,  17,  17,  18,  18,  19,  19,  20,
        20,  21,  21,  22,  22,  23,  23,  24,  24,  25,  25,  26,  26,
        27,  27,  28,  28,  29,  29,  30,  30,  31,  31,  32,  32,  33,
        33,  34,  34,  35,  35,  36,  36,  37,  37,  38,  38,  39,  39,
        40,  40,  41,  41,  42,  42,  43,  43,  44,  44,  45,  45,  46,
        46,  47,  47,  48,  48,  49,  49,  50,  50,  51,  51,  52,  52,
        53,  53,  54,  54,  55,  55,  56,  56,  57,  57,  58,  58,  59,
        59,  60,  60,  61,  61,  62,  62,  63,  63,  64,  64,  65,  65,
        66,  66,  67,  67,  68,  68,  69,  69,  70,  70,  71,  71,  72,
        72,  73,  73,  74,  74,  75,  75,  76,  76,  77,  77,  78,  78,
        79,  79,  80,  80,  81,  81,  82,  82,  83,  83,  84,  84,  85,
        85,  86,  86,  87,  87,  88,  88,  89,  89,  90,  90,  9

## Indexación y Segmentación
---

La forma de acceder a los elementos de un array es idéntico a como funciona con listas, también la forma de crear subarray o rebanadas (slices) pero existe una indexación adicional en arrays donde el índice puede ser una lista de `booleanos`, de la misma longitud que el array original y donde exista un valor `True` el valor en el mismo índice se queda como parte del resultado, si el valor en la posición `i` es False, entonces el valor en la misma posición del array se descarta.

Creamos un array de números negativos, positivos y cero:

In [38]:
a1 = np.array( [-5, -4, -3, -2, -1, 0, 3, 5, 7, 9])
a1

array([-5, -4, -3, -2, -1,  0,  3,  5,  7,  9])

Entonces si creamos una lista de 10 valores False obtendríamos un array vacio

In [42]:
a1[ -lista de 10 False- ]

array([], dtype=int64)

Para obtener la lista de todos los no negativos podemos comparar directamente el array con cero `a1 < 0`, esto nos diría los que son negativos, pero usando el operador de negación `~` (tilde) la comparación quedaría como `~(a1 < 0)`:

array([False, False, False, False, False,  True,  True,  True,  True,
        True])

In [45]:
es_no_negativo = 
es_no_negativo

array([False, False, False, False, False,  True,  True,  True,  True,
        True])

Y para aplicarlo usamos el array resultante como índice `array_orignal[array_boleano]` y podemos filtrar así nuestra lista de elementos:

In [46]:
a1[ ... ]

array([0, 3, 5, 7, 9])

## Desmitificación de Funciones Universales
---

Adicional a los operadores `numpy` cuenta con un arsenal de funcunciones que también se aplican a todos los elementos de un array, por ejemplo:

- add(), multiply(), sqrt(), ...
- sin(), cos(), ...

Para una lista de algunas de las funciones disponibles

- https://numpy.org/doc/stable/reference/routines.math.html#arithmetic-operations

In [71]:
a1 = np.arange(1, 20)
a2 = np.arange(1, 20)
a1, a2

(array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
        18, 19]),
 array([ 1,  2,  3,  4,  5,  6,  7,  8,  9, 10, 11, 12, 13, 14, 15, 16, 17,
        18, 19]))

Suma de dos arrays elemento a elemento usando np.add():

array([ 2,  4,  6,  8, 10, 12, 14, 16, 18, 20, 22, 24, 26, 28, 30, 32, 34,
       36, 38])

Elevar a la potencia 2 cada elemento del array `np.power(a, n)`:

División de los elementos de dos arrays elemento a elemento `np.divide()`:

Divisón de los elementos de un array por un escalar `np.divide()`, si justo la misma función: