# Francisco Regalado
### Introducción a la Ciencia de Datos
Maestria en Ciecias de la Computación, CICESE

**Comprendiendo los Tipos de Datos en Python**

Para trabajar eficazmente con datos, es crucial entender cómo se almacenan y manipulan en Python, y cómo NumPy mejora este proceso. La diferencia entre los métodos nativos de Python y NumPy es clave para entender la eficiencia y el rendimiento en la manipulación de datos.

### Tipado Dinámico en Python
Una de las razones por las cuales Python es popular es su **tipado dinámico**. A diferencia de lenguajes estáticamente tipados como C o Java, donde los tipos de las variables deben declararse explícitamente, en Python los tipos son inferidos automáticamente:

```python
result = 0
for i in range(100):
    result += i
```

Esto permite flexibilidad, pero también implica que cada variable en Python contiene información adicional sobre su tipo. Por ejemplo, en Python puedes reasignar diferentes tipos de datos a la misma variable:

```python
x = 4
x = "cuatro"
```

En C, esto causaría un error de compilación. Esta flexibilidad facilita el uso de Python, pero viene con un **costo de rendimiento**.

### Un Entero en Python es Más que un Entero
Cuando defines un entero en Python, este no es solo un número crudo. En realidad, es un puntero a una estructura compuesta en C, que contiene información adicional como:

- **ob_refcnt**: El contador de referencias para manejar la asignación y liberación de memoria.
- **ob_type**: El tipo de la variable.
- **ob_size**: El tamaño de los datos.
- **ob_digit**: El valor numérico en sí.

Todo esto hace que un entero en Python ocupe más memoria que un entero en C.

### Una Lista en Python es Más que una Lista
Las listas en Python son estructuras mutables que pueden almacenar múltiples objetos. Sin embargo, debido al tipado dinámico, cada elemento de la lista debe contener su propio tipo, contador de referencias y más. Esto implica que:

```python
L = list(range(10))
L2 = [str(c) for c in L]
L3 = [True, "2", 3.0, 4]
```

Este enfoque es flexible, pero ineficiente en comparación con un **arreglo de tipo fijo** como los de NumPy, que almacena los datos de manera más compacta.

### Arreglos de Tipo Fijo en Python
Python ofrece opciones para almacenar datos en buffers de tipo fijo. Una de ellas es el módulo `array`, que permite crear arreglos densos de tipo uniforme:

```python
import array
A = array.array('i', list(range(10)))
```

Más útil aún es el objeto `ndarray` de NumPy, que no solo almacena datos de manera eficiente, sino que también permite realizar operaciones rápidas sobre ellos.

### Creación de Arreglos en NumPy
Puedes crear arreglos en NumPy desde listas de Python usando `np.array`:

```python
import numpy as np
np.array([1, 4, 2, 5, 3])
```

NumPy también permite **arrays multidimensionales** y arreglos de diferentes tipos de datos. Ejemplos de creación de arreglos desde cero incluyen:

```python
# Arreglo de ceros
np.zeros(10, dtype=int)

# Arreglo de unos
np.ones((3, 5), dtype=float)

# Arreglo lleno con un valor
np.full((3, 5), 3.14)

# Secuencia lineal
np.arange(0, 20, 2)

# Valores distribuidos uniformemente
np.random.random((3, 3))
```

### Tipos de Datos en NumPy
Los arreglos en NumPy contienen valores de un solo tipo. Los tipos de datos estándar en NumPy son similares a los de C:

| Tipo de dato | Descripción |
|--------------|-------------|
| `bool_`      | Booleano (True o False) almacenado en un byte |
| `int_`       | Entero por defecto (normalmente `int32` o `int64`) |
| `float32`    | Punto flotante de precisión simple |
| `float64`    | Punto flotante de precisión doble |
| `complex128` | Número complejo representado por dos `float64` |

NumPy permite especificar estos tipos mediante cadenas o usando los objetos de tipo asociados, como `np.int16` o `np.float64`.

Este enfoque eficiente de NumPy es esencial para la manipulación de grandes volúmenes de datos de manera rápida y eficaz.