<a href="https://colab.research.google.com/github/sebabecerra/CursoBasicoPython/blob/main/03_Data_Types.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Data Types

## Visión General

### Notas

#### ¿Qué son los Tipos de Datos?

* Python puede almacenar datos de diferentes tipos.
* Estos tipos pueden hacer cosas diferentes.

#### ¿Qué podemos hacer con los Tipos de Datos?

Bueno, con `int` podemos hacer operaciones matemáticas como `+` y `-`.


In [None]:
salario_total = 110000
bono = 10000

In [None]:
type(salario_total)

int

In [None]:
salario_base = salario_total - bono

salario_base

100000

Sin embargo, eso no significa que podamos hacer lo mismo con `str`.

In [None]:
job_title = 'Data Analyst'
remove_word = 'Data'

In [None]:
type(job_title)

str

In [None]:
final_title = job_title - remove_word

final_title

TypeError: unsupported operand type(s) for -: 'str' and 'str'

#### Tipos Incorporados

Python tiene los siguientes tipos de datos incorporados por defecto:
| Tipo               | Tipo de Dato        | Ejemplo               |
|--------------------|---------------------|-----------------------|
| Texto              | `str`               | `"¡Aficionado a los datos!"`     |
| Numérico           | `int`               | `42`                  |
|                    | `float`             | `3.14159`             |
|                    | `complex`           | `1 + 2j`              |
| Secuencia          | `list`              | `[1, 2, 3]`           |
|                    | `tuple`             | `(1, 2, 3)`           |
|                    | `range`             | `range(10)`           |
| Mapeo              | `dict`              | `{"clave": "valor"}`    |
| Conjunto           | `set`               | `{1, 2, 3}`           |
|                    | `frozenset`         | `frozenset([1, 2, 3])`|
| Booleano           | `bool`              | `True` o `False`     |
| Binario            | `bytes`             | `b"Datos"`            |
|                    | `bytearray`         | `bytearray(5)`        |
|                    | `memoryview`        | `memoryview(b"Datos")`|
| Ninguno            | `NoneType`          | `None`                |

Para más información sobre los diferentes tipos de datos en Python, consulta la documentación de Python sobre tipos de datos [aquí](https://docs.python.org/3/library/datatypes.html).

#### Tipos Comunes en Análisis de Datos

Nos centraremos principalmente en los más comunes en análisis de datos:
* Tipo de Texto: `str`
* Tipos Numéricos: `int`, `float`
* Tipos de Secuencia: `list`, `tuples`
* Tipo de Mapeo: `dict`
* Tipos de Conjunto: `set`

### Importancia

Fundamental para el procesamiento de datos. Pandas y matplotlib manejan automáticamente diferentes tipos de datos para operaciones como cálculos matemáticos, manipulación de datos y gráficos.




## Ver Tipo de Dato

### Notas

* Ver el tipo de dato usando la función `type()`

### Ejemplo


In [None]:
company_name = "CMF"

type(company_name)

str

También puedes usar funciones dentro de otras funciones.

In [None]:
print(type(company_name))

<class 'str'>


**Nota**: Realmente no necesitamos usar `print()` aquí, ya que los Jupyter Notebooks siempre imprimen el último objeto.

## Verificar Tipos de Datos

Verifica los tipos de datos de las variables usando la función `type()`.

Nota: En este caso estamos usando `print()` para que podamos ver todos los tipos de datos de nuestras variables.

In [None]:
job_id = 102
company_name = 'Data Nerd, Inc.'
job_title = 'Data Scientist'
salary_rate = 170000.00
job_work_from_home = True

In [None]:
# Check data types
print(type(job_id))
print(type(company_name))
print(type(job_title))
print(type(salary_rate))
print(type(job_work_from_home))

<class 'int'>
<class 'str'>
<class 'str'>
<class 'float'>
<class 'bool'>


También puedes verificar si una variable es del tipo que piensas. Usando `isinstance()`. Tiene dos argumentos:
1. *Objeto* - lo que quieres verificar
2. *Tipo* - un tipo (lo que quieres usar para ver el objeto)

Por ejemplo, si quiero verificar si `job_id` es del tipo `float`. Si es del tipo que especificas, devolverá `True`; si no, devolverá `False`.

In [None]:
isinstance(job_id, float)

False

In [None]:
isinstance(company_name, str)

True

Alerta: En general usaremos `isinstance()` en proyectos avanzados 😈


## Obtener `help()` sobre Tipos de Datos (o realmente cualquier cosa)

Podemos usar la función `help()` para investigar tipos de datos, funciones, métodos... ¡realmente cualquier objeto!

In [None]:
help(isinstance)

Help on built-in function isinstance in module builtins:

isinstance(obj, class_or_tuple, /)
    Return whether an object is an instance of a class or of a subclass thereof.
    
    A tuple, as in ``isinstance(x, (A, B, ...))``, may be given as the target to
    check against. This is equivalent to ``isinstance(x, A) or isinstance(x, B)
    or ...`` etc.



Using the `help()` function we can see what "methods" are available to a data type.

A "method" in Python is like a tool that performs a specific task on or with an object.  

For instance, a string object has a method `.upper()`, which you can use like `your_string.upper()`. This takes `your_string` and turns all its letters to uppercase. It's like asking the string to explain itself.

In [None]:
help(str) # Chequear docuemntacion of objects including: str, int, float, bool

Help on class str in module builtins:

class str(object)
 |  str(object='') -> str
 |  str(bytes_or_buffer[, encoding[, errors]]) -> str
 |  
 |  Create a new string object from the given object. If encoding or
 |  errors is specified, then the object must expose a data buffer
 |  that will be decoded using the given encoding and error handler.
 |  Otherwise, returns the result of object.__str__() (if defined)
 |  or repr(object).
 |  encoding defaults to sys.getdefaultencoding().
 |  errors defaults to 'strict'.
 |  
 |  Methods defined here:
 |  
 |  __add__(self, value, /)
 |      Return self+value.
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __format__(self, format_spec, /)
 |      Return a formatted version of the string as described by format_spec.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  

## Establecer Tipo de Dato

### Notas

* Establece el tipo de dato específico usando *funciones* constructoras.
* Primero, ¿qué es una *función*? Vamos a profundizar mucho más en las funciones más adelante. Pero por ahora, entiende que es un bloque de código diseñado para realizar una tarea específica.
    * Puede tomar una entrada (conocida como argumentos), ejecutar una serie de operaciones y devolver una salida.
    * Ya hemos usado una función varias veces llamada `print()`. Esta función muestra el argumento (el texto que has estado escribiendo) en la consola.
        * Por ejemplo, `print('hola mundo')` imprimirá 'hola mundo'.
        * `print()` se centra en mostrar la salida.
    * Pero la mayoría de las funciones realizan cálculos, manipulan datos o devuelven datos. Como verás a continuación.

A continuación se muestran algunos tipos de datos comunes:

| Tipo de Dato | Sintaxis                    | Ejemplo                           |
|--------------|-----------------------------|-----------------------------------|
| Cadena       | `str()`                     | `str('Hola Mundo')`               |
| Entero       | `int()`                     | `int(20)`                         |
| Flotante     | `float()`                   | `float(20.5)`                     |
| Complejo     | `complex()`                 | `complex(1j)`                     |
| Lista        | `list()`                    | `list(('manzana', 'banana', 'cereza'))` |
| Tupla        | `tuple()`                   | `tuple(('manzana', 'banana', 'cereza'))`|
| Rango        | `range()`                   | `range(6)`                        |
| Diccionario  | `dict()`                    | `dict(nombre='Juan', edad=36)`    |
| Conjunto     | `set()`                     | `set(('manzana', 'banana', 'cereza'))`  |
| Frozenset    | `frozenset()`               | `frozenset(('manzana', 'banana', 'cereza'))`|
| Booleano     | `bool()`                    | `bool(5)`                         |
| Bytes        | `bytes()`                   | `bytes(5)`                        |
| Bytearray    | `bytearray()`               | `bytearray(5)`                    |
| Memoryview   | `memoryview()`              | `memoryview(bytes(5))`            |

### Ejemplo

Establece el tipo de dato específico para cada variable. Vamos a especificar una nueva oferta de trabajo.

🪲**Depuración**

**Este es un error intencional**

Esto se utiliza para demostrar la depuración.

Error: Falta la comilla simple `'` al final de Data Nerd, Inc.

```
company_name = str('Data Nerd, Inc.)
```

Pasos para Depurar:

1. Mira el error real, ¿puedes decir cuál es el problema?
2. Si no, entonces búscalo:
  1. Usa un chatbot como ChatGPT o Claude
  2. Búscalo usando Google
  3. O pregunta a nuestro mejor amigo ChatGPT

In [None]:
job_id = 102

type(job_id)

int

#### ¿Qué pasa si queremos que job_id tenga decimales en su lugar?

In [None]:
# Set job_id to a float value vice an integer
job_id = float(102)

print("Job ID:         ", job_id)
print("Type of Job ID: ", type(job_id))

Job ID:          102.0
Type of Job ID:  <class 'float'>
