# Un primer código en Python y R

**Fundamentos y operaciones básicas del lenguaje, tipos de datos.**

```{image} Imagenes/python.png
:width: 175px
:align: center
:alt: numpy
```
<p style="text-align: center; font-size: 8px;">
    <a href="https://www.flaticon.com/free-icons/coding" title="coding icons">Coding icons created by Edwinp99 - Flaticon</a>
</p>

## Análisis del Problema

El aprendizaje de un lenguaje de programación constituye hoy en día un paso casi inevitable para quienes desean desenvolverse en ámbitos relacionados con el análisis de datos, la investigación aplicada o el desarrollo tecnológico. No obstante, este proceso de iniciación presenta diversos retos que van más allá de la simple memorización de comandos o sintaxis.

> La cantidad de información disponible en internet, que si bien es una ventaja, también puede resultar abrumadora. Los recursos suelen estar dispersos y, con frecuencia, carecen de una estructura que guíe al principiante paso a paso, desde los conceptos básicos hasta aplicaciones prácticas alineadas con sus necesidades profesionales o académicas.

Es importante reconocer que aprender un lenguaje de programación no consiste únicamente en adquirir destrezas técnicas, sino también en adoptar una forma de pensar: resolver problemas de manera lógica, estructurar procesos y traducir necesidades reales en soluciones implementables mediante código.

En este sentido, introducirse en un lenguaje de programación implica tanto un desafío intelectual como práctico, y requiere de una orientación inicial clara que permita construir bases sólidas para avanzar con confianza en un campo en constante evolución.

```{image} Imagenes/code.png
:width: 175px
:align: center
:alt: numpy
```
<p style="text-align: center; font-size: 8px;">
    <a href="https://www.flaticon.com/free-icons/code" title="code icons">Code icons created by Freepik - Flaticon</a>
</p>

```{admonition} Objetivos de la sesión
:class: tip
 -  Conocer sobre los tipos de datos y creación de variables en Python y R
 -  Reconocer los operadores de los lenguajes Python y R
 -  Conocer las estructuras de datos propias de R de las librerías estándar de Python
```

```{admonition} Actividad 
:class: important
Abrir los enlaces a los recursos de esta sesión y ejecutarlos en Google Colab de acuerdo a las indiocaciones del profesor.
```

```{admonition} Recursos
:class: nota
- Notebook en Python: [Enlace a GitHub](https://github.com/monteroanibal/CursoPython2025II/blob/main/notebooks/CP2025II_Sesion2_Python.ipynb)
- Notebook en R: [Enlace a GitHub](https://github.com/monteroanibal/CursoPython2025II/blob/main/notebooks/CP2025II_Sesion2_R.ipynb)
```

## Tipos de datos

La siguiente es una explicación de los tipos de datos tanto en Python como en R.

### en R

todo análisis estadístico y proceso de programación parte del manejo adecuado de los **tipos de datos**, ya que estos determinan cómo se almacenan los valores, qué operaciones son posibles y qué funciones pueden aplicarse. A continuación, se describen los principales tipos de datos que ofrece el software R:

* **Numéricos (numeric)**:

    - Incluyen tanto números enteros como decimales (doble precisión).
    - Son el tipo más común en operaciones estadísticas y matemáticas.
    - Ejemplo: `3.14`, `42`, `-7.5`.

* **Enteros (integer)**:

    - Representan valores enteros exactos.
    - Se distinguen del tipo numérico al declararlos explícitamente con la letra `L`.
    - Ejemplo: `5L`, `100L`.

* **Caracteres o cadenas de texto (character)**:

    - Se utilizan para almacenar texto o cadenas alfanuméricas.
    - Se definen entre comillas simples o dobles.
    - Ejemplo: `"Colombia"`, `"DANE"`.

* **Lógicos (logical)**:

    - Representan valores booleanos: `TRUE` o `FALSE`.
    - Son fundamentales para estructuras condicionales y filtrado de datos.
    - Ejemplo: `x > 10` devuelve un valor lógico.

* **Factores (factor)**:

    - Se emplean para manejar variables categóricas (cualitativas).
    - Pueden ser nominales (sin orden) u ordinales (con jerarquía).
    - Internamente se representan con enteros, pero con etiquetas asociadas.
    - Ejemplo: `factor(c("Alto", "Medio", "Bajo"), ordered = TRUE)`.

* **Valores especiales**:

    - `NA`: representa un dato faltante o no disponible.
    - `NaN`: resultado de operaciones indefinidas (ej. `0/0`).
    - `Inf` y `-Inf`: valores infinitos (ej. `1/0`, `-1/0`).

Estos tipos de datos básicos son la base sobre la cual R construye **estructuras de datos**, como vectores, matrices, data frames y listas, que permiten organizar y manipular información de manera eficiente para el análisis estadístico.

```{image} Imagenes/files.png
:width: 175px
:align: center
:alt: numpy
```
<p style="text-align: center; font-size: 8px;">
    <a href="https://www.flaticon.com/free-icons/structure" title="structure icons">Structure icons created by Alfredo Creates - Flaticon</a>
</p>

### en Python

En Python, al igual que en R, el manejo de los **tipos de datos** es esencial, ya que de ellos depende la forma en que se representan los valores, las operaciones que se pueden realizar y el comportamiento de las funciones o métodos aplicables. Los principales tipos de datos básicos que ofrece el lenguaje son los siguientes:

* **Numéricos**:

   Incluyen tres subtipos principales:

    - **Enteros (`int`)**: representan números enteros sin parte decimal.
       Ejemplo: `42`, `-7`.
    - **Flotantes (`float`)**: números reales con parte decimal, de doble precisión.
       Ejemplo: `3.14`, `-0.001`.
    - **Complejos (`complex`)**: números con parte real e imaginaria.
       Ejemplo: `2 + 3j`.

* **Cadenas de texto (`str`)**:

    - Se utilizan para almacenar secuencias de caracteres.
    - Se definen entre comillas simples, dobles o triples (para textos multilínea).
    - Ejemplo: `"Colombia"`, `'Python'`, `"""Texto en varias líneas"""`.

* **Booleanos (`bool`)**:

    - Representan valores lógicos: `True` o `False`.
    - Son fundamentales en estructuras condicionales y en operaciones de control.
    - Ejemplo: `x > 10` devuelve un valor booleano.

* **Valores especiales**:

    - `None`: representa la ausencia de valor o un valor nulo. Puede usarse para inicializar variables o como valor de retorno por defecto en funciones.

Estos tipos de datos básicos constituyen la base sobre la cual Python construye estructuras de datos y son el punto de partida para las librerías *numpy* y *pandas*, para ampliar las posibilidades del lenguaje para el análisis estadístico.

```{image} Imagenes/bracket-curly.png
:width: 175px
:align: center
:alt: numpy
```
<p style="text-align: center; font-size: 8px;">
    <a href="https://www.flaticon.com/free-icons/json-file" title="json file icons">Json file icons created by Assetwave - Flaticon</a>
</p>

## Estructuras de datos 

Apartir de los tipos de datos antes mencionados, se derivan las estructuras de datios básicas que se utilizan en cada uno de los dos softwares.

### de las librerías estándar Python

Además de los tipos básicos como números, cadenas y booleanos, Python ofrece estructuras de datos integradas que permiten organizar y manipular información de manera eficiente. Entre las más utilizadas se encuentran las *secuencias*, los *conjuntos* y los *diccionarios*.

* **Secuencias**: mantienen un *orden* de los elementos (listas y tuplas).
* **Conjuntos**: no mantienen orden, pero garantizan *unicidad* de elementos.
* **Diccionarios**: organizan la información mediante un esquema *clave–valor*, muy eficiente para representar estructuras más complejas.

#### Tipos de secuencia

Las secuencias son colecciones ordenadas de elementos, lo que significa que cada elemento ocupa una posición definida dentro de la estructura (índice).

* **Listas (`list`)**:

    - Colecciones ordenadas y **mutables**, lo que permite modificar, agregar o eliminar elementos.
    - Se definen con corchetes `[]`.
    - Ejemplo: `numeros = [1, 2, 3, 4]`.

* **Tuplas (`tuple`)**:

    - Colecciones ordenadas pero **inmutables**, es decir, no se pueden modificar después de creadas.
    - Se definen con paréntesis `()`.
    - Ejemplo: `coordenadas = (10, 20)`.

* **Rangos (`range`)**:

    - Representan una secuencia de enteros, comúnmente utilizada en bucles.
    - Ejemplo: `range(0, 5)` genera los valores `0, 1, 2, 3, 4`.

Estas estructuras son la base del trabajo con colecciones en Python, y resultan esenciales en tareas de iteración y manipulación de datos.

#### Conjuntos (`set` y `frozenset`)

Un conjunto es una colección **desordenada** de elementos **únicos**.

* **Set (`set`)**:

    - Mutable, permite agregar y eliminar elementos.
    - Se define con llaves `{}` o con la función `set()`.
    - Ejemplo: `colores = {"rojo", "verde", "azul"}`.

* **Frozenset (`frozenset`)**:

    - Es la versión **inmutable** de un conjunto, útil cuando se requiere que los datos no cambien.
    - Ejemplo: `inmutable = frozenset([1, 2, 3])`.

Los conjuntos resultan útiles para operaciones como uniones, intersecciones o diferencias de colecciones.

#### Diccionarios (`dict`)

Un diccionario es una colección de **pares clave–valor**, en la que cada clave es única y sirve para acceder a su valor asociado.

* Se define con llaves `{}`, donde cada elemento tiene la forma `"clave": valor`.
* Ejemplo:

  ```python
  persona = {"nombre": "Ana", "edad": 30, "ciudad": "Bogotá"}
  ```
* Permiten una búsqueda rápida de información y son muy flexibles en la representación de datos estructurados.

```{image} Imagenes/cells.png
:width: 175px
:align: center
:alt: numpy
```
<p style="text-align: center; font-size: 8px;">
    <a href="https://www.flaticon.com/free-icons/table" title="table icons">Table icons created by Pixel perfect - Flaticon</a>
</p>

### en R

Además de los tipos de datos básicos (numéricos, lógicos, caracteres, factores), existen *estructuras de datos* que permiten organizar y manipular conjuntos de valores. Estas estructuras son la base del trabajo estadístico y computacional en este lenguaje.

* **Vectores**: colecciones homogéneas en una dimensión.
* **Matrices y arreglos**: colecciones homogéneas en dos o más dimensiones.
* **Data frames**: colecciones heterogéneas en forma tabular (similar a hojas de cálculo).
* **Listas**: colecciones heterogéneas y flexibles que pueden contener cualquier tipo de objeto.

#### Vectores

* Son la **unidad fundamental de almacenamiento en R**.
* Contienen elementos del **mismo tipo de dato** (numéricos, lógicos, caracteres, etc.).
* Se crean con la función `c()`.
* Ejemplo:

  ```R
  numeros <- c(1, 2, 3, 4, 5)
  colores <- c("rojo", "verde", "azul")
  ```

#### Matrices

* Extienden el concepto de vector a **dos dimensiones**.
* Todos los elementos deben ser del mismo tipo de dato.
* Se crean con la función `matrix()`.
* Ejemplo:

  ```R
  m <- matrix(1:6, nrow = 2, ncol = 3)
  ```

#### Arreglos (arrays)

* Generalizan las matrices a **más de dos dimensiones**.
* Todos los elementos son del mismo tipo de dato.
* Se crean con la función `array()`.
* Ejemplo:

  ```R
  a <- array(1:12, dim = c(2, 3, 2))
  ```

#### Data frames

* Son una de las estructuras más utilizadas en R.
* Almacenan datos en forma de **tabla** (filas y columnas).
* Cada columna puede contener un tipo de dato distinto, lo que los hace especialmente útiles para datos estadísticos.
* Se crean con la función `data.frame()`.
* Ejemplo:

  ```R
  df <- data.frame(
    nombre = c("Ana", "Luis", "María"),
    edad = c(23, 35, 29),
    estudiante = c(TRUE, FALSE, TRUE)
  )
  ```

#### Listas

* Son estructuras **flexibles y heterogéneas**, capaces de almacenar objetos de diferentes tipos y tamaños (vectores, matrices, data frames, incluso otras listas).
* Se crean con la función `list()`.
* Ejemplo:

  ```R
  mi_lista <- list(
    numeros = c(1, 2, 3),
    texto = "R es poderoso",
    tabla = df
  )
  ```

```{image} Imagenes/data-entry.png
:width: 175px
:align: center
:alt: numpy
```
<p style="text-align: center; font-size: 8px;">
    <a href="https://www.flaticon.com/free-icons/data-entry" title="data entry icons">Data entry icons created by Uniconlabs - Flaticon</a>
</p>

## Operadores

Los operadores son símbolos especiales que permiten realizar operaciones sobre variables y valores. Tanto Python como R disponen de un conjunto de operadores aritméticos, relacionales, lógicos y de asignación, aunque con algunas diferencias en su sintaxis y uso.

### aritméticos

Se emplean para operaciones matemáticas básicas.

| Operación       | Python | R     | Ejemplo (resultado)                   |
| --------------- | ------ | ----- | ------------------------------------- |
| Suma            | `+`    | `+`   | `3 + 2 → 5`                           |
| Resta           | `-`    | `-`   | `3 - 2 → 1`                           |
| Multiplicación  | `*`    | `*`   | `3 * 2 → 6`                           |
| División real   | `/`    | `/`   | `3 / 2 → 1.5`                         |
| División entera | `//`   | `%/%` | `3 // 2 → 1` (Py) ; `3 %/% 2 → 1` (R) |
| Módulo (resto)  | `%`    | `%%`  | `7 % 3 → 1` (Py) ; `7 %% 3 → 1` (R)   |
| Potencia        | `**`   | `^`   | `2 ** 3 → 8` (Py) ; `2 ^ 3 → 8` (R)   |

### relacionales o de comparación

Usados para comparar valores y devolver resultados booleanos.

| Comparación   | Python | R    | Ejemplo (resultado)    |
| ------------- | ------ | ---- | ---------------------- |
| Igual a       | `==`   | `==` | `3 == 3 → True / TRUE` |
| Distinto de   | `!=`   | `!=` | `3 != 2 → True / TRUE` |
| Mayor que     | `>`    | `>`  | `5 > 3 → True / TRUE`  |
| Menor que     | `<`    | `<`  | `2 < 4 → True / TRUE`  |
| Mayor o igual | `>=`   | `>=` | `3 >= 3 → True / TRUE` |
| Menor o igual | `<=`   | `<=` | `2 <= 3 → True / TRUE` |

### lógicos

Permiten combinar condiciones lógicas.

| Operación       | Python | R                                    | Ejemplo                                           | 
| --------------- | ------ | ------------------------------------ | ------------------------------------------------- | 
| Y lógico        | `and`  | `&` (vectorizado) / `&&` (escalares) | `True and False → False` ; `TRUE & FALSE → FALSE` |
| O lógico        | `or`   | `\|`                                  | `TRUE \| FALSE → TRUE` |
| Negación lógica | `not`  | `!`                                  | `not True → False` ; `!TRUE → FALSE`              |

### de asignación

Se usan para almacenar valores en variables.

| Python | R          | Ejemplo                               |
| ------ | ---------- | ------------------------------------- |
| `=`    | `<-` o `=` | `x = 5` (Py) ; `x <- 5` o `x = 5` (R) |

### especiales

* En Python, destacan los operadores de pertenencia (`in`, `not in`) y de identidad (`is`, `is not`), muy útiles en estructuras de datos.
    - Ejemplo: `"a" in ["a", "b", "c"] → True`.
* En R, existen operadores específicos para estadística y vectores, como `%in%` (pertenencia a un conjunto).
    - Ejemplo: `"a" %in% c("a", "b", "c") → TRUE`.

```{image} Imagenes/flow-diagram.png
:width: 175px
:align: center
:alt: numpy
```
<p style="text-align: center; font-size: 8px;">
    <a href="https://www.flaticon.com/free-icons/diagram" title="diagram icons">Diagram icons created by Freepik - Flaticon</a>
</p>

### Jerarquía de operadores en Python

En Python, cuando una expresión combina distintos operadores, el intérprete sigue un *orden de prioridad* para decidir qué operaciones realizar primero. Esta jerarquía garantiza que los resultados sean consistentes y evita ambigüedades.

```{admonition} Recomendación práctica
:class: tip
Aunque Python  respeta estrictamente las jerarquías explicadas a continuación, en la práctica se recomienda **usar paréntesis ()** para aclarar la intención del programador y mejorar la legibilidad del código.
```

#### 1. Operadores numéricos

De mayor a menor prioridad, el orden es el siguiente:

1. Paréntesis `( )`
2. Exponenciación `**`
3. Negación unaria `-x` y signo positivo `+x`
4. Multiplicación `*`, División `/`, División entera `//`, Módulo `%`
5. Suma `+` y Resta `-`

#### 2. Operadores relacionales y lógicos

En expresiones que combinan comparaciones y lógica booleana, la precedencia es:

1. Operadores relacionales: `<`, `<=`, `>`, `>=`, `==`, `!=`
2. `not` (negación lógica)
3. `and` (conjunción lógica)
4. `or` (disyunción lógica)

### Jerarquía de operadores en R

En R, al igual que en Python, las expresiones con múltiples operadores se evalúan según un *orden de precedencia* definido. Esto determina qué operaciones se realizan primero, salvo que el programador use *paréntesis* `( )` para modificar el orden natural.

```{admonition} Recomendación práctica
:class: tip
Aunque Python  respeta estrictamente las jerarquías explicadas a continuación, en la práctica se recomienda **usar paréntesis ()** para aclarar la intención del programador y mejorar la legibilidad del código.
```

#### 1. Operadores numéricos

De mayor a menor prioridad:

1. Paréntesis `( )`
2. Exponenciación `^` o `**`
3. Signos unarios `+x`, `-x`
4. Multiplicación `*`, División `/`, División entera `%/%`, Módulo `%%`
5. Suma `+` y Resta `-`

#### 2. Operadores relacionales y lógicos

En expresiones booleanas, R sigue esta precedencia:

1. Operadores relacionales**: `<`, `<=`, `>`, `>=`, `==`, `!=`
2. Negación lógica `!`
3. Conjunción lógica `&` y `&&`
4. Disyunción lógica `|` y `||`

## Apéndice

¡Gracias por su participación en el curso! Lo esperamos en una siguiente oportunidad.

### Documentación

[Libro de introducción al lenguaje _Python_](https://github.com/chardiwall/Coding-for-beginners-and-beyond/blob/main/python-basics-a-practical-introduction-to-python-3.pdf) <br>
[Libro de introducción al lenguaje _R_](https://cran.r-project.org/doc/manuals/R-intro.pdf)

### Referencias

* Bader, D., Jablonski, J., & Heisler, F. (2021). Python Basics: A Practical Introduction to Python 3. Real Python.
* Venables, W. N., Smith, D. M., & R Core Team. (2025). An introduction to R (version 4.5.1). The R Project for Statistical Computing.

<i>Taller de Análisis y procesamiento de datos con Open Source</i> © 2025 by <a href="https://scholar.google.es/citations?user=PP7CT6IAAAAJ">Aníbal Montero</a> is licensed under <a href="https://creativecommons.org/licenses/by-nc-nd/4.0/">CC BY-NC-ND 4.0</a><img src="https://mirrors.creativecommons.org/presskit/icons/cc.svg" style="max-width: 1em;max-height:1em;margin-left: .2em;"><img src="https://mirrors.creativecommons.org/presskit/icons/by.svg" style="max-width: 1em;max-height:1em;margin-left: .2em;"><img src="https://mirrors.creativecommons.org/presskit/icons/nc.svg" style="max-width: 1em;max-height:1em;margin-left: .2em;"><img src="https://mirrors.creativecommons.org/presskit/icons/nd.svg" style="max-width: 1em;max-height:1em;margin-left: .2em;">