<p><img alt="Colaboratory logo" height="160px" src="https://upload.wikimedia.org/wikipedia/commons/archive/f/fb/20161010213812%21Escudo-UdeA.svg" align="left" hspace="10px" vspace="0px"></p>

# **Análisis de Datos y Machine Learning en Python 1**

Juan Camilo Zapata Ceballos   
Facultad de Ciencias Exactas y Naturales   
Universidad de Antioquia   
2023

# **1. Fundamentos de Programación**

* <a href="#fp5">1.5. Python</a><br>
  - <a href="#fp51">1.5.1. ¿Qué es Python? y ¿Para qué Python?</a><br>
  - <a href="#fp52">1.5.2. Google Colaboratory</a><br>
  - <a href="#fp53">1.5.3. Librerías para Ciencia de Datos</a><br>

<p><a name="fp5"></a></p>

## **1.5. Python**

<p><a name="fp51"></a></p>

## **1.5.1. ¿Qué es Python? y ¿Para qué Python?**

[Python](https://www.python.org/) es un lenguaje de programación ampliamente utilizado en el desarrollo de aplicaciones web, software (programas de computador), la ciencia de datos, el machine learning y en la ciencia y en la ingeniaría, por esto se dice que es un lenguaje de propósito general. Los programadores, usualmente implementan Python en sus trabajos porque es eficiente, fácil de usar y muy intuitivo de aprender. Además, por ser un lenguaje interpretado puede ser ejecutado sin mayor dificultad en muchas plataformas y sistemas operativos (portabilidad). Python es gratis (Free) y de código abierto (Open Source).

<p><a name="fp52"></a></p>

## **1.5.2. Google Colaboratoty**

El documento actual es un [Notebook de Jupyter](https://jupyter.org/), que corre en el Colaboratory de Google (Colab). No es una página estática pues contiene aplicaciones en la misma web. Se trata de un ambiente interactivo en el cual se puede ejecutar código escrito en Python y enotros lenguajes de programación. (Dar una breve introducción a Colab).

<p><a name="fp53"></a></p>

## **1.5.3. Librerías para Ciencia de Datos**

La mayoría de funcionalidades en Python están proporcionadas por los módulos (librerías). Estos son programas escritos por terceros que proporcionan herramientas útiles para nuestros códigos. Para usar un módulo en un programa de Python lo primero que se debe hacer es importarlo mediante la sentencia `import`. Veamos:

<p><img alt="Colaboratory logo" height="100px" src="https://www.freecodecamp.org/espanol/news/content/images/2021/04/numpy-1-1-.png" align="left" hspace="10px" vspace="0px"></p>   

<br clear="left"/>

NumPy es una librería de Python, que agrega soporte para arreglos (listas) y matrices (tablas). En su repertorio cuenta con una gran colección de funciones matemáticas de alto nivel para operar en estos arreglos. Se importa como:


In [None]:
import numpy

In [None]:
import numpy as np

Para más información visite [NumPy](https://numpy.org/).

<p><img alt="Colaboratory logo" height="110px" src="https://interactivechaos.com/sites/default/files/inline-images/tutorial_matplotlib.png" align="left" hspace="10px" vspace="0px"></p>   

<br clear="left"/>

Matplotlib es una librería de Python para crear gráficos. Soporta NumPy y su eslogan es "*Matplotlib hace que las cosas fáciles sean fáciles y las difíciles sean posibles*". Se importa como:

In [None]:
import matplotlib

In [None]:
import matplotlib.pyplot as plt

Para más información visite [Matplotlib](https://matplotlib.org/).

<p><img alt="Colaboratory logo" height="90px" src="https://www.adictosaltrabajo.com/wp-content/uploads/2020/12/1200px-Pandas_logo.svg_.png" align="left" hspace="10px" vspace="0px"></p>   

<br clear="left"/>

Pandas es una librería de Python para la manipulación y el análisis de datos. En particular, ofrece estructuras de datos y operaciones para manipular tablas de forma rápida, potente y flexible. Se importa como:

In [None]:
import pandas

In [None]:
import pandas as pd

Para más información visite [Pandas](https://pandas.pydata.org/).

<p><img alt="Colaboratory logo" height="70px" src="https://seaborn.pydata.org/_static/logo-wide-lightbg.svg" align="left" hspace="10px" vspace="0px"></p>   

<br clear="left"/>

Seaborn es una librería de visualización de datos de Python. Está basada en Matplotlib y proporciona una interfaz de alto nivel para realizar gráficos estadísticos. Se importa como:

In [None]:
import seaborn

In [None]:
import seaborn as sns

Para más información visite [Seaborn](https://seaborn.pydata.org/).

# **2. Introducción a Python I**

* <a href="#ip1">2.1. Introducción</a><br>

* <a href="ip2">2.2. Tipos de Datos</a><br>
 - <a href="#ip21">2.2.1. Variables</a><br>
 - <a href="#ip22">2.2.2. Palabras Reservadas</a><br>

* <a href="#ip3">2.3. Entrada y Salida de Texto</a><br>
  - <a href="#ip31">2.3.1. Entrada</a><br>
  - <a href="#ip32">2.3.2. Salida</a><br>

<p><a name="ip1"></a></p>

## **2.1. Introducción**

En Python, los tipos de datos son conjuntos de valores que tienen características y propiedades bien definidas. Por otro lado, los operadores son símbolos que indican acciones que se deben llevar a cabo sobre los tipos de datos. Para crear un tipo de dato basta con declarar un valor numérico, alfabético, buleano o nulo y si se quiere guardar en memoria para un posterior procesamiento, deber ser asignado con `=`, a un contenedor o variable.

**Objetivos:**

* Estudiar los diferentes tipos de datos que se manejan en Python: `int`, `float`, `complex`, `str`, `bool` y `None`.
* Implementar la función nativa `type` para inspeccionar el tipo de dato.
* Comprender el concepto de variable y reconocer su sintáxis.
* Aprender sobre el funcionamiento de las funciones nativas de Python: `input` y `print`, para la entrada y salida de texto.
* Formatear y manipular la salida de datos.
* Abordar el concepto de operador y cuales son sus tipos.
* Aprender cómo indexar una cadena de caracteres.
* Implementar los métodos nativos de Python para manipular cade-
nas de caracteres: `isalnum`, `isalpha`, `isnumeric`, `upper`, `lower`, `title`,
`capitalize`, `split`, `replace`, entre otros.

**Palabras Claves:** tipo de dato, variable, salida, entrada, operador.

<p><a name="ip2"></a></p>

## **2.2. Tipos de Datos**

Los tipos de datos representan la clasificación de elementos según ciertas propiedades y características únicas. Estos son:

1. Entero (int)
2. Flotante (float)
3. Complejo (complex)
4. Cadena de Caracteres (str)
5. Buleano (bool)
6. Nulo (none)

Veamos algunos ejemplos:

In [1]:
#Entero
1

1

In [2]:
#Flotante
1.0

1.0

In [3]:
#Complejo
1+2j

(1+2j)

In [12]:
#Cadena de Caracteres - Ctrl+M+L
'Hola Mundo', "Hola Mundo"

('Hola Mundo', 'Hola Mundo')

In [11]:
'1500'+'1000'

'15001000'

In [5]:
#Buleano
True, False

(True, False)

In [None]:
true, false

In [6]:
#Nulo
None

Además, es posible obtener el tipo de dato de cualquier objeto utilizando la función nativa `type`:

In [None]:
type(1), type(1.0), type(1+2j), type('Hola Mundo'), type(True), type(False), type(None)

Y convertir un tipo de dato en otro:

In [None]:
#Entero a Flotante
float(1)

In [None]:
#Entero a Carácter
str(1)

In [None]:
#Flotante a Entero
int(1.0)

In [None]:
#Buleano a Entero
int(True), int(False)

### <font color='green'>**Ejercicio 1** </font>

¿Se puede convertir un número complejo a uno entero y viceversa?.

***Ayuda:*** Puede que le sean útiles las funciones nativas `int` y `complex`.

### <font color='green'>**Ejercicio 2** </font>

¿Se puede convertir un número entero en una cadena de caracteres y viceversa?. Explique.

***Ayuda:*** Puede que le sean útiles las funciones nativas `str` e `int`.

### <font color='green'>**Ejercicio 3** </font>

¿Se puede convertir un valor buleano en un entero y viceversa?

***Ayuda:*** Puede que le sean útiles las funciones nativas `bool` e `int`.

<p><a name="ip21"></a></p>

### **2.2.1. Variables**

Una variable es un contenedor o un espacio reservado en memoria para almacenar cierto valor, su sintáxis es: `nombre_variable = valor`. En Python, los nombres de las variables pueden contener caracteres alfanuméricos:  a-z, A-Z, 0-9 y algunos especiales como _. Estos no deben comenzar con números. Veamos:

In [14]:
x = 1 #x -> 1

In [17]:
x-2

-1

In [18]:
y = 1.0

In [19]:
z = 1+2j

In [22]:
palabra = 'Hola Mundo'
palabra+', Soy Juan' #Concatena (suma)

'Hola Mundo, Soy Juan'

In [28]:
condición = True

In [33]:
condición

True

In [34]:
nombres = ['Juan','Sebastian','Alejandra']

In [35]:
nombres

['Juan', 'Sebastian', 'Alejandra']

### <font color='green'>**Ejercicio 4** </font>

Inicie tres variables con nombres que contengan letras en mayúscula y miníscula, tildes, guiones al piso y números. Almacene valores en ellas.

In [43]:
nombre = 'Juan'
nombre_apellido = 'Juan Zapata'
NOMBRE = 'Camilo'
α_nombre = 'Andrés'

In [47]:
nombre, nombre_apellido, NOMBRE, α_nombre

('Juan', 'Juan Zapata', 'Camilo', 'Andrés')

<p><a name="ip22"></a></p>

### **2.2.2. Palabras Reservadas**

<p><a name="v1"></a></p>

Existe un número definido de palabras claves que no pueden ser usadas como nombres para variables. Dichas palabras están reservadas por Python para ejecutar acciones preestablecidas. Éstas son:

In [None]:
and, as, assert, break, class, continue, def, del, elif, else, except, finally, for, from
global, if, import, in is, lambda, not, or, pass, raise, return, try, while, with, yield

Observe que al estar reservadas por el sistema, tales palabras poseen un color diferente.

<p><a name="ip3"></a></p>

## **2.3. Entrada y Salida de Texto**

<p><a name="ip31"></a></p>

### **2.3.1. Entrada**

Para tomar datos por medio del teclado desde un usuario externo, se hace uso de la función nativa de *Python* `input`, que opcionalmente toma una cadena de caracteres como argumento. Veamos:

In [None]:
input('Ingrese un valor: ')


Independientemente de lo que se ingrese, la función `input`, siempre convierte la entrada en una cadena de caracteres. Se pueden utilizar las conversiones entre tipos para obtener el formato deseado:

In [None]:
a = input('Ingrese un valor: ')
a, type(a)

In [None]:
b = int(input('Ingrese un valor: '))
b, type(b)

In [None]:
c = float(input('Ingrese un valor: '))
c, type(c)

<p><a name="ip32"></a></p>

### **2.3.2. Salida**

Para mostrar valores en pantalla, se puede usar la función nativa de Python `print`, que toma como argumento los valores se quieren imprimir, separados por coma. Veamos:

In [49]:
1

1

In [50]:
print(1, 1.0, 1+2j, 'Hola Mundo', True, False, None)

1 1.0 (1+2j) Hola Mundo True False None


In [56]:
x = 1
y = 1.0
z = 1+2j
palabra = 'Hola Mundo'
condicion = True

print(x, y, z, palabra, condicion)
print(x, end='\n') #\n: Salto
print(palabra)

1 1.0 (1+2j) Hola Mundo True
1
Hola Mundo


Para formatear y manipular la salida de texto se debe hacer uso de la interpolación: `f'texto {variable:tamaño.precisióntipo}'`. Veamos:


In [73]:
round(1.99), int(1.99)

(2, 1)

In [69]:
x = 1.56

print(x)
print('Entero:',x)
print(f'  Entero: {int(x):8d} - d: Sistema Decimal') #8 espacios y que sea un entero
print(f'Flotante: {x:8f} - f: Decimal') #8 espacios y que sea un decimal
print(f'Flotante: {x:8.1f}')
print(f'Flotante: {x:8.2e} - e: Notación Científica')

1.56
Entero: 1.56
  Entero:        1 - d: Sistema Decimal
Flotante: 1.560000 - f: Decimal
Flotante:      1.6
Flotante: 1.56e+00 - e: Notación Científica


In [60]:
len('       1')

8

In [78]:
y = 'Hola Mundo'

print(f'Cadena de Caracteres: {y:s} - s: String')

Cadena de Caracteres: Hola Mundo - s: String


In [87]:
RM_R = 1.25
print('RM: %14.8e m'%RM_R) #VIEJO
print(f'RM: {RM_R:14.8e} m') #NUEVO
print(RM_R)
print(float(RM_R))
RM_R

RM: 1.25000000e+00 m
RM: 1.25000000e+00 m
1.25
1.25


1.25

In [89]:
#Resaltar la variable + Ctrl+D
numero = 5
print('RM: %14.8e m'%numero) #VIEJO
print(f'RM: {numero:14.8e} m') #NUEVO
print(numero)
print(float(numero))
numero

RM: 5.00000000e+00 m
RM: 5.00000000e+00 m
5
5.0


5

In [104]:
#Sea numérico con 3 decimales
round(float(numero), 3), round(3.14159, 6)
#Es uso sugerido únicamente cuando el número es decimal y tiene más decimales de lo que se necesiten

(5.0, 3.14159)

In [108]:
#Sea adorno (formatear, cadena de caracteres, cambiar el formato de presentación) con 3 decimales
print(f'{numero:.3f}')

{numero:.3f}


In [92]:
#float: Convertir en decimal
x = 10
float(x), str(x), complex(x)

(10.0, '10', (10+0j))

Para más detalle visite [Input and Output](https://docs.python.org/3/tutorial/inputoutput.html), [Formarting Text](https://docs.python.org/3/library/string.html#format-specification-mini-language) y [Escape Sequence](https://docs.python.org/3/reference/lexical_analysis.html#string-and-bytes-literals).

### <font color='green'>**Ejercicio 5** </font>

El número $\pi=3.141592$. Imprima en pantalla su valor con:

1. Cero decimales.
2. Dos decimales.
3. Cuatro decimales.

***Ayuda 1:*** Puede que le sean útil la función nativa `print`.   
***Ayuda 2:*** Use la sintáxis `f'texto {variable:tamaño.precisióntipo}'` para formatear la salida.   


### <font color='green'>**Ejercicio 6** </font>

Pida al usuario por teclado un número de tres cifras. Imprima en pantalla su valor en notación científica con un decimal.

***Ayuda 1:*** Las funciones nativas `input` y `print` pueden ser útiles.   
***Ayuda 2:*** Consulte cómo formatear en notación científica.

### <font color='green'>**Ejercicio 7** </font>

¿Python hace una aproximación (de $1.5$ a $2.0$) o un truncamiento (de $1.5$ a $1.0$) a los valores numéricos?

### <font color='green'>**Ejercicio 8** </font>

Pida al usuario por teclado y por separado, su nombre y su edad. Imprima en pantalla ambos valores, también por separado.