<img src="logo.png">

# Fundamentos de Python

Python fue creado en 1991 por Guido Van Rossum. Se trata de un *lenguaje interpretado orientado a objetos* (un lenguaje compilado como Java, es aquel que antes de ser interpretado tiene que ser "traducido" a un código que entienda la máquina; un lenguaje interpretado es aquel que, mientras escribes, la máquina va entendiendo). Python está enfocado en ser lenguaje con alta legibilidad (un lenguaje de alto nivel).

**¿Por qué usar Python en Ciencia de datos?**

Python tiene muchísimas bibliotecas diseñadas específicamente para trabajar la Ciencia de datos. En el siguiente diagrama podemos ver algunas:

<img src="diagrama_python.png" width="400">

**¿Dónde encontrar ayuda?**

Es importante saber dónde podemos hacer preguntas en general sobre temas de Ciencia de datos con los diferentes lenguajes que utilicemos. Para esto se cuenta con [Stack Overflow](https://stackoverflow.com/) (también existe versión en [español](https://es.stackoverflow.com/)) o bien [Reddit](https://www.reddit.com/r/learnpython/)

## Spyder

Para programar en Python hay muchos IDE's (entorno de desarrollo integrado; su trabajo es parecido al de un editor de texto). Existen diferentes que hacen que las funcionalidades sean mas rápidas. En particular, en Anaconda existe Spyder. 


Lo primero que recordaremos será cómo hacer comentarios en Python e imprimir en pantalla.

In [None]:
# Esto es un comentario simple

"""Esto es un bloque
de comentarios"""

print("Hola mundo")


El código se puede separar en varias líneas usando \

In [None]:
2+\
2

Pero el siguiente código nos marcará un error

In [None]:
2+
2

**Las celdas en Spyder**

En general, dentro de Spyder uno puede trabajar con un script o directamente sobre el intérprete. El inconveniente general de los scripts, a diferencia de RStudio, es que siempre se ejecutan en su totalidad y no solo un bloque de código. 

Para librar este inconveniente, se utiliza lo que se conoce como *celdas de Spyder*. Una celda de Spyder no es otra cosa mas que un bloque de código que se puede ejecutar únicamente sin tener que ejecutar todo el script.

Para definir una celda usamos `#%%`

**Ejemplo.**

Tomemos el siguiente código:

`#%%`

``
print("Hola mundo")``

`#%%`

``suma = 2+4
print(suma)
``

Lo anterior también puede hacerse al estilo de RStudio con la tecla **F9** y sin necesidad de utilizar celdas.



## Variables.

Las variables son objetos donde podemos guardar información. Las variables *primitivas* básicas de Python son los strings, las numéricas y las lógicas. Para saber de qué tipo es una variable usamos ``type``.



### Strings

Son variables que se declaran utilizando comillas.

``str1 = "hola"
str2 = "mundo"
print(str1)``

Además, para concatenar strings podemos usar el operador ``+``

``print(str1 + " " + str2)``

Y podemos usar el operador `*` para realizar repeticiones de strings

``print(3 * str2)``

Además, existen *métodos* que ya vienen incluidos en las variables string. Uno de ellos es *format*, que nos permite insertar strings dentro de strings:

``curso1 = "CDD_Py"
instructor1 = "Héctor"
presentacion = "Hola; bienvenido al Diplomado {} de SciData.\nTu instructor es {}".format(curso,instructor)
print(presentacion+"\n")``

E incluso mas elegante para automatizar:

``curso2 = "CDD_R"
instructor2 = "Manuel"
presentacion_aut = "Hola; bienvenido al Diplomado {} de SciData.\nTu instructor es {}"
print(presentacion_aut.format(curso2,instructor2))``

Incluso, a partir de **Python 3.6** podemos "prescindir" de format y aplicar directamente mediante un *f-string*. **Nótese la letra f antes del string:**

``print(f"Hola. Soy {instructor1} {instructor2} de SciData. Bienvenido a {curso1}.")``



Otros métodos importantes de los strings de Python son *upper*, *lower* y *capitalize*.

``
nombre_curso = "ciencia de datos con Python"
print(nombre_curso.upper())
print(nombre_curso.lower())
print(nombre_curso.capitalize())
``


Incluso, también son comunes los métodos para eliminar, reemplazar o particionar caracteres.

``Nombre_puntos = "..Manuel..."
print(Nombre_puntos.strip("."))
print(Nombre_puntos.replace("nuel","riano"))
print(Nombre_puntos.strip(".").replace("nuel","riano"))``

``
Nombre_Completo = "Héctor_Manuel_Garduño"
print(Nombre_Completo.split("_"))
``

**Observación.** El método *split* nos devuelve una lista donde cada elemento corresponde al string separado. 


## Númericos

Hay dos tipos básicos de datos primitivos de tipo numérico: enteros y flotantes. Los enteros, como su nombre lo dice, son aquellos que no tienen punto decimal, mientras que los flotantes **siempre** lo tienen. 

Por ejemplo, ``2020`` es un entero, en tanto ``2020.`` es un flotante por el simple hecho de tener un decimal.

In [None]:
print(f"El número 2020 es de tipo {type(2020)} en tanto que 2020. es de tipo {type(2020.)}")

Podemos convertir numéricos en strings fácilmente utilizando la función `str(variable_numérica)`





In [None]:
num1 = 2020
print("21"+str(num1))

Incluso también podemos usar numéricos en las f-strings:

In [None]:
nombre = "Héctor"
curso = "CDD_Py"
estimacion = 35

print(f"Hola. Me llamo {nombre} e impartiré el Diplomado {curso} que tiene duración de {estimacion} horas.")


Además, es posible, siempre que tenga sentido, convertir strings en numéricos:

In [None]:
num_str = "2020.4"
print(float(num_str)/2)

Y de hecho podemos convertir flotantes en enteros quitando los decimales.

In [None]:
print(int(float(num_str)/2))

Por otra parte, las operaciones básicas entre numéricos se realiza de manera natural con los operadores usuales.

In [None]:
print("La suma, la resta, el producto y la división de 2 y 3 es ",2 + 3,",", 2 - 3,",", 2 * 3,"y", 2 / 3, ",respectivamente")

Operaciones mas complicadas como la división, el resto y las potencias obedecen a las siguientes sintaxis.

In [None]:
a = 5; b = 3
print(a // b)
print(a % b)
print(a ** b)

## Booleanos (lógicos)

Las variables booleanas son aquellas que únicamente pueden ser verdaderas o falsas: `True` y `False`.

In [None]:
type(True)

La manera en la que Python decide si una variable booleana es verdadera o falsa es la siguiente:

* Si la expresión lógica es cierta, el resultado es ```True```.
* Si la expresión lógica NO es cierta, el resultado es ```False```.
* *False* equivale numéricamente a ```0```. 
* Cualquier otro valor no vacío equivale a ```True``` y su valor por defecto es ```1```.

In [None]:
a=1
b=2
c="Hola"

In [None]:
a>b

In [None]:
d=bool(c); d

In [None]:
int(d)

Existe un tipo primitivo especial llamado `None`. Esta juega el papel variable nula y es el único objeto de este tipo. Representa un valor nulo.

Una expresión que dé por resultado None no es desplegado por el intérprete.

In [None]:
type(None)

La siguiente celda incluye al objeto None, pero al ejecutarla, no se despliega nada.

In [None]:
None

Podemos hacer comparaciones entre variables; el resultado siempre es un booleano.

``a=2020
b=4040
print(f"¿{a} > {b}?\n",a > b)
print(f"¿{a} < {b}?\n",a < b)
print(f"¿{a} > {b}?\n",a == b)
print(f"¿{a} es diferente de {b}?\n",a != b)
print(f"La negación de '{a}!=23' es", not a != 23)``



In [None]:
a=2020
b=4040
print(f"¿{a} > {b}?\n",a > b)
print(f"¿{a} < {b}?\n",a < b)
print(f"¿{a} > {b}?\n",a == b)
print(f"¿{a} es diferente de {b}?\n",a != b)
print(f"La negación de '{a}!=23' es", not a != 23)

Incluso también tenemos podemos evaluar condiciones compuestas con los operadores ``and`` y `or`

`print(f"¿{a}!=23 y {a}>{b}?\n", a!=23 and a>b)
print(f"¿{a}!=23 or {a}>{b}?\n", a!=23 or a>b)`

In [None]:
print(f"¿{a} != 23 y {a} > {b}?\n", a!=23 and a>b)
print(f"¿{a} != 23 o {a} > {b}?\n", a!=23 or a>b)

Para comparar si algo es verdadero o falso no usamos `==` sino `is`

``
Ana = True
print(f"¿El valor de Ana es una verdad?\n", Ana is True)``

In [None]:
Ana = True
print(not(Ana is False))