# Python en el ámbito científico

A lo largo de los años Python a acrecentado sus capacidades en varios ámbitos, 
uno de ellos es el científico.
El proyecto [SciPy](https://www.scipy.org/) originalmente era una colección de
paquetes para matemáticas, ciencia e ingeniería que consistía en:

- [NumPy](http://www.numpy.org/): Un paquete para la manipulación de arreglos y
  matrices numéricas.
- [Matplotlib](https://matplotlib.org/): Una biblioteca para la visualización de
  datos en 2D.
- [SciPy](https://www.scipy.org/): Un paquete de análisis numérico con rutinas
  para optimización, álgebra lineal, integración, interpolación, funciones
  especiales, y más.
- [SymPy](https://www.sympy.org/): Una biblioteca de álgebra simbólica para la
  resolución exacta de ecuaciones en cálculo diferencial e integral, álgebra
  lineal, y más.
- [Pandas](https://pandas.pydata.org/): Una biblioteca para el análisis de datos
  tabulares (tablas).
- [IPython](https://ipython.org/): Un entorno de trabajo interactivo para
  computación científica.
  Actualmente [Jupyter](https://jupyter.org/) es el proyecto que ha tomado el
  relevo de IPython.

Para este curso nos enfocaremos en los paquetes de NumPy y Matplotlib, luego
en otras secciones veremos bibliotecas centradas en el procesamiento digital
de imágenes y en el aprendizaje automático, concretaente en los paquetes de
[scikit image](https://scikit-image.org/), [OpenCV](https://opencv.org/),
[scikit-learn](https://scikit-learn.org/stable/), y [Keras](https://keras.io/).

Si eres un purista de Python, es posible que te preguntes por qué no usamos
las bibliotecas estándar de Python para el procesamiento de datos, como
`math`, `random`, `itertools`, `functools`, y demás.
La respuesta es que estas bibliotecas están diseñadas para ser generales y
flexibles, y no están optimizadas para el procesamiento de datos numéricos.
No te sientas agobiado por la cantidad de bibliotecas que necesitas aprender,
ya que estas bibliotecas están diseñadas para ser fáciles de usar y tienen el
respaldo de una gran comunidad de usuarios y desarrolladores.

## 1. Agarrándole el hilo a Jupyter
<!-- Me rehúso a poner "Introducción a Jupyter" -->

Cuando uno trata de hacer algún tipo de análisis de datos, es común comenzar a
experimentar con instrucciones pequeñas y ver los resultados de inmediato antes
de pasar a un entorno de desarrollo más robusto.
Más aún, es común querer compartir estos resultados con otras personas.
Para estos casos, Jupyter es una herramienta muy útil.

- Jupyter combina celdas de texto (en lenguaje 
  [Markdown](https://youtu.be/X5mkZXmaKp4)) con celdas de código en algún
  lenguaje de programación como **Ju**lia, **Pyt**hon, o **R**.
- Las celdas de código se pueden ejecutar de manera independiente y puedes
  ver los resultados de inmediato.
- Las celdas de texto se pueden usar para explicar el código, los resultados, o
  cualquier otro aspecto del análisis.
- Las celdas de código admiten *comandos mágicos* que permiten realizar tareas
  específicas, como medir el tiempo de ejecución de una celda o solicitar ayuda
  sobre un objeto.

Nosotros usaremos Jupyter para presentar ejemplos de Python en el ámbito
del procesamiento digital de imágenes, que es el tema de este curso.

### 1.1 Obteniendo ayuda

En Python puedes solicitar ayuda sobre un objeto usando la función `help`.

In [1]:
help(max)

Help on built-in function max in module builtins:

max(...)
    max(iterable, *[, default=obj, key=func]) -> value
    max(arg1, arg2, *args, *[, key=func]) -> value
    
    With a single iterable argument, return its biggest item. The
    default keyword-only argument specifies an object to return if
    the provided iterable is empty.
    With two or more arguments, return the largest argument.



In [2]:
max([1,4,782,23,15])

782

In [3]:
max(1, 4)

4

Jupyter además utiliza el signo de interrogación `?` para solicitar ayuda sobre
un objeto.
Dado que esto no es sintaxis estándar de Python, es posible que observes errores
de sintaxis en un entorno de desarrollo estándar como Visual Studio Code.

In [4]:
?max

[0;31mDocstring:[0m
max(iterable, *[, default=obj, key=func]) -> value
max(arg1, arg2, *args, *[, key=func]) -> value

With a single iterable argument, return its biggest item. The
default keyword-only argument specifies an object to return if
the provided iterable is empty.
With two or more arguments, return the largest argument.
[0;31mType:[0m      builtin_function_or_method

Esta notación también funciona con métodos

In [5]:
canasta = ["huevos", "leche", "pan", "jamón", "manzanas"]
canasta.count?

[0;31mSignature:[0m [0mcanasta[0m[0;34m.[0m[0mcount[0m[0;34m([0m[0mvalue[0m[0;34m,[0m [0;34m/[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m Return number of occurrences of value.
[0;31mType:[0m      builtin_function_or_method

... e incluso con los objetos mismos

In [6]:
canasta?

[0;31mType:[0m        list
[0;31mString form:[0m ['huevos', 'leche', 'pan', 'jamón', 'manzanas']
[0;31mLength:[0m      5
[0;31mDocstring:[0m  
Built-in mutable sequence.

If no argument is given, the constructor creates a new empty list.
The argument must be an iterable if specified.

Hay ocasiones en las que la documentación de una función es suficiente ambigua
como para que merite una consulta más detallada.
En estos casos, el doble signo de interrogación `??` te mostrará el código
fuente del objeto en cuestión.

In [7]:
# Creamos una función en Python con una documentación ambigua
def lel(datos):
    """Aplica la transformación a los datos"""  # Casos de la vida real :(
    datos = datos**2 + 1
    return datos

In [8]:
?lel

[0;31mSignature:[0m [0mlel[0m[0;34m([0m[0mdatos[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mDocstring:[0m Aplica la transformación a los datos
[0;31mFile:[0m      /tmp/ipykernel_28757/734126753.py
[0;31mType:[0m      function

In [9]:
??lel

[0;31mSignature:[0m [0mlel[0m[0;34m([0m[0mdatos[0m[0;34m)[0m[0;34m[0m[0;34m[0m[0m
[0;31mSource:[0m   
[0;32mdef[0m [0mlel[0m[0;34m([0m[0mdatos[0m[0;34m)[0m[0;34m:[0m[0;34m[0m
[0;34m[0m    [0;34m"""Aplica la transformación a los datos"""[0m  [0;31m# Casos de la vida real :([0m[0;34m[0m
[0;34m[0m    [0mdatos[0m [0;34m=[0m [0mdatos[0m[0;34m**[0m[0;36m2[0m [0;34m+[0m [0;36m1[0m[0;34m[0m
[0;34m[0m    [0;32mreturn[0m [0mdatos[0m[0;34m[0m[0;34m[0m[0m
[0;31mFile:[0m      /tmp/ipykernel_28757/734126753.py
[0;31mType:[0m      function

### 1.2 Autocompletado

No importa si usas Jupyter o un entorno de desarrollo estándar, el
autocompletado es una herramienta muy útil para explorar las capacidades de
un objeto.

- En Jupyter, puedes presionar la tecla `TAB`
- En Visual Studio Code, puedes presionar `CTRL` + `ESPACIO`

Prueba esto: escribe `canasta.` en una celda de código y presiona `TAB` (si usas
Jupyter) o `CTRL` + `ESPACIO` (si usas Visual Studio Code) para ver una lista de
los métodos y atributos del objeto `canasta`.

Si más o menos recuerdas el nombre de un método o atributo, pero no estás seguro
de la ortografía, puedes solicitar a Juptyer que busque todas las coincidencias
posibles mediante el comodín `*`.

In [10]:
# Listar los métodos de la canasta que inician con "re"
canasta.re*?

canasta.remove
canasta.reverse

In [11]:
# Listar los métodos de la canasta que terminan con "nd"
canasta.*nd?

canasta.append
canasta.extend

### 1.2 Los métodos mágicos

Jupyter admite *comandos mágicos* que permiten realizar tareas específicas como
medir el tiempo de ejecución de una celda o ejecutar un comando externo.

In [12]:
# Cómo crear una lista de números al cuadrado más uno
def lol(datos):
    resultado = []
    for i in datos:
        resultado.append(i**2 + 1)
    return resultado

In [13]:
%%timeit
resultado = lol([1,2,3,4,5])

684 ns ± 138 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


In [14]:
datos = [1,2,3,4,5]

In [15]:
%%timeit
resultado = [i**2 + 1 for i in datos]

563 ns ± 45.2 ns per loop (mean ± std. dev. of 7 runs, 1,000,000 loops each)


In [16]:
%lsmagic

Available line magics:
%alias  %alias_magic  %autoawait  %autocall  %automagic  %autosave  %bookmark  %cat  %cd  %clear  %code_wrap  %colors  %conda  %config  %connect_info  %cp  %debug  %dhist  %dirs  %doctest_mode  %ed  %edit  %env  %gui  %hist  %history  %killbgscripts  %ldir  %less  %lf  %lk  %ll  %load  %load_ext  %loadpy  %logoff  %logon  %logstart  %logstate  %logstop  %ls  %lsmagic  %lx  %macro  %magic  %mamba  %man  %matplotlib  %micromamba  %mkdir  %more  %mv  %notebook  %page  %pastebin  %pdb  %pdef  %pdoc  %pfile  %pinfo  %pinfo2  %pip  %popd  %pprint  %precision  %prun  %psearch  %psource  %pushd  %pwd  %pycat  %pylab  %qtconsole  %quickref  %recall  %rehashx  %reload_ext  %rep  %rerun  %reset  %reset_selective  %rm  %rmdir  %run  %save  %sc  %set_env  %store  %sx  %system  %tb  %time  %timeit  %unalias  %unload_ext  %who  %who_ls  %whos  %xdel  %xmode

Available cell magics:
%%!  %%HTML  %%SVG  %%bash  %%capture  %%code_wrap  %%debug  %%file  %%html  %%javascript  %%js  %

In [17]:
%load_ext line_profiler

In [18]:
def fib(n):
    if n <= 1:
        return n
    return fib(n - 1) + fib(n - 2)

%lprun -f fib fib(32)

Timer unit: 1e-09 s

Total time: 3.81284 s
File: /tmp/ipykernel_28757/384297603.py
Function: fib at line 1

Line #      Hits         Time  Per Hit   % Time  Line Contents
     1                                           def fib(n):
     2   7049155 1733859822.0    246.0     45.5      if n <= 1:
     3   3524578  689915531.0    195.7     18.1          return n
     4   3524577 1389069562.0    394.1     36.4      return fib(n - 1) + fib(n - 2)

### 1.3 Consultar resultados anteriores

In [19]:
2761834761897461982376**128

2973750451001437028415783677997092938261392088530064309323439701340654363511525586783556557404021873858657800931462383500070893201373284078371093032920902669225561423695021035480457802892660109530219475094939843838037897176442936892684437518478579721247635681959178127682939648026969921461417912505156451032384694151671166649301619318888218920163572175095043538412989971708081765807067969289270090238349751818383389005116623484847769707291267819640032423068323617959177908196568261396753393245684798676712162031954329693109419444891637542024974025404719960319300774083503486015989061038548053478885349513711449443919050689732814887838631092239271728497850369391653081604333101082235420061492245439776919228290653349224641036819504000869192397109122422470235621953874138047699999634293714687276118777563356297731570001831770001174933759592334807777524431488997887103301496304985550485671945249206923151851144943555816408245356595644989464296008819992250050847994888452191885123426395698572826458077730

In [20]:
_//2

1486875225500718514207891838998546469130696044265032154661719850670327181755762793391778278702010936929328900465731191750035446600686642039185546516460451334612780711847510517740228901446330054765109737547469921919018948588221468446342218759239289860623817840979589063841469824013484960730708956252578225516192347075835583324650809659444109460081786087547521769206494985854040882903533984644635045119174875909191694502558311742423884853645633909820016211534161808979588954098284130698376696622842399338356081015977164846554709722445818771012487012702359980159650387041751743007994530519274026739442674756855724721959525344866407443919315546119635864248925184695826540802166550541117710030746122719888459614145326674612320518409752000434596198554561211235117810976937069023849999817146857343638059388781678148865785000915885000587466879796167403888762215744498943551650748152492775242835972624603461575925572471777908204122678297822494732148004409996125025423997444226095942561713197849286413229038865

In [22]:
In[19]

'2761834761897461982376**128'

In [23]:
Out[19]

2973750451001437028415783677997092938261392088530064309323439701340654363511525586783556557404021873858657800931462383500070893201373284078371093032920902669225561423695021035480457802892660109530219475094939843838037897176442936892684437518478579721247635681959178127682939648026969921461417912505156451032384694151671166649301619318888218920163572175095043538412989971708081765807067969289270090238349751818383389005116623484847769707291267819640032423068323617959177908196568261396753393245684798676712162031954329693109419444891637542024974025404719960319300774083503486015989061038548053478885349513711449443919050689732814887838631092239271728497850369391653081604333101082235420061492245439776919228290653349224641036819504000869192397109122422470235621953874138047699999634293714687276118777563356297731570001831770001174933759592334807777524431488997887103301496304985550485671945249206923151851144943555816408245356595644989464296008819992250050847994888452191885123426395698572826458077730

## 2. Manipulación de datos con NumPy

### 2.1 Creación de arreglos

### 2.2 Acceso a elementos


### 2.3 Operaciones con arreglos

## 3. Visualización de datos con Matplotlib

### 3.1 Gráficos de línea

### 3.2 Gráficos de dispersión

### 3.3 Histogramas