# Introducción a IPython y Jupyter

Al escribir código Python para ciencia de datos, generalmente opto entre tres modos de trabajo: uso el shell IPython para probar secuencias cortas de comandos, el Jupyter Notebook para análisis interactivos más largos y para compartir contenido con otros, y entornos de desarrollo interactivos (IDE). ) como Emacs o VSCode para crear paquetes Python reutilizables.
Este capítulo se centra en los dos primeros modos: el shell IPython y el Jupyter Notebook.
El uso de un IDE para el desarrollo de software es una tercera herramienta importante en el repertorio del científico de datos, pero no la abordaremos directamente aquí.

## Lanzamiento del shell IPython

El texto de esta parte, como la mayor parte de este libro, no está diseñado para ser absorbido pasivamente.
Le recomiendo que a medida que lo lea, lo siga y experimente con las herramientas y la sintaxis que cubrimos: la memoria muscular que desarrolle al hacer esto será mucho más útil que el simple hecho de leer sobre ello.
Comience iniciando el intérprete de IPython escribiendo **`ipython`** en la línea de comando; alternativamente, si ha instalado una distribución como Anaconda o EPD, puede haber un iniciador específico para su sistema (analizaremos esto con más detalle en [Ayuda y documentación en IPython](01.01-Help-And-Documentation.ipynb) ).

Una vez que haga esto, debería ver un mensaje como el siguiente:

```ipython
Python 3.9.2 (v3.9.2:1a79785e3e, 19 de febrero de 2021, 09:06:10) 
Escriba 'copyright', 'créditos' o 'licencia' para obtener más información
IPython 7.21.0: un Python interactivo mejorado. Tipo '?' por ayuda.

En [1]:
```
Con eso, estás listo para seguir adelante.

## Lanzamiento del cuaderno Jupyter

Jupyter Notebook es una interfaz gráfica basada en navegador para el shell IPython y se basa en un rico conjunto de capacidades de visualización dinámica.
Además de ejecutar sentencias Python/IPython, los cuadernos permiten al usuario incluir texto formateado, visualizaciones estáticas y dinámicas, ecuaciones matemáticas, widgets JavaScript y mucho más.
Además, estos documentos se pueden guardar de manera que otras personas puedan abrirlos y ejecutar el código en sus propios sistemas.

Aunque verá y editará los cuadernos de Jupyter a través de la ventana de su navegador web, deben conectarse a un proceso de Python en ejecución para poder ejecutar el código.
Puede iniciar este proceso (conocido como "núcleo") ejecutando el siguiente comando en el shell de su sistema:

```
$ laboratorio jupyter
```

Este comando iniciará un servidor web local que será visible para su navegador.
Inmediatamente escupe un registro que muestra lo que está haciendo; ese registro se verá así:

```
$ laboratorio jupyter
[ServerApp] Sirviendo cuadernos desde el directorio local: /Users/jakevdp/PythonDataScienceHandbook
[ServerApp] Jupyter Server 1.4.1 se ejecuta en:
[Aplicación de servidor] http://localhost:8888/lab?token=dd852649
[ServerApp] Utilice Control-C para detener este servidor y cerrar todos los kernels (dos veces para omitir la confirmación).
```

Al emitir el comando, su navegador predeterminado debería abrirse automáticamente y navegar a la URL local indicada;
la dirección exacta dependerá de su sistema.
Si el navegador no se abre automáticamente, puede abrir una ventana y abrir manualmente esta dirección (*http://localhost:8888/lab/* en este ejemplo).

## Ayuda y documentación en IPython

Si no lee otra sección de este capítulo, lea esta: Considero que las herramientas analizadas aquí son las contribuciones más transformadoras de IPython a mi flujo de trabajo diario.

Cuando a una persona con mentalidad tecnológica se le pide que ayude a un amigo, familiar o colega con un problema informático, la mayoría de las veces se trata menos de saber la respuesta que de saber cómo encontrar rápidamente una respuesta desconocida.
En la ciencia de datos ocurre lo mismo: los recursos web con capacidad de búsqueda, como la documentación en línea, los hilos de las listas de correo y las respuestas de Stack Overflow, contienen una gran cantidad de información, incluso (¿especialmente?) sobre temas que ha buscado antes.
Ser un practicante eficaz de la ciencia de datos se trata menos de memorizar la herramienta o comando que debe utilizar para cada situación posible, y más de aprender a encontrar eficazmente la información que no conoce, ya sea a través de un motor de búsqueda web u otro medio.

Una de las funciones más útiles de IPython/Jupyter es acortar la brecha entre el usuario y el tipo de documentación y búsqueda que le ayudará a realizar su trabajo de forma eficaz.
Si bien las búsquedas web siguen desempeñando un papel a la hora de responder preguntas complicadas, se puede encontrar una cantidad asombrosa de información sólo a través de IPython.
Algunos ejemplos de las preguntas que IPython puede ayudar a responder con unas pocas teclas incluyen:

- ¿Cómo llamo a esta función? ¿Qué argumentos y opciones tiene?
- ¿Cómo es el código fuente de este objeto Python?
- ¿Qué hay en este paquete que importé? 
- ¿Qué atributos o métodos tiene este objeto?

Aquí analizaremos las herramientas proporcionadas en el shell de IPython y Jupyter Notebook para acceder rápidamente a esta información, es decir, el carácter `?` para explorar la documentación, los caracteres `??` para explorar el código fuente y la tecla Tab para el autocompletado.

### Accediendo a la documentación con ?

El lenguaje Python y su ecosistema de ciencia de datos se crean pensando en el usuario, y una gran parte de eso es el acceso a la documentación.
Cada objeto de Python contiene una referencia a una cadena, conocida como *docstring*, que en la mayoría de los casos contendrá un resumen conciso del objeto y cómo usarlo.
Python tiene una función de "ayuda" incorporada que puede acceder a esta información e imprimir los resultados.
Por ejemplo, para ver la documentación de la función incorporada `len`, puede hacer lo siguiente:

```ipython
En [1]: ayuda(len)
Ayuda sobre la función incorporada len en los módulos incorporados:

len(obj, /)
    Devuelve la cantidad de artículos en un contenedor.
```

Dependiendo de su intérprete, esta información puede mostrarse como texto en línea o en una ventana emergente separada.

Debido a que encontrar ayuda sobre un objeto es tan común y útil, IPython y Jupyter introducen el carácter `?` como una abreviatura para acceder a esta documentación y otra información relevante:

```ipython
En [2]: len?
Firma: len(obj, /)
Docstring: devuelve la cantidad de elementos en un contenedor.
Tipo: función_o_método_integrada
```

Esta notación funciona para casi cualquier cosa, incluidos los métodos de objetos:

```ipython
En [3]: L = [1, 2, 3]
En [4]: ​​L.insertar?
Firma: L.insert(índice, objeto, /)
Cadena de documentación: Insertar objeto antes del índice.
Tipo: función_o_método_integrada
```

o incluso los propios objetos, con la documentación de su tipo:

```ipython
En [5]: ¿L?
Tipo: lista
Forma de cadena: [1, 2, 3]
Longitud: 3
Cadena de documentación:  
Secuencia mutable incorporada.

Si no se proporciona ningún argumento, el constructor crea una nueva lista vacía.
El argumento debe ser iterable si se especifica.
```

Es importante destacar que esto funcionará incluso para funciones u otros objetos que crees tú mismo.
Aquí definiremos una pequeña función con una cadena de documentación:

```ipython
En [6]: def cuadrado(a):
  ....: """Devuelve el cuadrado de a."""
  ....: devuelve un ** 2
  ....:
```

Tenga en cuenta que para crear una cadena de documentación para nuestra función, simplemente colocamos una cadena literal en la primera línea.
Debido a que las cadenas de documentos suelen tener varias líneas, por convención utilizamos la notación de comillas triples de Python para cadenas de varias líneas.

Ahora usaremos `?` para encontrar esta cadena de documentación:

```ipython
En [7]: ¿cuadrado?
Firma: cuadrado(a)
Docstring: Devuelve el cuadrado de a.
Archivo: <ipython-entrada-6>
Tipo: función
```

¡Este acceso rápido a la documentación a través de cadenas de documentos es una de las razones por las que debes acostumbrarte a agregar siempre dicha documentación en línea al código que escribes!

### Accediendo al código fuente con ??

Debido a que el lenguaje Python es tan fácil de leer, generalmente se puede obtener otro nivel de conocimiento leyendo el código fuente del objeto que le interesa.
IPython y Jupyter proporcionan un acceso directo al código fuente con el doble signo de interrogación (`??`):

```ipython
En [8]: cuadrado??
Firma: cuadrado(a)
Fuente:   
def cuadrado(a):
    """Devuelve el cuadrado de a."""
    devolver un ** 2
Archivo: <ipython-entrada-6>
Tipo: función
```

Para funciones simples como esta, el doble signo de interrogación puede brindar una visión rápida de los detalles ocultos.

Si juegas mucho con esto, notarás que a veces el sufijo `??` no muestra ningún código fuente: esto generalmente se debe a que el objeto en cuestión no está implementado en Python, sino en C o algún otro lenguaje de extensión compilado. .
Si este es el caso, el sufijo `??` da el mismo resultado que el sufijo `?`.
Encontrarás esto particularmente con muchos de los objetos y tipos integrados de Python, incluida la función `len` de antes:

```ipython
En [9]: len??
Firma: len(obj, /)
Docstring: devuelve la cantidad de elementos en un contenedor.
Tipo: función_o_método_integrada
```

Usar `?` y/o `??` es una forma potente y rápida de encontrar información sobre lo que hace cualquier función o módulo de Python.

### Explorando módulos con finalización de tabulación

Otra interfaz útil es el uso de la tecla Tab para autocompletar y explorar el contenido de objetos, módulos y espacios de nombres.
En los ejemplos siguientes, usaré `<TAB>` para indicar cuándo se debe presionar la tecla Tab.

#### Completar con tabulación el contenido del objeto

Cada objeto de Python tiene varios atributos y métodos asociados.
Al igual que la función `help` mencionada anteriormente, Python tiene una función `dir` incorporada que devuelve una lista de estos, pero la interfaz de finalización de pestañas es mucho más fácil de usar en la práctica.
Para ver una lista de todos los atributos disponibles de un objeto, puede escribir el nombre del objeto seguido de un carácter de punto ("`.`") y la tecla Tabulador:

```ipython
En [10]: L.<TAB>
            append() contar insertar revertir 
            borrar extender orden pop    
            copiar índice eliminar           
```

Para reducir la lista, puede escribir el primer carácter o varios caracteres del nombre y la tecla Tabulador encontrará los atributos y métodos coincidentes:

```ipython
En [10]: L.c<TAB>
             borrar() contar()
             Copiar()         

En [10]: L.co<TAB>
              copiar() contar()
```

Si solo hay una opción, al presionar la tecla Tab se completará la línea.
Por ejemplo, lo siguiente se sustituirá instantáneamente por "L.count":

```ipython
En [10]: L.cou<TAB>

```

Aunque Python no impone una distinción estricta entre atributos públicos/externos y atributos privados/internos, por convención se utiliza un guión bajo precedente para indicar estos últimos.
Para mayor claridad, estos métodos privados y métodos especiales se omiten de la lista de forma predeterminada, pero es posible enumerarlos escribiendo explícitamente el guión bajo:

```ipython
En [10]: L._<TAB>
           __add__ __delattr__ __eq__      
           __clase__ __delitem__ __formato__()
           __class_getitem__() __dir__() __ge__ >
           __contiene__ __doc__ __getattribute__     
```

Por brevedad, solo he mostrado las primeras columnas del resultado.
La mayoría de estos son métodos especiales de doble subrayado de Python (a menudo denominados métodos "dunder").

#### Completar tabulación al importar

La función de tabulación también es útil al importar objetos desde paquetes.
Aquí lo usaremos para encontrar todas las importaciones posibles en el paquete `itertools` que comienzan con `co`:

```ipython
En [10]: desde itertools importa co<TAB>
         combinaciones() comprimir()
         combinaciones_con_reemplazo() recuento()
```

De manera similar, puede usar la función de tabulación para ver qué importaciones están disponibles en su sistema (esto cambiará dependiendo de qué scripts y módulos de terceros sean visibles para su sesión de Python):

```ipython
En [10]: importar <TAB>
            abc anyio                          
            activar_esta aplicacióndirs                        
            aifc appnope >
            argón antigravedad2                         

En [10]: importar h<TAB>
            hashlib html   
            montónq http   
            hmac        
```

#### Más allá de completar la pestaña: coincidencia de comodines

La función de tabulación es útil si conoce los primeros caracteres del nombre del objeto o atributo que está buscando, pero es de poca ayuda si desea hacer coincidir los caracteres en el medio o al final del nombre.
Para este caso de uso, IPython y Jupyter proporcionan un medio de coincidencia de comodines para nombres que utilizan el carácter `*`.

Por ejemplo, podemos usar esto para enumerar todos los objetos en el espacio de nombres cuyo nombre termine con "Advertencia":

```ipython
En [10]: *¿Advertencia?
BytesAdvertencia Tiempo de ejecuciónAdvertencia
Sintaxis de advertencia en desusoAdvertencia
Advertencia de futuro Advertencia de Unicode
Advertencia de importación Advertencia de usuario
PendienteDeprecationWarning Advertencia
Advertencia de recursos
```

Observe que el carácter `*` coincide con cualquier cadena, incluida la cadena vacía.

De manera similar, supongamos que estamos buscando un método de cadena que contenga la palabra "buscar" en algún lugar de su nombre.
Podemos buscarlo de esta manera:

```ipython
En [11]: cadena.*buscar*?
str.buscar
str.rfind
```

Considero que este tipo de búsqueda flexible con comodines puede ser útil para encontrar un comando en particular cuando conozco un paquete nuevo o me reencuentro con uno familiar.