[![imagenes](imagenes/pythonista.png)](https://pythonista.io)

## Introducción y objetivo.

Aún cuando Python es un lenguaje de propósito general, su uso en el campo del cómputo científico, el análisis de datos, y recientemente, en Machine Learning, Deep Learning e Inteligencia Artificial se ha extendido y popularizado.

El objetivo de este módulo es el de presentar de forma general y práctica algunas de las herramientas y bibliotecas más populares dedicadas al análisis de datos y cómputo científico en Python.

El enfoque primordial será sobre las funciones básicas de las herramientas presentadas incluyendo algunos casos de uso, por lo que el presente contenido servirá de base para otros más enfocados en la teoría y práctica de temas de análisis científico, dejando a las herramientas como auxiliares del aprendizaje.

* Se discutirán algunos aspectos primordiales en el manejo de datos.
* Se explorarán algunas funciones y módulos que ofrece Python para el manejo de flujos de datos. 
* Se hará gran énfasis en la creación y uso de las principales estructuras y tipos de datos que Numpy ofrece.
* Se estudiarán algunos aspectos de los DataFrames y Series de Pandas.
* Se realizarán algunas demostraciones básicas del uso de Matplotlib tanto para la elaboración de gráficas como para la transformación de imágenes.
* Se realizarán algunos ejemplos del uso de Seaborn para la elaboración de gráficos estádísticos.
* Se hará una breve demostración del uso de NetworkX para la creación y análisis de redes y grafos.
* Se realizará una rápida introducción al uso de herramientas de an{alisis de lenguaje natural mediante el NLTK de Python. 
* Se explorarán algunos de los principales proyectos catalogados en los Scikits.
* Se tocará el tema del uso de expresiones de matemáticas simbólicas con Sympy.

## El proyecto Scipy. 

El proyecto [Scipy](https://www.scipy.org/) reune una serie de bibliotecas y herramientas especializadas en cómputo científico, análisis y visualización de datos.

Scipy está conformado a su vez por los siguientes componentes. 

* La [biblioteca de Scipy](https://www.scipy.org/scipylib/index.html).
* [Numpy](http://www.numpy.org/).
* [Matplotlib](https://matplotlib.org/).
* [iPython](https://ipython.org/)/[Jupyter](https://ipython.org/) https://en.wikipedia.org/wiki/Fernando_P%C3%A9rez_(software_developer)
* [Sympy](https://www.sympy.org).
* [Pandas](https://pandas.pydata.org/).

La característica principal de cada componente de Scipy es que las herramientas cuentan con una amplia documentación y soporte de una gran comunidad.

Para conocer con mayor profundidad sobre Scipy se sugiere consultar la documentación y tutoriales. localizados en https://www.scipy-lectures.org/

## Numpy.

Numpy es un paquete especializada en la creación, gestión y operación (incluyendo funciones matemáticas y estádisitcas básicas y generación de números aleatorios) con arreglos de una o varias dimensiones. 

Numpy cuenta con módulos especializados en operaciones de algebra lineal y transformaciones de Fourier entre otros.

Cabe señalar que Numpy generalmente se beneficia del uso de bibliotecas de algebra lineal escritas en FORTRAN, tales como [Lapack](https://netlib.sandia.gov/lapack/#_presentation) [BLAS](http://www.netlib.org/blas/) y [OpenBLAS](http://www.openblas.net/). Incluso existen algunas variantes de Numpy diseñadas para realizar cálculos mediante GPU tales como [Gnumpy](https://www.cs.toronto.edu/~tijmen/gnumpy.html).

Los tipos de datos y los arreglos de Numpy son elemento base del resto de los componentes de Scipy e incluso de otras herramientas de cómputo científico.

## Matplotlib.

Matplotlib es un paquete especializado en la creación y manipulación gráficos e imágenes. Muchos proyectos de visualización de imágenes y datos usan a Matplotlib como una biblioteca primordial.  

Utiliza una sintaxis y funcionalidad basada en [Matlab](https://www.mathworks.com/products/matlab.html) y es equiparable a [ggplot](https://ggplot2.tidyverse.org/)  de [R](https://www.r-project.org/).

## Pandas.

Pandas es un paquete especializado en realizar operaciones de análisis de datos, incluyendo:

* Adquisición de datos.
* Manipulación y depuración de conjuntos de datos (datasets).
* Análisis estadístico básico.
* Análisis de series de tgiempo.

## Sympy.

Sympy es un paquete que permite ingresar e interpretar fórmulas como si fueran símbolos matemáticos. Su objetivo es el de ser una sistema cómputo algebraico.

## iPython y Jupyter.

### iPython.

El proyecto iPython es un shell interactivo de Python que extiende las funcionalidades del shell tradicional de Python, permitiendo entre otras cosas:

* Coloreado del código.
* Autocompletado de comandos.
* Historial de comandos.
* Cómputo paralelo y concurrente.
* Capcidad de desplegar los gr;aficos generados por Matplotlib en la misma ventana.

iPython cuenta con una interfaz para la terminal, una interfaz (consola) de escritorio basada en QT y una interfaz web por medio de un kernel para notebooks de Jupyter.

### Jupyter.

La interfaz web de iPython evolucionó de tal forma que la matéfora de una libreta o "notebook" no sólo podía contener un intérprete de Python, sino que podía adapatarse a otros lenguajes de programación mediante "kernels". Es así que a partir de iPython surgió Jupyter (por JUlia PYTon y R). 

Jupyter es servidor web capaz de desplegar una interfaz web que incluye:

* Un gestor de archivos.
* Editor de texto.
* Un emulador de terminal (excepto en Windows).
* Las "Notebooks".

Las notebooks de Jupyter pueden combinar celdas de texto capaces de desplegar tipografías similares a las de HTML mediante la [sintaxis de Markdown](https://daringfireball.net/projects/markdown/syntax) con celdas de código ejecutable, incluyendo el despliegue de gráficos e imágenes, entre otras muchas funcionalidades.

Jupyter puede mantener múltiples notebooks, terminales ejecutándose simultáneamente.

Actualmente las notebooks de Jupyter soportan [kernels de diversos lenguajes.](https://github.com/jupyter/jupyter/wiki/Jupyter-kernels).

Las notebooks de jupyter pueden ser exportadas en múltiples formatos, tales como HTML, PDF, reST, LaTeX e incluso como un formato de diapositivas en línea utilizando [Reveal.js](https://revealjs.com/#).

## Los Scikits.

Los [scikits](https://scikits.appspot.com/about) son proyectos relacionados con Scipy que, por diversas razones, no forman parte de los componentes principales del proyecto.

Estos proyectos exploran diversas temáticas tales como por ejemplo [Machine Learning](http://scikit-learn.org/stable/index.html) y [procesamiento de imágenes](https://scikit-image.org/).

La lista de scikits está disponible en https://scikits.appspot.com/scikits.

La calidad de las bibliotecas y de la documentación 

## NetworkX.

[NetworkX](https://networkx.github.io/) es una herramienta especializada en el despliegue y análisis de redes complejas e incluye:

* Estructuras de datos para representar grafos, digrafos y multigrafos.
* Algoritmos especializados en el cálculo y análisis de redes.
* Generadores de grafos aleatorios y sintéticos.

La herramienta es muy madura y cuenta con una comunidad muy extendida.

## NLTK.

El kit de análisis de lenguaje natural ([NLTK](http://www.nltk.org/), por sus siglas en inglés) es el  proyecto más robusto y completo en el campo del estudio, análisis y desarrollo de datos a partir del lenguaje humanos.

Cuenta con herramientas y recursos lexicológicos para diversos idiomas, capaces de extraer, refinar, procesar, analizar y extender enormes cantidades de datos basados en el uso del lenguaje.

La comunidad de NLTK está conformada por programadores, lingüistas, filólogos y expertos que hacen uso de la herramienta de forma cotidiana.

## Seaborn.

[Seaborn](https://seaborn.pydata.org/) es una biblioteca basada en Matplotlib, especializada en despliegue y visualización de datos estadísticos.

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2019.</p>