[![imagenes/pythonista.png](imagenes/pythonista.png)](https://pythonista.io)

Existen herramientas y lenguajes de programación diseñados específicamente para el cómputo científico y el análisis de datos tales como:

* [*Matlab*](https://la.mathworks.com/products/matlab.html).
* [*SPSS* ](https://www.ibm.com/analytics/spss-statistics-software).
* [*Mathematica*](https://www.wolfram.com/mathematica/).

Algunos de ellos incluso ha sido publicado bajo los términos de licencias libres, como:

* [*GNU Octave*](https://www.gnu.org/software/octave/).
* [*R*](https://www.r-project.org/).
* [*Julia*](https://julialang.org/).

A diferencia de estas herramientas  y lenguajes altamente especializadas en temas estadísticos y de análisis de datos, Python es un lenguaje de programación de propósito general. 

Sin embargo, debido a las características de Python se han creado a partir de él una serie de proyectos enfocados a ofrecer herramientas altamente competitivas en el tema de análisis de datos, estadística y cómputo científico.

## Proyectos más relevantes para análisis de datos.

### El proyecto *Scipy*.

El proyecto [*Scipy*](https://www.scipy.org) consta de una serie de herramientas y bibliotecas especializadas en cómputo científico y  análisis de datos. Los componentes más importantes del proyecto son: 

* [*Numpy*](https://numpy.org), una biblioteca que ofrece:
    * Gestión de arreglos multidimensionales (*np.array*).
    * Tipos de datos optimizados para operaciones con arreglos.
    * Poderosos componentes de cálculo vectorial y de álgebra lineal.
* [*Pandas*](https://pandas.pydata.org/), una herramienta especializada en:
    * Obtención y almacenamientos de datos de diversas fuentes y con diversos formatos.
    * Tratamiento de los datos.
    * Análisis de los datos.   
* [*Matplotlib*](https://matplotlib.org/), una biblioteca especialzada en el despliegue y visualización de datos muy similar a [ggplot](https://ggplot2.tidyverse.org/) del lenguiaje *R*.
* [*iPython*](https://ipython.org/), un intérprete de Python especializado en temas de análisis de datos y cómputo científico, el cual fue el origen del proyecto [*Jupyter*]https://jupyter.org/).
* [Sympy](https://www.sympy.org), una herramienta que permite realizar operaciones con expresiones de álgebra simbólica.
* La biblioteca de Scipy.

Estos componentes principales son proyectos muy maduros, cuentan con extensa documentación y soporte tanto de la comunidad como comercial.

### Los Scikits.

Los [Scikits](https://www.scipy.org/scikits.html) son un compendio de proyectos basados en Scipy que ofrecen herramientas puntuales para temas muy específicos tales como:

* Machine Learning.
* Redes neuronales.
* Análisis de imágenes.
* Cómputo paralelo.
* Supercómputo usando GPU.
* Series de tiempo, etc.

Estos proyectos no son mantenidos ni soportados por Scipy y su documentación y madurez no es homogenea.

Los proyectos pueden sr consutados desde https://scikits.appspot.com/scikits

## Instalación de los componentes.

La instalación es muy sencilla, ya que todos los componentes se encuentran dentro del repositorio de Pypi en https://pypi.org/.

In [None]:
!pip install numpy scipy pandas

## Los arreglos de *Numpy*.

Los arreglos (*array*) de *Numpy* son la base fundamental de *Pandas*.

Dichos arreglos extienden y optimizan los tipos de datos propios de Python para crear estructuras que pueden tener múltiples dimensiones.

A diferencia de los tipos *tuple* y *list* los arreglos de Numpy sólo pueden contener datos de un tipo básico.

Los arreglos se definen de la siguiente forma:

```
np.array([[[<estructura_1,1>, [<estructura_1,2>]... [<estructura_1,n>]],
         [[<estructura_2,1>], [<estructura_2,2>]... [<estructura_2,n>]],
         ...
         ...
         [[<estructura_2,1>], [<estructura_2,2>]... [<estructura_2,n>]]], dtype=<tipo>)
```

el parámetro *dtype* denota el tipo de dato. 

### Los tipos de datos de *Numpy*.

Numpy también ha extendido los tipos básicos de Python de tal forma que puede ofrecer los siguientes:

####  Números enteros.

Numpy ofrece una familia de tipos enteros que se define por su tamaño en bits.

* Enteros con signo: *int*, *int8*, *int16*, *int32* e *int64*.
* Enteros sin signo: *uint*, *uint8*, *uint16*, *uint32* y *uint64*.
* Bytes: *byte*

#### Números de punto flotante.

Esta familia de tipos también se define por su tamaño en bits como *float* *float16*, *float32*, *float64* y *float128*.

#### Valores boleanos.

Estos se definen como *bool_*

#### Tipos de texto.

Estos tipos corresponden a *string_*, *unicode_*, *bytes_* y también definen su tamaño en bits.

In [None]:
import numpy as np

In [None]:
np.array([1,2,3])

In [13]:
arreglo = np.array([[1,2,3],[4,5,6]], dtype=np.int64)

In [None]:
arreglo.size

In [None]:
arreglo[1][1]

In [None]:
arreglo.dtype

<p style="text-align: center"><a rel="license" href="http://creativecommons.org/licenses/by/4.0/"><img alt="Licencia Creative Commons" style="border-width:0" src="https://i.creativecommons.org/l/by/4.0/80x15.png" /></a><br />Esta obra está bajo una <a rel="license" href="http://creativecommons.org/licenses/by/4.0/">Licencia Creative Commons Atribución 4.0 Internacional</a>.</p>
<p style="text-align: center">&copy; José Luis Chiquete Valdivieso. 2019.</p>