# Herramientas

## Git

En principio, buena parte del código y tutoriales serán alojados en un [repositorio público de GitHub](https://github.com/Argentan/DMA_LAB2/tree/master). Es posible acceder a ellos directamente desde el web, pero es más deseable sincronizarlos con una versión local. 

### Opción 1 - Clientes Git puros + VSCode (todos los sistemas operativo):

Existen varias opciones de interface gráfica y de línea de comandos para el sistema [git](https://git-scm.com/downloads). Es aconsejable utilizar tambien un IDE adecuado, es posible usar simplemente jupyter notebooks directamente o a través de otro IDE como [VsCode](https://code.visualstudio.com/).

### Opción 2 - GitHub Desktop (Windows y Mac):

[Github Desktop](https://desktop.github.com/) es una interface gráfica para el sistema git, integrada con la plataforma GitHub pero útil para cualquier repo.





## Python y sus paquetes de computación científica

### Opción 1 - Anaconda (todos los sistemas operativos):

Anaconda es otra distribución científica de Python. También viene preparada con una gran cantidad de paquetes científicos, pero tiene la desventaja de que no es portátil. Las instrucciones para descarga e instalación pueden encontrarse [su página de descargas](https://www.anaconda.com/products/individual). Para instalar paquetes adicionales, en general se pude usar el comando de línea 

> `conda install <nombre del paquete>`


### Opción 2 - WinPython (sólo para Windows): 

WinPython es una distribución científica portátil del lenguaje de programación Python, que viene con preparado con la vasta mayoría de los paquetes científicos necesarios para trabajos estadísticos, de preparación de datos y de Data Mining. 

La página principal del proyecto está [acá](https://winpython.github.io/), el repo de github está [acá](https://github.com/winpython/winpython). 

La principal virtud de esta distribución, además de ser extremadamente fácil de instalar, es que está auto-contenida y no interfiere con otras instalaciones de Python. De esta manera, podemos tener todos las mismas versiones de los paquetes, sin que cada uno de ustedes tenga que modificar sus instalaciones principales de Python (si es que la tienen). 

Otra virtud de esta distribución es que resulta relativamente simple instalar paquetes adicionales, a través de un panel de control, que permite la instalación por "Drag and Drop". Las distribuciones que son puro Python, simplemente se bajan de [Pypi](https://pypi.python.org/pypi). Existen otras librerías que requieren la compilación de módulos externos escritos en C. Muchos de ellos tienen archivos pre-compilados, que se pueden encontrar en la [página de  Christoph Gohlke](http://www.lfd.uci.edu/~gohlke/pythonlibs/), si no existen distribuciones pre-compiladas, la labor es algo más ardua y escapa al objetivo de esta introducción.


### Opción 3 - Instalación Manual (solo usuarios muy avanzados):

También pueden instalar Python sin librerías externas desde la [página principal de Python](https://www.python.org/) y luego instalar de a una las librerías necesarias. Esta tarea es ardua y por momentos muy frustrante para usuarios con moderados conocimientos de compilación de programas en C. 



## Jupyter Notebooks

[Jupyter Notebooks](http://jupyter.org/) es una aplicación cliente-servidor con un "front end" en html, que permite la ejecución remota e interactiva de código desde el navegador. Originalmente era exclusivo de Python (IPython Notebooks), pero se generalizó a [otros lenguajes](https://github.com/jupyter/jupyter/wiki/Jupyter-kernels)

No es una aplicación destinada a el remplazo de un IDE, sino que es particularmente util para:
- Presentaciones y tutoriales interactivos
- Prototipado rápido y visualizaciones
- Ejecución de código en máquinas remotas y/o en clúster
- Kaggle kernels **nota al margen: sería bueno que vayan abriendo una cuenta**


Además, para hacer el trabajo mas simple e interactivo, los notebooks incorporan resaltado de sintaxis, ayuda, renderizado de markdown y Latex, como así también funciones "mágicas", que iremos viendo a medida que sean útiles. 

Por ejemplo, esta presentación está escrita en markdown y la siguiente fórmula en Latex

$$c = \sqrt{a^2 + b^2}$$

> `$$c = \sqrt{a^2 + b^2}$$`


In [2]:
# ejemplos de ayuda y autocompletado (interactivo)
import pandas as pd

pd.read_csv?

[1;31mSignature:[0m
[0mpd[0m[1;33m.[0m[0mread_csv[0m[1;33m([0m[1;33m
[0m    [0mfilepath_or_buffer[0m[1;33m:[0m [0mUnion[0m[1;33m[[0m[0mstr[0m[1;33m,[0m [0mpathlib[0m[1;33m.[0m[0mPath[0m[1;33m,[0m [0mIO[0m[1;33m[[0m[1;33m~[0m[0mAnyStr[0m[1;33m][0m[1;33m][0m[1;33m,[0m[1;33m
[0m    [0msep[0m[1;33m=[0m[1;34m','[0m[1;33m,[0m[1;33m
[0m    [0mdelimiter[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mheader[0m[1;33m=[0m[1;34m'infer'[0m[1;33m,[0m[1;33m
[0m    [0mnames[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mindex_col[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0musecols[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0msqueeze[0m[1;33m=[0m[1;32mFalse[0m[1;33m,[0m[1;33m
[0m    [0mprefix[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mmangle_dupe_cols[0m[1;33m=[0m[1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mdtype[0m[1;33m=[0m[1;32mNo

In [4]:
help(pd.read_csv)

Help on function read_csv in module pandas.io.parsers:

read_csv(filepath_or_buffer: Union[str, pathlib.Path, IO[~AnyStr]], sep=',', delimiter=None, header='infer', names=None, index_col=None, usecols=None, squeeze=False, prefix=None, mangle_dupe_cols=True, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skipinitialspace=False, skiprows=None, skipfooter=0, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, skip_blank_lines=True, parse_dates=False, infer_datetime_format=False, keep_date_col=False, date_parser=None, dayfirst=False, cache_dates=True, iterator=False, chunksize=None, compression='infer', thousands=None, decimal: str = '.', lineterminator=None, quotechar='"', quoting=0, doublequote=True, escapechar=None, comment=None, encoding=None, dialect=None, error_bad_lines=True, warn_bad_lines=True, delim_whitespace=False, low_memory=True, memory_map=False, float_precision=None)
    Read a comma-separated values (csv) file in

In [6]:
%%timeit
a = 100
list(range(10000))
b = 123

194 µs ± 2.43 µs per loop (mean ± std. dev. of 7 runs, 10000 loops each)


In [7]:
%%html
<h1> Titulo </h1>

### Ejercitación en grupos: instalar todo