# **Herramientas**

#### **Instalar Git**

Van a la [web de Git](https://git-scm.com/), descargan e instalan git

#### **Instalar Visual Studio Code**

+ Descargar e instalar: https://code.visualstudio.com/
+ Instalar complementos:


Una vez abiero el VSC ir al menu de la izquierda a la solapa de "Extensions", buscar en la barra de search e instalar los siguientes complementos:

    + Github Pull Requests
    + Jupyter

Les va a aparecer el simbolo de github en el menu de la izquierda, loguearse con la cuenta de Github. También pueden desloguearse desde el simbolo de profile que se encuentra en la esquina izquierda abajo.  

*How to pull a repository from GitHub in VS Code?*
*Open the command palette with the key combination of Ctrl + Shift + P . At the command palette prompt, enter gitcl , select the Git: Clone command, then select Clone from GitHub and press Enter. When prompted for the Repository URL, select clone from GitHub, then press Enter*


#### **Github Desktop (opcional)**

Si les resulta más cómodo administrar los repositorios de manera visual con una interface gráfica, pueden bajarse el Github Desktop desde acá:
https://desktop.github.com/


#### **Configurar el repo local**

+ Crear carpeta que va a contener los proyectos (ej: GitHub en Documentos)
+ Navegar desde la terminal de VSC hasta la carpeta
+ Colocar el comando: git clone -b main https://github.com/AraneoA/UA_MDM_LDI_II.git

Donde "main" hace referencia a la rama que queremos clonar y el link es el que se exporta desde el boton "<>Code" del repo




# **Python + Paquetes**


#### **Opción 1 - Anaconda (todos los sistemas operativos)**:

Anaconda es otra distribución científica de Python. También viene preparada con una gran cantidad de paquetes científicos, pero tiene la desventaja de que no es portátil. Las instrucciones para descarga e instalación pueden encontrarse [su página de descargas](https://www.anaconda.com/products/individual). Para instalar paquetes adicionales, en general se pude usar el comando de línea

> `conda install <nombre del paquete>`

*Nota* Al momento de instalar en Windows, verificar que se está agregando el PATH. Pueden verificar que está bien instalado en una terminal metiendo el comando `conda --version`. En caso de que no reconozca "conda", seguir este tutorial:
https://medium.com/@hektorprofe/tutorial-windows-10-agregar-el-python-de-anaconda-al-path-para-utilizarlo-en-la-cmd-y-powershell-72acf22901a

*Nota 2*: Para que la terminar registre cambios de PATH, reiniciarla. Reiniciar VSC también siempre que existan problemas.

#### **Opción 2 - WinPython (sólo para Windows)**:

WinPython es una distribución científica portátil del lenguaje de programación Python, que viene con preparado con la vasta mayoría de los paquetes científicos necesarios para trabajos estadísticos, de preparación de datos y de Data Mining.

La página principal del proyecto está [acá](https://winpython.github.io/), el repo de github está [acá](https://github.com/winpython/winpython).

La principal virtud de esta distribución, además de ser extremadamente fácil de instalar, es que está auto-contenida y no interfiere con otras instalaciones de Python. De esta manera, podemos tener todos las mismas versiones de los paquetes, sin que cada uno de ustedes tenga que modificar sus instalaciones principales de Python (si es que la tienen).

Otra virtud de esta distribución es que resulta relativamente simple instalar paquetes adicionales, a través de un panel de control, que permite la instalación por "Drag and Drop". Las distribuciones que son puro Python, simplemente se bajan de [Pypi](https://pypi.python.org/pypi). Existen otras librerías que requieren la compilación de módulos externos escritos en C. Muchos de ellos tienen archivos pre-compilados, que se pueden encontrar en la [página de  Christoph Gohlke](http://www.lfd.uci.edu/~gohlke/pythonlibs/), si no existen distribuciones pre-compiladas, la labor es algo más ardua y escapa al objetivo de esta introducción.


#### **Opción 3 - Pyenv + Poetry (solo usuarios más avanzados)**:

Esta forma está pensada para poder trabajar en equipo en proyectos productivos. Poetry es un gestor de dependencias, genera como una "receta" para crear el environment siempre que se comparta la misma versión de python.

+ pyenv: https://github.com/pyenv/pyenv?tab=readme-ov-file#installation
+ poetry: https://python-poetry.org/docs/


# **Jupyter Notebooks**

[Jupyter Notebooks](http://jupyter.org/) es una aplicación cliente-servidor con un "front end" en html, que permite la ejecución remota e interactiva de código desde el navegador. Originalmente era exclusivo de Python (IPython Notebooks), pero se generalizó a [otros lenguajes](https://github.com/jupyter/jupyter/wiki/Jupyter-kernels)

No es una aplicación destinada a el remplazo de un IDE, sino que es particularmente util para:
- Presentaciones y tutoriales interactivos
- Prototipado rápido y visualizaciones
- Ejecución de código en máquinas remotas y/o en clúster
- Kaggle kernels **nota al margen: sería bueno que vayan abriendo una cuenta**


Además, para hacer el trabajo mas simple e interactivo, los notebooks incorporan resaltado de sintaxis, ayuda, renderizado de markdown y Latex, como así también funciones "mágicas", que iremos viendo a medida que sean útiles.

Por ejemplo, esta presentación está escrita en markdown y la siguiente fórmula en Latex

$$c = \sqrt{a^2 + b^2}$$

> `$$c = \sqrt{a^2 + b^2}$$`


# **Instalar herramientas**

En la materia vamos a utilizar algunas librerias y herramientas especificas. Les sugerimos usar conda con un entorno especifico ldi2 y vscode.

Si ya tienen instalado conda o anaconda sugerimos actualizarlo a la ultima version antes con este comando:

*conda update -n base -c defaults conda*

En caso de no tenerlo pueden seguir las [instrucciones](https://docs.anaconda.com/free/miniconda/miniconda-install.html).  de instalacion de miniconda para su sistema operativo.

*conda create -n ldi2 pytorch torchvision torchaudio ipykernel nb_conda_kernels matplotlib plotly seaborn wordcloud lightgbm optuna numpy pandas scikit-learn  optuna-dashboard -c pytorch -c conda-forge*

Quienes quieran correr modelos con GPU, en caso de disponer de una, pueden generar el ambiente de esta forma:

*conda create -n ldi2_cuda pytorch torchvision torchaudio pytorch-cuda=12.1 ipykernel nb_conda_kernels matplotlib plotly seaborn wordcloud lightgbm optuna numpy pandas scikit-learn optuna-dashboard -c pytorch -c nvidia -c conda-forge*

Para correr en GPU usando Colab tienen que seguir esta guia que les indica como vincular Kaggle con Colab
https://www.kaggle.com/discussions/general/74235

Las principales librerias que vamos a usar son las siguientes:

- [Numpy](https://numpy.org): Manipulacion de matrices/tensores
- [Pandas](https://pandas.pydata.org/docs/): Datasets, similares a tablas en bases de datos pero en memoria
- [Scikit Learn](https://scikit-learn.org/stable/): Libreria muy completa de data science/machine learning
- [Pytorch](https://pytorch.org) (torchivision, audio...): Redes neuronales
- [Jupyterlab](https://jupyter.org) (ipykernel, nb_conda_kernels...): Servidor de notebooks
- Librerias graficas (matplotlib, plotly, seaborn, wordcloud): Visualización
- [LightGBM](https://lightgbm.readthedocs.io/en/stable/#): Gradient boosting
- [Optuna](https://optuna.readthedocs.io/en/stable/#): Optimizacion de hiperparámetros
