# Conda

A la hora de trabajar en ciencia de datos, inteligencia artificial, deep learning, o como le quieras llamar, vamos a hacer varios proyectos. Y puede que en unos tengas que instalar por ejemplo la versión 11.6 de cuda y en otros la 11.8. Y en esos casos te lo aconsejes, nunca te pelees con cuda, siempre sale ganando.

Por tanto lo mejor es crear entornos distintos para cada proyecto. De esta manera podrás instalar lo que quieras en cada entorno y no de manera global. Y así no tendrás problemas de incopatibilidades con versiones de librerías.

Para crear entornos python trae por defecto `venv` que son sus entornos virtuales. Pero te recomiendo que uses `conda` para crear tus entornos virtuales, ya que a parte de crear entornos virtuales, también es un gestor de paquetes, y es mejor gestor de paquetes que `pip`.

Este no es un post explicativo de `conda`, por lo que no vas a encontrar cómo instalarlo ni cómo usarlo. Es un post en el que se cuentan las ventajas de usar `conda` y además de usar `mamba` (que explicaremos más adelante)

Voy a crear tres entornos de conda distintos, uno se llamará `pip_env`, otro `conda_env` y otro `mamba_env`

## Conda vs PIP

### pip_env

Voy a crear un nuevo entorno llamado `pip_env`

In [None]:
!conda create -n pip_env

En el entorno `pip_env` voy a instalar `pandas`

In [1]:
# pip_env
!pip install pandas

Collecting pandas
  Using cached pandas-2.0.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (12.3 MB)
Installing collected packages: pandas
Successfully installed pandas-2.0.1


Como se puede ver en el texto que ha salido al instalar `pandas`, este depende de `numpy` por lo que lo instala en su versión `1.24.3`. Pero si por la razón que sea necesitamos `numpy` en su versión `1.19`, si lo intentamos instalar nos dará un error

In [2]:
# pip_env
!pip install numpy==1.19.0

Collecting numpy==1.19.0
  Using cached numpy-1.19.0.zip (7.3 MB)
  Installing build dependencies ... [?25ldone
[?25h  Getting requirements to build wheel ... [?25ldone
[?25h  Preparing metadata (pyproject.toml) ... [?25ldone
[?25hBuilding wheels for collected packages: numpy
  Building wheel for numpy (pyproject.toml) ... [?25lerror
  [1;31merror[0m: [1msubprocess-exited-with-error[0m
  
  [31m×[0m [32mBuilding wheel for numpy [0m[1;32m([0m[32mpyproject.toml[0m[1;32m)[0m did not run successfully.
  [31m│[0m exit code: [1;36m1[0m
  [31m╰─>[0m [31m[1113 lines of output][0m
  [31m   [0m Running from numpy source directory.
  [31m   [0m Cythonizing sources
  [31m   [0m numpy/random/_bounded_integers.pxd.in has not changed
  [31m   [0m numpy/random/_bounded_integers.pyx.in has not changed
  [31m   [0m numpy/random/_philox.pyx has not changed
  [31m   [0m numpy/random/_mt19937.pyx has not changed
  [31m   [0m numpy/random/_sfc64.pyx has not changed

Nos ha dado un error, y si vemos qué versión de `numpy` tenemos, vemos que seguimos con la `1.24.3`

In [3]:
# pip_env
import numpy as np
np.__version__

'1.24.3'

Y vemos qué versión de `pandas` tenemos

In [4]:
# pip_env
import pandas as pd
pd.__version__

'2.0.1'

### conda_env

Para resolvers este conflicto, podemos usar `conda`, creo un nuevo entorno llamado `conda_env`

In [None]:
!conda create -n conda_env

y ahora le decimos que queremos instalar `numpy` en la versión `1.19` y `pandas`, y `conda` buscará la manera de hacerlo

In [8]:
# conda_env
!conda install -y numpy=1.19 pandas

Collecting package metadata (current_repodata.json): done
Solving environment: failed with initial frozen solve. Retrying with flexible solve.
Collecting package metadata (repodata.json): done
Solving environment: done

## Package Plan ##

  environment location: /home/wallabot/miniconda3/envs/conda_env

  added / updated specs:
    - numpy=1.19
    - pandas


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    ca-certificates-2023.01.10 |       h06a4308_0         120 KB
    certifi-2021.5.30          |   py36h06a4308_0         139 KB
    intel-openmp-2022.1.0      |    h9e868ea_3769         4.5 MB
    mkl-2020.2                 |              256       138.3 MB
    mkl-service-2.3.0          |   py36he8ac12f_0          52 KB
    mkl_fft-1.3.0              |   py36h54f3939_0         170 KB
    mkl_random-1.1.1           |   py36h0573a6f_0         327 KB
    numpy-1.19.2               |   py3

Parece que lo ha conseguido, vamos a ver

In [1]:
# conda_env
import numpy as np
np.__version__

'1.19.2'

In [2]:
# conda_env
import pandas as pd
pd.__version__

'1.1.5'

Vemos que ha podido instalar los dos, solo que para poder resolver los conflictos ha instalado `pandas` en su versión `1.1.5`, en vez de en la versión `2.0.1` que había instalado `pip`

## Mamba vs conda

Una vez hemos visto que conda es mejor para resolver conflictos, veamos ahora la diferencia de usar `mamba` y `conda`. `Conda` como hemos visto es muy bueno resolviendo conflictos, pero tiene el problema de que es lento instalando paquetes, ya que las dependencias las instala en serie, una detrás de otra. Gracias a `mamba` vamos a tener los mismo beneficios de `conda`, solo que las dependencias se van a instalar en paralelo, haciendo uso de los kernels que tengamos en nuestro micro

### conda_env

Vamos a seguir en el entorno `conda_env` y vamos a ver cuánto tarda en instalarse `pytorch`. Poniendo `time` antes de un comando vemos cuánto tarda en ejecutarse

In [2]:
# conda_env
!time conda install -y pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

Collecting package metadata (current_repodata.json): done
Solving environment: failed with initial frozen solve. Retrying with flexible solve.
Solving environment: failed with repodata from current_repodata.json, will retry with next repodata source.
Collecting package metadata (repodata.json): done
Solving environment: done

## Package Plan ##

  environment location: /home/wallabot/miniconda3/envs/conda_env

  added / updated specs:
    - pytorch
    - pytorch-cuda=11.8
    - torchaudio
    - torchvision


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    bzip2-1.0.8                |       h7b6447c_0          78 KB
    cuda-cudart-11.8.89        |                0         197 KB  nvidia
    cuda-cupti-11.8.87         |                0        25.3 MB  nvidia
    cuda-libraries-11.8.0      |                0           1 KB  nvidia
    cuda-nvrtc-11.8.89         |                0        1

Vemos que ha tardado 294,42 segundos, unos 4.9 minutos, casi 5 minutos

### mamba_env

Ahora vamos a volver a instalar `pytorch`, pero con `mamba`. Primero creamos un entorno llamado `mamba_env`

In [None]:
!conda create -n mamba_env

Para instalar `mamba` descargarlo de [mambaforge](https://github.com/conda-forge/miniforge#mambaforge) e instalarlo

Ahora volvemos a instalar `pytorch` en `mamba_env`

In [1]:
# mamba_env
!time mamba install -y pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia


                  __    __    __    __
                 /  \  /  \  /  \  /  \
                /    \/    \/    \/    \
███████████████/  /██/  /██/  /██/  /████████████████████████
              /  / \   / \   / \   / \  \____
             /  /   \_/   \_/   \_/   \    o \__,
            / _/                       \_____/  `
            |/
        ███╗   ███╗ █████╗ ███╗   ███╗██████╗  █████╗
        ████╗ ████║██╔══██╗████╗ ████║██╔══██╗██╔══██╗
        ██╔████╔██║███████║██╔████╔██║██████╔╝███████║
        ██║╚██╔╝██║██╔══██║██║╚██╔╝██║██╔══██╗██╔══██║
        ██║ ╚═╝ ██║██║  ██║██║ ╚═╝ ██║██████╔╝██║  ██║
        ╚═╝     ╚═╝╚═╝  ╚═╝╚═╝     ╚═╝╚═════╝ ╚═╝  ╚═╝

        mamba (1.3.1) supported by @QuantStack

        GitHub:  https://github.com/mamba-org/mamba
        Twitter: https://twitter.com/QuantStack

█████████████████████████████████████████████████████████████


Looking for: ['pytorch', 'torchvision', 'torchaudio', 'pytorch-cuda=11.8']

[?25l[2K[0G[+] 0.0s
[2K[1A[2K[

Ahora ha tardado 121,61 segundos, unos 2 minutos. Menos de la mitad que con `conda`