# Conda

 > Aviso: Este post foi traduzido para o português usando um modelo de tradução automática. Por favor, me avise se encontrar algum erro.

Ao trabalhar com ciência de dados, inteligência artificial, deep learning, ou como queira chamar, vamos realizar vários projetos. E pode ser que em alguns você precise instalar, por exemplo, a versão 11.6 do CUDA e em outros a 11.8. E nessas situações, é aconselhável seguir as recomendações, nunca entre em conflito com o CUDA, ele sempre sai vencedor.
Portanto, o melhor é criar ambientes diferentes para cada projeto. Dessa forma, você poderá instalar o que quiser em cada ambiente e não de maneira global. E assim, não terá problemas de incompatibilidade com versões de bibliotecas.
Para criar ambientes python, ele traz por padrão o `venv`, que são seus ambientes virtuais. Mas recomendo que você use o `conda` para criar seus ambientes virtuais, pois além de criar ambientes virtuais, também é um gerenciador de pacotes, e é um melhor gerenciador de pacotes que o `pip`.
Este não é um post explicativo de `conda`, então você não vai encontrar como instalá-lo nem como usá-lo. É um post no qual são contadas as vantagens de usar `conda` e, além disso, de usar `mamba` (que explicaremos mais adiante)

Vou criar três ambientes conda diferentes, um será chamado `pip_env`, outro `conda_env` e outro `mamba_env`

## Conda vs PIP

### pip_env

Vou criar um novo ambiente chamado `pip_env`

In [None]:
!conda create -n pip_env

No ambiente `pip_env` vou instalar `pandas`

In [1]:
# pip_env
!pip install pandas

Collecting pandas
  Using cached pandas-2.0.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (12.3 MB)
Installing collected packages: pandas
Successfully installed pandas-2.0.1


Como se pode ver no texto que saiu ao instalar `pandas`, este depende de `numpy`, portanto o instala em sua versão `1.24.3`. Mas se por algum motivo precisarmos do `numpy` em sua versão `1.19`, se tentarmos instalá-lo, receberemos um erro.

In [2]:
# pip_env
!pip install numpy==1.19.0

Collecting numpy==1.19.0
  Using cached numpy-1.19.0.zip (7.3 MB)
  Installing build dependencies ... [?25ldone
[?25h  Getting requirements to build wheel ... [?25ldone
[?25h  Preparing metadata (pyproject.toml) ... [?25ldone
[?25hBuilding wheels for collected packages: numpy
  Building wheel for numpy (pyproject.toml) ... [?25lerror
  [1;31merror[0m: [1msubprocess-exited-with-error[0m
  
  [31m×[0m [32mBuilding wheel for numpy [0m[1;32m([0m[32mpyproject.toml[0m[1;32m)[0m did not run successfully.
  [31m│[0m exit code: [1;36m1[0m
  [31m╰─>[0m [31m[1113 lines of output][0m
  [31m   [0m Running from numpy source directory.
  [31m   [0m Cythonizing sources
  [31m   [0m numpy/random/_bounded_integers.pxd.in has not changed
  [31m   [0m numpy/random/_bounded_integers.pyx.in has not changed
  [31m   [0m numpy/random/_philox.pyx has not changed
  [31m   [0m numpy/random/_mt19937.pyx has not changed
  [31m   [0m numpy/random/_sfc64.pyx has not changed

Nós recebemos um erro, e se verificarmos qual versão do `numpy` temos, percebemos que ainda estamos com a `1.24.3`

In [3]:
# pip_env
import numpy as np
np.__version__

'1.24.3'

E vemos qual versão do `pandas` temos

In [4]:
# pip_env
import pandas as pd
pd.__version__

'2.0.1'

### conda_env

Para resolver este conflito, podemos usar `conda`, crio um novo ambiente chamado `conda_env`

In [None]:
!conda create -n conda_env

E agora dizemos que queremos instalar `numpy` na versão `1.19` e `pandas`, e `conda` procurará a maneira de fazer isso.

In [8]:
# conda_env
!conda install -y numpy=1.19 pandas

Collecting package metadata (current_repodata.json): done
Solving environment: failed with initial frozen solve. Retrying with flexible solve.
Collecting package metadata (repodata.json): done
Solving environment: done

## Package Plan ##

  environment location: /home/wallabot/miniconda3/envs/conda_env

  added / updated specs:
    - numpy=1.19
    - pandas


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    ca-certificates-2023.01.10 |       h06a4308_0         120 KB
    certifi-2021.5.30          |   py36h06a4308_0         139 KB
    intel-openmp-2022.1.0      |    h9e868ea_3769         4.5 MB
    mkl-2020.2                 |              256       138.3 MB
    mkl-service-2.3.0          |   py36he8ac12f_0          52 KB
    mkl_fft-1.3.0              |   py36h54f3939_0         170 KB
    mkl_random-1.1.1           |   py36h0573a6f_0         327 KB
    numpy-1.19.2               |   py3

Parece que você conseguiu, vamos ver

In [1]:
# conda_env
import numpy as np
np.__version__

'1.19.2'

In [2]:
# conda_env
import pandas as pd
pd.__version__

'1.1.5'

Vemos que você conseguiu instalar os dois, só que para poder resolver os conflitos você instalou o `pandas` na versão `1.1.5`, em vez da versão `2.0.1` que havia instalado com o `pip`.

## Mamba vs conda

Uma vez que vimos que o conda é melhor para resolver conflitos, vejamos agora a diferença entre usar `mamba` e `conda`. Como vimos, o `conda` é muito bom em resolver conflitos, mas tem o problema de ser lento ao instalar pacotes, pois as dependências são instaladas em série, uma após a outra. Graças ao `mamba`, vamos ter os mesmos benefícios do `conda`, só que as dependências serão instaladas em paralelo, fazendo uso dos kernels que temos no nosso micro.

### conda_env

Vamos a seguir no ambiente `conda_env` e vamos a ver quanto tempo leva para instalar o `pytorch`. Colocando `time` antes de um comando, vemos quanto tempo ele leva para ser executado.

In [2]:
# conda_env
!time conda install -y pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

Collecting package metadata (current_repodata.json): done
Solving environment: failed with initial frozen solve. Retrying with flexible solve.
Solving environment: failed with repodata from current_repodata.json, will retry with next repodata source.
Collecting package metadata (repodata.json): done
Solving environment: done

## Package Plan ##

  environment location: /home/wallabot/miniconda3/envs/conda_env

  added / updated specs:
    - pytorch
    - pytorch-cuda=11.8
    - torchaudio
    - torchvision


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    bzip2-1.0.8                |       h7b6447c_0          78 KB
    cuda-cudart-11.8.89        |                0         197 KB  nvidia
    cuda-cupti-11.8.87         |                0        25.3 MB  nvidia
    cuda-libraries-11.8.0      |                0           1 KB  nvidia
    cuda-nvrtc-11.8.89         |                0        1

Vemos que demorou 294,42 segundos, cerca de 4,9 minutos, quase 5 minutos.

### mamba_env

Agora vamos a reinstalar o `pytorch`, mas com `mamba`. Primeiro criamos um ambiente chamado `mamba_env`

In [None]:
!conda create -n mamba_env

Para instalar `mamba`, baixe-o do [mambaforge](https://github.com/conda-forge/miniforge#mambaforge) e instale-o.

Agora vamos reinstalar o `pytorch` no `mamba_env`

In [1]:
# mamba_env
!time mamba install -y pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia


                  __    __    __    __
                 /  \  /  \  /  \  /  \
                /    \/    \/    \/    \
███████████████/  /██/  /██/  /██/  /████████████████████████
              /  / \   / \   / \   / \  \____
             /  /   \_/   \_/   \_/   \    o \__,
            / _/                       \_____/  `
            |/
        ███╗   ███╗ █████╗ ███╗   ███╗██████╗  █████╗
        ████╗ ████║██╔══██╗████╗ ████║██╔══██╗██╔══██╗
        ██╔████╔██║███████║██╔████╔██║██████╔╝███████║
        ██║╚██╔╝██║██╔══██║██║╚██╔╝██║██╔══██╗██╔══██║
        ██║ ╚═╝ ██║██║  ██║██║ ╚═╝ ██║██████╔╝██║  ██║
        ╚═╝     ╚═╝╚═╝  ╚═╝╚═╝     ╚═╝╚═════╝ ╚═╝  ╚═╝

        mamba (1.3.1) supported by @QuantStack

        GitHub:  https://github.com/mamba-org/mamba
        Twitter: https://twitter.com/QuantStack

█████████████████████████████████████████████████████████████


Looking for: ['pytorch', 'torchvision', 'torchaudio', 'pytorch-cuda=11.8']

[?25l[2K[0G[+] 0.0s
[2K[1A[2K[

Agora levou 121,61 segundos, cerca de 2 minutos. Menos da metade do tempo com `conda`.

## Criar um ambiente a partir de um arquivo

Podemos querer criar um ambiente com uma lista de pacotes determinada, então podemos passar um arquivo para o conda para que ele crie o ambiente com esses pacotes. Para isso, criamos um arquivo chamado `environment.yml` com um conteúdo como o seguinte
```yml
nome: ambiente_a_partir_de_arquivocanais:- padrões- conda-forge- pytorch- nvidiadependências:- python=3.11- cudatoolkit=11.8- pytorch=2.2.1- torchaudio- torchvision- pip- pip:- transformadores```

Como vemos, indica-se o nome do ambiente, os canais que vamos usar, os pacotes com suas versões que vamos instalar através do Conda e os pacotes que vamos instalar através do Pip. Agora dizemos ao Conda para criar o ambiente com esses pacotes.
```bash
conda env create -f environment.yml```

Criamos o arquivo

In [1]:
!touch environment.yml \
&& echo "name: entorno_desde_archivo" >> environment.yml \
&& echo "channels:" >> environment.yml \
&& echo "  - defaults" >> environment.yml \
&& echo "  - conda-forge" >> environment.yml \
&& echo "  - pytorch" >> environment.yml \
&& echo "  - nvidia" >> environment.yml \
&& echo "dependencies:" >> environment.yml \
&& echo "    - python=3.11" >> environment.yml \
&& echo "    - cudatoolkit=11.8" >> environment.yml \
&& echo "    - pytorch=2.2.1" >> environment.yml \
&& echo "    - torchaudio" >> environment.yml \
&& echo "    - torchvision" >> environment.yml \
&& echo "    - pip" >> environment.yml \
&& echo "    - pip:" >> environment.yml \
&& echo "        - transformers" >> environment.yml

Agora que temos o arquivo, podemos criar o ambiente personalizado.

In [2]:
!conda env create -f environment.yml

Retrieving notices: ...working... done
Channels:
 - defaults
 - conda-forge
 - pytorch
 - nvidia
Platform: linux-64
Collecting package metadata (repodata.json): done
Solving environment: done


    current version: 23.11.0
    latest version: 24.1.2

Please update conda by running

    $ conda update -n base -c conda-forge conda



Downloading and Extracting Packages:
pytorch-2.2.1        | 1.35 GB   |                                       |   0% 
cudatoolkit-11.8.0   | 630.7 MB  |                                       |   0% [A

libcublas-12.1.0.26  | 329.0 MB  |                                       |   0% [A[A


libcusparse-12.0.2.5 | 163.0 MB  |                                       |   0% [A[A[A



libnpp-12.0.2.50     | 139.8 MB  |                                       |   0% [A[A[A[A




libcufft-11.0.2.4    | 102.9 MB  |                                       |   0% [A[A[A[A[A





libcusolver-11.4.4.5 | 98.3 MB   |                                       |   0% [A

## Instalar pacotes a partir de um arquivo

Outra coisa que podemos fazer é ter uma lista de pacotes que queremos instalar. Para poder instalar todos de uma vez, podemos criar um arquivo chamado `requirements.yml` com um conteúdo como o seguinte
```txt
canais:- conda-forgedependências:- pandas==2.2.1- matplotlib==3.8.3```

E agora dizemos ao Conda para instalar esses pacotes
```bash
conda install --file requirements.yml```

In [3]:
!touch requirements.txt \
&& echo "pandas==2.2.1" >> requirements.txt \
&& echo "matplotlib==3.8.3" >> requirements.txt

Agora que temos o arquivo, instalamos os pacotes

In [5]:
!conda install --file requirements.txt

Channels:
 - conda-forge
 - defaults
Platform: linux-64
Collecting package metadata (repodata.json): done
failed

LibMambaUnsatisfiableError: Encountered problems while solving:
  - package pandas-1.3.3-py37h40f5888_0 requires python >=3.7,<3.8.0a0, but none of the providers can be installed

Could not solve for environment specs
The following packages are incompatible
├─ [32mpandas 1.3.3 [0m is installable with the potential options
│  ├─ [32mpandas 1.3.3[0m would require
│  │  └─ [32mpython >=3.7,<3.8.0a0 [0m, which can be installed;
│  ├─ [32mpandas 1.3.3[0m would require
│  │  └─ [32mpython >=3.8,<3.9.0a0 [0m, which can be installed;
│  └─ [32mpandas 1.3.3[0m would require
│     └─ [32mpython >=3.9,<3.10.0a0 [0m, which can be installed;
└─ [31mpin-1[0m is not installable because it requires
   └─ [31mpython 3.11.* [0m, which conflicts with any installable versions previously reported.

Pins seem to be involved in the conflict. Currently pinned specs:
 - python 3.1