# Conda

Quando trabalhamos com ciência de dados, inteligência artificial, aprendizado profundo, ou como você quiser chamar, vamos fazer vários projetos. E talvez seja necessário instalar, por exemplo, a versão 11.6 do cuda em alguns projetos e a 11.8 em outros. E, nesses casos, eu o aconselho a nunca brigar com o cuda, pois ele sempre sai na frente.

Portanto, é melhor criar ambientes separados para cada projeto. Dessa forma, você pode instalar o que quiser em cada ambiente e não globalmente. E, dessa forma, você não terá problemas com incompatibilidades de versões de bibliotecas.

Para criar ambientes, o python vem com o `venv` por padrão, que é o seu ambiente virtual. Mas recomendo que você utilize o `conda` para criar seus ambientes virtuais, pois além de criar ambientes virtuais, ele também é um gerenciador de pacotes, e é um gerenciador de pacotes melhor que o `pip`.

Esta não é uma postagem explicando o `conda`, portanto você não descobrirá como instalá-lo ou como utilizá-lo. É uma postagem sobre as vantagens de usar o `conda` e também sobre o uso do `mamba` (que explicaremos mais tarde).

Este caderno foi traduzido automaticamente para torná-lo acessível a mais pessoas, por favor me avise se você vir algum erro de digitação..

Criarei três ambientes conda diferentes, um será chamado `pip_env`, um `conda_env` e um `mamba_env`.

## Conda vs PIP

### pip_env

Criarei um novo ambiente chamado `pip_env`.

In [None]:
!conda create -n pip_env

No ambiente `pip_env`, instalarei o `pandas`.

In [1]:
# pip_env
!pip install pandas

Collecting pandas
  Using cached pandas-2.0.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl (12.3 MB)
Installing collected packages: pandas
Successfully installed pandas-2.0.1


Como você pode ver no texto que apareceu ao instalar o `pandas`, ele depende do `numpy`, portanto, ele o instala em sua versão `1.24.3`. Mas se, por qualquer motivo, precisarmos do `numpy` em sua versão `1.19`, se tentarmos instalá-lo, receberemos um erro

In [2]:
# pip_env
!pip install numpy==1.19.0

Collecting numpy==1.19.0
  Using cached numpy-1.19.0.zip (7.3 MB)
  Installing build dependencies ... [?25ldone
[?25h  Getting requirements to build wheel ... [?25ldone
[?25h  Preparing metadata (pyproject.toml) ... [?25ldone
[?25hBuilding wheels for collected packages: numpy
  Building wheel for numpy (pyproject.toml) ... [?25lerror
  [1;31merror[0m: [1msubprocess-exited-with-error[0m
  
  [31m×[0m [32mBuilding wheel for numpy [0m[1;32m([0m[32mpyproject.toml[0m[1;32m)[0m did not run successfully.
  [31m│[0m exit code: [1;36m1[0m
  [31m╰─>[0m [31m[1113 lines of output][0m
  [31m   [0m Running from numpy source directory.
  [31m   [0m Cythonizing sources
  [31m   [0m numpy/random/_bounded_integers.pxd.in has not changed
  [31m   [0m numpy/random/_bounded_integers.pyx.in has not changed
  [31m   [0m numpy/random/_philox.pyx has not changed
  [31m   [0m numpy/random/_mt19937.pyx has not changed
  [31m   [0m numpy/random/_sfc64.pyx has not changed

Recebemos um erro e, se verificarmos a versão do `numpy` que temos, veremos que ainda estamos na versão `1.24.3`.

In [3]:
# pip_env
import numpy as np
np.__version__

'1.24.3'

E vemos qual versão do `pandas` temos

In [4]:
# pip_env
import pandas as pd
pd.__version__

'2.0.1'

### conda_env

Para resolver esse conflito, podemos usar o `conda`, eu crio um novo ambiente chamado `conda_env`.

In [None]:
!conda create -n conda_env

e agora dizemos a ele que queremos instalar o `numpy` na versão `1.19` e o `pandas`, e o `conda` procurará uma maneira de fazer isso.

In [8]:
# conda_env
!conda install -y numpy=1.19 pandas

Collecting package metadata (current_repodata.json): done
Solving environment: failed with initial frozen solve. Retrying with flexible solve.
Collecting package metadata (repodata.json): done
Solving environment: done

## Package Plan ##

  environment location: /home/wallabot/miniconda3/envs/conda_env

  added / updated specs:
    - numpy=1.19
    - pandas


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    ca-certificates-2023.01.10 |       h06a4308_0         120 KB
    certifi-2021.5.30          |   py36h06a4308_0         139 KB
    intel-openmp-2022.1.0      |    h9e868ea_3769         4.5 MB
    mkl-2020.2                 |              256       138.3 MB
    mkl-service-2.3.0          |   py36he8ac12f_0          52 KB
    mkl_fft-1.3.0              |   py36h54f3939_0         170 KB
    mkl_random-1.1.1           |   py36h0573a6f_0         327 KB
    numpy-1.19.2               |   py3

Ele parece ter conseguido, vamos ver

In [1]:
# conda_env
import numpy as np
np.__version__

'1.19.2'

In [2]:
# conda_env
import pandas as pd
pd.__version__

'1.1.5'

Podemos ver que ele conseguiu instalar ambos, só que, para resolver os conflitos, ele instalou o `pandas` em sua versão `1.1.5`, em vez da versão `2.0.1` que o `pip` havia instalado.

## Mamba vs conda

Agora que já vimos que o conda é melhor na resolução de conflitos, vamos ver a diferença entre o `mamba` e o `conda`. O `conda`, como vimos, é muito bom na resolução de conflitos, mas tem o problema de ser lento na instalação de pacotes, pois instala as dependências em série, uma após a outra. Graças ao `mamba` teremos os mesmos benefícios do `conda`, só que as dependências serão instaladas em paralelo, fazendo uso dos kernels que temos em nosso micro.

### conda_env

Vamos permanecer no ambiente `conda_env` e ver quanto tempo leva para instalar o `pytorch`. Ao colocar `time` antes de um comando, veremos quanto tempo leva para executar

In [2]:
# conda_env
!time conda install -y pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia

Collecting package metadata (current_repodata.json): done
Solving environment: failed with initial frozen solve. Retrying with flexible solve.
Solving environment: failed with repodata from current_repodata.json, will retry with next repodata source.
Collecting package metadata (repodata.json): done
Solving environment: done

## Package Plan ##

  environment location: /home/wallabot/miniconda3/envs/conda_env

  added / updated specs:
    - pytorch
    - pytorch-cuda=11.8
    - torchaudio
    - torchvision


The following packages will be downloaded:

    package                    |            build
    ---------------------------|-----------------
    bzip2-1.0.8                |       h7b6447c_0          78 KB
    cuda-cudart-11.8.89        |                0         197 KB  nvidia
    cuda-cupti-11.8.87         |                0        25.3 MB  nvidia
    cuda-libraries-11.8.0      |                0           1 KB  nvidia
    cuda-nvrtc-11.8.89         |                0        1

Vemos que levou 294,42 segundos, cerca de 4,9 minutos, quase 5 minutos.

### mamba_env

Agora vamos reinstalar o `pytorch`, mas com o `mamba`. Primeiro, criamos um ambiente chamado `mamba_env`.

In [None]:
!conda create -n mamba_env

Para instalar o `mamba`, faça o download em [mambaforge] (https://github.com/conda-forge/miniforge#mambaforge) e instale-o.

Agora vamos reinstalar o `pytorch` no `mamba_env`.

In [1]:
# mamba_env
!time mamba install -y pytorch torchvision torchaudio pytorch-cuda=11.8 -c pytorch -c nvidia


                  __    __    __    __
                 /  \  /  \  /  \  /  \
                /    \/    \/    \/    \
███████████████/  /██/  /██/  /██/  /████████████████████████
              /  / \   / \   / \   / \  \____
             /  /   \_/   \_/   \_/   \    o \__,
            / _/                       \_____/  `
            |/
        ███╗   ███╗ █████╗ ███╗   ███╗██████╗  █████╗
        ████╗ ████║██╔══██╗████╗ ████║██╔══██╗██╔══██╗
        ██╔████╔██║███████║██╔████╔██║██████╔╝███████║
        ██║╚██╔╝██║██╔══██║██║╚██╔╝██║██╔══██╗██╔══██║
        ██║ ╚═╝ ██║██║  ██║██║ ╚═╝ ██║██████╔╝██║  ██║
        ╚═╝     ╚═╝╚═╝  ╚═╝╚═╝     ╚═╝╚═════╝ ╚═╝  ╚═╝

        mamba (1.3.1) supported by @QuantStack

        GitHub:  https://github.com/mamba-org/mamba
        Twitter: https://twitter.com/QuantStack

█████████████████████████████████████████████████████████████


Looking for: ['pytorch', 'torchvision', 'torchaudio', 'pytorch-cuda=11.8']

[?25l[2K[0G[+] 0.0s
[2K[1A[2K[

Agora, o processo levou 121,61 segundos, cerca de 2 minutos. Menos da metade do tempo gasto com o `conda`.