Skip to content
Apresentação para o Pyjamas 2019
Jupyter Notebook Shell
Branch: master
Clone or download
Fetching latest commit…
Cannot retrieve the latest commit at this time.
Permalink
Type Name Latest commit message Commit time
Failed to load latest commit information.
01_shell
02_snakemake
binder
.gitignore
README.md
index.ipynb

README.md

Organizando sua análise de dados com Snakemake

Binder

Vídeo

Descrição

Projetos de análises de dados tendem a começar com uma tarefa pequena: baixar um arquivo, limpar dados brutos, gerar uma figura. Notebooks são ótimas ferramentas para exploração, mas o que fazer quando você tem centenas (ou milhares) de arquivos, e precisa repetir esse processo para cada um deles?

Snakemake é uma ferramenta para gerenciamento de workflows, com uma sintaxe parecida com Makefiles mas com muitas outras funcionalidades úteis:

  • gerenciamento de software (usando conda)
  • submissão de tarefas para clusters
  • medição de recursos utilizados

E, principalmente: snakemake é Python, e você pode usar qualquer pacote ou definir suas próprias funções para guiar a sua análise!

Configurando esse repositório

Online

Esse repositório pode ser usado diretamente no Binder, um serviço que inicializa um ambiente pronto para ser usado no seu browser. Clique no botão para acessar: Binder

Localmente

Vamos usar conda para gerenciar pacotes nesse exemplo. Para criar um ambiente com as versões corretas rode

conda env create --force --file binder/environment.yml

conda activate pyjamas
You can’t perform that action at this time.