**Source of the materials**: Biopython Tutorial and Cookbook (adapted)


**Fonte dos materiais** : Tutorial e livro de receitas do Biopython (adaptado)


<img src="images/biopython.jpg">


&lt;img src = "images / biopython.jpg"&gt;


# Introduction


# Introdução


## What is Biopython?


## O que é Biopython?


The Biopython Project is an international association of developers of freely available Python (http://www.python.org) tools for computational molecular biology. Python is an object oriented, interpreted, flexible language that is becoming increasingly popular for scientific computing. Python is easy to learn, has a very clear syntax and can easily be extended with modules written in C, C++ or FORTRAN.

The Biopython web site (http://www.biopython.org) provides an online resource for modules, scripts, and web links for developers of Python-based software for bioinformatics use and research. Basically, the goal of Biopython is to make it as easy as possible to use Python for bioinformatics by creating high-quality, reusable modules and classes. Biopython features include parsers for various Bioinformatics file formats (BLAST, Clustalw, FASTA, Genbank,...), access to online services (NCBI, Expasy,...), interfaces to common and not-so-common programs (Clustalw, DSSP, MSMS...), a standard sequence class, various clustering modules, a KD tree data structure etc. and even documentation.

Basically, we just like to program in Python and want to make it as easy as possible to use Python for bioinformatics by creating high-quality, reusable modules and scripts.


O Projeto Biopython é uma associação internacional de desenvolvedores de ferramentas Python ( [http://www.python.org](http://www.python.org) ) disponíveis gratuitamente para biologia molecular computacional. Python é uma linguagem orientada a objetos, interpretada e flexível que está se tornando cada vez mais popular para a computação científica. Python é fácil de aprender, tem uma sintaxe muito clara e pode ser facilmente estendido com módulos escritos em C, C ++ ou FORTRAN.

 O site Biopython ( [http://www.biopython.org](http://www.biopython.org) ) fornece um recurso online para módulos, scripts e links da web para desenvolvedores de software baseado em Python para uso e pesquisa de bioinformática. Basicamente, o objetivo do Biopython é tornar o mais fácil possível o uso do Python para bioinformática, criando módulos e classes reutilizáveis de alta qualidade. Os recursos do Biopython incluem analisadores para vários formatos de arquivo de bioinformática (BLAST, Clustalw, FASTA, Genbank, ...), acesso a serviços online (NCBI, Expasy, ...), interfaces para programas comuns e não tão comuns (Clustalw, DSSP, MSMS ...), uma classe de sequência padrão, vários módulos de agrupamento, uma estrutura de dados em árvore KD etc. e até mesmo documentação.

 Basicamente, gostamos de programar em Python e queremos tornar o mais fácil possível o uso de Python para bioinformática criando módulos e scripts reutilizáveis de alta qualidade.


## What can I find in the Biopython package


## O que posso encontrar no pacote Biopython


The main Biopython releases have lots of functionality, including:

- The ability to parse bioinformatics files into Python utilizable data structures, including support for the following formats:
  - Blast output – both from standalone and WWW Blast
  - Clustalw
  - FASTA
  - GenBank
  - PubMed and Medline
  - ExPASy files, like Enzyme and Prosite
  - SCOP, including ‘dom’ and ‘lin’ files
  - UniGene
  - SwissProt
- Files in the supported formats can be iterated over record by record or indexed and accessed via a Dictionary interface.
- Code to deal with popular on-line bioinformatics destinations such as:
  - NCBI – Blast, Entrez and PubMed services
  - ExPASy – Swiss-Prot and Prosite entries, as well as Prosite searches
- Interfaces to common bioinformatics programs such as:
  - Standalone Blast from NCBI
  - Clustalw alignment program
  - EMBOSS command line tools
-A standard sequence class that deals with sequences, ids on sequences, and sequence features.
- Tools for performing common operations on sequences, such as translation, transcription and weight calculations.
- Code to perform classification of data using k Nearest Neighbors, Naive Bayes or Support Vector Machines.
- Code for dealing with alignments, including a standard way to create and deal with substitution matrices.
- Code making it easy to split up parallelizable tasks into separate processes.
- GUI-based programs to do basic sequence manipulations, translations, BLASTing, etc.
- Extensive documentation and help with using the modules, including this file, on-line wiki documentation, the web site, and the mailing list.
- Integration with BioSQL, a sequence database schema also supported by the BioPerl and BioJava projects.

We hope this gives you plenty of reasons to download and start using Biopython!


Os principais lançamentos do Biopython têm muitas funcionalidades, incluindo:
-  A capacidade de analisar arquivos de bioinformática em estruturas de dados utilizáveis em Python, incluindo suporte para os seguintes formatos:<ul><li> Saída de explosão - tanto do autônomo quanto do WWW Blast
-  Clustalw
-  FASTA
-  GenBank
-  PubMed e Medline
-  Arquivos ExPASy, como Enzyme e Prosite
-  SCOP, incluindo arquivos &#39;dom&#39; e &#39;lin&#39;
-  UniGene
-  SwissProt

 Os arquivos nos formatos suportados podem ser iterados registro por registro ou indexados e acessados por meio de uma interface de Dicionário.

 Código para lidar com destinos populares de bioinformática on-line, como:
-  NCBI - serviços Blast, Entrez e PubMed
-  ExPASy - entradas Swiss-Prot e Prosite, bem como pesquisas Prosite

 Interfaces para programas comuns de bioinformática, como:
-  Blast autônomo do NCBI
-  Programa de alinhamento Clustalw
-  Ferramentas de linha de comando EMBOSS

 -Uma classe de sequência padrão que lida com sequências, ids em sequências e recursos de sequência.
-  Ferramentas para realizar operações comuns em sequências, como tradução, transcrição e cálculos de peso.
-  Código para realizar a classificação de dados usando k vizinhos mais próximos, Naive Bayes ou Support Vector Machines.
-  Código para lidar com alinhamentos, incluindo uma maneira padrão de criar e lidar com matrizes de substituição.
-  Código que facilita a divisão de tarefas paralelizáveis em processos separados.
-  Programas baseados em GUI para fazer manipulações de sequência básicas, traduções, BLASTing, etc.
-  Documentação extensa e ajuda com o uso dos módulos, incluindo este arquivo, documentação wiki on-line, o site e a lista de discussão.
-  Integração com BioSQL, um esquema de banco de dados de sequência também suportado pelos projetos BioPerl e BioJava.

 Esperamos que isso lhe dê muitos motivos para fazer o download e começar a usar o Biopython!


## About these notebooks


## Sobre esses notebooks


These notebooks were prepared on Python 3 for Project Jupyter 4+ (formely IPython Notebook). Biopython should be installed and available (v1.66 or newer recommended).

You can check the basic installation and inspect the version by doing:


Esses notebooks foram preparados em Python 3 para o Projeto Jupyter 4+ (anteriormente IPython Notebook). Biopython deve estar instalado e disponível (v1.66 ou mais recente recomendado).

 Você pode verificar a instalação básica e inspecionar a versão fazendo:


In [1]:
import Bio
print(Bio.__version__)

1.66
