**Source of the materials**: Biopython cookbook (adapted)
<font color='red'>Status: Draft</font>


**Fonte dos materiais** : livro de receitas Biopython (adaptado)

 &lt;font color = &#39;red&#39;&gt; Status: Rascunho &lt;/font&gt;


Appendix: Useful stuff about Python {#sec:appendix}
===================================

If you haven’t spent a lot of time programming in Python, many questions
and problems that come up in using Biopython are often related to Python
itself. This section tries to present some ideas and code that come up
often (at least for us!) while using the Biopython libraries. If you
have any suggestions for useful pointers that could go here, please
contribute!

What the heck is a handle? {#sec:appendix-handles}
--------------------------

Handles are mentioned quite frequently throughout this documentation,
and are also fairly confusing (at least to me!). Basically, you can
think of a handle as being a “wrapper” around text information.

Handles provide (at least) two benefits over plain text information:

1.  They provide a standard way to deal with information stored in
    different ways. The text information can be in a file, or in a
    string stored in memory, or the output from a command line program,
    or at some remote website, but the handle provides a common way of
    dealing with information in all of these formats.

2.  They allow text information to be read incrementally, instead of all
    at once. This is really important when you are dealing with huge
    text files which would use up all of your memory if you had to load
    them all.

Handles can deal with text information that is being read (e. g. reading
from a file) or written (e. g. writing information to a file). In the
case of a “read” handle, commonly used functions are `read()`, which
reads the entire text information from the handle, and `readline()`,
which reads information one line at a time. For “write” handles, the
function `write()` is regularly used.

The most common usage for handles is reading information from a file,
which is done using the built-in Python function `open`. Here, we open a
handle to the file [m\_cold.fasta](data/m_cold.fasta) (also
available online
[here](http://biopython.org/DIST/docs/tutorial/examples/m_cold.fasta)):




Apêndice: Coisas úteis sobre Python {#sec: apêndice}

 =======================================

 Se você não passou muito tempo programando em Python, muitas perguntas

 e os problemas que surgem no uso do Biopython são frequentemente relacionados ao Python

 em si. Esta seção tenta apresentar algumas idéias e códigos que surgem

 frequentemente (pelo menos para nós!) ao usar as bibliotecas Biopython. Se vocês

 tem alguma sugestão de dicas úteis que podem vir aqui, por favor

 contribuir!

 O que diabos é uma alça? {#sec: alças de apêndice}

 Os identificadores são mencionados com bastante frequência em toda esta documentação,

 e também são bastante confusos (pelo menos para mim!). Basicamente, você pode

 pense em um identificador como um “invólucro” em torno das informações de texto.

 As alças fornecem (pelo menos) dois benefícios em relação às informações de texto simples:
1.  Eles fornecem uma maneira padrão de lidar com as informações armazenadas em jeitos diferentes. As informações de texto podem estar em um arquivo ou em um string armazenada na memória, ou a saída de um programa de linha de comando, ou em algum site remoto, mas o identificador fornece uma maneira comum de lidar com informações em todos esses formatos.
1.  Eles permitem que as informações de texto sejam lidas de forma incremental, em vez de todas de uma vez só. Isso é muito importante quando você está lidando com grandes arquivos de texto que usariam toda a sua memória se você tivesse que carregar o Shopping.

 Alças podem lidar com informações de texto que estão sendo lidas (por exemplo, leitura

 de um arquivo) ou gravadas (por exemplo, gravação de informações em um arquivo). No

 caso de um identificador de "leitura", as funções comumente usadas são `read()` , que

 lê todas as informações de texto do identificador e `readline()` ,

 que lê as informações uma linha de cada vez. Para identificadores de “gravação”, o

 a função `write()` é usada regularmente.

 O uso mais comum para identificadores é ler informações de um arquivo,

 que é feito usando a função `open` embutida do Python. Aqui, abrimos um

 lidar com o arquivo [m_cold.fasta](data/m_cold.fasta) (também

 Disponível

 [aqui](http://biopython.org/DIST/docs/tutorial/examples/m_cold.fasta) ):


In [5]:
handle = open("data/m_cold.fasta", "r")
handle.readline()

">gi|8332116|gb|BE037100.1|BE037100 MP14H09 MP Mesembryanthemum crystallinum cDNA 5' similar to cold acclimation protein, mRNA sequence\n"


Handles are regularly used in Biopython for passing information to
parsers. For example, since Biopython 1.54 the main functions in
`Bio.SeqIO` and `Bio.AlignIO` have allowed you to use a filename instead
of a handle:




As alças são usadas regularmente no Biopython para passar informações para

 analisadores. Por exemplo, desde Biopython 1.54 as principais funções em

 `Bio.SeqIO` e `Bio.AlignIO` permitiram que você use um nome de arquivo no lugar

 de uma alça:


In [7]:
from Bio import SeqIO
for record in SeqIO.parse("data/m_cold.fasta", "fasta"):
    print(record.id, len(record))

gi|8332116|gb|BE037100.1|BE037100 1111



On older versions of Biopython you had to use a handle, e.g.




Em versões anteriores do Biopython, você tinha que usar um identificador, por exemplo


In [9]:
from Bio import SeqIO
handle = open("data/m_cold.fasta", "r")
for record in SeqIO.parse(handle, "fasta"):
    print(record.id, len(record))
handle.close()

gi|8332116|gb|BE037100.1|BE037100 1111



This pattern is still useful - for example suppose you have a gzip
compressed FASTA file you want to parse:




Este padrão ainda é útil - por exemplo, suponha que você tenha um gzip

 arquivo FASTA compactado que você deseja analisar:


```python
import gzip
from Bio import SeqIO
handle = gzip.open("m_cold.fasta.gz")
for record in SeqIO.parse(handle, "fasta"):
    print(record.id, len(record))
handle.close()
```


```
import gzip from Bio import SeqIO handle = gzip.open("m_cold.fasta.gz") for record in SeqIO.parse(handle, "fasta"): print(record.id, len(record)) handle.close()
```



See Section \[sec:SeqIO\_compressed\] for more examples like this,
including reading bzip2 compressed files.

### Creating a handle from a string

One useful thing is to be able to turn information contained in a string
into a handle. The following example shows how to do this using
`cStringIO` from the Python standard library:




Veja a seção [sec: SeqIO_compressed] para mais exemplos como este,

 incluindo a leitura de arquivos compactados bzip2.

###  Criação de uma alça a partir de uma corda

 Uma coisa útil é ser capaz de transformar as informações contidas em uma string

 em uma alça. O exemplo a seguir mostra como fazer isso usando

 `cStringIO` da biblioteca padrão Python:


In [1]:
my_info = 'A string\n with multiple lines.'
print(my_info)

A string
 with multiple lines.


In [4]:
from io import StringIO
my_info_handle = StringIO(my_info)
first_line = my_info_handle.readline()
print(first_line)

A string



In [10]:
second_line = my_info_handle.readline()
print(second_line)

 with multiple lines.
