## Uma cadeia de caracteres simples
No exemplo desta unidade, há um só fato sobre a lua atribuído a uma variável, desta forma:

In [1]:
fact = "The Moon has no atmosphere."
print(fact)

The Moon has no atmosphere.


Sobre como usar aspas
Você pode colocar as cadeias de caracteres do Python entre aspas simples, duplas ou triplas. Embora você possa usá-las de maneira intercambiável, é melhor adotar o mesmo tipo de modo consistente em todo o projeto. Por exemplo, a seguinte cadeia de caracteres usa aspas duplas:

In [2]:
moon_radius = "The Moon has a radius of 1,080 miles."

No entanto, quando uma cadeia de caracteres contém palavras, números ou caracteres especiais (uma substring) que também estão entre aspas, você deve usar um estilo diferente. Por exemplo, se uma substring usar aspas duplas, coloque toda a cadeia de caracteres entre aspas simples, conforme mostrado aqui:

In [3]:
'The "near side" is the part of the Moon that faces the Earth.'

'The "near side" is the part of the Moon that faces the Earth.'

Da mesma forma, se houver aspas simples (ou um apóstrofo, como na palavra Lua's no exemplo a seguir) em qualquer lugar dentro da cadeia de caracteres, coloque toda a cadeia de caracteres entre aspas duplas:

In [4]:
"We only see about 60% of the Moon's surface."

"We only see about 60% of the Moon's surface."

Quando o texto tiver uma combinação de aspas simples e duplas, você poderá usar aspas triplas para evitar problemas com o interpretador:

In [5]:
"""We only see about 60% of the Moon's surface, this is known as the "near side"."""

'We only see about 60% of the Moon\'s surface, this is known as the "near side".'

Texto com várias linhas
Há algumas maneiras diferentes de definir várias linhas de texto como uma variável. As maneiras mais comuns são:

Usar um caractere de nova linha (\n).
Usar aspas triplas (""").
Os caracteres de nova linha separam o texto em várias linhas quando você imprime a saída:

In [6]:
multiline = "Facts about the Moon:\n There is no atmosphere.\n There is no sound."
print(multiline)

Facts about the Moon:
 There is no atmosphere.
 There is no sound.


Você pode obter o mesmo resultado usando aspas triplas:

In [7]:
multiline = """Facts about the Moon: There is no atmosphere. There is no sound."""
print(multiline)

Facts about the Moon: There is no atmosphere. There is no sound.


Métodos de cadeia de caracteres no Python

In [8]:
print("temperatures and facts about the moon".title())

Temperatures And Facts About The Moon


Os mesmos comportamento e uso ocorrem em uma variável:

In [9]:
heading = "temperatures and facts about the moon"
heading_upper = heading.title()
print(heading_upper)

Temperatures And Facts About The Moon


Dividir uma cadeia de caracteres
Um método comum de cadeia de caracteres é .split(). Sem argumentos, o método separa a cadeia de caracteres em cada espaço. Isso cria uma lista composta por cada palavra ou número existente separado(a) por espaço:

In [10]:
temperatures = "Daylight: 260 F Nighttime: -280 F"
temperatures_list = temperatures .split()
print(temperatures_list)

['Daylight:', '260', 'F', 'Nighttime:', '-280', 'F']


Neste exemplo, você está lidando com várias linhas, portanto, o caractere de nova linha (implícito) pode ser usado para dividir a cadeia de caracteres ao final de cada linha, criando linhas individuais:

In [11]:
temperatures = "Daylight: 260 F\n Nighttime: -280 F"
temperatures_list = temperatures .split('\n')
print(temperatures_list)

['Daylight: 260 F', ' Nighttime: -280 F']


Pesquisar uma cadeia de caracteres
Alguns métodos de cadeia de caracteres podem procurar conteúdos antes do processamento, sem usar um loop. Vamos supor que você tem duas frases que discutem as temperaturas em diversos planetas e luas. No entanto, você está interessado apenas em temperaturas relacionadas à nossa lua. Ou seja, se as frases não estão falando sobre a Lua da Terra, elas não devem ser processadas para extrair informações.

A maneira mais simples de descobrir se uma determinada palavra, caractere ou grupo de caracteres existe em uma cadeia de caracteres é usar o operador in:

In [12]:
print("Moon" in "This text will describe facts and challenges with space travel")

False


In [13]:
print("Moon" in "This text will describe facts about the Moon")

True


Uma abordagem para localizar a posição de uma palavra específica em uma cadeia de caracteres é usar o método .find():

In [14]:
temperatures = """Saturn has a daytime temperature of -170 degrees Celsius, while Mars has -28 Celsius."""
print(temperatures.find("Moon"))

-1


O método .find() retorna um -1 quando a palavra não é encontrada ou retorna o índice (o número que representa o local na cadeia de caracteres). É assim que ele se comportaria se você estivesse pesquisando a palavra Marte:

In [15]:
temperatures = """Saturn has a daytime temperature of -170 degrees Celsius, while Mars has -28 Celsius."""
print(temperatures.find("Mars"))

64


64 é a posição em que "Mars" aparece na cadeia de caracteres.

Outra maneira de pesquisar conteúdo é usar o método .count(), que retorna o número total de ocorrências de uma determinada palavra em uma cadeia de caracteres:

In [16]:
temperatures = """Saturn has a daytime temperature of -170 degrees Celsius, while Mars has -28 Celsius."""
print(temperatures.count("Mars"))
print(temperatures.count("Moon"))

1
0


As cadeias de caracteres em Python diferenciam letras minúsculas de minúsculas, o que significa que Lua e lua são consideradas palavras distintas. Para fazer uma comparação sem diferenciar maiúsculas de minúsculas, você pode converter uma das cadeias de caracteres em letras minúsculas usando o método .lower():

In [17]:
print("The Moon And The Earth".lower())

the moon and the earth


Semelhante ao método .lower(), as cadeias de caracteres têm um método .upper() que faz o oposto, convertendo cada caractere em letras maiúsculas:

In [18]:
print("The Moon And The Earth".upper())

THE MOON AND THE EARTH


Dica

Quando você está pesquisando e verificando conteúdos, a abordagem mais adequada é converter a cadeia de caracteres para minúsculas a fim de evitar que isso atrapalhe nas correspondências encontradas. Por exemplo, se você estiver contando o número de vezes que a palavra o aparece, o método não contará as ocorrências de O, embora ambos correspondam à mesma palavra. Você pode usar o método .lower() para alterar todos os caracteres para minúsculos.

Verificar conteúdo
Há ocasiões em que você terá que processar textos para extrair informações apresentadas de modo irregular. Por exemplo, a seguinte cadeia de caracteres é mais simples de processar do que um parágrafo não estruturado:

In [19]:
temperatures = "Mars Average Temperature: -60 C"

Para extrair a temperatura média em Marte, você pode fazer bem com os seguintes métodos:

In [20]:
temperatures = "Mars Average Temperature: -60 C"
parts = temperatures.split(':')
print(parts)
print(parts[-1])

['Mars Average Temperature', ' -60 C']
 -60 C


O código anterior confia que tudo o que vem após os dois-pontos (:) corresponde a dados de temperatura. A cadeia de caracteres é dividida em :, o que produz uma lista de dois itens. Usar [-1] na lista retorna o último item, que é a temperatura neste exemplo.

Se o texto for irregular, você não poderá usar os mesmos métodos de divisão para obter o valor. Você deve fazer um loop sobre os itens e verificar se os valores são de um determinado tipo. O Python tem métodos que ajudam a verificar o tipo de cadeia de caracteres:

In [21]:
mars_temperature = "The highest temperature on Mars is about 30 C"
for item in mars_temperature.split():
    if item.isnumeric():
        print(item)

30


Como o método .isnumeric(), .isdecimal() pode verificar se há cadeias de caracteres que se parecem com decimais.

 Importante

Pode ser surpreendente descobrir que "-70".isnumeric() retornaria False. Isso ocorre porque todos os caracteres da cadeia de caracteres precisariam ser numéricos e o traço (-) não é. Se você precisar verificar números negativos em uma cadeia de caracteres, o método .isnumeric() não funcionará.

Há validações adicionais que você pode aplicar nas cadeias de caracteres para checar valores. Para números negativos, o traço aparece como um prefixo do número, podendo ser detectado com o método .startswith():

In [22]:
print("-60".startswith('-'))

True


Da mesma forma, o método .endswith() ajuda a verificar o último caractere de uma cadeia de caracteres:

In [23]:
if "30 C".endswith("C"):
    print("This temperature is in Celsius")

This temperature is in Celsius


## Texto de transformação

Há outros métodos que ajudam em situações em que o texto precisa ser transformado em outra coisa. Até agora, você viu cadeias de caracteres que podem usar C para Celsius e F para Fahrenheit. Você pode usar o método .replace() para encontrar e substituir ocorrências de um caractere ou grupo de caracteres:

In [24]:
print("Saturn has a daytime temperature of -170 degrees Celsius, while Mars has -28 Celsius.".replace("Celsius", "C"))

Saturn has a daytime temperature of -170 degrees C, while Mars has -28 C.


Conforme mencionado anteriormente, .lower() é uma excelente maneira de normalizar o texto para fazer uma pesquisa que não faça distinção entre maiúsculas e minúsculas. Vamos verificar rapidamente se algum texto discute temperaturas:

In [25]:
text = "Temperatures on the Moon can vary wildly."
print("temperatures" in text)

False


Talvez você não precise fazer a verificação que não faz distinção entre maiúsculas e minúsculas o tempo todo, mas converter todas as letras para minúsculas é uma boa estratégia quando o texto mistura letras maiúsculas e minúsculas.

Depois de dividir o texto e realizar as transformações, talvez seja necessário reunir todas as partes novamente. Assim como o método .split() pode separar caracteres, o método .join() pode uni-los novamente.

O método .join() requer um objeto iterável (como uma lista do Python) como um argumento, portanto, seu uso é diferente de outros métodos de cadeia de caracteres:

In [26]:
moon_facts = ["The Moon is drifting away from the Earth.", "On average, the Moon is moving about 4cm every year."]
print(' '.join(moon_facts))

The Moon is drifting away from the Earth. On average, the Moon is moving about 4cm every year.


## Formato de cadeia de caracteres no Python

Além de transformar texto e executar operações básicas, como correspondência e pesquisa, é essencial formatar o texto quando você estiver apresentando informações. A maneira mais simples de apresentar informações de texto com o Python é usar a função print(). Você verá que é essencial colocar informações em variáveis e outras estruturas de dados em cadeias de caracteres que podem ser usadas por print(). Nesta unidade, você aprenderá várias maneiras válidas de incluir valores de variáveis em texto usando o Python.

Formatação do sinal de porcentagem (%)
O espaço reservado para a variável na cadeia de caracteres é %s. Após a cadeia de caracteres, use outro caractere % seguido pelo nome da variável. O exemplo a seguir mostra como formatar usando o caractere %:

In [27]:
mass_percentage = "1/6"
print("On the Moon, you would weigh about %s of your weight on Earth." % mass_percentage)

On the Moon, you would weigh about 1/6 of your weight on Earth.


O uso de vários valores altera a sintaxe, pois requer parênteses ao redor das variáveis que são passadas:

In [28]:
print("""Both sides of the %s get the same amount of sunlight, but only one side is seen from %s because the %s rotates around its own axis when it orbits %s.""" % ("Moon", "Earth", "Moon", "Earth"))

Both sides of the Moon get the same amount of sunlight, but only one side is seen from Earth because the Moon rotates around its own axis when it orbits Earth.


Dica

Embora esse método ainda seja uma forma válida de formatar cadeias de caracteres, ele pode levar a erros e reduzir a clareza do código quando você estiver lidando com diversas variáveis. Qualquer uma das outras duas opções de formatação descritas nesta unidade seria mais adequada para essa finalidade.

O método format()
O método .format() usa chaves ({}) como espaços reservados em uma cadeia de caracteres e usa a atribuição de variável para substituir o texto.

In [29]:
mass_percentage = "1/6"
print("On the Moon, you would weigh about {} of your weight on Earth.".format(mass_percentage))

On the Moon, you would weigh about 1/6 of your weight on Earth.


Você não precisa atribuir variáveis repetidas diversas vezes, tornando-as menos detalhadas porque menos variáveis precisam ser atribuídas:

In [30]:
mass_percentage = "1/6"
print("""You are lighter on the {0}, because on the {0} you would weigh about {1} of your weight on Earth.""".format("Moon", mass_percentage))

You are lighter on the Moon, because on the Moon you would weigh about 1/6 of your weight on Earth.


m vez de chaves vazias, a substituição deve usar números. O {0} significa usar o primeiro argumento (índice zero) para .format(), que, nesse caso, é Moon. Para repetição simples {0} funciona bem, mas reduz a legibilidade. Para melhorar a legibilidade, use argumentos de palavra-chave em .format() e faça referência aos mesmos argumentos entre chaves:

In [31]:
mass_percentage = "1/6"
print("""You are lighter on the {moon}, because on the {moon} you would weigh about {mass} of your weight on Earth.""".format(moon="Moon", mass=mass_percentage))

You are lighter on the Moon, because on the Moon you would weigh about 1/6 of your weight on Earth.


esde a versão 3.6 do Python, é possível usar as cadeias de caracteres f. Essas cadeias de caracteres se parecem com modelos e usam os nomes de variáveis do seu código. O uso de cadeias de caracteres f no exemplo anterior ficaria assim:

In [32]:
print(f"On the Moon, you would weigh about {mass_percentage} of your weight on Earth.")

On the Moon, you would weigh about 1/6 of your weight on Earth.


As variáveis são passadas entre chaves e a cadeia de caracteres deve usar o prefixo f.

Além das cadeias de caracteres f serem menos detalhadas do que qualquer outra opção de formatação, é possível usar expressões dentro das chaves. Essas expressões podem ser funções ou operações diretas. Por exemplo, se você quiser representar o valor 1/6 como um percentual com uma casa decimal, poderá usar a função round() diretamente:

In [34]:
print(round(100/6, 1))

16.7


Com cadeias de caracteres f, você não precisa atribuir um valor a uma variável com antecedência:

In [35]:
print(f"On the Moon, you would weigh about {round(100/6, 1)}% of your weight on Earth.")

On the Moon, you would weigh about 16.7% of your weight on Earth.
