# 1. Pilares do pensamento computacional

- Decomposição
    - a decomposição consiste em dividir um problema complexo em partes menores e mais gerenciáveis. 
    - cada subproblema pode ser resolvido individualmente, facilitando a resolução do problema original. 
        - Por exemplo, poderíamos precisar calcular o percentual do PIB de cada estado no total do país. Esse problema poderia ser divido da seguinte forma: 
            - somar o PIB de todos os estados para obter o PIB total; 
            - para cada estado, dividir o PIB do estado pelo PIB total; e 
            - multiplicar o resultado por 100 para obter o percentual.

- Reconhecimento de padrões
    - o reconhecimento de padrões envolve a identificação de semelhanças ou padrões entre problemas, ou em um mesmo problema. 
    - a utilização de soluções anteriores pode auxiliar na resolução de novos problemas, simplificando o processo. 
        - Por exemplo, para todos os estados, podemos aplicar a seguinte expressão: 

$$percent_{pib} = \frac{(pib_{estado})*100}{pib_{total}}$$

- Abstração
    - a abstração refere-se à remoção de detalhes específicos para se concentrar nas características essenciais de um problema ou sistema. 
    - isso permite criar representações simplificadas que são mais fáceis de manipular e entender. 
    - além disso, com a abstração, poderíamos observar que se tratava apenas de um cálculo de percentual e usar uma funcionalidade já existente na linguagem e/ou ferramenta usada.

- Algoritmos
    - os algoritmos são as sequências de passos ou instruções que irão resolver o problema em si. 
    - observe, a seguir, a apresentação em alto nível dos passos para calcular o percentual do PIB por estado e como poderíamos escrever essas etapas usando a linguagem de programação Python e a biblioteca Pandas. 
    - não se preocupe em entender em detalhes os códigos, foque apenas no conceito de algoritmo e observe que podemos realizar todos os passos com poucas linhas de código.

Para finalizar esta seção, leia esta definição de algoritmo:

> "Um algoritmo é um método finito, escrito em um vocabulário fixo, regido por instruções precisas, que se movem em passos discretos, 1, 2, 3, ..., cuja execução não requer insight, esperteza, intuição, inteligência ou clareza e que mais cedo ou mais tarde chega a um fim" (BERLINSKI, 2002, p.21)."

Esse conceito captura uma importante característica desse pilar do pensamento computacional: a inteligência está na construção do algoritmo, e não na sua execução. Portanto, é uma forma de representar e compartilhar o conhecimento que se tem sobre um determinado problema, podendo ser executado por um computador e entendido por qualquer pessoa que compreenda essa linguagem.

**Análise Percentual do PIB por Estado**
- **Passo 1:** Coletar os dados de entrada

In [None]:
import pandas as pd
df = pd.read_excel('https://drive?id=1hw-SPd8EMBgsaXUKu3FpOhWe4NANgu30')

- **Passo 2:** Calcular o PIB total

In [None]:
pib_total = df['PIB'].sum()

- **Passo 3:** Calcular o percentual do PIB para cada estado

In [None]:
df['PIB Percentual'] = (df['PIB'] / pib_total) * 100

- **Passo 4:** Retornar os percentuais

In [None]:
df.set_index('Estado')['PIB Percentual'].sort_values(ascending=False)


# 2. Linguagem Python e ambiente de desenvolvimento

Python é uma linguagem de programação de alto nível, interpretada e de propósito geral. Criada por Guido van Rossum e lançada pela primeira vez em 1991, Python se destaca por sua sintaxe clara e legível, que facilita tanto o aprendizado quanto a escrita de códigos (LUTZ, 2013). Sua filosofia de design enfatiza a legibilidade do código e permite que os programadores expressem conceitos em menos linhas de código em comparação com outras linguagens, como C++ ou Java.

Python é amplamente utilizado em várias áreas, incluindo desenvolvimento web, automação, análise de dados, aprendizado de máquina, inteligência artificial, desenvolvimento de jogos e mais. Sua vasta biblioteca padrão e a disponibilidade de inúmeros pacotes e frameworks de terceiros tornam-na uma ferramenta poderosa para desenvolvedores.


Enquanto desenvolvedores de software geralmente utilizam IDEs (Integrated Development Environments), ou Ambientes de Desenvolvimento Integrados, muitos analistas de dados preferem utilizar Jupyter Notebooks, que é um ambiente interativo de computação que permite aos usuários criarem e compartilharem documentos que contêm código executável, visualizações e texto narrativo. Originalmente desenvolvido como parte do projeto IPython, o Jupyter tornou-se um projeto independente e agora suporta várias linguagens de programação por meio de um sistema de extensões conhecido como kernels.

<div style="display: flex; align-items: center;">
  <div style="flex: 0.5;">
    <img src="jupyter.png" style="width: 200%; max-width: 500px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
    Python é uma linguagem de programação de alto nível, interpretada e de propósito geral. Criada por Guido van Rossum e lançada pela primeira vez em 1991, Python se destaca por sua sintaxe clara e legível, que facilita tanto o aprendizado quanto a escrita de códigos (LUTZ, 2013). Sua filosofia de design enfatiza a legibilidade do código e permite que os programadores expressem conceitos em menos linhas de código em comparação com outras linguagens, como C++ ou Java.

Python é amplamente utilizado em várias áreas, incluindo desenvolvimento web, automação, análise de dados, aprendizado de máquina, inteligência artificial, desenvolvimento de jogos e mais. Sua vasta biblioteca padrão e a disponibilidade de inúmeros pacotes e frameworks de terceiros tornam-na uma ferramenta poderosa para desenvolvedores.

  </div>
</div>

Jupyter Notebooks promovem o conceito de Literate Programming, ou Programação Literária, um paradigma de programação introduzido por Donald Knuth em 1984. 
Knuth descreveu a Programação Literária como a combinação de "linguagem de programação" e "linguagem natural" para criar um documento coeso que pode ser lido como um ensaio explicativo. Esse documento contém fragmentos de código que são compilados e executados, mas também inclui explicações detalhadas, introdução a conceitos e outros comentários que ajudam a contextualizar o código. Desse modo, um notebook permite combinar código executável, visualizações e texto explicativo em um único documento interativo. Isso torna os notebooks uma escolha ideal para cientistas de dados, pesquisadores e educadores que desejam compartilhar suas análises de forma transparente e reprodutível.


A ideia central é que um programa deve ser escrito de forma que seja compreensível tanto para humanos quanto para computadores. Isso é alcançado integrando o código com a documentação, as explicações e os comentários em um formato narrativo. A Programação Literária facilita a leitura e compreensão do código, tornando-o mais acessível e fácil de manter. 

<div style="display: flex; align-items: center;">
  <div style="flex: 3.5;">
    <img src="anaconda-navigator.png" style="width: 400%; max-width: 500px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
  
  Para utilizar esse ambiente, será necessária a instalação de diversas ferramentas e bibliotecas. Contudo, esse processo poderá ser facilitado mediante uma distribuição voltada para a ciência de dados e o aprendizado de máquina denominada Anaconda. Essa distribuição facilita a instalação e o gerenciamento de bibliotecas e dependências, o que é especialmente útil em projetos complexos. Alguns componentes e benefícios do Anaconda incluem:

  - Conda: um poderoso gerenciador de pacotes e ambientes que facilita a instalação de bibliotecas específicas e a criação de ambientes isolados.

  - Jupyter Notebook: Ferramenta interativa para desenvolvimento de código, que permite combinar código, texto, visualizações e recursos multimídia em um único documento.

  - Anaconda Navigator: interface gráfica que facilita a gestão de pacotes, ambientes e aplicações.
  </div>
</div>


### SAIBA MAIS

DataCamp
Você também pode ler um excelente tutorial elaborado pela DataCamp.
Anaconda
Para mais informações sobre como baixar e instalar o Anaconda, você pode visitar o site oficial.

## 2.1 Google Colaboratory

<div style="display: flex; align-items: center;">
  <div style="flex: 3.5;">
    <img src="google-colaboratory.png" style="width: 400%; max-width: 500px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
  
  Uma alternativa para iniciar em análise de dados sem ter que instalar essas ferramentas e bibliotecas é o **Google Colab** ou **Colaboratory**. Esse é um ambiente de desenvolvimento interativo fornecido pelo Google que permite escrever e executar código Python diretamente no navegador, sem a necessidade de instalar nada no seu computador. Ele já vem instalado com as bibliotecas mais utilizadas para análise de dados e permite a instalação de novas bibliotecas quando necessárias. Para utilizá-lo, é preciso ter uma conta Google e conexão com a Internet. 
A Figura lateral apresenta um Jupyter Notebook aberto no Google Colab.

Neste momento, iremos optar pelo Google Colab, ou Colaboratory, por já vir com as principais bibliotecas instaladas e permitir o fácil compartilhamento dos notebooks. Para começar a usar o Google Colab, siga os seguintes passos:

  - Para começar a usar o Google Colab, você precisa de uma conta Google. Com ela, você irá acessar o site:

  </div>
</div>

<div style="display: flex; align-items: center;">
  <div style="flex: 3.5;">
    <img src="google-colaboratory-passos-1.png" style="width: 400%; max-width: 500px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
  
  - Para começar a usar o Google Colab, você precisa de uma conta Google. Com ela, você irá acessar o site, Na página inicial do Google Colab, clicar em "Novo Notebook" para criar um ambiente de trabalho e executar o passo-a-passo ilustrado na figura lateral
  
  </div>
</div>

  </div>
</div>

<div style="display: flex; align-items: center;">
  <div style="flex: 3.5;">
    <img src="google-colaboratory-passos-2.png" style="width: 400%; max-width: 500px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
  
  - Após a criação do Notebook, clique no título do Notebook (inicialmente "Untitled") no topo da página para renomeá-lo conforme sua necessidade. Por exemplo, escreva ‘Primeiro Notebook’:
  
  </div>
</div>


<div style="display: flex; align-items: center;">
  <div style="flex: 3.5;">
    <img src="google-colaboratory-passos-3.png" style="width: 400%; max-width: 500px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
  
  - A partir desse primeiro notebook, você já será capaz de escrever código em Python, como os que serão apresentados neste texto. A interface gráfica do notebook apresenta alguns elementos que estão destacados na Figura 8, passe o mouse sobre os pontos azuis para conhecer
  
  </div>
</div>

## 2.2 Tipos de dados e operações


<div style="display: flex; align-items: center;">
  <div style="flex: 1.5;">
    <img src="componentes-sistema.png" style="width: 200%; max-width: 300px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
  
  Em computação, "dados" referem-se a qualquer conjunto de valores ou informações que podem ser processados por um computador. Esses dados podem representar uma variedade de coisas, incluindo texto, números, imagens, áudio, vídeo, sinais, medições e qualquer outra informação que possa ser digitalizada e utilizada para fins de cálculo, análise ou armazenamento. Em computação, estamos sempre processando dados de entrada que irão gerar novos dados de saída, como na Figura 9. Observe que a saída de dados de um processo poderá ser a entrada para outro processo.

  - Como exemplo, considere que você está recebendo um salário de R$2.500 e lhe foi prometido um aumento de 15% caso você conclua um curso sobre ciência de dados. Você rapidamente poderia colocar na calculadora do seu celular. Mas, será que poderíamos fazer um script que calculasse o valor final para qualquer valor inicial e percentagem? Quais seriam os passos? Como descrito anteriormente, primeiro precisamos definir quais serão as entradas de dados. Nesse caso, teríamos o salário atual e a percentagem de aumento, que, no exemplo anterior, eram os valores 2500 e 15. Porém, para escrever nossos algoritmos, não podemos pensar em valores específicos, como 2500 e 15, temos que abstrair esses valores. Isso permitirá focar nas relações que são verdadeiras independentemente de um valor específico.
  
  </div>
</div>

<div style="display: flex; align-items: center;">
  <div style="flex: 1.5;">
    <img src="pitagoras.png" style="width: 200%; max-width: 300px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
  
  - Você sabia que séculos atrás os matemáticos já usavam variáveis para descrever as propriedades e relações entre os números? Como exemplo, temos a famosa relação entre os lados de um triângulo retângulo descrita na figura ao lado.
  
  </div>
</div>

É importante destacar que existem algumas ressalvas relacionadas ao nome de variáveis em linguagens de programação, como a restrição no uso de espaços e acentos. Então, a fórmula para o novo salário após um aumento, dado o salário atual e a percentagem de aumento, pode ser descrita da seguinte maneira:

$$
novo\_salario = salario\_atual \times \left(1 + \frac{percentagem\_aumento}{100}\right)
$$

**Comando de atribuição (=)**  

Para associar valores para as variáveis de entrada: $salario_{atual}$ e $porcentagem_{aumento}$. Para a manipulação de dados, estaremos sempre aplicando operações e atribuindo resultados para variáveis. A sintaxe básica do comando de atribuição é bem simples:
> = valor

Para o nosso exemplo, podemos atribuir o valor `2500` para a variável $salario_{atual}$  
$$salario_{atual} = 2500$$  

E depois realizar o mesmo com a variável $porcentagem_{aumento}$:
$$porcentagem_{aumento} = 15$$

Nesse exemplo simples, o processamento será o cálculo do novo_salario, que terá como atribuição a expressão da fórmula que apresentamos anteriormente. Para esse cálculo, iremos usar operadores aritméticos e parênteses de modo similar ao que aprendemos nas aulas de matemática. 

**Operadores aritméticos**  

Existem algumas diferenças nos símbolos de multiplicação e divisão, como demonstrado na seguinte tabela abaixo:

| Operador | Descrição               | Exemplo                   |
|----------|-------------------------|---------------------------|
| +        | Adição                  | `a = 5 + 3` (a será 8)    |
| -        | Subtração               | `b = 7 - 2` (b será 5)    |
| *        | Multiplicação           | `c = 4 * 6` (c será 24)   |
| /        | Divisão                 | `d = 10 / 2` (d será 5.0) |
| //       | Divisão inteira         | `e = 10 // 3` (e será 3)  |
| %        | Módulo (resto da divisão)| `f = 10 % 3` (f será 1)   |
| **       | Exponenciação           | `g = 2 ** 3` (g será 8)   |



O algoritmo anterior foi capaz de demonstrar os componentes de entrada, o processamento e a saída de dados. Contudo, para simplificação, foram atribuídos valores constantes para as variáveis de entrada salario_atual e porcentagem_aumento. Em problemas reais, as entradas de dados são fornecidas por meio de arquivos, acesso à internet ou por um usuário. No caso de análise de dados, o mais comum serão arquivos de dados, como a planilha que estamos usando como exemplo.

Em algumas situações, pode ser necessário receber a entrada de dados do usuário através do teclado. Para isso, temos a função input() que exibe uma mensagem (argumento opcional) e aguarda o usuário digitar algo. O que é digitado pelo usuário retorna e pode ser atribuído a uma variável (como fizemos com entrada, no exemplo anterior). O programa completo, com entrada de dados via função input(), ficaria como explicitado a seguir:

```python
# entrada 
salario_atual = input("Entre com salário atual: ") 
porcentagem_aumento = input("Entre com o percentual de aumento: ") 
# processamento 
 novo_salario = salario_atual * ( 1 + porcentagem_aumento / 100)
# saída 
print (novo_salario)
```

In [1]:
# entrada 
salario_atual = input("Entre com salário atual: ") 
porcentagem_aumento = input("Entre com o percentual de aumento: ") 
# processamento 
novo_salario = salario_atual * ( 1 + porcentagem_aumento / 100)
# saída 
print (novo_salario)

TypeError: unsupported operand type(s) for /: 'str' and 'int'

Ao tentar executar esse código no Google Colab (ou em qualquer outro ambiente), teremos um erro. O que significa esse `str` e esse `int`? O que essa mensagem quer nos dizer? O que seria `TypeError`? Para sermos capazes de responder essas perguntas, precisamos entender o que são valores e tipos de dados.
- Um dado (ou um valor) é a unidade básica trabalhada por nossos scripts, como um texto ou um número.   

Os dados que vimos até aqui foram 2500, 15 e “Entre com o salário atual”. Esses dados pertencem a diferentes tipos, enquanto os dois primeiros são números, o terceiro é uma string. Isso mesmo, em linguagens de programação, os textos são chamados de strings e delimitados por aspas (simples ou duplas).

A linguagem Python permite que saibamos os tipos dos valores associados às variáveis através do comando type:


In [2]:
print(type(2500))
print(type("Entre com o salário atual"))

<class 'int'>
<class 'str'>


Observe que, para a string, ele imprimiu `str`; mas, para o número, ele imprimiu `int`. Será que existem diferentes tipos de números? Qual seria o tipo do número 2500, 89?
Antes de testar, precisamos lembrar que as linguagens de programação seguem geralmente o padrão americano para representar números. Nesse caso, a separação de decimal é ponto em vez de vírgula:

In [None]:
print(type(2500.89))

Observe que realmente existem diferentes tipos de número, enquanto o tipo int representa um número inteiro, o tipo float representa os números reais. A tabela a seguir, sumariza os tipos básicos:

| Tipo de Dado | Descrição                        | Exemplo               |
|--------------|----------------------------------|-----------------------|
| int          | Números inteiros                 | `x = 10`              |
| float        | Números de ponto flutuante       | `y = 3.14`            |
| str          | Sequências de caracteres         | `texto = "Olá, mundo!"`|
| bool         | Valores booleanos (Verdadeiro/Falso) | `verdadeiro = True`    |


Agora podemos entender melhor o erro anterior. A função `input()` sempre retorna uma string, logo, o valor das variáveis salario_atual e porcentagem_aumento eram strings. Desse modo, a linguagem não permitiu realizar operações aritméticas entre um valor inteiro e strings, causando um erro de tipo `(TypeError)`.


A soma (ou a divisão, como nesse caso) entre uma `string` e um `número inteiro` não é uma operação válida ou definida. Para solucionar esse problema, a linguagem fornece operações que permitem converter dados de um tipo em outro. Por exemplo, podemos converter a saída `string` da função `input()` para um valor numérico usando funções como `int()` ou `float()`. 

Antes de realizar a conversão, podemos aproveitar para falar sobre precedência na avaliação de expressões. Como aprendemos nas aulas de matemática, os valores entre parênteses são avaliados primeiro. Entre as operações, a multiplicação e a divisão têm precedência sobre a soma e a subtração. Por isso, no nosso exemplo, o primeiro erro identificado foi na divisão entre a string “15” e o inteiro 100. Veja que a mensagem de erro está mostrando que a operação de divisão entre uma string e um inteiro não é suportada.

Reescrevendo o nosso script que calcula o valor do novo salário, iremos converter as entradas para float, para não restringir nossas entradas a valores inteiros. O código final ficaria da seguinte forma:

In [3]:
salario_atual = float( input("Entre com salário atual: ") ) 
porcentagem_aumento = float(input("Entre com o percentual de aumento: ")) 
novo_salario = salario_atual * ( 1 + porcentagem_aumento / 100)
print (novo_salario)

110.00000000000001


A tabela a seguir descreve as funções de conversão entre outros tipos, inclusive para o tipo booleano sobre o qual já iremos falar.

| Função   | Descrição                        | Exemplo               |
|----------|----------------------------------|-----------------------|
| int()    | Converte para inteiro            | `x = int(3.14)`       |
| float()  | Converte para ponto flutuante    | `y = float("3.14")`   |
| str()    | Converte para string             | `texto = str(123)`    |
| bool()   | Converte para booleano           | `verdadeiro = bool(1)`|


No exemplo do cálculo do novo salário, foi necessária a utilização de operações aritméticas. Além dessas operações, em programação, é comum haver a necessidade de comparar grandezas. Por exemplo:
- Se um dado número é maior ou menor que outro, o resultado dessa comparação será “sim” ou “não”.
- O resultado dessa comparação será “sim” ou “não”, mas na programação é usado um tipo de dado chamado de lógico ou booleano. Ao invés de “sim” ou “não”, os valores lógicos são True ("verdadeiro" em inglês) e False ("falso" em inglês).

Você percebeu que o operador de igualdade é representado por dois sinais de igual (`==`), enquanto o operador de atribuição é representado por apenas um sinal de igual (`=`)? Observe que se tentarmos usar o operador de atribuição no lugar do operador relacional, teremos um erro


A tabela a seguir sumariza os operadores relacionais em Python, com descrições e exemplos:

| Operador | Descrição            | Exemplo | Resultado |
|----------|-----------------------|---------|-----------|
| ==       | Igualdade             | 5 == 5  | True      |
| !=       | Diferente             | 5 != 3  | True      |
| >        | Maior que             | 5 > 3   | True      |
| <        | Menor que             | 3 < 5   | True      |
| >=       | Maior ou igual que    | 5 >= 5  | True      |
| <=       | Menor ou igual que    | 3 <= 5  | True      |


Uma expressão que usa operadores relacionais resulta em um valor booleano, logo é denominada de expressão booleana (ou lógica). Os operadores relacionais, como os aritméticos, são binários, uma vez que são aplicados a dois operandos. Como no exemplo anterior, o operador de igualdade foi aplicado a dois operandos (42 e 42) e produziu um valor booleano verdadeiro (True), posto que os operandos eram iguais. 
Para comparar mais de dois valores, precisamos combinar os valores booleanos usando um dos três operadores lógicos:
| Operador | Descrição                                           | Exemplo     | Resultado |
|----------|-----------------------------------------------------|-------------|-----------|
| and      | Retorna True, se ambas as expressões forem verdadeiras. | True and False | False     |
| or       | Retorna True, se pelo menos uma expressão for verdadeira. | True or False  | True      |
| not      | Inverte o valor lógico de uma expressão.            | not True    | False     |


Considere um algoritmo que verifica a validade de um triângulo dadas as dimensões do seus lados. Para um triângulo ser válido, a soma de dois lados quaisquer deve ser sempre maior que o terceiro lado.
Como transcrever isso em uma expressão booleana?

Da mesma forma que fizemos anteriormente, vamos abstrair os três lados por meio de três variáveis (a, b e c). Então, a soma de a com b deve ser maior que c; a soma de a com c deve ser maior que b; e a soma de b com c maior que a. Isso poderia ser descrito com a expressão do script a seguir:

In [4]:
a = 10
b = 10 
c = 10 
triangulo_valido = a + b > c and a + c > b and b + c > a 
print("é um triângulo válido? ", triangulo_valido)

é um triângulo válido?  True




<div style="display: flex; align-items: center;">
  <div style="flex: 3.5;">
    <img src="traingulo.png" style="width: 400%; max-width: 500px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
  
  Nesse exemplo, serão impressos os valores em inglês: True ou False. Adicionalmente, talvez você lembre que esse seria um exemplo de um triângulo equilátero, uma vez que os três lados são iguais. 
Temos também o triângulo com 2 lados iguais (isóceles) e todos os lados diferentes (escaleno)
  Com essas expressões identificadas, poderíamos incluir essa verificação ao exemplo anterior.
Para identificar se é um triângulo **equilátero**, basta verificar se todos os lados são iguais:
```python
a == b and b == c
```
No caso do **isósceles**, precisamos verificar se um dos quaisquer pares de lado são iguais:
```python
a == b or a == c or b == c
```

Já no **escaleno**, precisamos verificar se todos os pares possíveis são diferentes:
```python
a != b and a != c and b != c
```
  </div>
</div>

Observe que, no exemplo, todas as linhas de código serão sempre executadas. Mesmo quando não é um triângulo válido, os testes serão executados. Além disso, mesmo quando é identificado que se trata de um triângulo equilátero, o script continuará testando os outros dois tipos. 


In [5]:
a = 10
b = 8
c = 7

triangulo_valido = a + b > c and a + c > b and b + c > a
print("É um triângulo válido? ", triangulo_valido)

eh_equilaterio = triangulo_valido and (a == b == c)
print("É um triângulo equilátero? ", eh_equilaterio)

eh_isosceles = triangulo_valido and ((a == b or a == c or b == c) and not (a == b == c))
print("É um triângulo isósceles? ", eh_isosceles)

eh_escaleno = triangulo_valido and (a != b and a != c and b != c)
print("É um triângulo escaleno? ", eh_escaleno)

É um triângulo válido?  True
É um triângulo equilátero?  False
É um triângulo isósceles?  False
É um triângulo escaleno?  True


## 2.3 Abstraindo expressões e comandos

Anteriormente, usamos a definição de triângulos para exemplificar o uso de expressões lógicas e operadores relacionais. Vimos que a seguinte expressão definiria um triângulo válido:

> a + b > c and a + c > b and b + c > a

Ao olhar essa expressão isoladamente, daqui a alguns meses, poucos de nós iremos lembrar o que ela definia. Por isso, seria melhor nomearmos essa expressão criando uma abstração, assim, ela poderia ser aplicada a outras variáveis e valores.

Linguagens de programação, como Python, permitem que criemos nossas próprias abstrações. Podemos abstrair expressões complexas e sequências de comandos por meio de funções que possuam um nome e opcionalmente alguns parâmetros de entrada, como na seguinte estrutura:
``` python
def NOME( PARÂMETROS ): 
       COMANDOS
```
Agora que sabemos as regras e convenções para os identificadores, poderemos criar a função que irá abstrair a expressão que identifica se um dado triângulo é válido:

In [7]:
def triangulo_valido(a, b, c):
    resultado = a + b > c and a + c > b and b + c > a
    return resultado

No caso do isósceles, precisamos verificar se um dos quaisquer pares de lado são iguais:

In [10]:
print(triangulo_valido(10, 10, 10)) # True (equilátero)
print(triangulo_valido(10, 8, 10)) # True (isosceles)
print(triangulo_valido(10, 7, 8)) # True (escaleno)

True
True
True


Ou podemos criar variáveis e então passá-las como parâmetros:

In [9]:
lado_a = 10
lado_b = 10
lado_c = 8
print(triangulo_valido(lado_a,lado_b, lado_c))

True


Funções são construções relativamente simples e, com um pouco de prática, você conseguirá identificar partes de um programa ou script que poderão ser “encapsuladas” como uma função.   
- Encapsulamento é uma palavra que você irá encontrar nos livros de programação e computação. 
    - Ela se refere à prática de esconder detalhes específicos de implementação e expor apenas o que é necessário para usar uma função. 
    - Isso ajuda a manter o código organizado e fácil de usar. Como se fosse uma caixa, ou um controle remoto, que expõe alguns botões que executam determinadas operações. 
    - Quando usamos a função triângulo válido, não precisamos mais nos preocupar com a sua estrutura interna, da mesma forma que não precisamos saber como um controle remoto funciona.

link: https://docs.python.org/pt-br/3.10/tutorial/controlflow.html#defining-functions


## 2.4 Estruturas de Dados

Como vimos anteriormente, os tipos de dados básicos incluem: int, float, bool e str. Esses tipos podem ser agrupados através de estruturas de dados, que atuam como contêineres ou coleções, que estão apresentados na seguinte tabela:

| Tipo de Dado | Descrição                            | Exemplo                    |
|--------------|--------------------------------------|----------------------------|
| tuple        | Sequência imutável de elementos      | `tupla = (1, 2, 3)`        |
| list         | Sequência mutável de elementos       | `lista = [1, 2, 3, 4]`     |
| dict         | Coleção de pares chave-valor         | `dicionario = {'chave': 'valor'}` |
| set          | Coleção não ordenada de elementos únicos | `conjunto = {1, 2, 3}`      |


Dentre essas coleções, é usual iniciar a explicação pelas listas, por serem as mais utilizadas. Contudo, aqui vamos começar com as `tuplas`, que são `coleções e de elementos`, tornando-as úteis para representar dados que `não devem ser modificados ao longo do tempo` e que representam uma unidade. Por exemplo, os lados de um triângulo poderiam estar agrupados em uma tupla:

In [12]:
ex_triangulo_equilatero = (10,10,10)
ex_triangulo_isosceles = (10, 8, 10)
ex_triangulo_escaleno = (10, 7, 8)


Nesse exemplo, cada triângulo é uma tupla com a dimensão de cada lado. Depois de criada a tupla, podemos acessar os valores individuais através de seu índice especificado entre colchetes []. 

In [13]:
a = ex_triangulo_escaleno[0] # primeiro elemento
b = ex_triangulo_escaleno[1] # segundo elemento
c = ex_triangulo_escaleno[2] # terceiro elemento

Observe que os índices começam em 0. Além do acesso por índices, no Python, podemos realizar o desempacotamento de tuplas, que permite que você atribua os valores da tupla a variáveis individuais em uma única linha de código. Esse método é muito útil quando você sabe exatamente quantos elementos existem na tupla.

In [14]:
a, b, c = ex_triangulo_escaleno

Voltando ao exemplo da função que verifica a validade de um triângulo, poderíamos passar uma tupla como parâmetro de entrada da função ao invés dos lados isoladamente:

In [16]:
def triangulo_valido(triangulo):
    a, b, c = triangulo  # Desempacotando a tupla
    resultado = a + b > c and a + c > b and b + c > a
    return resultado

triangulo_1 = (10, 10, 10)
print(triangulo_valido(triangulo_1))

True


Com base na característica de ordenação, faz sentido falarmos em um primeiro, segundo e terceiro elemento, conforme vimos no exemplo anterior. A imutabilidade não permite que os valores de uma tupla sejam modificados depois da sua criação:

In [15]:
triangulo_1 = (10, 10, 10)
triangulo_1[1] = 30

TypeError: 'tuple' object does not support item assignment

Além disso, não existem operações que permitam adicionar ou remover elementos como é possível nas listas, que também são ordenadas, porém mutáveis. Uma lista pode ser criada usando colchetes [] e separando os itens por vírgulas. Os itens podem ser de diferentes tipos de dados (inteiros, floats, strings, listas etc.). Veja um exemplo de uma lista com nomes de frutas:

In [17]:
frutas = ['maçã', 'banana', 'cereja', 'damasco']


As listas podem ser acessadas de modo similar às tuplas, com índice iniciando em 0. Contudo, diferentemente das tuplas, as listas são mutáveis. Logo, é possível modificar os valores, além de acessá-los:

In [18]:
print(frutas[3]) # damasco
frutas[3] = 'laranja'
print(frutas) # ['maçã', 'banana', 'cereja', 'laranja']

damasco
['maçã', 'banana', 'cereja', 'laranja']


Também podemos remover e adicionar novos elementos a uma lista. Observe que a função `append` adiciona um novo item ao final da lista.

In [19]:
frutas.remove("cereja")
print(frutas) # ['maçã', 'banana', 'laranja']
frutas.append('caqui')
print(frutas) # ['maçã', 'banana', 'laranja', 'caqui']


['maçã', 'banana', 'laranja']
['maçã', 'banana', 'laranja', 'caqui']


Assumindo uma lista com os seguintes itens ['maçã', 'banana', 'cereja', 'laranja'], poderíamos remover cereja pelo índice:

In [None]:
print(frutas) # ['maçã', 'banana', 'cereja', 'laranja']
elemento_removido = frutas.pop(2) # retorna cereja
print(frutas) # ['maçã', 'banana', 'laranja']

Além de adicionar um elemento, podemos combinar duas listas através da operação de concatenação, que usa o mesmo símbolo de adição ‘+’:

In [None]:
frutas1 = ["maçã", "banana"]
frutas2 = ["morango", "uva"]
print (frutas1+frutas2) #['maçã', 'banana','morango', 'uva']

Em relação ao acesso, é possível acessar mais de um elemento com o recurso denominado fatiamento. O fatiamento (ou slicing) em Python é uma técnica poderosa que permite acessar subsequências, como listas, strings e tuplas. A sintaxe básica para o fatiamento está descrita abaixo. 

> SEQUENCIA [INICIO: FIM: PASSO]

- Início: o índice inicial (inclusivo) do fatiamento (se omitido, assume o valor 0).
- Fim: o índice final (exclusivo) do fatiamento (se omitido, vai até o final da sequência).
- Passo: o intervalo entre elementos selecionados (se omitido, assume o valor 1).


Por exemplo, usando o exemplo das frutas, Podemos selecionar o segundo, o terceiro e o quarto valor:

In [None]:
frutas = ["maçã", "banana", "cereja", "damasco", "kiwi"]
print(frutas[1:4])  # ['banana', 'cereja', 'damasco']

Quando usamos um índice final no fatiamento, como em sequencia[início:fim], o elemento no índice fim não é incluído no resultado. Esse comportamento é conhecido como fatiamento exclusivo. Por isso, o elemento de índice 4 não foi incluído. Se quiséssemos selecionar todos os valores a partir do segundo elemento, poderíamos omitir o fim:

In [None]:
print(frutas[1:])  # ['banana', 'cereja', 'damasco', 'kiwi']

Podemos selecionar elementos de 2 em 2, definindo o passo:

In [None]:
print(frutas[0:4:2])  # ['maçã', 'cereja']

Por fim, o operador `in` é usado para verificar a existência de um elemento dentro de uma sequência, como uma lista. Ele retorna um valor `booleano` (`True` ou `False`), dependendo de o elemento estar presente na lista ou não. Por exemplo:

Obs: saiba mais sobre listas clicando aqui https://panda.ime.usp.br/panda/static/pensepy/09-Listas/listas.html

In [None]:
frutas = ['maçã', 'banana', 'laranja']
print ('banana' in frutas) # True

Outra estrutura muito relevante para a representação de dados são os dicionários que armazenam pares de chave e valor. Um dicionário é definido usando chaves {}, e os pares chave-valor são separados por dois pontos :. Usando o exemplo da planilha com dados por estado, cada linha dela poderia ser representada por um dicionário:

In [None]:
ma = {
    'Estado': 'Maranhão',
    'Região': 'Nordeste',
    'População': 6800605,
    'PIB': 124981000000
}

Com a definição anterior, poderíamos acessar os valores utilizando a sintaxe dicionario[chave] da seguinte forma:

In [None]:
print(ma['Região'])  # Nordeste
print(ma['População'])  # 6800605

Voltando ao exemplo da planilha, poderíamos representar os mesmos dados como uma lista de dicionários. Como demonstração, no exemplo a seguir, foram definidos apenas dois estados.

In [None]:
estados = [
  {'Estado': 'Maranhão', 'Região': 'Nordeste',
  'População': 6800605, 'PIB': 124981000000},
  {'Estado': 'Mato Grosso', 'Região': 'Centro-Oeste',
  'População': 3784239, 'PIB': 233390000000}
]

Observe o uso de dicionários e listas para representar um dado. Nesta unidade, iremos fazer uma breve introdução à biblioteca Pandas, que é uma ferramenta poderosa para a manipulação e análise de dados em Python. Os seus recursos são suportados principalmente pelo uso dos DataFrames, que poderiam ser criados a partir de listas de dicionários.

In [20]:
import pandas as pd

estados = [
    {'Estado': 'Maranhão', 'Região': 'Nordeste', 'População': 6800605, 'PIB': 124981000000},
    {'Estado': 'Mato Grosso', 'Região': 'Centro-Oeste', 'População': 3784239, 'PIB': 233390000000}
]

df_estados = pd.DataFrame(estados)
df_estados

Unnamed: 0,Estado,Região,População,PIB
0,Maranhão,Nordeste,6800605,124981000000
1,Mato Grosso,Centro-Oeste,3784239,233390000000


Listas, tuplas e dicionários serão as coleções que iremos utilizar com maior frequência na análise de dados. Porém, os conjuntos (sets) podem nos ajudar em alguns problemas. Diferentemente das listas e tuplas, os conjuntos são coleções não ordenadas de elementos únicos. Eles não permitem elementos duplicados e não mantêm a ordem dos elementos. Algumas operações básicas com conjuntos incluem:

In [21]:
# Criação de conjuntos
meu_set = {1, 2, 3}  # criação
print("Conjunto inicial:", meu_set)

# Adiciona elemento
meu_set.add(4)
print("Após adicionar 4:", meu_set)

# Remove elemento
meu_set.remove(2)
print("Após remover 2:", meu_set)

# Definindo outros conjuntos para operações de união, interseção e diferença
set1 = {1, 2, 3, 4}
set2 = {3, 4, 5, 6}

# União dos conjuntos set1 e set2
uniao = set1.union(set2)
print("União de set1 e set2:", uniao)

# Interseção dos conjuntos set1 e set2
intersecao = set1.intersection(set2)
print("Interseção de set1 e set2:", intersecao)

# Diferença dos conjuntos set1 e set2
diferenca = set1.difference(set2)
print("Diferença de set1 e set2:", diferenca)


Conjunto inicial: {1, 2, 3}
Após adicionar 4: {1, 2, 3, 4}
Após remover 2: {1, 3, 4}
União de set1 e set2: {1, 2, 3, 4, 5, 6}
Interseção de set1 e set2: {3, 4}
Diferença de set1 e set2: {1, 2}


Os conjuntos são úteis para operações matemáticas, como união e interseção, e para remover duplicatas de uma lista.

## 2.5 Operações sobre strings

Agora que você já conhece as operações sobre listas e tuplas, podemos aproveitar esse conhecimento para introduzir as operações sobre strings. Em Python, uma string é uma sequência de caracteres, semelhante a coleções como listas e tuplas. Assim como uma lista, uma string pode ser vazia ou conter vários caracteres.

> Fique atento: Strings se comportam de modo semelhante ao de outras coleções, como as listas, contudo, strings não são listas de caracteres.

Assim como podemos juntar duas listas usando o operador de concatenação +, também podemos concatenar duas strings.


In [None]:
str1 = "Olá,"
str2 = " mundo!"
print(str1 + str2)  # Olá, mundo!


Assim como listas têm métodos, como: `.append()` e `.pop()`; strings têm métodos, como: `.upper()`, `.lower()`, `.strip()`, `.replace()`.

In [None]:
mensagem = " Olá, Mundo! "
print(mensagem.strip())  # Remove espaços: "Olá, Mundo!"
print(mensagem.lower())  # olá, mundo!
print(mensagem.replace("Mundo", "Universo"))  # Olá, Universo!


Ainda, como nas listas, podemos verificar a presença de substrings em uma string usando o operador in.

In [None]:
frase = "Python é uma linguagem poderosa."
print("Python" in frase)  # True


Por fim, a função `split()` é utilizada para dividir uma string em uma lista de substrings com base em um separador especificado. Ela é uma maneira conveniente de quebrar uma string em partes menores, nas quais um determinado padrão (o separador) é encontrado. Por exemplo:


In [None]:
numeros = "1, 2, 3, 4, 5"
lista_numeros = numeros.split(", ")
print(lista_numeros)  # ['1', '2', '3', '4', '5']


## 2.6 Controlando o fluxo de execução

Os scripts que escrevemos até aqui eram sempre sequenciais, ou seja, todas as linhas de código eram sempre executadas. Códigos sequenciais serão suficientes para realizar muitas análises de dados com Python, uma vez que suas bibliotecas de alto nível já abstraem muitos comandos. A maioria das tarefas envolverá carregamento e transformação de dados. Por isso, nesta unidade, iremos ser bem sucintos em relação ao controle de fluxo. Contudo, em alguns casos, vamos precisar controlar o fluxo de execução, ou seja, definir quais partes do código serão executadas e quantas vezes.

Vimos anteriormente que o script do exemplo dos triângulos continuava verificando o tipo de triângulo mesmo quando os lados não representavam um triângulo válido. Depois, quando ele verificava que se tratava de um triângulo equilátero, ele continuava executando os testes para os outros dois tipos desnecessariamente. Para problemas como esse, precisamos usar um comando de decisão, também chamado de comando de seleção.

A forma mais simples de seleção é o comando if, com a seguinte sintaxe:
```python
if EXPRESSÃO BOOLEANA:
    COMANDOS_1  # executados se condição tem valor True
else:
    COMANDOS_2  # executados se condição tem valor False
```

Observe, que o primeiro if já verifica se o triângulo é válido, caso contrário (else) o algoritmo já irá imprimir: “Não é um triangulo válido”. Os testes para os tipos de triângulo só serão executados quando forem válidos. Talvez você já tenha utilizado ou visto um fluxograma, que é outra maneira de descrever um algoritmo. O fluxograma da figura ao lado descreve os testes que verificam o tipo de um triângulo.  

<div style="display: flex; align-items: center;">
  <div style="flex: 3.5;">
    <img src="fluxo-triangulo.png" style="width: 500%; max-width: 500px;"/> <!-- Ajuste a largura máxima conforme necessário -->
  </div>
  <div style="flex: 10; margin-left: 100px;"> <!-- Aumente o flex para dar mais espaço ao texto e adicione margin-left para espaço -->
  
  - Como exemplo, considere que você está recebendo um salário de R$2.500 e lhe foi prometido um aumento de 15% caso você conclua um curso sobre ciência de dados. Você rapidamente poderia colocar na calculadora do seu celular. Mas, será que poderíamos fazer um script que calculasse o valor final para qualquer valor inicial e percentagem? Quais seriam os passos? Como descrito anteriormente, primeiro precisamos definir quais serão as entradas de dados. Nesse caso, teríamos o salário atual e a percentagem de aumento, que, no exemplo anterior, eram os valores 2500 e 15. Porém, para escrever nossos algoritmos, não podemos pensar em valores específicos, como 2500 e 15, temos que abstrair esses valores. Isso permitirá focar nas relações que são verdadeiras independentemente de um valor específico.
  

  
  </div>
</div>
Fonte: Adaptado de https://www.alliferschool.com/2020/05/sequencia-didatica-triangulos.html.

1. Início
2. Os três lados têm medidas iguais?
   - Sim: É triângulo equilátero e triângulo isósceles.
   - Não: Verifique se dois lados têm medidas iguais.
3. Dois lados têm medidas iguais?
   - Sim: É triângulo isósceles.
   - Não: É triângulo escaleno.
4. Fim




In [22]:
def tipo_triangulo(a, b, c):
    if a == b == c:
        return "Triângulo equilátero e triângulo isósceles."
    elif a == b or a == c or b == c:
        return "Triângulo isósceles."
    else:
        return "Triângulo escaleno."

# Exemplos de uso
print(tipo_triangulo(10, 10, 10))  # Triângulo equilátero e triângulo isósceles.
print(tipo_triangulo(10, 10, 5))   # Triângulo isósceles.
print(tipo_triangulo(10, 5, 7))    # Triângulo escaleno.


Triângulo equilátero e triângulo isósceles.
Triângulo isósceles.
Triângulo escaleno.


Além de selecionar (ou decidir) quais partes de um script serão executadas, podemos definir quantas vezes elas serão executadas. Por exemplo, o comando `while` é usado para repetir um bloco de código enquanto uma expressão lógica for verdadeira. Ele é útil quando não se sabe previamente quantas vezes um bloco de código deve ser repetido, posto que essa repetição depende de uma condição que pode mudar ao longo do tempo.

Para entender como esse comando funciona, vamos ilustrar com o algoritmo babilônico, também conhecido como método de Herão, que é um dos métodos mais antigos para calcular a raiz quadrada de um número. O algoritmo babilônico, para encontrar a raiz quadrada de um número n, funciona da seguinte forma:

- Comece com uma estimativa inicial $x$. Pode ser qualquer valor positivo; geralmente, $x=\frac{n}{2}$ é uma boa escolha. 
- Melhore a estimativa usando a fórmula: $x =(x + \frac{n}{x})$
- Repita o passo 2 até que a diferença entre a nova estimativa e a estimativa anterior seja menor que um valor de tolerância pré-definido (indicando que a estimativa não está mudando significativamente).

Observem que não sabemos quantas vezes será necessário repetir o passo 2, logo é um bom exemplo de quando precisaríamos usar o while.

In [23]:
def raiz_quadrada(n, tolerancia=1e-10): 
       estimativa = n / 2.0 
       diferenca = tolerancia + 1 # Qualquer valor maior que a tolerância 
       while diferenca > tolerancia: 
            # Calcule uma nova estimativa 
            nova_estimativa = (estimativa + n / estimativa) / 2 
            # Atualize a diferença 
            diferenca = abs(nova_estimativa - estimativa) 
            # Atualize a estimativa para o próximo ciclo 
            estimativa = nova_estimativa 
       return nova_estimativa
           # Exemplo de uso
numero = 25 
resultado = raiz_quadrada(numero) 
print(f"A raiz quadrada de {numero} é aproximadamente {resultado}")

A raiz quadrada de 25 é aproximadamente 5.0


Além do comando while, o comando for é outra estrutura que permite a repetição de trechos de código e geralmente é usado para iterar uma sequência (como uma lista, uma tupla, um dicionário, um conjunto ou uma string). A estrutura básica é a seguinte:

```python
for elemento in sequência:
    # bloco de código a ser executado repetidamente
```
Por exemplo, poderíamos aplicar a função tipo_triangulo criada anteriormente para cada triângulo de uma dada lista:

In [None]:
triangulos = [(10, 10, 10), (10, 8, 10), (10, 7, 8), (20, 5, 2)]
for triangulo in triangulos:
    print(tipo_triangulo(triangulo))

Outra aplicação comum para o comando for, é quando precisamos executar uma quantidade de vezes pré-determinada. Nesses casos, usamos a função `range()` que gera uma sequência de números. Aqui está um resumo de como `range()` funciona:

> range(stop)  
- Gera números de 0 até stop – 1.
> range(start, stop)  
- Gera números de start até stop - 1.
> range(start, stop, step)  
- Gera números de start até stop - 1, pulando de step em step.

Então, quando precisamos executar n vezes, basta usar `range(n)`, que será gerada uma sequência de `0` a `n-1`. Por exemplo, o seguinte código irá imprimir de `0` até `4`:

In [24]:
for i in range(5):
    print(i)

0
1
2
3
4


# Resumo

- Nesta unidade, fomos apresentados ao conceito de **scripts** e, através de exemplos, entendemos como eles podem nos tornar mais produtivos, comparado com o uso de aplicativos de interfaces gráficas.

- Conhecemos os quatro pilares do **pensamento computacional** e como eles são importantes na elaboração de scripts pelos cientistas de dados.

- Fomos apresentados à **linguagem de programação Python** e ao seu ecossistema para ciência de dados, como o Jupyter Notebook, que promove o conceito de **Literate Programming**, ou Programação Literária, que foi um paradigma de programação introduzido por Donald Knuth em 1984, mas que se tornou mais popular entre os cientistas de dados apenas nos últimos anos.

- Conhecemos o **Google Colab**, ou Colaboratory, que é um **ambiente de desenvolvimento interativo** fornecido pelo Google que permite escrever e executar código Python diretamente no navegador, sem a necessidade de instalar nada no seu computador.


- Aprendemos o conceito de **tipos de dados** e a sua importância para os cientistas de dados saberem quais operações podem ser aplicadas e quando é preciso realizar transformações e conversões nos tipos dados
- Aprendemos a **abstrair expressões** e comandos com a criação de **funções parametrizadas**.
- Fomos apresentados às estruturas de dados básicas da linguagem, como **listas, tuplas, conjuntos e dicionários**.
- Aprendemos como controlar **fluxo de execução** para que os nossos scripts possam decidir em tempo de execução quais linhas e a quantidade de vezes que elas serão executadas.

Até a próxima!


# Referências

BERLINSKI, D. **Advento do Algoritmo**. Rio de Janeiro, RJ: Globo, 2002.  
LUTZ, Mark. **Learning python: Powerful object-oriented programming**. " O'Reilly Media, Inc.", 2013.  
WING, Jeannette M. Computational thinking. **Communications of the ACM**, v. 49, n. 3, p. 33-35, 2006.  
