## Para início de conversa

Bem-vindo ao nosso curso Python para iniciantes!

Este curso é um esforço para a auxiliar aquelas pessoas que, como eu há algum tempo atrás, não têm qualquer familiaridade com linguagem de programação, mas gostariam de utilizar [Python](https://www.python.org/) como ponto de partida em uma trajetória de capacitação para melhor desempenho profissional.

Dessa forma, a estrutura, os exemplos, os exercícios e o ritmo foram cuidadosamente pensados para servir como ponto de partida, de forma que possamos ter uma visão geral dessa linguagem de programação e uma base sólida para avançarmos futuramente sobre temas mais complexos. Antes de disponibilização final do curso, algumas pessoas foram convidadas para iniciar seus estudos com esse material. Fica aqui o agradecimento a todas elas por suas sugestões e críticas.

O curso conta com alguns vídeos, aulas ao vivo, on-line, que são ofertadas frequentemente, e com o presente conjunto de documentos interativos, chamados Jupyter Notebooks.

Mas afinal, porque iniciar uma trajetória de aprendizado na linguagem Python? Aqui vão algumas considerações que podem nos ajudar a responder a esssa questão. Python:

* é uma linguagem multi-propósito, o que permite fazer análise de dados, jogos, aplicativos, websites e tantos outros seviços;
* é considerada uma boa linguagem de programação para iniciantes, dada sua sintaxe simples;
* é uma das linguagens de programação mais utilizadas na atualidade, de acordo com o repositório de codigos [Github](https://madnight.github.io/githut/#/pull_requests/2020/2);
* é, na atualidade, a base do ecossistema mais robusto para Ciência de Dados e Machine Learning;
* apresenta uma imensa quantidade bibliotecas de terceiros, com diversas finalidades, que facilitam o desenvolvimento;
* conta com uma comunidade de desenvolvimento bastante ativa, sempre disposta a compartilhar informações e conhecimento.

Para tirarmos o maior proveito deste curso, precisamos nos familiarizar com este ambiente interativo em que a parte textual e prática de nosso curso está ocorrendo, o que faremos na seção seguinte.

## Conhecendo o Jupyter Notebook

Este ambiente aqui, em que se encontra a parte escrita de nosso curso, é um **Jupyter Notebook**. Notebooks são excelentes mecanismos para se trabalhar com dados a partir de programação, pois eles agregam células de textos formatáveis e células de código, em que são executados nossos programas de maneira interativa. Por essa interatividade, podemos visualizar diversos tipos de resultados de códigos, inclusive com renderização de tabelas, gráficos, mapas, grafos, fórmulas matemáticas etc.

Por essa razão, notebooks têm sido utilizados amplamente no fluxo de trabalho de Ciência de Dados, desde a obtenção e o tratamento dos dados, passando para a análise exploratória, até a modelagem e divulgação de resultados. A respeito da divulgação de análises, diversos artigos científicos de peso já têm sido submetidos a partir de notebooks como este. Isso garante que avaliadores, a comunidade científica em geral e quaisquer interessados possam não só ler os resultados e observar os produtos gráficos de apoio, mas também verificar o funcionamento do código que dá base para a publicação, o que permite avaliá-lo, validá-lo e reproduzi-lo em novos trabalhos.

Os exemplos abaixo são de código que dão sustentação a algumas análises sobre a difusão territorial da Covid-19 enntre municípios brasileiros. Os resultados foram aceitos pela Hygeia - Revista Brasileira de Geografia da Saúde - e estarão disponíveis on-line em breve.

**Figura 1: Renderização de figura cartográfica, tabela e gráfico a partir de código Python em Jupyter Notebook** - 

![image.png](attachment:image.png)

![image.png](attachment:image.png)

![image.png](attachment:image.png)

Da mesma forma, em trabalhos técnicos, notebooks podem ser utilizados como verdadeiras notas técnicas interativas. A publicação de livros também tem sido um campo de aplicação desses ambientes de programação. Existem casos de livros que foram feitos inteiramente em notebooks, com divulgação interativa associada aos volumes físicos, como é o caso do livro [Deep Learning for Coders with fastai and PyTorch](https://mybinder.org/v2/gh/fastai/fastbook/master).

Ainda quanto a sua aplicação, avanços têm sido feitos na utilização de notebooks como plataformas de distribuição final - _deployment_ - de aplicativos e serviços _web_, como, por exemplo, na forma de painéis temáticos de visualização de dados - _dashboards_. No entanto, ainda existem grandes limitações para seu uso em diversas dessas finalidades. Assim, na maior parte dos casos, o notebook é utilizado como uma ferramenta dinâmica, para obtenção, tratamento e análise de dados, que deixa de ser considerada na fase de deployment, em que ferramentas mais tradicionais de programação são utilizadas, tais como editores de textos e as IDEs - Integrated Development Environment, associadas a servidores _on-line_, serviços de distribuição e a contêineres em nuvem.

Se muitos dos termos acima forem novos. Não precisamos nos preocupar. O importante a se reter aqui é que notebooks são poderosas ferramentas durante o fluxo de análise de dados com Python. Porém existem limitações e, a depender de nosso projeto de aprendizado e de aplicação dos conhecimentos de programação, novas ferramentas de construção de código precisarão ser consideradas no futuro.

Por sua aplicação em operações com dados, diversos serviços em nuvem oferecem a possibilidade de programação por meio de Jupyter Notebooks, entre elas Microsoft Azure, Google Cloud e Amazon AWS. Da mesma forma, mesmo IDEs têm recebido interface com notebooks para permitir que desenvolvedores utilizem suas potencialidades.

A princípio, o projeto Ipython oferecia ambiente de programação interativo voltado para Python. A partir de 2014, o projeto contava com suporte para as linguagens Julia, Python e R, o que gerou o acrônimo Jupyter. Desde então, o projeto ganhou o nome de Jupyter Notebooks, passando Ipython a se referir Ipython a se referir ao servidor de _kernels_ (unidades computacionais) por traz da interface de programação. Nos anos seguintes, novas funcionalidades e suporte às mais diversas linguagens de programação foram adicionadas, fazendo com que crescesse imensamente o seu uso. Em 2018, foi lançado o Jupyter Lab, que amplia significativamente as ferramentas disponíveis para desenvolvimento por notebooks, o que leva alguns a o chamarem de "Jupyter Notebooks com esteroides)".

o Jupyter apresenta, no nosso navegador de internet, uma interface (jupyter dashboard) para os diretórios do computador , a partir da qual podemos, entre outras coisas, criar, acessar, renomear e deletar notebooks, que são salvos com a extensão .ipynb. Trata-se da interface exposta adiante:

**Figura 2: Jupyter Dashboard - Interface de navegação entre arquivos .ipynb**
_______
![image.png](attachment:image.png)
_______

Ao abrirmos um jupyter notebook, temos acesso à interface do Jupyter Editor, por meio da qual podemo redigir texto e código nas células do documento. De cima para baixo, conforme a imagem abaixo, temos uma barra de cabeçalho -_header_-, a barra de menu -menubar-, com diversas seções (File, Edit, View etc.), e barra de ferramentas -_toolbar_-, com botões para acesso rápido às principais funcionalidades, entre elas salvar, adicionar novas células, recortar, colar, executar - _run_ -, interromper etc.<br>
<br>

**Figura 3: Jupyter Editor - Interface de edição e execução de Notebooks**
_______
![image-3.png](attachment:image-3.png)
_______

Após essa porção superior, com as barras, encontramos a área do documento interativo em si, composta por células de tipo código e Markdown. Podemos inserir novas células, seja por meio dos controles na barra de ferramentas, seja a partir de atalhos (o que é amplamente utilizado). É possível se navegar entre células e dentro de cada célula. Isso ocorre, pois o editor apresenta dois estados básicos: o **modo de navegação** e o **modo de edição de célula**.

No **modo de navegação**, ao pressionarmos os botões _up_ e _down_ do nosso teclado - setas para cima e para baixo -, movemos uma caixa de selação entre as células. Sabemos que estamos em modo de navegação quando a lateral esquerda da caixa de seleção se encontra com uma margem azul (veja a Figura 2). Caso estejamos dentro de uma célula, no modo edição, podemos pressionar _Esc_ no teclado para voltar para o modo de navegação. 

No modo de navegação, simplesmente pressionar certas teclas no teclado já significa utilizá-las como atalho para algumas funcionalidades. Podemos inserir célula de código acima (A), abaixo (B), mudar a célula para tipo Markdown(M), ou para tipo código (Y), além de visualizar todas as teclas de atalho (H), entre tantas outras funcionalidades. 

Ao pressionar Shift+Enter ou Ctrl+Enter executamos a célula atualmente selecionada, o que renderiza a edição de texto, caso estejamos em uma célula Markdown, ou executa o código, caso se trate de uma célula de código. A diferença entre ambos os comandos é o primeiro avança para a próxima célula, ou cria uma nova, enquanto o segundo mantém a seleção sobre a célula recém-executada.


Quando estamos em modo de navegação, ao pressionar Enter sobre uma célula, acessamos o seu conteúdo, entrando para o **modo de edição**. Nesse modo, simplesmente pressionar as letras, números e caracteres especiais do teclado não corresponde a acionar qualquer atalho, mas inserir na célula os caracteres correspondentes. O modo de edição é identificável por uma margem verde no lado esquerdo da célula selecionada.

Agora podemos avançar para entendermos como utilizar as células de tipo Markdown. Markdown é uma linguagem de marcação bastante simples e de fácil utilização, por meio da qual podemos criar textos formatados. A próxima célula, não renderizada, mostra alguns exemplos de formatação texto, enquanto a célula seguinte mostra esses exemplos já renderizados.
<br>
<br>

**Célula de Exemplo 1: notações de formatação em Markdown não renderizadas**

__________________________________________
**trecho em negrito**.

_trecho em itálico_

~~riscado~~

* marcador
    * marcador subordinado

1. Primeiro item de uma lista ordenada
1. Segundo item de uma lista ordenada 
    1. Subitem de uma lista ordenada
    
```python
s = "destaque de código"
print s
```

[Exemplo de link para o _Google website_](https://www.google.com)
__________________________________________

**Célula de Exemplo 2: notações de formatação em Markdown renderizadas**

_______
**trecho em negrito**.

_trecho em itálico_

~~riscado~~

* marcador
    * marcador subordinado

1. Primeiro item de uma lista ordenada
1. Segundo item de uma lista ordenada
    1. Subitem de uma lista ordenada
    
```python
s = "destaque de código"
print s
```

[Exemplo de link para o _Google website_](https://www.google.com)


_______

Em células Markdown, um título é destacado ao colocarmos o símbolo # no início de uma frase. Títulos de nível 1 começam com um sustenido, enquanto aqueles de nível dois começam com dois, e assim sucessivamente. Não é adequado colocarmos um exemplo aqui, pois isso interferiria na estrutura de títulos deste próprio notebook. Para verificar como cada título é feito, basta adentrar em qualquer célula de título deste notebook com Enter.

Por padrão, operações computacionais não são calculadas em células de tipo markdown. Assim, de maneira geral, 1+1, em uma célula de texto não retorna o resultado 2. O mesmo é verdade para qualquer outro tipo de operação com Python. Caso seja útil para algum projeto, é possível inserir trechos executáveis em células markdown, o que pode gerar textos atualizáveis automaticamente. Isso é feito por meio de extensões, Nbextensions.

Existem diversas fontes _on-line_ de informações sobre notações para formatação de texto em Markdown. Na [documentação do Jupyter Notebook](https://jupyter-notebook.readthedocs.io/en/stable/examples/Notebook/Working%20With%20Markdown%20Cells.html) é possível ver alguns exemplos. Caso necessitemos de auxílio em Português, uma breve busca na internet trará dezenas de tutoriais, guias e exemplos úteis.

Quando passamos às células de código, por sua vez, os caracteres inseridos passam a ser _inputs_ com significado particular para a linguagem de programação em uso, de tal forma que, ao serem executadas, uma unidade de processamento interativa (_kernel_) é acionada, retornando o resultado de uma operação computacional. As células de código apresentam duas partes básicas, **_In_**, em que inserimos o código, e **_Out_**, em que obtemos resultados, quando a operação descrita no código assim o requerer. Operações de armazenamento de variáveis, por exemplo, não geram representação em Out.


À esquerda das células de código, chaves são dispostas e seu conteúdo nos indica o status de execução. Assim, temos células que não foram executadas - nenhuma informação entre as chaves -, que estão em execução - asterisco entre as chaves - e já executadas - número de ordem da execução. Na figura abaixo podemos observar uma célula já executada (observe a numeração em In) e acionada em modo edição (margem verde à esquerda). 


**Figura 4: Célula de Código - Interface de edição e execução de Notebooks**
![image-2.png](attachment:image-2.png)


Como estamos em um documento interativo, podemos ir além de visualizar algumas figuras que dão exemplo sobre o funcionamento das células, passando a realmente interagir com elas. Assim, nas próximas três células, podemos pressionar Shift+Enter para verificar o retorno das operações Python nelas inseridas (duas operações matemáticas simples e a verificação da versão do Python que estamos utilizando).

________

In [1]:
1 + 1 

2

In [2]:
3 * 3

9

In [3]:
from platform import python_version
print("Versão do Python: ", python_version())

Versão do Python:  3.6.10


______

De maneira geral, ao longo do curso, faremos uso dessa interatividade, de forma que, após a exposição de conceitos básicos, possamos aplicá-los na prática, por meio de elaboração e execução de breves operações em Python nessas células de código. Já que estamos nesse tema, passemos adiante à elaboração de um código bastante importante na tradição do aprendizado de linguagens de computação.

## Um Ritual

Como tradição que remonta a milênios, aqueles que querem ser iniciados, que querem compreender os segredos dos códigos e da fé, devem escrever um primeiro programa que convoque a CPU para trazer sua mensagem de saudação ao mundo:

Assim, na célula seguinte, escreva as duas linhas destacadas abaixo: 

```Python

mensagem = 'Hello world!'

print(mensagem)
```



Para encerrar o ritual, com a célula ativada, pressione shift+Enter, ou clique no botão Run, na barra de ferramentas acima.

## Sobre a abordagem didática e a estrutura do curso

Existem várias abordagens para o aprendizado de linguagens da programação. Os cursos elaborados por desenvolvedores, que são muito voltados para a solução de problemas, procuram utilizar projetos como pontos de partida. Assim, conforme raciocinamos sobre como poderíamos resolver a questão, certos conceitos de programação e particularidades do funcionamento da linguagem Python são introduzidos.

Essa abordagem é ótima e deve ser encarada por iniciantes para desenvolver essa inclinação para solução de problemas. No entanto, o custo dessa abordagem, para alguém que se encontra muito no início do aprendizado, é uma sensação de certa alienação em relação a uma visão geral da linguagem, com sua estrutura, funcionamento e principais ferramentas. Ao aprender cada ferramenta conforme surge a necessidade em um projeto - no início do aprendizado, porque, na realidade, esse tipo de aprendizado jamais acaba -, não é raro que não tenhamos uma ideia da trajetória, de uma proporção de aprendizado alcançado em relação a um objetivo de conhecimento. A rigor, não sabemos quanto de Python aprendemos. Sabemos fazer soluções com o que sabemos, o que é ótimo, mas resta a dúvida sobre o grau desse aprendizado.

Por outro lado, um aprendizado procedimental, em que se trate do conjunto de ferramentas em Python, segundo certas categorias (tipos de dados, tipos de operações, tipos de circunstâncias etc.) tem a vantagem de criar uma visão geral da tecnologia, de dar uma ideia de quanto de avanço quotidiano temos em termos da operacionalização básica da linguagem. Isso ajuda na escolha consciente de quais pontos queremos aprender a fundo e quais pontos podemos deixar para depois.

Outra vantagem é que existe um componente emocional no aprendizado que não pode ser ignorado. As dúvidas se avolumam. Será que vamos aprender? Será que conseguiremos utilizar a ferramenta? Aprendemos o suficiente? Ao se ter uma visão geral das ferramentas, podemos fazer uma melhor gestão dessas incertezas, de forma a conseguir uma confiança que nos faça mais confortáveis e abertos para o aprendizado. É a partir daí que podemos nos dizer, conscientemente coisas como: "são 68 funções nativas em Python, mas algumas raramente são utilizadas, enquanto outras são muito mais frequentes, logo vou aprender mais a fundo essas funções mais frequentes e jamais ficar ansioso por não saber exatamente cada uma delas"; "Python tem dois tipos básicos de dados, simples e compostos, eu tenho uma base sobre as principais características desses principais tipos e agora consigo ser autônomo para buscar auxílio _on-line_, quando precisar implementar um detalhe desses objetos que ainda não estudei".

Outra vantagem dessa abordagem é que, para aqueles bem iniciantes, que já têm algum contato com ferramentas como Microsoft Excel, encaminhamento de soluções já aparece no seu quotidiano, o que falta é uma visão geral da linguagem da programação que use esse conhecimento prévio de planilhas (tipos de dados, fórmulas etc.) como ponto comum para mais fácil apreensão da linguagem. A enorme desvantagem dessa abordagem, no entanto, é que ela é bastante insuficiente para apresentar, de fato, a aplicação dessas ferramentas, conjuntamente, na forma dde soluções para problemas. Existe um certo

Por essa razão, nesta sequência de conversas que teremos por aulas adiante, o que tentaremos fazer é mitigar essas duas situações, de forma que maximizemos as vantagens e minimizemos as desvantagens de cada uma das abordagens. Assim, o curso está estruturado em duas partes, na primeira, tentamos passar uma visão geral do Python. Para tanto, partimos de uma classificação em seis categorias de ferramentas da linguagem, que, se não engloba tudo que se deve saber, dá conta de apresentar mais de 90% de seus componentes com os quais interagimos e sobre os quais aprenderemos não só nesse curso, mas em toda nossa trajetória de aprendizado, com nossas aplicações práticas, erros e acertos, novos livros, cursos, projetos, palestras, conversas em um café (pode chamar!) etc.

## Estrutura do Curso

A linguagem Python é um campo muito amplo para nosso conhecimento. Por essa razão, para explorarmos esse vasto mundo, precisamos agrupar esses assuntos em poucas categorias, que nos auxiliem a identificar cada uma das ferramentas integrantes. Por essa razão, dividimos o aprendizado neste curso em Dados, Ações, Circunstâncias, Revisão, Customização e Expansão, conforme mostra a Figura 2.


**Figura 5: Chaves de Interpretação das Ferramentas em Python**

______

![image-3.png](attachment:image-3.png)
______

**Dados**

Python nos fornece matérias-primmas com as quais vamos trabalhar, na forma de dados. Os dados são os elementos que queremos armazenar, recuperar e processar, de forma a que, tenhamos um determinado resultado desejado. De partida, alguns tipos básicos de dados são fornecidos pela linguagem, que chamamos de tipos nativos.

Esses tipos básicos podem ser simples ou compostos. Cada dado que armazenamos em um tipo simples se encontra em um endereço específico da memória. Esses tipos podem ser numéricos (números inteiros ou decimais), boleanos (valores lógicos verdadeiro ou falso), ou de valor Nulo. Existem outros tipos básicos, como números complexos. No entanto, para início de estudos, esses dados irão compor mais de 90% de nossas necessidades.

Os dados também podem ser compostos, ou seja, podem se referir a objetos computacionais que servem como contêineres de outros dados, inclusive outros dados compostos. Vamos nos aprofundar nesses temas a seu tempo. por ora, basta que saibamos que existem listas (sequências ordenadas de quaisquer tipos de dadosmm simples ou compostos), dicionários(contêineres de pares chave:valor), tuplas (semelhantes às listas, mas imutáveis) e conjuntos (objetos compostos que não aceitam valores duplicados).

Entre os dados compostos também se encontram as _strings_ que são contêineres de caracteres. Para entendermos strings, devemos identificar que os aparentes textos que podem nelas aparecer, na realidade são coleções de caracteres salvos em diferentes posições da memória e identificados pelo contêiner.

**Ações**

Já que estmos tratando de uma linguagem, podemos entender os dados como os substantivos, ou seja, as categorias que dão nome às coisas. No entanto, para uma linguagem, precisamos também de verbos. É isso que temos quando olhamos para o conjunto de ferramentas que nos permitem ações em Python. Assim, temos os operadores, as funções e os métodos.
Operadores são caracteres especiais que apresentam alguma operação associada, tais como operadores matemáticos (+, -, *, / etc.), operadores comparativos (< > !=, ==), operadores lógicos (and, or e not), entre outros. Temos também as funções (nativas e desenvolvidas pelo usuário), que são operações com seus respectivos nomes e estrutura de execução de rotinas (print(argumento), para apresentar na tela um determinado valor, indicado como argumento, entre parênteses, por exemplo).

Entre as formas de se realizar ações em Python, também se contam os métodos. Os métodos são mecanismos funcionais ligados intimamente a determinado objeto. Enquanto uma função pode aceitar diversos tipos de objetos como argumento a partir do qual podem ser executadas, os métodos são dependentes dos seus objetos específicos. A  notação de um método é distinta à da função.



São

**Circunstâncias**

Aquilo que chamamos aqui de circunstâncias, são palavras-chave que criam diferentes condicionamentos para o funcionamento de um determinado código. São palavras chaves como if, for, while e with, e outras a elas associadas, que criam condições sem as quais um determinado bloco de código não deve funcionar, deve funcionar continuamente, por um determinado número de repetições ou associado a uma determinada rotina, tida como contexto. 

**Revisão**

Novamente utilizando da analogia da linguagem humana como aproximação para o entendimento da linguagem computacional, podemos entender que o conjunto de operações programadas a partir das palavras e operadores de dados, ações e circunstâncias mencionados acima podem conter erros. Nesse sentido, uma série de ferramentas são disponíveis em Python para que possammos identificar um erro ou criar um alerta de erro, quando uma regra por nós estabelecida não for cumprida.
São...

**Customização**

Os dados originais em Python são bastante aproveitados por nós em todos os nosso fluxos de trabalho, para qualquer tipo de trabalho. No entanto, eles não são suficientes para lidar com tarefas muito complexas, de forma que precisamos de novos tipos de objetos, com seus próprios, valore e comportamentos próprios. Quando custamizamos, podemos tomar uma lista básica e, a partir dela, derivar um novo objeto que tenha novos comportamentos, como não aceitar valores nulos, somente aceitar textos etc.

De customização em customização, podemos chegar a objetos bastante complexos: servidores de internet, bancos de dados, tensores matemáticos multidimensionais, redes neurais, ambientes virtuais em 3d para games etc. 

Se quisermos trabalhar com esses tipos de dados muito complexos, devemos construí-los do zero, nós mesmos, correto? Errado! Para isso podemos contar com expansão dos tipos e funcionalidades do Python.

**Expansão**

As funcionalidades e tipos básicos do Python podem ser expandidos por meio de módulos, pacotes e bibliotecas disponíveis para que sejam importadas em nosso código. Ao importar esses objetos, estamos obtendo códigos anteriormente produzido que nos garante ganhos de produção nas nossas diversas atividades. Esses módulos podem se encontrar na própria distribuição do Python que temos instalada, em repositórios que recebem contribuições de toda a comunidade pythonista, bem como de outros, agora sim, elaboradados por nós mesmos.

Com isso, se queremos criar um banco de dados, fazer um _website_, gerar um jogo, fazer análises estatísticas, elaborar servidores de mapas, gerar interfaces gráficas para usuários, ou mesmo criar modelagem com _deep learning_, podemos contar com esses pacotes produzidos e consistidos pela comunidade para vançar em nossos trabalhos. 