### Introdução

Olá Cientista de Dados!

Nesta aula vamos conhecer o Google Colab, e entender como utiliza-lo em nossas tarefas de Análise e Visualização de Dados.

Vamos lá?

### O que é o Google Colab?

O Google Colab é uma plataforma de computação em nuvem gratuita baseada no [Jupyter Notebook](https://jupyter.org/). Ele permite que os usuários criem e compartilhem documentos que contenham código executável, equações, visualizações e texto explicativo. O Google Colab oferece suporte a várias linguagens de programação populares, incluindo Python, JavaScript e Swift.

Isto significa que podemos intercalar blocos de texto, imagens e código em um mesmo documento. Como um Cientista de Dados, você vai utilizar muito este recurso tanto nos momentos em que você está trabalhando os dados e construindo o modelo quanto naquele momento em que você precisa comunicar seus achados e resultados para outros cientistas e para o seu público alvo.

### Como acessamos o Google Colab?

Para acessar o Google Colab, você precisa se conectar com uma conta do Google e acessar o site [colab.research.google.com](https://colab.research.google.com). Você verá então, a seguinte tela:

![Tela Inicial do Colab](colab-001.png)

Como você pode ver, a primeira atividade que ele sugere é abrir exemplos ou, no meu caso, alguns arquivos mais recentes. O Colab é integrado com o Google Drive, então seus arquivos, que terão sempre a extensão `.ipynb` estarão sempre salvos lá no seu Drive, em uma pasta específica.

### Iniciando um novo notebook!

Vamos iniciar? Clique no link "new notebook". Você deve ver sua tela assim:

![Novo Notebook](colab-002.png)

Neste momento, vamos destacar três áreas da tela:

1) Onde fica o nome do notebook. Você pode modificar quando quiser
2) Sistema de arquivos do notebook. Quando iniciamos um novo notebook, temos um sistema de arquivos virtual, onde podemos subir arquivos que serão utilizados durante a execução do código. Esses arquivos são apagados quando o notebook não está ativo.
3) Esta é uma célula. Um notebook é feito de um conjunto de células que são executadas sequencialmente. As células podem ser de dois tipos: células de código ou células de texto. A célula que estamos marcando é especificamente uma célula de código, pois tem o botão de execução bem a esquerda.

#### Células de Texto

As células de texto nos permitem escrever texto no formato Markdown, que facilita bastante a formatação. Se quiser aprender mais sobre Markdown, [clique aqui](https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet). Veja alguns exemplos:

![Exemplos de célula de texto](colab-003.png)

#### Células de Código

Células de código, como o próprio nome diz, servem para escrever código que será executado. Podemos usar algumas linguagens, sendo que a mais comum é Python. Cada célula, ao ser executada, pode imprimir o resultado de sua execução logo abaixo. Veja um exemplo abaixo:

In [1]:
import pandas as pd
import json
import requests

response = requests.get("https://dummyjson.com/products")
json.dump(json.loads(response.text)['products'], open('products.json','w'))
raw_data = open('products.json','r')
# .load("https://dummyjson.com/products")
df = pd.read_json(raw_data)

df

Unnamed: 0,id,title,description,price,discountPercentage,rating,stock,brand,category,thumbnail,images
0,1,iPhone 9,An apple mobile which is nothing like apple,549,12.96,4.69,94,Apple,smartphones,https://i.dummyjson.com/data/products/1/thumbn...,[https://i.dummyjson.com/data/products/1/1.jpg...
1,2,iPhone X,"SIM-Free, Model A19211 6.5-inch Super Retina H...",899,17.94,4.44,34,Apple,smartphones,https://i.dummyjson.com/data/products/2/thumbn...,[https://i.dummyjson.com/data/products/2/1.jpg...
2,3,Samsung Universe 9,Samsung's new variant which goes beyond Galaxy...,1249,15.46,4.09,36,Samsung,smartphones,https://i.dummyjson.com/data/products/3/thumbn...,[https://i.dummyjson.com/data/products/3/1.jpg]
3,4,OPPOF19,OPPO F19 is officially announced on April 2021.,280,17.91,4.3,123,OPPO,smartphones,https://i.dummyjson.com/data/products/4/thumbn...,[https://i.dummyjson.com/data/products/4/1.jpg...
4,5,Huawei P30,Huawei’s re-badged P30 Pro New Edition was off...,499,10.58,4.09,32,Huawei,smartphones,https://i.dummyjson.com/data/products/5/thumbn...,[https://i.dummyjson.com/data/products/5/1.jpg...
5,6,MacBook Pro,MacBook Pro 2021 with mini-LED display may lau...,1749,11.02,4.57,83,Apple,laptops,https://i.dummyjson.com/data/products/6/thumbn...,[https://i.dummyjson.com/data/products/6/1.png...
6,7,Samsung Galaxy Book,Samsung Galaxy Book S (2020) Laptop With Intel...,1499,4.15,4.25,50,Samsung,laptops,https://i.dummyjson.com/data/products/7/thumbn...,[https://i.dummyjson.com/data/products/7/1.jpg...
7,8,Microsoft Surface Laptop 4,Style and speed. Stand out on HD video calls b...,1499,10.23,4.43,68,Microsoft Surface,laptops,https://i.dummyjson.com/data/products/8/thumbn...,[https://i.dummyjson.com/data/products/8/1.jpg...
8,9,Infinix INBOOK,Infinix Inbook X1 Ci3 10th 8GB 256GB 14 Win10 ...,1099,11.83,4.54,96,Infinix,laptops,https://i.dummyjson.com/data/products/9/thumbn...,[https://i.dummyjson.com/data/products/9/1.jpg...
9,10,HP Pavilion 15-DK1056WM,HP Pavilion 15-DK1056WM Gaming Laptop 10th Gen...,1099,6.18,4.43,89,HP Pavilion,laptops,https://i.dummyjson.com/data/products/10/thumb...,[https://i.dummyjson.com/data/products/10/1.jp...


Esta célula, se executada, irá carregar dados de um site, salvar um arquivo e carrega-lo em um DataFrame que depois será impresso na área de resultados.

### Utilizando um notebook

Os exemplos acima são bons para mostrar cada parte separadamente, mas vamos a um exemplo que irá ilustrar a utilização típica destes blocos.

#### Exemplo

Digamos que você precisa entregar um relatório para o professor sobre quais são os primeiros 1000 números primos. Ele também solicita que você explique o que são números primos e como descobrir se um número é primo ou não.

Em um cenário tradicional de programação, provavelmente se faria a entrega de pelo menos dois arquivos: um documento do word, por exemplo, com a parte descritiva e um arquivo de código-fonte com o código. Como o arquivo de código-fonte não guarda o resultado da execução, é muito provável que este resultado fosse adicionado ao documento do word, ou quem sabe, disponibilizado em um terceiro arquivo.

Dá um certo trabalho preparar tudo... Além precisar de um computador com Word e com um editor de código-fonte para fazer todo o relatório. Mas com o Google Colab, você pode fazer tudo em um único lugar: um notebook pode ser editado de qualquer lugar, através do browser!

Veja o resultado abaixo:

![Notebook completo](colab-004.png)

É bem interessante, não é mesmo? Tudo em um único documento, que eu posso compartilhar com outras pessoas, sem nenhuma complicação. E o melhor, quem abre este notebook, pode executar as partes que são código, quando bem quiserem, sem depender de você para atualizar os resultados.

### Finalizando

Espero que você tenha gostado de aprender um pouco sobre o ambiente de desenvolvimento que iremos utilizar neste curso. Ao longo do curso, utilizaremos recursos mais avançados, então não perca a oportunidade de aprender mais sobre o Google Colab com estes links abaixo:

- [O que é Google Colab](https://www.alura.com.br/artigos/google-colab-o-que-e-e-como-usar?gclid=CjwKCAiAxvGfBhB-EiwAMPakqjBnFPSyZyay7wg-cefz02KTf52hSDkUZ-sUAXtIgv6x79w8AKjrghoCSAYQAvD_BwE)
- [Google Colaboratory - Hashtag Treinamentos](https://www.hashtagtreinamentos.com/programar-online-google-colab-python)
- [Vantagens de usar o Google Colab](https://kenzie.com.br/blog/google-colab/)


:::{.callout-note}
Os artigos citado acima e o conteúdo apresentado nesta aula não são de maneira nenhuma uma revisão extensiva do Google Colab, apresentamos apenas o necessário para você andar com seus próprios pés e no seu ritmo!
:::

### Navegação

| [< Anterior](/posts/data-101/index.html) 	| \| | [Próximo >](/posts/data-103/index.html) 	|
|---------- |---|--------:	|