### **Tutorail `Julia Lang`**
---
---
<br>

Um tutorial introdutório abrangente que ajudará você a dominar os fundamentos de Julia. Aprenda sobre operadores, declarações condicionais, trabalhando com _DataFrames_ e muito mais.

`Julia` é uma linguagem de programação de alto nível, dinâmica e de código aberta, para aplicações em _computação científica_. Foi desenvolvida por um grupo de 4 pessoas do **MIT** e anunciada pela primeira vez em 2012. Desde então, a linguagem tornou-se uma concorrente de peso no cenário de aplicação de análise e ciência de dados, fornecendo suporte para análise de big data para realização de tarefas complexas como computação em nuvem e paralelismo, que desempenham um papel fundamental na análise de Big Data. Com sua facilidade de uso, velocidade e suporte para casos de uso de computação científica, aprender Julia é um caminho viável para muitos cientistas de dados atualmente.

Este artigo fornece um tutorial detalhado e longo sobre a linguagem de programação Julia para iniciantes, abrangendo sintaxe básica, trabalhando com diferentes tipos de dados, vetores e strings, quadros de dados e muito mais.

**Por que aprender Júlia?**

Há muitas razões por trás da popularidade de Julia. Enquanto `Python` e `R` reinam supremos como as linguagens de programação mais usadas em ciência de dados, Julia foi baixada mais de [35 milhões de vezes](https://juliacomputing.com/blog/2022/01/newsletter-january/). As razões por trás de seu crescimento são descritas detalhadamente [neste artigo](https://www.datacamp.com/blog/the-rise-of-julia-is-it-worth-learning-in-2022), mas aqui está um resumo dos recursos e vantagens de Julia: 

- Velocidade
 - um dos principais princípios fundadores de Julia é que ele precisa ser tão geral quanto Python, compatível com _estatísticas_ como **R**, mas _tão rápido_ quanto **C**. Isso permite fluxos de trabalho de dados mais rápidos, especialmente para computação científica.

- Sintaxe
 - outra maneira pela qual Julia brilha é sua sintaxe. Apesar de sua velocidade, a sintaxe de Julia é tipada dinamicamente, tornando-a mais próxima de R e Python do que linguagens de programação mais complexas. Isso significa que é muito mais acessível e fácil de aprender do que outras linguagens de programação de alto desempenho.
 
- Despacho múltiplo
 - sem ser muito técnico, outra vantagem de Julia é o despacho múltiplo, que se refere à capacidade das funções de Julia de se comportarem de maneira diferente com base nos tipos de argumentos que recebem. Isso torna uma linguagem flexível para trabalhar. 
 
Por causa desses recursos, Julia estava no top 5 das linguagens mais amadas na pesquisa de desenvolvedores do StackOverflow de 2022. Esse é especialmente o caso de pessoas da comunidade científica que desejam fazer a [transição de ferramentas como o Matlab](https://www.datacamp.com/blog/progressing-from-matlab-to-julia).

![image.png](attachment:f273955e-82c6-47f1-9fa8-72a6f438be76.png)
<center>Captura de tela da Pesquisa de desenvolvedores do StackOverflow 2022
    
<br><br>

Com isso resolvido, vamos nos aprofundar em como começar com Julia. 

<br>

**Como instalar e executar Julia?**

A instalação do Julia é simples. Baixe o instalador específico para o seu sistema operacional nesta [página](https://julialang.org/downloads/) do site da Julia e marque a caixa que adiciona Julia ao PATH do sistema. Se você digitar julia na linha de comando e obter a seguinte saída, tudo está funcionando bem.

![image.png](attachment:9fd1ab64-fbf1-4189-9c94-c93858d32ff2.png)

Tanto o **PyCharm** quanto o **VSCode** oferecem _plugins_ Julia que suportam realce e depuração de código. No entanto, como os cientistas de dados geralmente gostam de trabalhar no Jupyter Notebook ou no Jupyter Lab, também é fácil adicionar um kernel Julia aos respectivos ambientes.

**COMO TRABALHAR COM JULIA NO JUPYTER NOTEBOOK / JUPYTER LAB?**

A maneira mais fácil é instalá-lo através do aplicativo do Anaconda. A distribuição Anaconda contém notebooks python, jupyter e outros pacotes para implementação de ciência de dados. Clique [aqui](https://www.anaconda.com/products/individual) e role para baixo para baixar a última versão apropriada do arquivo de instalação do Anaconda para o seu sistema operacional.

Depois de instalado e verificado seu funcionamento, segue os próximos passsos.

**Passo 1:** Agora, a comunicação entre Julia e Jupyter deve ser estabelecida, para isso digite os seguintes comandos no prompt e pressione Enter:



```julia
using Pkg
Pkg.add("IJulia")
```

Isso diz a Julia para usar o gerenciador de pacotes e, em seguida, adicionar o pacote IJulia, que estabelece a conexão entre Jupyter e Julia. Julia leva algum tempo para instalar o pacote IJulia e o final do processo deve ficar como na imagem abaixo:

![image.png](attachment:5e891c21-b875-4081-823c-173ee6a87d40.png)

O código adiciona o pacote IJulia à instalação do Julia no sistema. Reinicie todas as sessões do JupyterLab em execução e você verá a opção Julia no Iniciador.

**Passo 2:** estabelecemos uma conexão entre Julia e Jupyter e agora um novo bloco de notas Jupyter pode ser criado com Julia em vez de Python. A opção de selecionar Julia estará presente quando a opção do novo caderno for clicada conforme mostrado na imagem abaixo: 

![image.png](attachment:46ab6b88-3ad0-4ee8-a659-198a7c922685.png)

Passo 3: Pacotes apropriados também devem ser adicionados para usar Julia para os fins necessários. Os comandos para adicionar alguns dos pacotes mais comumente usados ​​são fornecidos a seguir: 

```julia
Pkg.add("DataFrames")
Pkg.add("CSV")
Pkg.add("Plots")
```

Os pacotes mencionados acima são para criar e usar frames de dados, ler e escrever arquivos CSV e usar plotagens para visualização, respectivamente.

Depois de instalar os pacotes necessários para seus propósitos, você pode experimentar a linguagem Julia de alto desempenho no notebook Jupyter.

Como o Jupyter Notebook ou o Jupyter Lab aberto, vamos realizar o famoso **Hello world!** para darmos início a utilização da `Julia Lang`, para isse digite o seguinte código em uma célula.

```julia
print("Helllo world!")
```

In [217]:
print("Hello world!")

Hello world!

<br>

#### **O diretório de trabalho**

O diretório de trabalho é um caminho de arquivo que Julia usará como ponto de partida para caminhos de arquivo relativos. Ou seja, é o local padrão para importar e exportar arquivos.

In [218]:
# obtendo o diretório de trabalho atual com "pwd()"
pwd()

"/home/fernandogalvao/Documentos/Learning Julia Lang"

<br>

#### **Sintaxe básica da Julia**

Esta seção cobrirá os fundamentos da sintaxe do Julia, incluindo variáveis, tipos de dados, operadores, vetores e assim por diante.

- operadores  
Na programação, existem caracteres especiais chamados operadores que representam processos matemáticos ou lógicos específicos. Abaixo, você verá os operadores mais comuns, incluindo adição, subtração, multiplicação, subtração e muito mais. 

_**Observação:**_ em Julia, os comentários são escritos com  #caracteres únicos. Qualquer coisa escrita após o #é ignorada pelo programa (até o final da linha).

In [219]:
# adição
37 + 53

90

In [220]:
# subtração
17 - 7

10

In [221]:
# mutiplicação
29 * 6

174

In [222]:
# divisão
22 / 7

3.142857142857143

In [223]:
# a divisão reversa em Julia é igual a 0/5.
5 \ 0

0.0

In [224]:
0 / 5

0.0

In [225]:
# operação de resto da divisão
98456 % 23

16

In [226]:
# elevando à potência 2 (ao quadrado)
(15 / 5) ^ 2

9.0

In [227]:
# elevando à potência 2 (ao quadrado)
7 ^ 2

49

In [228]:
# elevando à potência 3 (ao cubo)
(15 / 3) ^ 3

125.0

In [229]:
# elevando à potência 3 (ao cubo)
-7 ^ 3

-343

In [230]:
# elevando à potência 0.5 (raiz quadrada)
(110 - 10) ^ 0.5

10.0

In [231]:
# elevando à potência 0.5 (raiz quadrada)
16 ^ 0.5

4.0

<br>

#### **Variáveis**

Na programação, usamos variáveis ​​para armazenar informações. As variáveis ​​facilitam a referência a uma informação por meio de um nome. Por exemplo, aqui estamos armazenando o número 73 em uma variável chamada `a`, e a string `“Hello world!”` na variável “word” (veremos os diferentes tipos de dados de Julia na seção a seguir). 

Digitar o nome da variável na linha de comando imprime seu valor.

In [232]:
# armazenando o número 73 na variável "a"
a = 73

73

In [233]:
# armazenando "Hello, world!" em "word"
word = "Hello, world!"

"Hello, world!"

In [234]:
# instanciando o valor 8 no objeto "var_1"
var_1 = 7

7

In [235]:
# realizando a adição de dois objetos e armazene-os no objeto do lado esquerdo
var_1 += 3  # isso é o mesmo que a = a + 3, ou seja, 7 + 3 = 10
# Portanto valor do objeto "var_1" será atualizada para 10

10

In [236]:
# realizando a subtração de dois objetos e armazene-os no objeto do lado esquerdo
var_1 -= 4  # isso é o mesmo que a = 10 - 4, ou seja, 10 - 4 = 6
# Portanto valor do objeto "var_1" será atualizada para 6

6

Todos os operadores e funções do Julia funcionam da mesma forma em variáveis.

In [237]:
# multiplicação de duas variávies
a = 73
b = 5

a * b

365

Você pode usar qualquer caractere alfanumérico em nomes de variáveis, incluindo sublinhados. No entanto, existem certas convenções em nomeá-los em Julia. Nomes de variáveis:

- são `lower_snake_case` (minúsculas e as palavras são separadas por um sublinhado)
- não pode começar com um número.

<br>

#### **Introdução aos tipos de dados em Julia**

Os tipos de dados informam ao programa quais valores uma variável assume e que tipo de operadores matemáticos ou lógicos podem ser usados ​​nelas sem causar um erro. Existem vários tipos de dados no Julia, abaixo você encontra os mais básicos.

    Tipo de dados            Expressão             Exemplos             Descrição
    -----------------------------------------------------------------------------

    inteiros                 Int64                 1. -99               números inteiros

    decimais                 Float64               1.23, 4.0            números com ponto decimal 

    boleanos                 Bool                  verdadeiro falso     valores lógicos

    string                   String                "Ola", ""            dados de texto com qualquer número de caracteres

    caracteres               Char                  'A', '$', '\u20AC'   dados de texto com exatamente um caractere

O tipo de dados de uma variável pode ser impresso usando a função `typeof()`:

In [238]:
# obtendo o tipo de dado do número 3.14
typeof(3.14)

Float64

Ao realizar operações em Julia, você precisa estar atento às consequências de diferentes tipos de dados. Por exemplo, multiplicar um **float** e um **inteiro** retorna um `float`.

In [239]:
# saldo bancário como um número inteiro
balance = 100

# taxa de juros em decimais
interest_rate = 1.05

# calculando novo saldo bancário
new_balance = balance * interest_rate

# visualizando o tipo de dado retornado
typeof(new_balance)

Float64

Por outro lado, executar operações em strings e tipos de dados numéricos geralmente leva a um erro. Como o seguinte.

In [240]:
# saldo bancário como um número inteiro
balance = 100

# taxa de juros em decimais
interest_rate = "5%"

# calculando novo saldo bancário
new_balance = balance * interest_rate

# visualizando o tipo de dado retornado
typeof(new_balance)

LoadError: MethodError: no method matching *(::Int64, ::String)
[0mClosest candidates are:
[0m  *(::Any, ::Any, [91m::Any[39m, [91m::Any...[39m) at operators.jl:591
[0m  *(::T, [91m::T[39m) where T<:Union{Int128, Int16, Int32, Int64, Int8, UInt128, UInt16, UInt32, UInt64, UInt8} at int.jl:88
[0m  *([91m::Union{AbstractChar, AbstractString}[39m, ::Union{AbstractChar, AbstractString}...) at strings/basic.jl:260
[0m  ...

<br>

#### **Convertendo tipos de dados em Julia**

É possível converter diferentes tipos de dados em outros tipos de dados no Julia com funções dedicadas prontas para uso. Abaixo está uma tabela contendo como converter diferentes tipos de dados em Julia. 

    De                         Para                        Função
    ----------------------------------------------------------------------------
    Integer                    Float                       Float64(x)
    Float                      Integer                     Int64(x)
    Inter ou Float             Float                       string(x)
    String                     Float                       parse(Float64, string)
    String                     Integer                     parse(Int64, string)

**Trabalhando com caracteres e strings em Julia**

Vimos os tipos de dados de caracteres e strings em Julia na seção anterior. Nesta seção, vamos nos aprofundar nas operações comuns de caracteres e strings. Como lembrete, uma string é uma série ordenada de caracteres ou texto simples entre aspas duplas. 

In [241]:
# uma string é uma série de caracteres
world = "Hello, world!"
world

"Hello, world!"

Para escrever uma string de várias linhas, você pode usar aspas triplas:

In [242]:
multi_line = """
This is a 
multi-line 
string."""

print(multi_line)

This is a 
multi-line 
string.

Você pode extrair informações e atributos de strings de várias maneiras. Por exemplo, a indexação de colchetes pode extrair caracteres individuais ou um intervalo de caracteres com base em sua posição. Neste exemplo, 1:3 denota a sequência de números de 1 a 3 inclusive.

In [27]:
text = "Julia is a high-level, dynamic programming language"

"Julia is a high-level, dynamic programming language"

In [28]:
# extraindo o primeiro caractere do texto acima com base em seu índice
text[1]

'J': ASCII/Unicode U+004A (category Lu: Letter, uppercase)

In [29]:
# extraindo os três primeiros caracteres do texto com base em seu índice
text[1:3]

"Jul"

Quando colocamos 1 dentro dos colchetes, e ele retornou o primeiro caractere. Como alternativa, você também pode usar o operador especial, `begin`:

In [30]:
# extraindo o primeiro caractere do texto com o operador especial "begin"
text[begin]

'J': ASCII/Unicode U+004A (category Lu: Letter, uppercase)

Quando você extrai um único caractere de uma string, ele terá um `Char` tipo de dados.

In [31]:
# extrai o tipo do caractere do índice 4
typeof(text[4])

Char

No entanto, quando você divide uma string e extrai mais de um caractere, a saída também é uma string. 

In [32]:
# extrai o tipo do caractere do índice 1:4
typeof(text[1:4])

String

In [33]:
# utilizando a operador especial "begin"
typeof(text[begin:5])

String

Acima, estamos cortando os cinco primeiros caracteres do texto. Tenha em mente que ambos os índices em ambos os lados dos dois pontos são inclusivos. Ao contrário do Python, índices negativos não são suportados. Em vez disso, você usará o operador final com um número negativo. Por exemplo, para obter o terceiro caractere do final da string, você pode escrever o seguinte. 

In [34]:
text

"Julia is a high-level, dynamic programming language"

In [35]:
# obtendo o terceiro caracatere do texto
text[end-2]

'a': ASCII/Unicode U+0061 (category Ll: Letter, lowercase)

In [36]:
# obtendo o último caractere
text[end-0]

'e': ASCII/Unicode U+0065 (category Ll: Letter, lowercase)

**Operações de string comuns em Julia**

Você pode usar a função `length()` para contar o número de caracteres em uma string.

In [37]:
# contando o número de caracteres da string
length(text)

51

Uma tarefa comum é combinar duas ou mais strings. Você pode fazer isso com a função `string()`, passando strings para a função separadas por vírgulas.

In [38]:
# criando uma string com as palavras "Julia", "is" e "awesome!"
string("Julia", " is", " awesome!")

"Julia is awesome!"

Você também pode usar o operador `*` (multiplicação) para combinar strings.

In [39]:
# criando uma string de multiplicação de strings
"73" * " is" * " the" * " best" * " prime."

"73 is the best prime."

Em ambas as formas, lembre-se de deixar um espaço entre as palavras. 

Outra maneira de unir strings é repetindo uma string várias vezes, isso é feito com operador `^` (exponenciação):

In [40]:
# criando uma string com o perador de exponenciação
"Three times the fun! " ^ 3

"Three times the fun! Three times the fun! Three times the fun! "

**Encontrando e modificando strings**

In [247]:
# detectando a presença de um padrão em uma string com ocursin()
occursin("Julia", "Julia for data science is cool") # retorna true

true

In [254]:
# detectando a posição da primeira correspondência em uma string com findfirst()
findfirst("Julia Lang", "Julia Lang for data science is cool") # retorna 1:10

1:10

In [257]:
# convertendo uma string para letras maiúsculas com uppercase()
uppercase("Julia") # retorna "JULIA"

"JULIA"

In [259]:
# convertendo uma string para letras minúsculas com lowercase()
lowercase("JULIA") # retorna "julia"

"julia"

In [261]:
# convertendo uma string em maiúsculas e minúsculas com titlecase()
titlecase("JULIA programming") # retorna "Julia Programming"

"Julia Programming"

In [266]:
# substituíndo correspondências de um padrão por uma nova string com replace()
replace("Learn Pyhon for Data Science!", "Python" => "Julia") # retorna "Learn Pyhon for Data Science"

"Learn Pyhon for Data Science!"

<br>

#### **Matrizes em Julia**

Outro tipo de dados comum no Julia e em outras linguagens são os _arrays_, como são chamados no Julia. 

   _Arrays são uma lista de valores armazenados entre colchetes `[]`_. 
   
   Arrays são chamados de forma diferente com base em suas dimensões.

- Arrays unidimensionais são chamados de **vetores**.
- Arrays bidimensionais são chamados de **matrizes**.
- Arrays tridimensionais e acima são chamados apenas de **arrays**.

Neste tutorial, vamos nos concentrar exclusivamente em vetores. Os vetores podem ser criados passando itens em um par de colchetes, como visto abaixo.

In [41]:
# instanciando um vetor de 3 inteiros
x = [1, 2, 3]

3-element Vector{Int64}:
 1
 2
 3

In [42]:
# visualizando o tipo de objeto criado acima
typeof(x)

Vector{Int64}[90m (alias for [39m[90mArray{Int64, 1}[39m[90m)[39m

O vetor `x` tem o tipo **Vector**, que é uma matriz unidimensional (conforme listado pela saída alias for `Array{In664, 1}`). 

Todos os seus elementos têm tipo de dados `Int64`. Mas isso nem sempre significa que todos os elementos devem ter o mesmo tipo. Por exemplo, aqui está um vetor com elementos de diferentes tipos. 

In [43]:
# criando vetores com tipos de elementos específicos usando Vector{type}([4, 5, 6])
y = Vector{Float64}([4, 5, 6])

3-element Vector{Float64}:
 4.0
 5.0
 6.0

In [44]:
# criando uma sequência de números de a até b com a:b
5:50

5:50

In [45]:
# criando uma sequência de números de a até b em etapas com a:step:b
1:2:100

1:2:99

In [46]:
vector = [4, "Julia", [7, 8]]
n = 1
m = 3

# criando um vetor que se repita m vezes onde cada elemento se repita n vezes
seq = repeat(vector, inner=n, outer=m)
print(seq)

Any[4, "Julia", [7, 8], 4, "Julia", [7, 8], 4, "Julia", [7, 8]]

In [47]:
# instaciando um vetor de vários tipos de dados
array = [1, "Julia Lang", 22/7]

3-element Vector{Any}:
 1
  "Julia Lang"
 3.142857142857143

Como você pode ver, os elementos do vetor têm o tipo de dados `Any` dentro das chaves, que representam vários tipos de dados. Você pode até mesmo passar vetores para vetores.

In [48]:
# instanciando um vetor com vários tipos de dados, e dentro do mesmo outro vetor
array = [1, 2, 3, ["Julia Lang", 2022]]

4-element Vector{Any}:
 1
 2
 3
  Any["Julia Lang", 2022]

A função `length()` funciona da mesma forma em vetores e strings, pois conta o número de elementos dentro do array.

In [49]:
# contabilizando a quantidade de elementos do vetor acima
length(array)

4

As regras de indexação também funcionam de forma semelhante — aqui, estamos indexando o primeiro e o segundo elementos na matriz.

In [50]:
# obtendo o primeiro elemento do vetor
array = [2022, "Julia Lang", 22/7]
array[begin]

2022

In [51]:
# obtendo o último elemento do vetor
array[end-0]

3.142857142857143

In [52]:
# obtendo o penúltimo elemento do vetor
array[end-1]

"Julia Lang"

In [53]:
# visualizando o tipo de dado do primeiro elemento do vetor
typeof(array[begin])

Int64

In [54]:
# visualizando o tipo de dado do último elemento do vetor
typeof(array[end-0])

Float64

In [55]:
# visualizando o tipo de dado do penúltimo elemento
typeof(array[end-1])

String

**Funções vetoriais**

In [56]:
# classificando vetores com sort(x)
x = [17, 9, 3, 4, 3, 17]
sort(x)

6-element Vector{Int64}:
  3
  3
  4
  9
 17
 17

In [57]:
# invertendo vetores com reverse(x)
reverse(x)

6-element Vector{Int64}:
 17
  3
  4
  3
  9
 17

In [58]:
# invertendo no local com reverso!(x)
reverse!(x)

6-element Vector{Int64}:
 17
  3
  4
  3
  9
 17

In [59]:
# obtendo elementos únicos de um vetor com unique()
unique(x)

4-element Vector{Int64}:
 17
  3
  4
  9

**Selecionando elementos vetoriais**

In [60]:
# selecionando o 6º elemento de um vetor com x[6]
x = [9, 1, 4, 6, 7, 11, 5] # retorna 11
x[6]

11

In [61]:
# selecionando o primeiro elemento de um vetor com x[begin]
x[begin] # retorna 9

9

In [62]:
# selecionando o primeiro elemento de um vetor com x[1]
x[1] # retorna 9

9

In [63]:
# fatiando elementos de dois a seis de um vetor com x[2:6]
x[2:6]

5-element Vector{Int64}:
  1
  4
  6
  7
 11

In [64]:
# selecionando o 2º e 6º elemento de um vetor com x[[2, 6]]
x[[2, 6]]

2-element Vector{Int64}:
  1
 11

In [65]:
# selecionando elementos iguais a 5 com x[x .== 5]
x[x .== 5]

1-element Vector{Int64}:
 5

In [66]:
# selecionando elementos no vetor 2, 5, 8 com x[in([2, 5, 8]).(x)]
x[in([2, 5, 8]).(x)]

1-element Vector{Int64}:
 5

**Funções matemáticas**

In [115]:
# instanciando um vetor
x = [9, 1, 4, 6, 7, 11, 5]

7-element Vector{Int64}:
  9
  1
  4
  6
  7
 11
  5

In [116]:
# obtendo o logaritmo de um número com log()
log(2)

0.6931471805599453

In [117]:
# obtendo o logaritmo elementar de um vetor com log.()
log.(x)

7-element Vector{Float64}:
 2.1972245773362196
 0.0
 1.3862943611198906
 1.791759469228055
 1.9459101490553132
 2.3978952727983707
 1.6094379124341003

In [118]:
# obtendo o exponencial de um número com exp()
exp(2)

7.38905609893065

In [119]:
# obtendo a exponencial elementar de um vetor com exp.()
exp.(2)

7.38905609893065

In [120]:
# obtendo o máximo de um vetor com maximum()
maximum(x)

11

In [121]:
# obtendo o mínimo de um vetor com minumum()
minimum(x)

1

In [122]:
# obtendo a soma de um vetor com sum()
sum(x)

43

**Observação:** o código a seguir requer a instalação e o carregamento dos pacotes `Statistics` e `StatsBase`. Isso pode ser feito com o comando abaixo.

In [123]:
# instalando os pacotes necessários
using Pkg
Pkg.add("Statistics")
Pkg.add("StatsBase")

[32m[1m   Resolving[22m[39m package versions...
[32m[1m  No Changes[22m[39m to `~/.julia/environments/v1.8/Project.toml`
[32m[1m  No Changes[22m[39m to `~/.julia/environments/v1.8/Manifest.toml`
[32m[1m   Resolving[22m[39m package versions...
[32m[1m  No Changes[22m[39m to `~/.julia/environments/v1.8/Project.toml`
[32m[1m  No Changes[22m[39m to `~/.julia/environments/v1.8/Manifest.toml`


In [124]:
# habilitando os pacotes
using Statistics
using StatsBase

In [182]:
# declarando um vetor
x = [2.0, 7.5, 5.13, 9.0, 3.14, 13.11, 8.08, 25.257]

8-element Vector{Float64}:
  2.0
  7.5
  5.13
  9.0
  3.14
 13.11
  8.08
 25.257

In [183]:
# obtendo a média de um vetor com mean()
mean(x)

9.152125

In [184]:
# obtendo a mediana de um vetor com median()
median(x)

7.79

In [185]:
# obtendo os quantis do vetor com quantile(x)
quantile(x)

5-element Vector{Float64}:
  2.0
  4.6325
  7.79
 10.0275
 25.257

In [186]:
# obtendo o primeiro quantil de um vetor com quantile(x)[1]
quantile(x)[1]

2.0

In [187]:
# obtendo o quarto quantil de um vetor com quantile(x)[4]
quantile(x)[4]

10.0275

In [196]:
# valores inteiros do vetor
round.(x)

8-element Vector{Float64}:
  2.0
  8.0
  5.0
  9.0
  3.0
 13.0
  8.0
 25.0

In [195]:
# obtendo o ranking de elementos vetoriais com StatsBase; classificação ordinal()
ordinalrank(x)

8-element Vector{Int64}:
 1
 4
 3
 6
 2
 7
 5
 8

In [198]:
# obtendo a variância de um vetor com var()
var(x)

54.629987553571425

In [199]:
# obtendo o desvio padrão de um vetor com std()
std(x)

7.391210154877983

In [214]:
# imprimindo o vetor x e a quantidade de elementos
print(x); length(x)

[2.0, 7.5, 5.13, 9.0, 3.14, 13.11, 8.08, 25.257]

8

In [215]:
# instanciando o vetor y e a quantidade de elementos
y = [11, 43, 25, 10, 23, 16, 5, 3]; length(y)

8

In [216]:
# otendo a correlação entre dois vetores com cor(x, y)
cor(x, y)

-0.41857879432007267

<br>

#### **Operadores booleanos e comparações numéricas**

As linguagens de programação usam valores booleanos para implementar a lógica. Um booleano só pode ter dois valores: trueou false. Os valores booleanos são especialmente úteis ao trabalhar com comparações numéricas e operadores booleanos. Vejamos primeiro as comparações numéricas.

**Operadores de comparação numérica em Julia**

Na tabela abaixo, você encontrará os operadores de comparação numérica mais usados ​​em Julia. Como você verá nos exemplos, você pode comparar booleanos, objetos numéricos e muito mais usando operadores de comparação numérica. Observe que você pode usar um ou dois símbolos para escrever menor/maior que ou igual a. Para usar a versão de um símbolo, digite `\|e` e depois TAB ou `\ge` depois TAB.

    Operador                    Nome                    Exemplo
    --------------------------------------------------------------------------------------------
    ==                          igualdade               1 == 3 # retorna false
    !=                          desigualdade            1 != 3 # retorna true
    <                           menor que               1 < 3 # retorna true
    <=, ≤                       menor que ou igual a    length("Hello") <= 5 # retorna true
    >                           maior que               1 > 1 # retorna false
    >=, ≥                       maior que ou igual a    true >= true # retorna true
    ~                           não lógico              ~(2 == 2) # retorna false

Segue os exemplos abaixo:

In [75]:
# igualdade
1 == 3

false

In [76]:
# desigualdade
1 != 3

true

In [77]:
# menor que
1 < 3

true

In [78]:
# menor que ou igual
length("Hello") <= 5

true

In [79]:
# maior que
1 > 1

false

In [80]:
# maior que ou igual
true >= true

true

In [81]:
# não lógico
~(2 == 2)

false

**Outros operadores**

In [82]:
# procurando se um valor está em uma matriz com x em arr
 x = [2, 11, 17, 20]

11 in x  # retorna true

true

In [83]:
# tipo do objeto declarado acima
typeof(x)

Vector{Int64}[90m (alias for [39m[90mArray{Int64, 1}[39m[90m)[39m

In [84]:
# canaliza os valores para uma função com value |> fn
x |> (y -> length(y) + sum(y))  # retorna 56
# soma os valores do vetor e realiza o acréscimo da quantidade de elementos no vetor
# 2 + 11 + 17 + 20 = 50, mais a quantidade de elementos, 4 + 50 = 54

54

<br>

#### **Sintaxe Julia intermediária**

**Declarações condicionais em Julia**

Usando valores e operadores booleanos, você pode escrever instruções condicionais. Por exemplo, se algo for avaliado como verdadeiro — execute uma operação. Se falso, execute outro. As instruções condicionais também são chamadas de instruções `if/else`. Aqui está como eles são escritos:

In [85]:
if true
    print("Faça alguma coisa!")
else
    print("Faça outra coisa!")
end

Faça alguma coisa!

Sempre que uma condição após a palavra-chave `if` for avaliada como **true**, o bloco if é executado, caso contrário, o bloco else é executado. Este exemplo mostra uma condicional que verifica se um número é par ou ímpar.

In [86]:
number = 5

if number % 2 == 0
    print("O número é par!")
else
    print("O número é ímpar!")
end

O número é ímpar!

Na expressão após `if`, estamos usando o operador de módulo, **%**, para verificar se o número retorna `0` como resto quando dividido por 2. É avaliado como falso porque o resto da divisão de 5 por 2 é 1. Portanto, a cláusula else é executado. Agora, vamos usar nosso conhecimento de operadores booleanos e declarações condicionais para escrever um programa que verifica se um número é positivo, negativo ou zero. 

In [87]:
number = 0

if number > 0
    print("O número é positivo!")
elseif number == 0
    print("O número é igual a zero!")
else
    print("O número é negativo!")
end

O número é igual a zero!

Estamos adicionando a nova condição usando a cláusula `elseif`. Usamos cláusulas **elseif** quando temos que verificar duas ou mais condições na ordem exata. 

**Para loops**

Um _loop for_ na programação é usado para iterar e executar operações em cada elemento de uma sequência (string, vetor, tupla, conjunto etc.) em ordem. A sintaxe `for-loop` é direta em Julia. Por exemplo, vamos construir um loop que imprima cada elemento de um vetor:

In [88]:
languages = ["Julia", "Python", "R"]

3-element Vector{String}:
 "Julia"
 "Python"
 "R"

In [89]:
for lang = languages
    println(lang)
end

Julia
Python
R


O loop for é iniciado escrevendo a palavra- forchave. Em seguida, escolhemos um nome de variável temporária. Neste caso, estamos escolhendo lang, cujo valor muda à medida que percorremos as linguagens vetoriais. Então, para especificar que estamos percorrendo languages, escrevemos seu nome após o operador de atribuição =.

Dentro do loop, utilizamos a `println()` função para imprimir cada elemento das linguagens, representado pela variável **lang** temporária. _lang_ é chamada de variável temporária porque não está acessível quando o loop termina.

**Nota:** a diferença entre `print()` e `println()` é que _println()_ imprime itens em novas linhas.

Você pode usar tudo o que aprendeu até aqui dentro dos _loops for_. Por exemplo, vamos criar um array de 10 inteiros e imprimir apenas números ímpares nele:

In [90]:
integers_vector = [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

10-element Vector{Int64}:
 0
 1
 2
 3
 4
 5
 6
 7
 8
 9

In [91]:
for i = integers_vector
    # imprima apenas os números ímpares
    if i % 2 == 1
        println(i)
    end
end

1
3
5
7
9


Não se esqueça de fechar o **for loop** e a instrução **if** com `end`.

Você também pode iterar por meio de strings, pois elas também são sequências. Aqui, por exemplo, estamos imprimindo cada letra da string "Julia".

In [92]:
for letter = "Julia"
    println(letter)
end

J
u
l
i
a


<br>

#### **Instalando pacotes no Julia**

Todos os operadores ( +, -, *, ^), funções ( print(), println(), typeof()) e palavras-chave ( for, if, else) que usamos vêm com a instalação do Julia. No entanto, o código na instalação não é suficiente para resolver todos os nossos problemas. Precisamos instalar pacotes para carregar ferramentas e funções para funcionalidade extra. Os pacotes são bibliotecas de código pré-escrito (por outros programadores) que podemos adicionar à nossa instalação do Julia, que nos ajudam a resolver problemas específicos.

Por exemplo, instalaremos dois pacotes chamados `DataFrames` e `CSV` que nos ajudam a manipular informações em arquivos **CSV**. Aqui está como fazê-lo:

```julia
using Pkg
Pkg.add("DataFrames")
Pkg.add("CSV")
```

A classe `Pkg` é um gerenciador de pacotes global Julia. A função `add()` adiciona novos pacotes à instalação. Para importar todos os nomes de funções das bibliotecas, nós os importamos com a palavra-chave `using` no topo de nossos scripts.

```julia
using DataFrames
using CSV
```

Usaremos suas funções na próxima seção.

<br>

#### **Começando com DataFrames**

Um `DataFrame` é um tipo de dados especial em linguagens de ciência de dados como Julia, Python ou R projetado para trabalhar com tabelas. O formato de arquivo mais popular para armazenar tabelas é o `CSV` (valores separados por vírgula). A biblioteca **DataFrame** terá as ferramentas para carregar esses arquivos e manipular as informações contidas.

**Importando arquivos CSV**

Estaremos importando o conjunto de [dados de diamantes](https://github.com/tidyverse/ggplot2/blob/main/data-raw/diamonds.csv) para este tutorial. O arquivo `diamonds.csv` fica assim:

![image.png](attachment:6ea7804f-9c9b-4140-8fff-3c80bb76bac5.png)

A primeira linha é chamada de cabeçalho e contém os nomes das colunas. Vamos carregá-lo usando os pacotes `CSV` e `.DataFrames`

In [93]:
# instalando os pacotes necessários
using Pkg
Pkg.add("DataFrames")
Pkg.add("CSV")

[91m[1mUnhandled Task [22m[39m[91m[1mERROR: [22m[39mIOError: FDWatcher: bad file descriptor (EBADF)
Stacktrace:
 [1] [0m[1mtry_yieldto[22m[0m[1m([22m[90mundo[39m::[0mtypeof(Base.ensure_rescheduled)[0m[1m)[22m
[90m   @ [39m[90mBase[39m [90m./[39m[90m[4mtask.jl:871[24m[39m
 [2] [0m[1mwait[22m[0m[1m([22m[0m[1m)[22m
[90m   @ [39m[90mBase[39m [90m./[39m[90m[4mtask.jl:931[24m[39m
 [3] [0m[1mwait[22m[0m[1m([22m[90mc[39m::[0mBase.GenericCondition[90m{Base.Threads.SpinLock}[39m[0m[1m)[22m
[90m   @ [39m[90mBase[39m [90m./[39m[90m[4mcondition.jl:124[24m[39m
 [4] [0m[1m_wait[22m[0m[1m([22m[90mfdw[39m::[0mFileWatching._FDWatcher, [90mmask[39m::[0mFileWatching.FDEvent[0m[1m)[22m
[90m   @ [39m[35mFileWatching[39m [90m/snap/julia/70/share/julia/stdlib/v1.8/FileWatching/src/[39m[90m[4mFileWatching.jl:535[24m[39m
 [5] [0m[1mwait[22m[0m[1m([22m[90mfdw[39m::[0mFileWatching.FDWatcher[0m[1m)[22m
[9

In [94]:
# habilitando os pacotes
using DataFrames
using CSV

In [95]:
# carregando o conjundo de dados
diamonds = DataFrame(CSV.File("data/diamonds.csv"))

Row,carat,cut,color,clarity,depth,table,price,x,y,z
Unnamed: 0_level_1,Float64,String15,String1,String7,Float64,Float64,Int64,Float64,Float64,Float64
1,0.23,Ideal,E,SI2,61.5,55.0,326,3.95,3.98,2.43
2,0.21,Premium,E,SI1,59.8,61.0,326,3.89,3.84,2.31
3,0.23,Good,E,VS1,56.9,65.0,327,4.05,4.07,2.31
4,0.29,Premium,I,VS2,62.4,58.0,334,4.2,4.23,2.63
5,0.31,Good,J,SI2,63.3,58.0,335,4.34,4.35,2.75
6,0.24,Very Good,J,VVS2,62.8,57.0,336,3.94,3.96,2.48
7,0.24,Very Good,I,VVS1,62.3,57.0,336,3.95,3.98,2.47
8,0.26,Very Good,H,SI1,61.9,55.0,337,4.07,4.11,2.53
9,0.22,Fair,E,VS2,65.1,61.0,337,3.87,3.78,2.49
10,0.23,Very Good,H,VS1,59.4,61.0,338,4.0,4.05,2.39


In [96]:
# visualizando o tipo de dado do arquivo
typeof(diamonds)

DataFrame

Passamos o caminho do arquivo `CSV` para `CSV.File()`, que por sua vez, é passado para a função **DataFrame()**. A saída de `typeof()` mostra que a operação foi bem-sucedida.

**Manipulação de dados simples**

A primeira coisa que você sempre faz quando tem um novo **DataFrame** é imprimir algumas linhas dele para ver como fica. Você pode fazer isso com a função `first()`.

In [97]:
# imprimindo as 5 primeiras linhas
first(diamonds, 5)

Row,carat,cut,color,clarity,depth,table,price,x,y,z
Unnamed: 0_level_1,Float64,String15,String1,String7,Float64,Float64,Int64,Float64,Float64,Float64
1,0.23,Ideal,E,SI2,61.5,55.0,326,3.95,3.98,2.43
2,0.21,Premium,E,SI1,59.8,61.0,326,3.89,3.84,2.31
3,0.23,Good,E,VS1,56.9,65.0,327,4.05,4.07,2.31
4,0.29,Premium,I,VS2,62.4,58.0,334,4.2,4.23,2.63
5,0.31,Good,J,SI2,63.3,58.0,335,4.34,4.35,2.75


<center>Primeiras 5 linhas do conjunto de dados de diamantes

<br><br>
A função `first()` retorna as primeiras _n_ linhas de um **DataFrame**. Como podemos ver, existem 6 colunas numéricas e 3 categóricas (de texto). O índice também é contado como uma coluna em DataFrames Julia. 

Existe também a função `last()` que funciona de forma semelhante ao `first()`. Você já pode adivinhar o que faz pelo nome. Sim, ele obtém as últimas _n_ linhas.

Outra função útil é `size()`, que imprime o número de linhas e colunas de um DataFrame.

In [98]:
# imprimindo a última linha do conjunto de dados
last(diamonds)

Row,carat,cut,color,clarity,depth,table,price,x,y,z
Unnamed: 0_level_1,Float64,String15,String1,String7,Float64,Float64,Int64,Float64,Float64,Float64
53940,0.75,Ideal,D,SI2,62.2,55.0,2757,5.83,5.87,3.64


In [99]:
# imprimindo as 5 últimas linhas
last(diamonds, 5)

Row,carat,cut,color,clarity,depth,table,price,x,y,z
Unnamed: 0_level_1,Float64,String15,String1,String7,Float64,Float64,Int64,Float64,Float64,Float64
1,0.72,Ideal,D,SI1,60.8,57.0,2757,5.75,5.76,3.5
2,0.72,Good,D,SI1,63.1,55.0,2757,5.69,5.75,3.61
3,0.7,Very Good,D,SI1,62.8,60.0,2757,5.66,5.68,3.56
4,0.86,Premium,H,SI2,61.0,58.0,2757,6.15,6.12,3.74
5,0.75,Ideal,D,SI2,62.2,55.0,2757,5.83,5.87,3.64


In [100]:
# imprimindo a dimensão do conjunto de dados
size(diamonds) # linhas e colunas

(53940, 10)

Temos tem 53.940 linhas e 10 colunas (incluindo o índice). A olho nu não é possível lidar com todas as linhas, portanto, usamos estatísticas resumidas para ter uma ideia da distribuição das colunas em nosso conjunto de dados. Para isso, usamos a função `describe()`

In [101]:
# estatística descritiva do conjunto de dados
describe(diamonds)

Row,variable,mean,min,median,max,nmissing,eltype
Unnamed: 0_level_1,Symbol,Union…,Any,Union…,Any,Int64,DataType
1,carat,0.79794,0.2,0.7,5.01,0,Float64
2,cut,,Fair,,Very Good,0,String15
3,color,,D,,J,0,String1
4,clarity,,I1,,VVS2,0,String7
5,depth,61.7494,43.0,61.8,79.0,0,Float64
6,table,57.4572,43.0,57.0,95.0,0,Float64
7,price,3932.8,326,2401.0,18823,0,Int64
8,x,5.73116,0.0,5.7,10.74,0,Float64
9,y,5.73453,0.0,5.71,58.9,0,Float64
10,z,3.53873,0.0,3.53,31.8,0,Float64


<center>Saída da função describe()

<br>

A saída é uma tabela de resumo com 7 colunas. As colunas _mínima, máxima, média_ e _mediana_ só se aplicam a colunas numéricas. Na coluna `eltype`, você pode ver os tipos de dados de cada coluna. Os números ao lado de String referem-se ao comprimento da string mais longa naquela coluna.

Você também pode usar a seguinte sintaxe para selecionar colunas individuais do DataFrame.

In [102]:
# extraindo as primeiras 10 linhas da coluna "cut"
diamonds[:, :cut][begin:10]

10-element PooledArrays.PooledVector{String15, UInt32, Vector{UInt32}}:
 "Ideal"
 "Premium"
 "Good"
 "Premium"
 "Good"
 "Very Good"
 "Very Good"
 "Very Good"
 "Fair"
 "Very Good"

Os primeiros dois pontos dentro dos colchetes selecionam todas as linhas. Em seguida, especificamos o nome da coluna após uma vírgula e outros dois pontos (sem aspas). Em seguida, usamos a indexação no array retornado para selecionar as dez primeiras linhas. Para simplificar ainda mais o código acima, poderíamos selecionar as dez primeiras linhas diretamente dentro dos primeiros colchetes, como abaixo:

In [103]:
# extraindo as primeiras 10 linhas da coluna "carat"
diamonds[1:10, :carat]

10-element Vector{Float64}:
 0.23
 0.21
 0.23
 0.29
 0.31
 0.24
 0.24
 0.26
 0.22
 0.23

Para selecionar várias colunas, coloque os nomes das colunas (combinados com dois pontos) entre colchetes.

In [104]:
# extraindo as primeiras 10 linhas das colunas quilate (carat), corte (cut)  e preço (price)
diamonds[1:10, [:carat, :cut, :price]]

Row,carat,cut,price
Unnamed: 0_level_1,Float64,String15,Int64
1,0.23,Ideal,326
2,0.21,Premium,326
3,0.23,Good,327
4,0.29,Premium,334
5,0.31,Good,335
6,0.24,Very Good,336
7,0.24,Very Good,336
8,0.26,Very Good,337
9,0.22,Fair,337
10,0.23,Very Good,338


Vamos executar a describe()função apenas nas colunas numéricas

In [105]:
# executando a descrição apenas em colunas numéricas: quilate, profundidade, tabela, preço x, e y
describe(diamonds[:, [:carat, :depth, :table, :price, :x, :y]]) 

Row,variable,mean,min,median,max,nmissing,eltype
Unnamed: 0_level_1,Symbol,Float64,Real,Float64,Real,Int64,DataType
1,carat,0.79794,0.2,0.7,5.01,0,Float64
2,depth,61.7494,43.0,61.8,79.0,0,Float64
3,table,57.4572,43.0,57.0,95.0,0,Float64
4,price,3932.8,326.0,2401.0,18823.0,0,Int64
5,x,5.73116,0.0,5.7,10.74,0,Float64
6,y,5.73453,0.0,5.71,58.9,0,Float64


Para ver o DataFrame classificado em ordem crescente com base em uma coluna, use a função `sort()`:

In [106]:
# classifique os diamantes e veja as primeiras 5 linhas
sorted_diamonds = sort(diamonds, :price)

first(sorted_diamonds, 5)

Row,carat,cut,color,clarity,depth,table,price,x,y,z
Unnamed: 0_level_1,Float64,String15,String1,String7,Float64,Float64,Int64,Float64,Float64,Float64
1,0.23,Ideal,E,SI2,61.5,55.0,326,3.95,3.98,2.43
2,0.21,Premium,E,SI1,59.8,61.0,326,3.89,3.84,2.31
3,0.23,Good,E,VS1,56.9,65.0,327,4.05,4.07,2.31
4,0.29,Premium,I,VS2,62.4,58.0,334,4.2,4.23,2.63
5,0.31,Good,J,SI2,63.3,58.0,335,4.34,4.35,2.75


Para classificar em ordem decrescente, envolva a função `order()` ao redor do nome da coluna.

In [107]:
# classifique os diamantes em ordem decrescente e veja as primeiras 5 linhas
sorted_diamonds = sort(diamonds, order(:price, rev=true))

first(sorted_diamonds, 5)

Row,carat,cut,color,clarity,depth,table,price,x,y,z
Unnamed: 0_level_1,Float64,String15,String1,String7,Float64,Float64,Int64,Float64,Float64,Float64
1,2.29,Premium,I,VS2,60.8,60.0,18823,8.5,8.47,5.16
2,2.0,Very Good,G,SI1,63.5,56.0,18818,7.9,7.97,5.04
3,1.51,Ideal,G,IF,61.7,55.0,18806,7.37,7.41,4.56
4,2.07,Ideal,G,SI2,62.5,55.0,18804,8.2,8.13,5.11
5,2.0,Very Good,H,SI1,62.8,57.0,18803,7.95,8.0,5.01


**Criando `DataFrame`**

In [268]:
using DataFrames
using CSV

In [286]:
df = DataFrame(
    first_name=["Fernando", "Kátia", "Sara", "Eloah"],
    genre=['M', 'F', 'F', 'F'],
    age=[45, 42, 22, 15],
    )

Row,first_name,genre,age
Unnamed: 0_level_1,String,Char,Int64
1,Fernando,M,45
2,Kátia,F,42
3,Sara,F,22
4,Eloah,F,15


In [289]:
# selecionando uma linha específica do DataFrame e todas as colunas
df[1, :]

Row,first_name,genre,age
Unnamed: 0_level_1,String,Char,Int64
1,Fernando,M,45


In [290]:
# selecionando uma coluna de um DataFrame usando "." e nome da coluna
df.first_name

4-element Vector{String}:
 "Fernando"
 "Kátia"
 "Sara"
 "Eloah"

In [292]:
# selecionando uma coluna de um DataFrame
df[:, 2]

4-element Vector{Char}:
 'M': ASCII/Unicode U+004D (category Lu: Letter, uppercase)
 'F': ASCII/Unicode U+0046 (category Lu: Letter, uppercase)
 'F': ASCII/Unicode U+0046 (category Lu: Letter, uppercase)
 'F': ASCII/Unicode U+0046 (category Lu: Letter, uppercase)

In [294]:
# selecionando um dado de uma coluna e linha específica
df[1, 2]

'M': ASCII/Unicode U+004D (category Lu: Letter, uppercase)

**Manipulação de DataFrames**

In [297]:
# concatenando dois DataFrames horizontalmente com hcat()
df_1 = DataFrame(column_A= 1:3, column_B = 1:3)
df_2 = DataFrame(column_C = 4:6, column_D = 4:6)

df_3 = hcat(df_1, df_2) # retorna um DataFrame de quatro colunas com colunas A, B, C, D

Row,column_A,column_B,column_C,column_D
Unnamed: 0_level_1,Int64,Int64,Int64,Int64
1,1,1,4,4
2,2,2,5,5
3,3,3,6,6


In [298]:
# filtrando as linhas com filter() — isolando todas as linhas de df_3 onde column_A > 2
df_filter = filter(row -> row.column_A > 2, df_3)

Row,column_A,column_B,column_C,column_D
Unnamed: 0_level_1,Int64,Int64,Int64,Int64
1,3,3,6,6


In [300]:
# selecionando colunas com select()
select(df_3, 2) # retorna a segunda coluna

Row,column_B
Unnamed: 0_level_1,Int64
1,1
2,2
3,3


In [301]:
# selecionando todas as colunas, exceto aquelas especificadas com select(Not())
select(df_3, Not(2)) # retorne tudo, exceto a segunda coluna

Row,column_A,column_C,column_D
Unnamed: 0_level_1,Int64,Int64,Int64
1,1,4,4
2,2,5,5
3,3,6,6


In [304]:
# renomeando colunas com rename(old => new)
rename(df_3, ["column_A" => "first_column"])

Row,first_column,column_B,column_C,column_D
Unnamed: 0_level_1,Int64,Int64,Int64,Int64
1,1,1,4,4
2,2,2,5,5
3,3,3,6,6


In [305]:
# obtenha linhas com valores distintos em uma coluna com unique(df, :col)
unique(df_3, :column_A)

Row,column_A,column_B,column_C,column_D
Unnamed: 0_level_1,Int64,Int64,Int64,Int64
1,1,1,4,4
2,2,2,5,5
3,3,3,6,6


In [307]:
# ordenando as linhas com sort()
sort(df_3, :column_A)

Row,column_A,column_B,column_C,column_D
Unnamed: 0_level_1,Int64,Int64,Int64,Int64
1,1,1,4,4
2,2,2,5,5
3,3,3,6,6


In [309]:
# obtenha estatísticas resumidas do DataFrame com describe()
describe(df_3)

Row,variable,mean,min,median,max,nmissing,eltype
Unnamed: 0_level_1,Symbol,Float64,Int64,Float64,Int64,Int64,DataType
1,column_A,2.0,1,2.0,3,0,Int64
2,column_B,2.0,1,2.0,3,0,Int64
3,column_C,5.0,4,5.0,6,0,Int64
4,column_D,5.0,4,5.0,6,0,Int64


Impressionante! Agora, você pode carregar DataFrames e realizar a exploração básica de dados.