In [1]:
# Versão da Linguagem Python
from platform import python_version
print('Versão de Python Neste Jupyter Notebook:', python_version())

# usaremos o filtro 'warning' para deixar mais limpo.
import warnings
warnings.filterwarnings('ignore')

Versão de Python Neste Jupyter Notebook: 3.10.5


### Obtendo dados para Python

A primeira etapa da análise de dados é obter os dados. Mover seus dados de onde você os armazenou para suas ferramentas analíticas e voltar novamente pode ser uma tarefa difícil se você não souber o que está fazendo. O Python e suas bibliotecas tentam torná-lo o mais fácil possível.

Com apenas algumas linhas de código, você poderá importar e exportar dados nos seguintes formatos:

- CSV
- Excel
- SQL

#### Carregando dados de arquivos CSV

Normalmente, os dados chegarão até nós como arquivos ou links de banco de dados. 

In [2]:
# Carregando dados do arquivo CSV.

import pandas as pd

arquivo = "datasets/smallgradesh.csv"
df = pd.read_csv(arquivo, header = None)

Agora, vamos dar uma olhada em como nossos dados se parecem

In [3]:
# Exibir as cinco primeiras linhas de dados.

df.head()

Unnamed: 0,0,1
0,Name,Grade
1,Marcia,82.4
2,Kadeem,78.2
3,Nash,79.3
4,Noelani,83.2


Como você pode ver, nosso dataframe não possui cabeçalhos de coluna. Ou melhor, existem cabeçalhos, mas não foram carregados como cabeçalhos; eles foram carregados como linha um de seus dados.

In [4]:
# Carregando dados do arquivo CSV com cabeçalhos.

caminho = "datasets/gradedata.csv" 
df = pd.read_csv(caminho)

In [5]:
df.head()

Unnamed: 0,fname,lname,gender,age,exercise,hours,grade,address
0,Marcia,Pugh,female,17,3,10,82.4,"9253 Richardson Road, Matawan, NJ 07747"
1,Kadeem,Morrison,male,18,4,4,78.2,"33 Spring Dr., Taunton, MA 02780"
2,Nash,Powell,male,18,5,9,79.3,"41 Hill Avenue, Mentor, OH 44060"
3,Noelani,Wagner,female,14,2,7,83.2,"8839 Marshall St., Miami, FL 33125"
4,Noelani,Cherry,female,18,4,15,87.4,"8304 Charles Rd., Lewis Center, OH 43035"


Se você tiver um conjunto de dados que não inclua cabeçalhos, poderá adicioná-los posteriormente.

In [6]:
# Carregando dados do arquivo CSV e adicionando cabeçalhos.arquivo

caminho = "datasets/smallgrades.csv"

# Para adicionar cabeçalhos enquanto carregamos os dados.
df = pd.read_csv(caminho, 
                 names = ['Names', 'Grades'])

# Para adicionar cabeçalhos a um dataframe.
df.columns = ['Names', 'Grades']

In [7]:
df.head()

Unnamed: 0,Names,Grades
0,Marcia,82.4
1,Kadeem,78.2
2,Nash,79.3
3,Noelani,83.2
4,Noelani,87.4


#### Salvando dados em CSV

Talvez você queira salvar seu progresso ao analisar dados. Talvez você esteja apenas usando o Python para massagear alguns dados para análise posterior em outra ferramenta. Ou talvez você tenha algum outro motivo para exportar seu dataframe para um arquivo CSV.

In [8]:
# Exportando um conjunto de dados para CSV

nomes = ['Bob', 'Jessica', 'Mary', 'John', 'Mel'] 
notas = [76, 95, 77, 78, 99]
GradeList = zip(nomes, notas) 

df = pd.DataFrame(data = GradeList, 
                  columns = ['Nomes', 'Notas'])

df.to_csv('datasets/studentgrades.csv',
          index = False,
          header = False)

- As linhas 3 a 8 são as linhas que criam o dataframe. 
- A linha 10 é o código para exporte o dataframe df para um arquivo CSV chamado studentgrades.csv.

Os únicos parâmetros que usamos são index e header. Configurando estes parâmetros como falso impedirá que os nomes de índice e cabeçalho sejam exportados. Altere os valores desses parâmetros para entender melhor seu uso.

Se você deseja informações detalhadas sobre o método to_csv,

In [9]:
# Obtendo ajuda para to_csv

df.to_csv?

[1;31mSignature:[0m
[0mdf[0m[1;33m.[0m[0mto_csv[0m[1;33m([0m[1;33m
[0m    [0mpath_or_buf[0m[1;33m:[0m [1;34m'FilePath | WriteBuffer[bytes] | WriteBuffer[str] | None'[0m [1;33m=[0m [1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0msep[0m[1;33m:[0m [1;34m'str'[0m [1;33m=[0m [1;34m','[0m[1;33m,[0m[1;33m
[0m    [0mna_rep[0m[1;33m:[0m [1;34m'str'[0m [1;33m=[0m [1;34m''[0m[1;33m,[0m[1;33m
[0m    [0mfloat_format[0m[1;33m:[0m [1;34m'str | None'[0m [1;33m=[0m [1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mcolumns[0m[1;33m:[0m [1;34m'Sequence[Hashable] | None'[0m [1;33m=[0m [1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mheader[0m[1;33m:[0m [1;34m'bool_t | list[str]'[0m [1;33m=[0m [1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mindex[0m[1;33m:[0m [1;34m'bool_t'[0m [1;33m=[0m [1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mindex_label[0m[1;33m:[0m [1;34m'IndexLabel | None'[0m [1;33m=[0m [1;32mNone[0m[1;33m,[0m[1;33m

In [10]:
# Criando um conjunto de dados para o exercício

names = ['Bob', 'Jessica', 'Mary', 'John', 'Mel'] 

notas = [76, 95, 77, 78, 99] 
bsdegrees = [1, 1, 0, 0, 1] 
msdegrees = [2, 1, 0, 0, 0] 
phddegrees = [0, 1, 0, 0, 0]

Graus = zip(nomes, notas, bsdegrees, msdegrees, phddegrees) 

colunas = ['Nomes', 'Notas', 'BS', 'MS', 'PhD'] 

df = pd.DataFrame(data = Graus,
                  columns = colunas ) 

df

Unnamed: 0,Nomes,Notas,BS,MS,PhD
0,Bob,76,1,2,0
1,Jessica,95,1,1,1
2,Mary,77,0,0,0
3,John,78,0,0,0
4,Mel,99,1,0,0


Você pode exportar o dataframe criado pelo código na Listagem

#### Carregando dados de arquivos do Excel

Normalmente, os dados chegarão até nós como arquivos ou links de banco de dados. Vamos ver como carregar dados de um arquivo Excel

In [11]:
# Carregando dados do arquivo do Excel

caminho = "datasets/gradedata.xlsx"
df = pd.read_excel(caminho)

vamos dar uma olhada

In [12]:
# Exibir as cinco primeiras linhas de dados
df.head()

Unnamed: 0,fname,lname,gender,age,exercise,hours,grade,address
0,Marcia,Pugh,female,17,3,10,82.4,"7379 Highland Rd. , Dublin, GA 31021"
1,Kadeem,Morrison,male,18,4,4,78.2,"8 Bayport St. , Honolulu, HI 96815"
2,Nash,Powell,male,18,5,9,79.3,"Encino, CA 91316, 3 Lilac Street"
3,Noelani,Wagner,female,14,2,7,83.2,"Riverview, FL 33569, 9998 North Smith Dr."
4,Noelani,Cherry,female,18,4,15,87.4,"97 SE. Ocean Street , Bethlehem, PA 18015"


Se desejar alterar ou simplificar os nomes das colunas, você pode executar o código
mostrado na Listagem 2-11.

In [13]:
# Alterar nomes de colunas

df.columns = ['first', 'last', 'sex', 'age', 'exer', 'hrs', 'grd', 'addr'] 
df.head()

Unnamed: 0,first,last,sex,age,exer,hrs,grd,addr
0,Marcia,Pugh,female,17,3,10,82.4,"7379 Highland Rd. , Dublin, GA 31021"
1,Kadeem,Morrison,male,18,4,4,78.2,"8 Bayport St. , Honolulu, HI 96815"
2,Nash,Powell,male,18,5,9,79.3,"Encino, CA 91316, 3 Lilac Street"
3,Noelani,Wagner,female,14,2,7,83.2,"Riverview, FL 33569, 9998 North Smith Dr."
4,Noelani,Cherry,female,18,4,15,87.4,"97 SE. Ocean Street , Bethlehem, PA 18015"


#### Salvando dados em arquivos do Excel

In [14]:
# Exportando um Dataframe para o Excel

nomes = ['Bob', 'Jessica', 'Mary', 'John', 'Mel'] 
notas = [76, 95, 77, 78, 99]

GradeList = zip(nomes, notas) 
df = pd.DataFrame(data = GradeList, 
                  columns = ['Nomes', 'Notas']) 

escritor = pd.ExcelWriter('datasets/dataframe.xlsx', 
                          engine = 'xlsxwriter') 

df.to_excel(escritor, sheet_name = 'Planilha1') 

escritor.save()

Se desejar, você pode salvar diferentes quadros de dados em diferentes planilhas e com um `.save()` você criará um arquivo do Excel com várias planilhas

In [15]:
nomes = ['Bob', 'Jessica', 'Mary', 'John', 'Mel'] 
notas = [33, 93, 47, 99, 49]

GradeList = zip(nomes, notas) 
df2 = pd.DataFrame(data = GradeList, 
                  columns = ['Nomes', 'Notas']) 

In [16]:
# Exportando Múltiplos Dataframes para o Excel

escritor = pd.ExcelWriter('datasets/dataframe.xlsx',
                          engine = 'xlsxwriter') 
df.to_excel(escritor, 
            sheet_name = 'Sheet1') 

df2.to_excel(escritor, 
             sheet_name = 'Sheet2') 

escritor.save()

In [17]:
# Criando um conjunto de dados para o exercício

marca = ['Nike', 'Adidas', 'New Balance', 'Puma', 'Reebok'] 
price = [176, 59, 47, 38, 99]

PriceList = zip(marca, price) 
df = pd.DataFrame(data = PriceList, 
                  columns = ['Marca', 'Preços'])

Combinando dados de vários arquivos do Excel

Às vezes, precisaremos combinar os dados de vários. Arquivos do Excel no mesmo dataframe.

Podemos fazer isso pelo caminho mais longo ou pelo caminho mais curto.

In [18]:
# Caminho Longo

import numpy as np

dados_completos = pd.DataFrame()

df = pd.read_excel("datasets/data1.xlsx") 
dados_completos = dados_completos.append(df, ignore_index=True)

df = pd.read_excel("datasets/data2.xlsx") 
dados_completos = dados_completos.append(df, ignore_index=True)

df = pd.read_excel("datasets/data3.xlsx") 
dados_completos = dados_completos.append(df, ignore_index=True) 

dados_completos.describe()

Unnamed: 0,age,grade
count,300.0,300.0
mean,16.456667,82.923333
std,1.700321,10.544576
min,14.0,65.0
25%,15.0,73.75
50%,16.0,82.0
75%,18.0,92.0
max,19.0,100.0


- Linha 5: Primeiro, vamos definir dados_completos para um dataframe vazio.
- Linha 7: Carregue o primeiro arquivo Excel no dataframe df.
- Linha 8: Anexa o conteúdo de df ao dataframe dados_completos.
- Linhas 10 e 11: Basicamente o mesmo que as linhas 7 e 8, mas para o próximo arquivo do Excel.

In [19]:
# Caminho curto

import glob

dados_completos = pd.DataFrame() 

for f in glob.glob("datasets/data*.xlsx"):
    df = pd.read_excel(f) 
    dados_completos = dados_completos.append(df, ignore_index = True)

dados_completos.describe()

Unnamed: 0.1,age,grade,Unnamed: 0,Notas
count,300.0,300.0,5.0,5.0
mean,16.456667,82.923333,2.0,85.0
std,1.700321,10.544576,1.581139,11.067972
min,14.0,65.0,0.0,76.0
25%,15.0,73.75,1.0,77.0
50%,16.0,82.0,2.0,78.0
75%,18.0,92.0,3.0,95.0
max,19.0,100.0,4.0,99.0


- Linha 3: Importa a biblioteca glob
- Linha 5: Vamos definir dados_completos para um dataframe vazio.
- Linha 6: Esta linha percorrerá todos os arquivos que correspondem ao padrão.
- Linha 7: Carregue o arquivo Excel em f no dataframe df.
- Linha 8: Anexa o conteúdo de df ao dataframe dados_completos.

Como temos apenas três arquivos de dados, a diferença no código não é tão perceptível. No entanto, se estivéssemos carregando cem arquivos, a diferença na quantidade de código seria enorme. Este código carregará todos os arquivos do Excel cujos nomes começam com dados que estão no diretório de conjuntos de dados, não importa quantos existam.

Na pasta datasets/weekly_call_data, existem 104 arquivos de dados de chamadas semanais por dois anos. Vamos carregar todos esses dados em um dataframe.

In [20]:
# Caminho curto

import glob

dados_completos = pd.DataFrame() 

for f in glob.glob("datasets/weekly_call_data/weekdata_*.xlsx"):
    df = pd.read_excel(f) 
    dados_completos = dados_completos.append(df, ignore_index = True)

dados_completos.describe()

Unnamed: 0.1,Unnamed: 0,CallDuration
count,129588.0,129588.0
mean,688.521476,12.517147
std,457.631443,6.925404
min,0.0,1.0
25%,311.0,7.0
50%,623.0,13.0
75%,1009.0,19.0
max,1944.0,24.0


In [21]:
dados_completos.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 129588 entries, 0 to 129587
Data columns (total 7 columns):
 #   Column          Non-Null Count   Dtype 
---  ------          --------------   ----- 
 0   Unnamed: 0      129588 non-null  int64 
 1   CallingNumber   129588 non-null  object
 2   DayOfWeek       129588 non-null  object
 3   TimeOfDay       129588 non-null  object
 4   CallDuration    129588 non-null  int64 
 5   ReasonForCall   129588 non-null  object
 6   AnsweringAgent  129588 non-null  object
dtypes: int64(2), object(5)
memory usage: 6.9+ MB


#### Carregando dados do SQL

Normalmente, nossos dados chegarão até nós como arquivos ou links de banco de dados. Vamos aprender como carregar nossos dados de um arquivo de banco de dados sqlite.

In [22]:
# Carregar dados do sqlite

from sqlalchemy import create_engine # Conecte-se ao sqlite db 

db_caminho = r'datasets/gradedata.db'

engine = create_engine(r"sqlite:///{}" .format(db_caminho))

sql =' SELECT * FROM test'
'WHERE Grades in (76, 77, 78)'

dados_de_vendas_df = pd.read_sql(sql, engine) 
dados_de_vendas_df

Unnamed: 0,index,Names,Grades
0,0,Bob,76
1,1,Jessica,95
2,2,Mary,77
3,3,John,78
4,4,Mel,99


Esse código cria um link para o arquivo de banco de dados chamado `gradedata.db` e executa uma consulta nele. Em seguida, ele carrega os dados resultantes dessa consulta no dataframe chamado dados_de_vendas_df. Se você não souber os nomes das tabelas em um banco de dados sqlite, poderá descobrir alterando a instrução SQL.

In [23]:
# Encontrando os nomes das tabelas

sql = "SELECT name FROM sqlite_master"
"WHERE type = 'table';"

"WHERE type = 'table';"

In [24]:
dados_de_vendas_df = pd.read_sql(sql, engine)
dados_de_vendas_df

Unnamed: 0,name
0,test
1,ix_test_index


Depois de saber o nome de uma tabela que deseja visualizar (digamos que seja um teste), se quiser saber os nomes dos campos dessa tabela, você pode alterar sua instrução SQL

In [25]:
# Uma consulta básica

sql = "SELECT * FROM test;"

In [26]:
dados_de_vendas_df = pd.read_sql(sql, engine)
dados_de_vendas_df

Unnamed: 0,index,Names,Grades
0,0,Bob,76
1,1,Jessica,95
2,2,Mary,77
3,3,John,78
4,4,Mel,99


In [27]:
dados_de_vendas_df.head()

Unnamed: 0,index,Names,Grades
0,0,Bob,76
1,1,Jessica,95
2,2,Mary,77
3,3,John,78
4,4,Mel,99


Então, depois de executar `dados_de_vendas_df.head()` no dataframe, você ser capaz de ver os campos como cabeçalhos no topo de cada coluna.

Como sempre, se precisar de mais informações sobre o comando,

In [28]:
# Obtenha ajuda em read_sql

pd.read_sql?

[1;31mSignature:[0m
[0mpd[0m[1;33m.[0m[0mread_sql[0m[1;33m([0m[1;33m
[0m    [0msql[0m[1;33m,[0m[1;33m
[0m    [0mcon[0m[1;33m,[0m[1;33m
[0m    [0mindex_col[0m[1;33m:[0m [1;34m'str | Sequence[str] | None'[0m [1;33m=[0m [1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mcoerce_float[0m[1;33m:[0m [1;34m'bool'[0m [1;33m=[0m [1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mparams[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mparse_dates[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mcolumns[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mchunksize[0m[1;33m:[0m [1;34m'int | None'[0m [1;33m=[0m [1;32mNone[0m[1;33m,[0m[1;33m
[0m[1;33m)[0m [1;33m->[0m [1;34m'DataFrame | Iterator[DataFrame]'[0m[1;33m[0m[1;33m[0m[0m
[1;31mDocstring:[0m
Read SQL query or database table into a DataFrame.

This function is a convenience wrapper around ``read_sql_table`` and
``read_sql_query`` (for backward compatib

vamos carregar dados do banco de dados `datasets/salesdata.db`

In [29]:
db_caminho = r'datasets/salesdata.db'

engine = create_engine(r"sqlite:///{}" .format(db_caminho))

# Encontrando os nomes das tabelas
sql = "SELECT name FROM sqlite_master"
"WHERE type = 'table';"

dados_de_vendas_df = pd.read_sql(sql, engine) 
dados_de_vendas_df

Unnamed: 0,name
0,scores
1,ix_scores_index


In [30]:
# Encontrando os nomes das tabelas

sql = "SELECT * FROM scores"

In [31]:
dados_de_vendas_df = pd.read_sql(sql, engine)
dados_de_vendas_df

Unnamed: 0,index,Sales Person,Intelligence,Extroversion,$ Sales/Week
0,0,1,89,21,2625
1,1,2,93,24,2700
2,2,3,91,21,3100
3,3,4,122,23,3150
4,4,5,115,27,3175
5,5,6,180,18,3100
6,6,7,98,19,2700
7,7,8,105,16,2475
8,8,9,112,23,3625
9,9,10,109,28,3525


#### Salvando dados em SQL

In [32]:
# Criar conjunto de dados para salvar

nomes = ['Bob', 'Jessica', 'Mary', 'John', 'Mel'] 
notas =[76, 95, 77, 78, 99]

GradeList = zip(nomes,notas) 
df = pd.DataFrame(data = GradeList,
                  columns = ['Nomes', 'Notas'])

df

Unnamed: 0,Nomes,Notas
0,Bob,76
1,Jessica,95
2,Mary,77
3,John,78
4,Mel,99


Para exportá-lo para SQL, podemos usar esse código.

In [33]:
# Exportar dataframe para sqlite
import os
import sqlite3 as lite

db_nome_arquivo = r'datasets/mydb.db' 

con = lite.connect(db_nome_arquivo)
df.to_sql('minha_tabela',
          con,
          schema = None,
          if_exists = 'replace',
          index = True,
          index_label = None,
          chunksize = None,
          dtype = None)

con.close()

- Linha 5: `mydb.db` é o caminho e o nome do sqlite banco de dados que você deseja usar.
- Linha 8: `minha_tabela` é o nome da tabela no base de dados.

se precisar de mais informações sobre o comando, você pode execute o código

In [34]:
# Obtenha ajuda sobre to_sql

df.to_sql?

[1;31mSignature:[0m
[0mdf[0m[1;33m.[0m[0mto_sql[0m[1;33m([0m[1;33m
[0m    [0mname[0m[1;33m:[0m [1;34m'str'[0m[1;33m,[0m[1;33m
[0m    [0mcon[0m[1;33m,[0m[1;33m
[0m    [0mschema[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mif_exists[0m[1;33m:[0m [1;34m'str'[0m [1;33m=[0m [1;34m'fail'[0m[1;33m,[0m[1;33m
[0m    [0mindex[0m[1;33m:[0m [1;34m'bool_t'[0m [1;33m=[0m [1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mindex_label[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mchunksize[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mdtype[0m[1;33m:[0m [1;34m'DtypeArg | None'[0m [1;33m=[0m [1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mmethod[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m[1;33m)[0m [1;33m->[0m [1;34m'int | None'[0m[1;33m[0m[1;33m[0m[0m
[1;31mDocstring:[0m
Write records stored in a DataFrame to a SQL database.

Databases supported by SQLAlchemy [1]_ are supported.

vamos criar uma tabela sqlite que contenha os dados encontrados em `datasets/gradedata.csv`

#### Números aleatórios e criação dados aleatórios

Normalmente você usará as técnicas com conjuntos de dados reais. No entanto, às vezes você precisará criar valores aleatórios.

Digamos que queríamos fazer uma lista aleatória de nomes de bebês. nós poderíamos conseguir dessa forma

In [35]:
# Começando

import random 
from numpy.random import randint 

nomes = ['Bob', 'Jessica', 'Mary', 'John', 'Mel']

importamos nossas bibliotecas como de costume. Na última linha, criamos uma lista dos nomes que selecionaremos aleatoriamente

Em seguida, adicionamos o código

In [36]:
# Semeando Gerador Aleatório

random.seed(500)

Isso semeia o gerador de números aleatórios. Se você usar a mesma semente, obterá os mesmos números "aleatórios".

In [37]:
# 1. randint(low = 0, high = len(nomes))

Gera um inteiro aleatório entre zero e o comprimento dos nomes da lista.

In [38]:
# 2. nomes[n]

Seleciona o nome onde seu índice é igual a n.

In [39]:
# 3. for i in range(n)

Faz um loop até que i seja igual a n, ou seja, 1,2,3,….n.

In [40]:
# 4. random_names =

Seleciona um nome aleatório da lista de nomes e não isso n vezes.

Faremos tudo isso agora.

In [41]:
# Seleção de 1.000 nomes aleatórios

nomes_aleatorios = [] 

for i in range(1_000): 
    nome = nomes[randint(low = 0, 
                         high = len(nomes))] 
    
    nomes_aleatorios.append(nome)

Agora temos uma lista de 1000 nomes aleatórios salvos em nosso `nomes_aleatorios` variável. Vamos criar uma lista de 1000 números aleatórios de 0 a 1000

In [42]:
# Seleção de 1.000 números aleatórios

nascimentos = [] 
for i in range(1000):
    nascimentos.append(randint(low = 0, 
                               high = 1_000))

E, finalmente, junte as duas listas e crie o dataframe

In [43]:
# Criando conjunto de dados a partir de listas de nomes e números aleatórios

BabyDataSet2 = list(zip(nomes_aleatorios, nascimentos)) 
df = pd.DataFrame(data = BabyDataSet2, 
                  columns = ['Nomes', 'Nascimentos'])

df

Unnamed: 0,Nomes,Nascimentos
0,Mel,827
1,Jessica,230
2,Mel,214
3,Bob,359
4,John,492
...,...,...
995,Bob,789
996,Mary,918
997,Jessica,783
998,Mel,217


Crie um dataframe chamado parkingtickets com 250 linhas contendo um nome e um número entre 1 e 25.

In [44]:
# Seleção de 30 nomes aleatórios
nomes_aleatorios = [] 

for i in range(30): 
    nome = nomes[randint(low = 0, 
                         high = len(nomes))] 
    
    nomes_aleatorios.append(nome)

# Seleção de 30 números aleatórios
numeros_aleatorios = [] 

for i in range(30):
    numeros_aleatorios.append(randint(low = 0, 
                                      high = 30))

parkingtickets = list(zip(nomes_aleatorios, nascimentos)) 
df = pd.DataFrame(data = parkingtickets, 
                  columns = ['Nomes', 'Numeros'])

df

Unnamed: 0,Nomes,Numeros
0,Mary,827
1,Mary,230
2,Bob,214
3,Mary,359
4,John,492
5,Bob,359
6,Jessica,602
7,Bob,707
8,Mel,993
9,John,244


In [45]:
%reload_ext watermark
%watermark -a "Caique Miranda" -gu "caiquemiranda" -iv

Author: Caique Miranda

Github username: caiquemiranda

pandas : 1.4.3
sqlite3: 2.6.0
numpy  : 1.23.0



### End.