In [None]:
#!pip install pandas
#!pip install faker

In [1]:
import sqlite3
from faker import Faker
from random import randint, choice
import pandas as pd

In [2]:
fake = Faker('pt_BR')

# Conectando e entendendo o banco criado pelo Django

In [3]:
conn = sqlite3.connect('db.sqlite3')

In [4]:
cur = conn.cursor()

## Vendo os nomes das tabelas que o Django criou

In [5]:
query = '''
SELECT name
FROM sqlite_master 
WHERE type ='table' AND name NOT LIKE 'sqlite_%';
'''

cur.execute(query)
for c in cur.fetchall():
    print(c)

('django_migrations',)
('auth_group_permissions',)
('auth_user_groups',)
('auth_user_user_permissions',)
('django_admin_log',)
('django_content_type',)
('auth_permission',)
('auth_group',)
('auth_user',)
('pages_interesses',)
('django_session',)
('pages_aluno',)
('pages_perguntas',)
('pages_aluno_interesses',)


## Acessando cada tabela

In [6]:
df = pd.read_sql_query('SELECT * FROM pages_interesses', conn)
df.head()

Unnamed: 0,id,categoria,grau,nome
0,1,Arte,1,Musica
1,2,Arte,1,Dança
2,3,Arte,1,Literatura
3,4,Arte,1,Museu
4,5,Arte,1,Cinema


In [7]:
df = pd.read_sql_query('SELECT * FROM pages_aluno', conn)
df.head()

Unnamed: 0,id,nome,idade,sexo,curso,periodo
0,1,João Gabriel Barbosa,F,46,Matemática Aplicada,3
1,2,Dr. Davi das Neves,M,22,Ciência de Dados e Inteligência Artificial,5
2,3,Yuri Barbosa,F,26,Matemática Aplicada,5
3,4,Luiz Fernando Souza,M,49,Ciência de Dados e Inteligência Artificial,7
4,5,Stella Nunes,F,16,Matemática Aplicada,2


In [8]:
df = pd.read_sql_query('SELECT * FROM pages_aluno_interesses', conn)
df.head()


Unnamed: 0,id,aluno_id_id,interesses_id_id
0,1,197,89
1,2,37,149
2,3,194,34
3,4,337,125
4,5,146,174


## Zerando os dados das tabelas

In [9]:
cur.execute('DELETE FROM pages_interesses')
cur.execute('DELETE FROM pages_aluno')
cur.execute('DELETE FROM pages_aluno_interesses')

<sqlite3.Cursor at 0x24c03115810>

In [10]:
cur.execute("SELECT * FROM pages_aluno")
for c in cur.fetchmany(15):
    print(c)

In [11]:
cur.execute("SELECT * FROM pages_interesses")
for c in cur.fetchmany(15):
    print(c)

In [12]:
cur.execute("SELECT * FROM pages_aluno_interesses")
for c in cur.fetchmany(15):
    print(c)

# Criando dados fakes

## Tabela pages_interesses

In [13]:
categorias = []
categorias.extend(['Arte']*6)
categorias.extend(['Esporte']*10)
categorias.extend(['Entretenimento']*5)
categorias.extend(['Estilos de Música']*12)
categorias.extend(['Social']*9)

In [14]:
nomes = ['Musica', 'Dança', 'Literatura', 'Museu', 'Cinema', 'Teatro',
'Xadrez', 'Volei', 'Futebol', 'Handbol', 'Basquete', 'Tenis de Mesa', 'Natação', 'Crossfit', 'Musculação', 'Golfe',
'Jogos', 'Séries', 'Filmes', 'Novelas', 'Livros',
'Pop', 'Samba', 'Pagode', 'Sertanejo', 'R&B', 'Jazz', 'Blues', 'Piseiro', 'KPOP', 'Funk', 'Rap', 'Trap',
'Festas', 'Boate', 'Churrasco', 'Roda de Samba', 'Passeio no Parque', 'Praia', 'Trilha', 'Piquenique', 'Montanhas']


In [15]:
graus = []
graus.extend([1]*42)
graus.extend([2]*42)
graus.extend([3]*42)
graus.extend([4]*42)
graus.extend([5]*42)

In [16]:
ids = range(1,211)

In [17]:
categorias.extend(categorias*4)
nomes.extend(nomes*4)

In [18]:
interesses = {
    'id': ids,
    'categoria': categorias,
    'grau': graus,
    'nome': nomes
}
df_int = pd.DataFrame(interesses)


In [19]:
df_int

Unnamed: 0,id,categoria,grau,nome
0,1,Arte,1,Musica
1,2,Arte,1,Dança
2,3,Arte,1,Literatura
3,4,Arte,1,Museu
4,5,Arte,1,Cinema
...,...,...,...,...
205,206,Social,5,Passeio no Parque
206,207,Social,5,Praia
207,208,Social,5,Trilha
208,209,Social,5,Piquenique


## Tabela pages_alunos

In [20]:
alunos = {
    'id': [],
    'nome':[],
    'idade':[],
    'sexo':[],
    'curso':[],
    'periodo':[]
}


for id in range(1,401):
    alunos['id'].append(id)
    alunos['nome'].append(fake.name())
    alunos['idade'].append(randint(15,50))
    alunos['sexo'].append(choice(['M','F']))
    alunos['curso'].append(choice(['Ciência de Dados e Inteligência Artificial', 'Matemática Aplicada']))
    alunos['periodo'].append(randint(1,8))

In [21]:
df_alunos = pd.DataFrame(alunos)

In [22]:
df_alunos

Unnamed: 0,id,nome,idade,sexo,curso,periodo
0,1,Dra. Nina Silva,25,F,Matemática Aplicada,6
1,2,Maria Cecília Cavalcanti,39,F,Matemática Aplicada,1
2,3,Sr. Rodrigo Caldeira,37,F,Ciência de Dados e Inteligência Artificial,5
3,4,Raul Aragão,33,M,Ciência de Dados e Inteligência Artificial,6
4,5,Letícia da Rosa,33,M,Ciência de Dados e Inteligência Artificial,4
...,...,...,...,...,...,...
395,396,Calebe Nascimento,32,M,Matemática Aplicada,4
396,397,Benício das Neves,35,M,Matemática Aplicada,2
397,398,Alice Oliveira,31,F,Matemática Aplicada,1
398,399,Isabel Azevedo,26,M,Matemática Aplicada,8


## Tabela pages_interesses_alunos

In [23]:
aluno_interesses = {
    'id': [],
    'aluno_id_id': [],
    'interesses_id_id': []
}

In [24]:
for id in range(1, 1501):
    aluno_interesses['id'].append(id),
    aluno_interesses['aluno_id_id'].append(randint(1,400)),
    aluno_interesses['interesses_id_id'].append(randint(1,210))

In [25]:
df_alunos_interesses = pd.DataFrame(aluno_interesses)
df_alunos_interesses

Unnamed: 0,id,aluno_id_id,interesses_id_id
0,1,314,55
1,2,104,66
2,3,168,53
3,4,118,56
4,5,378,79
...,...,...,...
1495,1496,130,42
1496,1497,74,102
1497,1498,111,21
1498,1499,333,92


# Registrando dados no banco

In [26]:
data_int = []
for i in range(0,len(df_int)):
    tuple = (int(df_int['id'][i]), str(df_int['categoria'][i]), int(df_int['grau'][i]), (str(df_int['nome'][i])))
    data_int.append(tuple)

In [27]:
cur.executemany('INSERT INTO pages_interesses VALUES (?,?,?,?)', data_int)

<sqlite3.Cursor at 0x24c03115810>

In [28]:
cur.execute("SELECT * FROM pages_interesses")
for c in cur.fetchmany(15):
    print(c)

(1, 'Arte', 1, 'Musica')
(2, 'Arte', 1, 'Dança')
(3, 'Arte', 1, 'Literatura')
(4, 'Arte', 1, 'Museu')
(5, 'Arte', 1, 'Cinema')
(6, 'Arte', 1, 'Teatro')
(7, 'Esporte', 1, 'Xadrez')
(8, 'Esporte', 1, 'Volei')
(9, 'Esporte', 1, 'Futebol')
(10, 'Esporte', 1, 'Handbol')
(11, 'Esporte', 1, 'Basquete')
(12, 'Esporte', 1, 'Tenis de Mesa')
(13, 'Esporte', 1, 'Natação')
(14, 'Esporte', 1, 'Crossfit')
(15, 'Esporte', 1, 'Musculação')


In [29]:
data_alunos = []
for i in range(0,len(df_alunos)):
    tuple = (int(df_alunos['id'][i]), str(df_alunos['nome'][i]), int(df_alunos['idade'][i]), str(df_alunos['sexo'][i]), str(df_alunos['curso'][i]), int(df_alunos['periodo'][i]))
    data_alunos.append(tuple)

In [30]:
cur.executemany('INSERT INTO pages_aluno VALUES (?,?,?,?,?,?)', data_alunos)

<sqlite3.Cursor at 0x24c03115810>

In [31]:
cur.execute("SELECT * FROM pages_aluno")
for c in cur.fetchmany(15):
    print(c)

(1, 'Dra. Nina Silva', 25, 'F', 'Matemática Aplicada', 6)
(2, 'Maria Cecília Cavalcanti', 39, 'F', 'Matemática Aplicada', 1)
(3, 'Sr. Rodrigo Caldeira', 37, 'F', 'Ciência de Dados e Inteligência Artificial', 5)
(4, 'Raul Aragão', 33, 'M', 'Ciência de Dados e Inteligência Artificial', 6)
(5, 'Letícia da Rosa', 33, 'M', 'Ciência de Dados e Inteligência Artificial', 4)
(6, 'João Guilherme Pinto', 39, 'F', 'Matemática Aplicada', 6)
(7, 'Alexandre Aragão', 32, 'F', 'Matemática Aplicada', 3)
(8, 'Yuri Souza', 39, 'M', 'Ciência de Dados e Inteligência Artificial', 6)
(9, 'Erick Rezende', 15, 'F', 'Ciência de Dados e Inteligência Artificial', 3)
(10, 'Ana Beatriz Araújo', 24, 'F', 'Matemática Aplicada', 4)
(11, 'Matheus da Mata', 41, 'F', 'Ciência de Dados e Inteligência Artificial', 7)
(12, 'Cecília da Cruz', 19, 'M', 'Matemática Aplicada', 7)
(13, 'Ana Vitória Dias', 15, 'F', 'Ciência de Dados e Inteligência Artificial', 3)
(14, 'Luana Ramos', 18, 'M', 'Ciência de Dados e Inteligência Artifi

In [32]:
data_int_alunos = []
for i in range(0,len(df_alunos_interesses)):
    tuple = (int(df_alunos_interesses['id'][i]), int(df_alunos_interesses['aluno_id_id'][i]), int(df_alunos_interesses['interesses_id_id'][i]))
    data_int_alunos.append(tuple)

In [33]:
cur.executemany('INSERT INTO pages_aluno_interesses VALUES (?,?,?)', data_int_alunos)

<sqlite3.Cursor at 0x24c03115810>

In [34]:
cur.execute("SELECT * FROM pages_aluno_interesses")
for c in cur.fetchmany(500):
    print(c)


(1, 314, 55)
(2, 104, 66)
(3, 168, 53)
(4, 118, 56)
(5, 378, 79)
(6, 149, 190)
(7, 110, 45)
(8, 362, 23)
(9, 194, 58)
(10, 47, 37)
(11, 246, 153)
(12, 328, 139)
(13, 273, 81)
(14, 226, 197)
(15, 397, 76)
(16, 151, 96)
(17, 45, 1)
(18, 324, 84)
(19, 18, 46)
(20, 68, 110)
(21, 191, 106)
(22, 38, 27)
(23, 64, 161)
(24, 123, 163)
(25, 378, 199)
(26, 148, 98)
(27, 14, 127)
(28, 146, 160)
(29, 161, 137)
(30, 146, 95)
(31, 161, 207)
(32, 337, 171)
(33, 223, 142)
(34, 197, 147)
(35, 57, 135)
(36, 302, 14)
(37, 329, 19)
(38, 12, 100)
(39, 231, 64)
(40, 59, 23)
(41, 345, 74)
(42, 255, 168)
(43, 185, 194)
(44, 356, 106)
(45, 178, 24)
(46, 184, 186)
(47, 264, 6)
(48, 35, 109)
(49, 253, 75)
(50, 347, 110)
(51, 113, 127)
(52, 165, 21)
(53, 197, 151)
(54, 383, 137)
(55, 371, 66)
(56, 264, 50)
(57, 202, 78)
(58, 77, 115)
(59, 117, 19)
(60, 145, 31)
(61, 373, 199)
(62, 154, 173)
(63, 123, 202)
(64, 263, 195)
(65, 100, 98)
(66, 259, 105)
(67, 390, 182)
(68, 289, 22)
(69, 290, 131)
(70, 348, 120)
(71, 15

## Analisando estrutura da tabela pages_aluno_interesses

In [35]:
query = '''
SELECT sql
FROM sqlite_master
WHERE name = 'pages_aluno_interesses';
'''

cur.execute(query)
for c in cur.fetchall():
    print(c[0])

CREATE TABLE "pages_aluno_interesses" ("id" integer NOT NULL PRIMARY KEY AUTOINCREMENT, "aluno_id_id" bigint NOT NULL REFERENCES "pages_aluno" ("id") DEFERRABLE INITIALLY DEFERRED, "interesses_id_id" bigint NOT NULL REFERENCES "pages_interesses" ("id") DEFERRABLE INITIALLY DEFERRED)


In [36]:
conn.commit()
conn.close()