In [None]:
#!pip install pandas
#!pip install faker

In [6]:
import sqlite3
from faker import Faker
from random import randint, choice
import pandas as pd

In [7]:
fake = Faker('pt_BR')

# Conectando e entendendo o banco criado pelo Django

In [8]:
conn = sqlite3.connect('db.sqlite3')

In [9]:
cur = conn.cursor()

## Vendo os nomes das tabelas que o Django criou

In [10]:
query = '''
SELECT name
FROM sqlite_master 
WHERE type ='table' AND name NOT LIKE 'sqlite_%';
'''

cur.execute(query)
for c in cur.fetchall():
    print(c)

('django_migrations',)
('auth_group_permissions',)
('auth_user_groups',)
('auth_user_user_permissions',)
('django_admin_log',)
('django_content_type',)
('auth_permission',)
('auth_group',)
('auth_user',)
('pages_interesses',)
('django_session',)
('pages_aluno',)
('pages_perguntas',)
('pages_aluno_interesses',)


## Acessando cada tabela

In [11]:
df = pd.read_sql_query('SELECT * FROM pages_interesses', conn)
df.head()

Unnamed: 0,id,categoria,grau,nome
0,1,Arte,1,Musica
1,2,Arte,1,Dança
2,3,Arte,1,Literatura
3,4,Arte,1,Museu
4,5,Arte,1,Cinema


In [12]:
df = pd.read_sql_query('SELECT * FROM pages_aluno', conn)
df.head()

Unnamed: 0,id,nome,idade,sexo,curso,periodo
0,1,Dra. Milena Moura,F,30,Ciência de Dados e Inteligência Artificial,3
1,2,Laura Dias,F,31,Ciência de Dados e Inteligência Artificial,4
2,3,Bernardo Silva,M,30,Ciência de Dados e Inteligência Artificial,4
3,4,Lucas Gabriel Silva,F,17,Matemática Aplicada,6
4,5,Maria Cecília Viana,F,32,Matemática Aplicada,3


In [13]:
df = pd.read_sql_query('SELECT * FROM pages_aluno_interesses', conn)
df.head()


Unnamed: 0,id,aluno_id_id,interesses_id_id


## Zerando os dados das tabelas

In [14]:
cur.execute('DELETE FROM pages_interesses')
cur.execute('DELETE FROM pages_aluno')
cur.execute('DELETE FROM pages_aluno_interesses')

<sqlite3.Cursor at 0x18a4bc956c0>

In [15]:
cur.execute("SELECT * FROM pages_aluno")
for c in cur.fetchmany(15):
    print(c)

In [16]:
cur.execute("SELECT * FROM pages_interesses")
for c in cur.fetchmany(15):
    print(c)

In [17]:
cur.execute("SELECT * FROM pages_aluno_interesses")
for c in cur.fetchmany(15):
    print(c)

# Criando dados fakes

## Tabela pages_interesses

In [18]:
categorias = []
categorias.extend(['Arte']*6)
categorias.extend(['Esporte']*10)
categorias.extend(['Entretenimento']*5)
categorias.extend(['Estilos de Música']*12)
categorias.extend(['Social']*9)

In [19]:
nomes = ['Musica', 'Dança', 'Literatura', 'Museu', 'Cinema', 'Teatro',
'Xadrez', 'Volei', 'Futebol', 'Handbol', 'Basquete', 'Tenis de Mesa', 'Natação', 'Crossfit', 'Musculação', 'Golfe',
'Jogos', 'Séries', 'Filmes', 'Novelas', 'Livros',
'Pop', 'Samba', 'Pagode', 'Sertanejo', 'R&B', 'Jazz', 'Blues', 'Piseiro', 'KPOP', 'Funk', 'Rap', 'Trap',
'Festas', 'Boate', 'Churrasco', 'Roda de Samba', 'Passeio no Parque', 'Praia', 'Trilha', 'Piquenique', 'Montanhas']


In [20]:
graus = []
graus.extend([1]*42)
graus.extend([2]*42)
graus.extend([3]*42)
graus.extend([4]*42)
graus.extend([5]*42)

In [21]:
ids = range(1,211)

In [22]:
categorias.extend(categorias*4)
nomes.extend(nomes*4)

In [23]:
interesses = {
    'id': ids,
    'categoria': categorias,
    'grau': graus,
    'nome': nomes
}
df_int = pd.DataFrame(interesses)


In [24]:
df_int

Unnamed: 0,id,categoria,grau,nome
0,1,Arte,1,Musica
1,2,Arte,1,Dança
2,3,Arte,1,Literatura
3,4,Arte,1,Museu
4,5,Arte,1,Cinema
...,...,...,...,...
205,206,Social,5,Passeio no Parque
206,207,Social,5,Praia
207,208,Social,5,Trilha
208,209,Social,5,Piquenique


## Tabela pages_alunos

In [25]:
alunos = {
    'id': [],
    'nome':[],
    'idade':[],
    'sexo':[],
    'curso':[],
    'periodo':[]
}


for id in range(1,401):
    alunos['id'].append(id)
    alunos['nome'].append(fake.name())
    alunos['idade'].append(randint(15,50))
    alunos['sexo'].append(choice(['M','F']))
    alunos['curso'].append(choice(['Ciência de Dados e Inteligência Artificial', 'Matemática Aplicada']))
    alunos['periodo'].append(randint(1,8))

In [26]:
df_alunos = pd.DataFrame(alunos)

In [27]:
df_alunos

Unnamed: 0,id,nome,idade,sexo,curso,periodo
0,1,João Gabriel Barbosa,46,F,Matemática Aplicada,3
1,2,Dr. Davi das Neves,22,M,Ciência de Dados e Inteligência Artificial,5
2,3,Yuri Barbosa,26,F,Matemática Aplicada,5
3,4,Luiz Fernando Souza,49,M,Ciência de Dados e Inteligência Artificial,7
4,5,Stella Nunes,16,F,Matemática Aplicada,2
...,...,...,...,...,...,...
395,396,Manuela Rocha,21,M,Matemática Aplicada,1
396,397,Diogo Moraes,42,M,Ciência de Dados e Inteligência Artificial,6
397,398,Maria Barbosa,28,M,Ciência de Dados e Inteligência Artificial,3
398,399,Cecília da Cruz,39,F,Ciência de Dados e Inteligência Artificial,2


## Tabela pages_interesses_alunos

In [30]:
aluno_interesses = {
    'id': [],
    'aluno_id_id': [],
    'interesses_id_id': []
}

In [31]:
for id in range(1, 1501):
    aluno_interesses['id'].append(id),
    aluno_interesses['aluno_id_id'].append(randint(1,400)),
    aluno_interesses['interesses_id_id'].append(randint(1,210))

In [32]:
df_alunos_interesses = pd.DataFrame(aluno_interesses)
df_alunos_interesses

Unnamed: 0,id,aluno_id_id,interesses_id_id
0,1,197,89
1,2,37,149
2,3,194,34
3,4,337,125
4,5,146,174
...,...,...,...
1495,1496,350,178
1496,1497,82,99
1497,1498,321,24
1498,1499,222,47


# Registrando dados no banco

In [33]:
data_int = []
for i in range(0,len(df_int)):
    tuple = (int(df_int['id'][i]), str(df_int['categoria'][i]), int(df_int['grau'][i]), (str(df_int['nome'][i])))
    data_int.append(tuple)

In [34]:
cur.executemany('INSERT INTO pages_interesses VALUES (?,?,?,?)', data_int)

<sqlite3.Cursor at 0x18a4bc956c0>

In [35]:
cur.execute("SELECT * FROM pages_interesses")
for c in cur.fetchmany(15):
    print(c)

(1, 'Arte', 1, 'Musica')
(2, 'Arte', 1, 'Dança')
(3, 'Arte', 1, 'Literatura')
(4, 'Arte', 1, 'Museu')
(5, 'Arte', 1, 'Cinema')
(6, 'Arte', 1, 'Teatro')
(7, 'Esporte', 1, 'Xadrez')
(8, 'Esporte', 1, 'Volei')
(9, 'Esporte', 1, 'Futebol')
(10, 'Esporte', 1, 'Handbol')
(11, 'Esporte', 1, 'Basquete')
(12, 'Esporte', 1, 'Tenis de Mesa')
(13, 'Esporte', 1, 'Natação')
(14, 'Esporte', 1, 'Crossfit')
(15, 'Esporte', 1, 'Musculação')


In [36]:
data_alunos = []
for i in range(0,len(df_alunos)):
    tuple = (int(df_alunos['id'][i]), str(df_alunos['nome'][i]), str(df_alunos['sexo'][i]), int(df_alunos['idade'][i]), str(df_alunos['curso'][i]), int(df_alunos['periodo'][i]))
    data_alunos.append(tuple)

In [37]:
cur.executemany('INSERT INTO pages_aluno VALUES (?,?,?,?,?,?)', data_alunos)

<sqlite3.Cursor at 0x18a4bc956c0>

In [38]:
cur.execute("SELECT * FROM pages_aluno")
for c in cur.fetchmany(15):
    print(c)

(1, 'João Gabriel Barbosa', 'F', '46', 'Matemática Aplicada', 3)
(2, 'Dr. Davi das Neves', 'M', '22', 'Ciência de Dados e Inteligência Artificial', 5)
(3, 'Yuri Barbosa', 'F', '26', 'Matemática Aplicada', 5)
(4, 'Luiz Fernando Souza', 'M', '49', 'Ciência de Dados e Inteligência Artificial', 7)
(5, 'Stella Nunes', 'F', '16', 'Matemática Aplicada', 2)
(6, 'Isis Viana', 'F', '15', 'Ciência de Dados e Inteligência Artificial', 5)
(7, 'Ian Viana', 'M', '19', 'Matemática Aplicada', 4)
(8, 'André Nogueira', 'F', '17', 'Matemática Aplicada', 2)
(9, 'Ana Laura Nascimento', 'F', '20', 'Ciência de Dados e Inteligência Artificial', 4)
(10, 'Paulo Rocha', 'M', '49', 'Ciência de Dados e Inteligência Artificial', 3)
(11, 'Yago da Conceição', 'F', '44', 'Ciência de Dados e Inteligência Artificial', 1)
(12, 'Davi Luiz Rodrigues', 'M', '27', 'Ciência de Dados e Inteligência Artificial', 1)
(13, 'Stephany Silveira', 'F', '17', 'Ciência de Dados e Inteligência Artificial', 1)
(14, 'Igor Mendes', 'M', '36'

In [39]:
data_int_alunos = []
for i in range(0,len(df_alunos_interesses)):
    tuple = (int(df_alunos_interesses['id'][i]), int(df_alunos_interesses['aluno_id_id'][i]), int(df_alunos_interesses['interesses_id_id'][i]))
    data_int_alunos.append(tuple)

In [40]:
cur.executemany('INSERT INTO pages_aluno_interesses VALUES (?,?,?)', data_int_alunos)

<sqlite3.Cursor at 0x18a4bc956c0>

In [41]:
cur.execute("SELECT * FROM pages_aluno_interesses")
for c in cur.fetchmany(500):
    print(c)


(1, 197, 89)
(2, 37, 149)
(3, 194, 34)
(4, 337, 125)
(5, 146, 174)
(6, 24, 154)
(7, 337, 130)
(8, 330, 142)
(9, 121, 74)
(10, 355, 180)
(11, 221, 159)
(12, 174, 45)
(13, 301, 39)
(14, 391, 168)
(15, 125, 88)
(16, 261, 10)
(17, 138, 167)
(18, 91, 48)
(19, 354, 7)
(20, 317, 8)
(21, 351, 123)
(22, 292, 65)
(23, 15, 176)
(24, 222, 112)
(25, 385, 49)
(26, 146, 111)
(27, 102, 29)
(28, 9, 192)
(29, 263, 77)
(30, 170, 192)
(31, 261, 36)
(32, 289, 114)
(33, 6, 37)
(34, 11, 122)
(35, 50, 180)
(36, 323, 75)
(37, 193, 154)
(38, 87, 76)
(39, 337, 105)
(40, 214, 79)
(41, 246, 137)
(42, 37, 180)
(43, 71, 100)
(44, 35, 96)
(45, 333, 156)
(46, 75, 58)
(47, 143, 148)
(48, 339, 16)
(49, 91, 172)
(50, 217, 162)
(51, 333, 112)
(52, 376, 60)
(53, 95, 57)
(54, 348, 200)
(55, 224, 198)
(56, 363, 83)
(57, 220, 102)
(58, 253, 165)
(59, 276, 17)
(60, 61, 28)
(61, 29, 114)
(62, 247, 21)
(63, 269, 158)
(64, 161, 69)
(65, 13, 129)
(66, 363, 89)
(67, 321, 144)
(68, 46, 121)
(69, 55, 181)
(70, 155, 184)
(71, 311, 75)

In [42]:
conn.commit()

## Analisando estrutura da tabela pages_aluno_interesses

In [43]:
query = '''
SELECT sql
FROM sqlite_master
WHERE name = 'pages_aluno_interesses';
'''

cur.execute(query)
for c in cur.fetchall():
    print(c[0])

CREATE TABLE "pages_aluno_interesses" ("id" integer NOT NULL PRIMARY KEY AUTOINCREMENT, "aluno_id_id" bigint NOT NULL REFERENCES "pages_aluno" ("id") DEFERRABLE INITIALLY DEFERRED, "interesses_id_id" bigint NOT NULL REFERENCES "pages_interesses" ("id") DEFERRABLE INITIALLY DEFERRED)


In [44]:
conn.commit()
conn.close()