In [None]:
#!pip install pandas
#!pip install faker

In [2]:
import sqlite3
from faker import Faker
from random import randint, choice
import pandas as pd

In [3]:
fake = Faker('pt_BR')

# Conectando e entendendo o banco criado pelo Django

In [4]:
conn = sqlite3.connect('db.sqlite3')

In [5]:
cur = conn.cursor()

## Vendo os nomes das tabelas que o Django criou

In [5]:
query = '''
SELECT name
FROM sqlite_master 
WHERE type ='table' AND name NOT LIKE 'sqlite_%';
'''

cur.execute(query)
for c in cur.fetchall():
    print(c)

('django_migrations',)
('auth_group_permissions',)
('auth_user_groups',)
('auth_user_user_permissions',)
('django_admin_log',)
('django_content_type',)
('auth_permission',)
('auth_group',)
('auth_user',)
('pages_interesses',)
('django_session',)
('pages_aluno',)
('pages_aluno_interesses',)


## Acessando cada tabela

In [6]:
df = pd.read_sql_query('SELECT * FROM pages_interesses', conn)
df.head()

Unnamed: 0,id,categoria,grau,nome
0,1,Arte,1,Música
1,2,Arte,2,Música


In [7]:
df = pd.read_sql_query('SELECT * FROM pages_aluno', conn)
df.head()

Unnamed: 0,id,nome,idade,sexo,curso,periodo
0,1,Cristiano Larréa,20,M,Ciência de Dados e Inteligência Artificial,2


In [8]:
df = pd.read_sql_query('SELECT * FROM pages_aluno_interesses', conn)
df.head()


Unnamed: 0,id,aluno_id,interesses_id
0,1,1,1


## Zerando os dados das tabelas

In [7]:
cur.execute('DELETE FROM pages_interesses')
cur.execute('DELETE FROM pages_aluno')
cur.execute('DELETE FROM pages_aluno_interesses')

<sqlite3.Cursor at 0x1e028f4bab0>

In [8]:
cur.execute("SELECT * FROM pages_aluno")
for c in cur.fetchmany(15):
    print(c)

In [9]:
cur.execute("SELECT * FROM pages_interesses")
for c in cur.fetchmany(15):
    print(c)

In [10]:
cur.execute("SELECT * FROM pages_aluno_interesses")
for c in cur.fetchmany(15):
    print(c)

# Criando dados fakes

## Tabela pages_interesses

In [11]:
categorias = []
categorias.extend(['Arte']*6)
categorias.extend(['Esporte']*10)
categorias.extend(['Entretenimento']*5)
categorias.extend(['Estilos de Música']*12)
categorias.extend(['Social']*9)

In [12]:
nomes = ['Musica', 'Dança', 'Literatura', 'Museu', 'Cinema', 'Teatro',
'Xadrez', 'Volei', 'Futebol', 'Handbol', 'Basquete', 'Tenis de Mesa', 'Natação', 'Crossfit', 'Musculação', 'Golfe',
'Jogos', 'Séries', 'Filmes', 'Novelas', 'Livros',
'Pop', 'Samba', 'Pagode', 'Sertanejo', 'R&B', 'Jazz', 'Blues', 'Piseiro', 'KPOP', 'Funk', 'Rap', 'Trap',
'Festas', 'Boate', 'Churrasco', 'Roda de Samba', 'Passeio no Parque', 'Praia', 'Trilha', 'Piquenique', 'Montanhas']


In [13]:
graus = []
graus.extend([1]*42)
graus.extend([2]*42)
graus.extend([3]*42)
graus.extend([4]*42)
graus.extend([5]*42)

In [14]:
ids = range(1,211)

In [15]:
categorias.extend(categorias*4)
nomes.extend(nomes*4)

In [16]:
interesses = {
    'id': ids,
    'categoria': categorias,
    'grau': graus,
    'nome': nomes
}
df_int = pd.DataFrame(interesses)


In [17]:
df_int

Unnamed: 0,id,categoria,grau,nome
0,1,Arte,1,Musica
1,2,Arte,1,Dança
2,3,Arte,1,Literatura
3,4,Arte,1,Museu
4,5,Arte,1,Cinema
...,...,...,...,...
205,206,Social,5,Passeio no Parque
206,207,Social,5,Praia
207,208,Social,5,Trilha
208,209,Social,5,Piquenique


## Tabela pages_alunos

In [18]:
alunos = {
    'id': [],
    'nome':[],
    'idade':[],
    'sexo':[],
    'curso':[],
    'periodo':[]
}


for id in range(1,401):
    alunos['id'].append(id)
    alunos['nome'].append(fake.name())
    alunos['idade'].append(randint(15,50))
    alunos['sexo'].append(choice(['M','F']))
    alunos['curso'].append(choice(['Ciência de Dados e Inteligência Artificial', 'Matemática Aplicada']))
    alunos['periodo'].append(randint(1,8))

In [19]:
df_alunos = pd.DataFrame(alunos)

In [20]:
df_alunos

Unnamed: 0,id,nome,idade,sexo,curso,periodo
0,1,Dra. Milena Moura,30,F,Ciência de Dados e Inteligência Artificial,3
1,2,Laura Dias,31,F,Ciência de Dados e Inteligência Artificial,4
2,3,Bernardo Silva,30,M,Ciência de Dados e Inteligência Artificial,4
3,4,Lucas Gabriel Silva,17,F,Matemática Aplicada,6
4,5,Maria Cecília Viana,32,F,Matemática Aplicada,3
...,...,...,...,...,...,...
395,396,Vitor Pinto,23,F,Matemática Aplicada,2
396,397,Miguel Carvalho,22,F,Ciência de Dados e Inteligência Artificial,6
397,398,Dr. Danilo Dias,28,M,Matemática Aplicada,5
398,399,Luna Moreira,23,M,Matemática Aplicada,1


## Tabela pages_interesses_alunos

In [21]:
aluno_interesses = {
    'id': [],
    'aluno_id': [],
    'interesses_id': []
}

In [22]:
for id in range(1, 1501):
    aluno_interesses['id'].append(id),
    aluno_interesses['aluno_id'].append(randint(1,400)),
    aluno_interesses['interesses_id'].append(randint(1,210))

In [23]:
df_alunos_interesses = pd.DataFrame(aluno_interesses)
df_alunos_interesses

Unnamed: 0,id,aluno_id,interesses_id
0,1,220,166
1,2,344,62
2,3,347,53
3,4,348,189
4,5,33,135
...,...,...,...
1495,1496,146,190
1496,1497,194,139
1497,1498,81,203
1498,1499,249,135


# Registrando dados no banco

In [24]:
data_int = []
for i in range(0,len(df_int)):
    tuple = (int(df_int['id'][i]), str(df_int['categoria'][i]), int(df_int['grau'][i]), (str(df_int['nome'][i])))
    data_int.append(tuple)

In [25]:
cur.executemany('INSERT INTO pages_interesses VALUES (?,?,?,?)', data_int)

<sqlite3.Cursor at 0x1e028f4bab0>

In [26]:
cur.execute("SELECT * FROM pages_interesses")
for c in cur.fetchmany(15):
    print(c)

(1, 'Arte', 1, 'Musica')
(2, 'Arte', 1, 'Dança')
(3, 'Arte', 1, 'Literatura')
(4, 'Arte', 1, 'Museu')
(5, 'Arte', 1, 'Cinema')
(6, 'Arte', 1, 'Teatro')
(7, 'Esporte', 1, 'Xadrez')
(8, 'Esporte', 1, 'Volei')
(9, 'Esporte', 1, 'Futebol')
(10, 'Esporte', 1, 'Handbol')
(11, 'Esporte', 1, 'Basquete')
(12, 'Esporte', 1, 'Tenis de Mesa')
(13, 'Esporte', 1, 'Natação')
(14, 'Esporte', 1, 'Crossfit')
(15, 'Esporte', 1, 'Musculação')


In [27]:
data_alunos = []
for i in range(0,len(df_alunos)):
    tuple = (int(df_alunos['id'][i]), str(df_alunos['nome'][i]), str(df_alunos['sexo'][i]), int(df_alunos['idade'][i]), str(df_alunos['curso'][i]), int(df_alunos['periodo'][i]))
    data_alunos.append(tuple)

In [28]:
cur.executemany('INSERT INTO pages_aluno VALUES (?,?,?,?,?,?)', data_alunos)

<sqlite3.Cursor at 0x1e028f4bab0>

In [29]:
cur.execute("SELECT * FROM pages_aluno")
for c in cur.fetchmany(15):
    print(c)

(1, 'Dra. Milena Moura', 'F', '30', 'Ciência de Dados e Inteligência Artificial', 3)
(2, 'Laura Dias', 'F', '31', 'Ciência de Dados e Inteligência Artificial', 4)
(3, 'Bernardo Silva', 'M', '30', 'Ciência de Dados e Inteligência Artificial', 4)
(4, 'Lucas Gabriel Silva', 'F', '17', 'Matemática Aplicada', 6)
(5, 'Maria Cecília Viana', 'F', '32', 'Matemática Aplicada', 3)
(6, 'Dr. Pedro Henrique Cardoso', 'M', '35', 'Ciência de Dados e Inteligência Artificial', 5)
(7, 'Fernanda Lopes', 'M', '24', 'Ciência de Dados e Inteligência Artificial', 5)
(8, 'Maria Eduarda Novaes', 'F', '28', 'Matemática Aplicada', 1)
(9, 'Esther Duarte', 'F', '18', 'Matemática Aplicada', 3)
(10, 'Daniela Oliveira', 'F', '49', 'Ciência de Dados e Inteligência Artificial', 2)
(11, 'Clara Silva', 'F', '40', 'Ciência de Dados e Inteligência Artificial', 7)
(12, 'Vitor Hugo Sales', 'F', '39', 'Matemática Aplicada', 1)
(13, 'Maria Vitória Pinto', 'F', '48', 'Ciência de Dados e Inteligência Artificial', 3)
(14, 'Brenda 

In [30]:
data_int_alunos = []
for i in range(0,len(df_alunos_interesses)):
    tuple = (int(df_alunos_interesses['id'][i]), int(df_alunos_interesses['aluno_id'][i]), int(df_alunos_interesses['interesses_id'][i]))
    data_int_alunos.append(tuple)

In [31]:
cur.executemany('INSERT INTO pages_aluno_interesses VALUES (?,?,?)', data_int_alunos)

IntegrityError: UNIQUE constraint failed: pages_aluno_interesses.aluno_id, pages_aluno_interesses.interesses_id

Está aceitando só 270 registros!

In [32]:
cur.execute("SELECT * FROM pages_aluno_interesses")
for c in cur.fetchmany(500):
    print(c)


(1, 220, 166)
(2, 344, 62)
(3, 347, 53)
(4, 348, 189)
(5, 33, 135)
(6, 393, 20)
(7, 186, 48)
(8, 186, 85)
(9, 261, 74)
(10, 153, 175)
(11, 84, 74)
(12, 15, 64)
(13, 173, 39)
(14, 383, 209)
(15, 172, 120)
(16, 63, 88)
(17, 265, 24)
(18, 396, 115)
(19, 144, 87)
(20, 77, 70)
(21, 28, 98)
(22, 280, 208)
(23, 26, 130)
(24, 168, 31)
(25, 125, 3)
(26, 269, 150)
(27, 339, 46)
(28, 88, 135)
(29, 51, 108)
(30, 45, 68)
(31, 112, 94)
(32, 135, 173)
(33, 252, 119)
(34, 165, 51)
(35, 62, 63)
(36, 25, 84)
(37, 96, 23)
(38, 266, 123)
(39, 262, 168)
(40, 346, 124)
(41, 314, 41)
(42, 229, 200)
(43, 88, 64)
(44, 286, 98)
(45, 374, 193)
(46, 311, 197)
(47, 396, 112)
(48, 96, 79)
(49, 60, 134)
(50, 163, 139)
(51, 131, 181)
(52, 133, 150)
(53, 330, 21)
(54, 334, 165)
(55, 249, 204)
(56, 90, 28)
(57, 93, 170)
(58, 354, 100)
(59, 168, 70)
(60, 337, 169)
(61, 18, 202)
(62, 94, 118)
(63, 336, 92)
(64, 83, 195)
(65, 85, 179)
(66, 158, 17)
(67, 367, 143)
(68, 156, 57)
(69, 331, 202)
(70, 304, 7)
(71, 29, 113)
(72

In [None]:
conn.commit()

## Analisando estrutura da tabela pages_aluno_interesses

In [38]:
query = '''
SELECT sql
FROM sqlite_master
WHERE name = 'pages_aluno_interesses';
'''

cur.execute(query)
for c in cur.fetchall():
    print(c[0])

CREATE TABLE "pages_aluno_interesses" ("id" integer NOT NULL PRIMARY KEY AUTOINCREMENT, "aluno_id" bigint NOT NULL REFERENCES "pages_aluno" ("id") DEFERRABLE INITIALLY DEFERRED, "interesses_id" bigint NOT NULL REFERENCES "pages_interesses" ("id") DEFERRABLE INITIALLY DEFERRED)


In [33]:
conn.commit()
conn.close()