# Criando do banco de dados

1. Instalar sqlite: 
    - a. `sudo apt update`
    - b. `sudo apt install sqlite3`

In [2]:
import sqlite3
import csv

In [1]:
def create_db_from_csv(csv_files, db_name):
    # Conecta com o banco de dados. Se inexistente, cria-o
    conn = sqlite3.connect(db_name)
    cur = conn.cursor()

    # Iteração nos CSVs
    for csv_file in csv_files:
        table_name = csv_file.split('.')[0]  # extrai o nome do arquivo
        with open(csv_file, 'r', newline='', encoding='utf-8') as f:
            reader = csv.reader(f) # transforma cada linha em uma lista
            headers = next(reader)  # Retorna a 1a linha e itera para a 2a
            column_names = ', '.join(headers)
            placeholders = ', '.join('?' * len(headers))
            cur.execute(f'CREATE TABLE IF NOT EXISTS {table_name} ({column_names})')
            cur.executemany(f'INSERT INTO {table_name} VALUES ({placeholders})', reader)

    conn.commit()
    conn.close()

# Example usage:
csv_files = ['top_songs.csv', 'top_songs_features.csv']
db_name = 'database.db'

create_db_from_csv(csv_files, db_name)


In [9]:
conn = sqlite3.connect('../database.db')
cur = conn.cursor()
cur.execute('PRAGMA table_info(top_songs)')
columns = cur.fetchall()
print("Colunas da tabela top_songs:")
for column_name in columns:
    print(column_name[1])

cur.execute('PRAGMA table_info(top_songs_features)')
columns = cur.fetchall()
print("\nColunas da tabela top_songs_features:")
for column_name in columns:
    print(column_name[1])
conn.close()

Colunas da tabela top_songs:
playlist_country
artist_name
track_name
release_date
popularity
track_id
playlist_id

Colunas da tabela top_songs_features:
danceability
energy
key
loudness
mode
speechiness
acousticness
instrumentalness
liveness
valence
tempo
type
id
uri
track_href
analysis_url
duration_ms
time_signature


## Descrição de cada audio feature:

- Acousticness ( acusticidade )
    - feature: number [ float ]
    - Medida de confiança de 0,0 a1.0
    - 1,0 representa alta confiança de que a faixa é acústica
- Analysis_url ( análise_url )
    - feature: string
    - É a URL para acessar a análise completa de áudio da faixa.
- Danceability ( dançabilidade )
    - feature:  number [ float ]
    - Descreve o quão adequada uma faixa é para dançar com base em um combinação.
    - 0,0 significa menos dançante.
    - 1,0 significa mais dançante.
- Duration_ms ( duração_ms)
    - feature : integer
    - Representa a duração da faixa em milissegundos.
- Energy ( energia )
    - feature: number [ float ]
    - É uma medida de 0,0 a 1,0 e representa uma medida perceptiva de intensidade e atividade.
- Id (id)
    - feature : string
    - É o ID do spotify para a faixa.
- Instrumentalness ( instrumentalidade )
    - feature : number [ float ]
    - Prevê se uma faixa não contém vocais.
    - 1,0 : valores proximos significa maior probabilidade da faixa não conter conteúdo vocal.
    - 0,5 : valores acinma pretendem representar faixas instrumentais.
- Key ( chave )
    - feature : integer
    - Representa a tonalidade em que a faixa está.
    - Os números inteiros são mapeados para as notas usando a notação padrão de classe de nota
    - [https://en.wikipedia.org/wiki/Pitch_class](https://en.wikipedia.org/wiki/Pitch_class)
    - Se nenhuma chave foir detectada, o valor será: -1

- Liveness ( vivacidade )
    - feature : numer [ float ]
    - Detecta a presença de público na gravação.
    - Valores altos representam uma maior probabilidade que a faixa tenha sido tocada ao vivo.
    - 0,8 : tal valor representa uma forte probabilidade de que a pista esteja ativa.
- Loudness ( intensidade )
    - feature : number [ float ]
    - Representa o volume geral de uma faixa em decibéis (dB)
    - Os valorem normalmente variam entre -60 e 0 dB.
    - Os valores são calculados em média em toda faixa e são uteo para comparar a intensidade relativa das faixas.
- Mode ( modo )
    - feature : integger
    - Indica a modalidade ( maior ou menos ) de uma faixa, o tipo de escala da qual deriva seu conteúdo melódico.
    - Maior é representado por 1 e menor é 0.
- Speechiness ( fala )
    - feature : number [ float ]
    - Detecta a presença de palavras faladas em uma faixa
    - Quanto mais falada for a gravação, mais próximo de 1,0 será o valor atribuido.
    - Valores acima de 0,66 descrevem faixas que provavelmente são composta inteiramente de palavras faladas.
    - Valores entre 0,33 e 0,66 descrevem faixas que podem contem música e fala
    - Valores abaixo de 0,33 provavelmente representam música e outras faixas não faladas.
- Tempo
    - feature: number [ float ]
    - Represrnta o andamento geral estimado de uma faixa em batidas por minutos (BPM)
- Time_signature ( assinatura_hora )
    - feature: integger
    - Uma formula de compasso estimada.
    - A fórmula de compasso varia de 3 a 7 indicando fórmulas de compasso de “3/4” a  “7/4”
- Track_href
    - feature : string
    - Um link para endpoint da API Web fornecendo detalhes completos da faixa.
- Type ( tipo )
    - feature : string
    - Representa o tipo de objeto.
    - Valores permitidos: `"audio_features"`
- URI
    - feature : string
    - O URI do Spotify para a faixa
- Valence ( valência )
    - feature: number [ float ]
    - Representa uma medida de 0,0 a 1,0 que descreve a positivdade musical transmitida por uma faixa.
    - Faixas com valência alta soam mais positivas (por exemplo, feliz, alegre, eufórica).
    - faixas com valência baixa soam mais negativas (por exemplo, triste, deprimida, irritada).
