Permalink
Switch branches/tags
Nothing to show
Find file Copy path
Fetching contributors…
Cannot retrieve contributors at this time
346 lines (250 sloc) 8.28 KB

Databases

SQL Syntax

Note

For SQL Syntax refer to :ref:`SQL`

DB API

 • Database API in Python

sqlite3

Connection

.. literalinclude:: src/database-connect-memory.py
  :language: python
  :caption: Connection to in-memory database

.. literalinclude:: src/database-connect-file.py
  :language: python
  :caption: Connection to database file

.. literalinclude:: src/database-connect-context-manager.py
  :language: python
  :caption: Connection

Execute and executemany

.. literalinclude:: src/database-execute.py
  :language: python
  :caption: Execute

.. literalinclude:: src/database-execute-many.py
  :language: python
  :caption: Execute many

Results

.. literalinclude:: src/database-results.py
  :language: python
  :caption: Results

.. literalinclude:: src/database-results-dict.py
  :language: python
  :caption: Results with ``dict``

Cursor

.. literalinclude:: src/database-cursor.py
  :language: python
  :caption: Results with cursor


pyMySQL

$ pip install PyMySQL
.. literalinclude:: src/database-pymysql.py
  :language: python
  :caption: PyMySQL


psycopg2

$ pip install psycopg2
.. literalinclude:: src/database-psycopg2.py
  :language: python
  :caption: Psycopg2


pymongo

$ pip install pymongo
import datetime
from pymongo import MongoClient

client = MongoClient('mongodb://localhost:27017/')
db = client.test_database
posts = db.posts

data = {
  "name": "José Jiménez",
  "catchphrase": "My name... José Jiménez",
  "tags": ["astronaut", "nasa", "space"],
  "date": datetime.datetime.utcnow()
}

posts.insert_one(data).inserted_id
# ObjectId('...')
for post in posts.find():
  print(post)

for post in posts.find({"author": "Mike"}):
  print(post)

SQL Injection

username = input('Username: ') # User type: ' OR 1=1; DROP TABLE users --
password = input('Password: ') # User type: whatever

query = f"""

  SELECT id, username, email
  FROM users
  WHERE username='{username}' AND password='{password}'

"""

print(query)
# SELECT id, username, email
# FROM users
# WHERE username='' OR 1=1; DROP TABLE users -- ' AND password='132'
img/sql-injection.jpg

SQL Injection

ORM

SQLAlchemy

Django ORM

Database Schema Migration

SQLAlchemy

Django

FlywayDB

LiquidBase

Data exploration

# Install superset
pip install superset

# Create an admin user (you will be prompted to set username, first and last name before setting a password)
fabmanager create-admin --app superset

# Initialize the database
superset db upgrade

# Load some data to play with
superset load_examples

# Create default roles and permissions
superset init

# Start the web server on port 8088, use -p to bind to another port
superset runserver

# To start a development web server, use the -d switch
# superset runserver -d
superset_config.py:
import os

#---------------------------------------------------------
# Superset specific config
#---------------------------------------------------------
ROW_LIMIT = 5000
SUPERSET_WORKERS = 4

SUPERSET_WEBSERVER_PORT = 8088
#---------------------------------------------------------

#---------------------------------------------------------
# Flask App Builder configuration
#---------------------------------------------------------
# Your App secret key
SECRET_KEY = '\2\1secretkey\1\2\e\y\y\h'

# The SQLAlchemy connection string to your database backend
# This connection defines the path to the database that stores your
# superset metadata (slices, connections, tables, dashboards, ...).
# Note that the connection information to connect to the datasources
#you want to explore are managed directly in the web UI
SQLALCHEMY_DATABASE_URI = os.environ.get('HEROKU_POSTGRESQL_GREEN_URL', None)

# Flask-WTF flag for CSRF
WTF_CSRF_ENABLED = True
# Add endpoints that need to be exempt from CSRF protection
WTF_CSRF_EXEMPT_LIST = []

# Set this API key to enable Mapbox visualizations
MAPBOX_API_KEY = ''
gunicorn \
  -w 10 \
  -k gevent \
  --timeout 120 \
  -b 0.0.0.0:6666 \
  --limit-request-line 0 \
  --limit-request-field_size 0 \
  --statsd-host localhost:8125 \
  superset:app

Case Study

.. literalinclude:: src/database-case-study.py
  :name: listing-database-case-study
  :language: python
  :caption: Zapisywanie do bazy danych wyników pobranych z sensorów podłączonych po USB


Assignments

Iris Database

 1. Pobierz dane z listingu :numref:`listing-database-iris.csv`

 2. Bazę pomiarów Irysów przekonwertuj na tabelę w sqlite3

 3. Nazwy poszczególnych kolumn:

  • id - int
  • species - str
  • datetime - datetime
  • sepal_length - float
  • sepal_width - float
  • petal_length - float
  • petal_width - float
 4. Do połączenia wykorzystaj context manager (with)

 5. Dane wrzuć do bazy za pomocą .executemany() podając dict

 6. Do bazy danych zapisz species jako nazwę gatunku (str), a nie jego id (int) (wersja z gwiazdką: nie korzystaj z if-ów do tego)

  • 0 - setosa
  • 1 - versicolor
  • 2 - virginica
 7. Dodaj kolumnę datetime z datą i czasem dodania (UTC)

 8. Załóż index na datetime

 9. Wyniki wypisz z bazy danych (SELECT * FROM iris ORDER BY datetime DESC)

 10. Zwracaj dane jako sqlite3.Row

.. literalinclude:: assignment/database-iris.csv
  :name: listing-database-iris.csv
  :language: python
  :caption: Iris Database

About:
 • Filename: database_iris.py
 • Lines of code to write: 30 lines
 • Estimated time of completion: 30 min
The whys and wherefores:
 • Parsowanie plików csv
 • Wykorzystywanie bazy sqlite3
 • Tworzenie bazy danych
 • Zakładanie indeksów na bazie danych
 • Wrzucanie danych do bazy
 • Wyciąganie danych z bazy
 • Konwersja typów
 • Korzystanie z datetime

Tworzenie bazy danych i proste zapytania

 1. Wykorzystaj kod z listingu :numref:`listing-database-addressbook.sql` oraz :numref:`listing-database-addressbook.txt`
 2. Wykorzystaj cursor oraz połączenia jako context manager (with)
 3. Dane powinny być zwracane w postaci listy dict
 4. Do wpisywania danych wykorzystaj konstrukcję execute wykorzystując dict jako argument
About:
 • Filename: database_addressbook.py
 • Lines of code to write: 15 lines
 • Estimated time of completion: 20 min
Zadanie z gwiazdką:
 • Dodaj obsługę wielu adresów
 • Dodaj obsługę relacji w aplikacji
.. literalinclude:: assignment/database-addressbook.sql
  :name: listing-database-addressbook.sql
  :language: sql
  :caption: Address Book SQL queries

.. literalinclude:: assignment/database-addressbook.txt
  :name: listing-database-addressbook.txt
  :language: text
  :caption: Address Book data

Dane w jednej tabeli

 1. Dane z listingu :numref:`listing-database-addressbook.txt`

 2. Jak zapisać w jednej tabeli bez wykorzystania relacji?

 3. Przeprowadź dyskusję na temat zalet i wad podejść:

  • jedno pole adresy i dane rozdzielone separatorem (;)
  • wiele adresów i dane rozdzielone separatorem (;)
  • wiele kolumn dla każdego pola
 4. Które podejście jest najepsze?

 5. Które podejście jest zgodne z ACID?