In [19]:
import os
import pandas as pd
from dotenv import load_dotenv

pd.set_option('display.max_columns', None)
pd.set_option('display.max_colwidth', 30)

In [20]:
load_dotenv()
password = os.getenv('ZIVILE_POSTGRES_PSWD')

In [21]:
%reload_ext sql

In [22]:
%sql postgresql://zivile:{password}@127.0.0.1:5432/books

### How many books are in dataset ?

%%sql
select count(*) from book;

In [23]:
%%sql
select count(*) from book;

 * postgresql://zivile:***@127.0.0.1:5432/books
1 rows affected.


count
52390


### What are the most prolific authors  ? top 5

In [24]:
%%sql
select author, count('title') as numOfBooks from book group by author order by numOfBooks desc limit 5;

 * postgresql://zivile:***@127.0.0.1:5432/books
5 rows affected.


author,numofbooks
Nora Roberts (Goodreads Author),86
Agatha Christie,72
Stephen King (Goodreads Author),66
Erin Hunter,58
Bella Forrest (Goodreads Author),53


### What genre is most popular between most pupular authors?

In [25]:
%%sql
select genre, count(*) from book join genre on book.id=genre.book_id where author in
('Nora Roberts (Goodreads Author)', 'Agatha Christie', 'Stephen King (Goodreads Author)', 'Erin Hunter', 'Bella Forrest (Goodreads Author)')
group by genre order by 2 desc limit 5;

 * postgresql://zivile:***@127.0.0.1:5432/books
5 rows affected.


genre,count
Fiction,325
Fantasy,191
Mystery,165
Romance,126
Audiobook,123


### How many different awards there are in this dataset?

In [26]:
%%sql
select count(distinct(award)) from award;

 * postgresql://zivile:***@127.0.0.1:5432/books
1 rows affected.


count
5783


### What are most given awards?

In [27]:
%%sql
select award, count(*) from award group by award order by 2 desc limit 5;

 * postgresql://zivile:***@127.0.0.1:5432/books
5 rows affected.


award,count
Dorothy Canfield Fisher Children's Book Award Nominee,323
Lincoln Award Nominee,246
Rhode Island Teen Book Award Nominee,219
Goodreads Choice Award Nominee for Young Adult Fiction,165
Carnegie Medal Nominee,164


### Which awards are the oldest?

In [28]:
%%sql
select * from award where award_year in (select award_year from award order by award_year NULLS last limit 5) order by 3;

 * postgresql://zivile:***@127.0.0.1:5432/books
8 rows affected.


id,award,award_year,publication_id
21631,بهترین رمان سال در بیستمین دوره کتاب سال جمهوری اسلامی ایران,1380,5613
20529,Chaucer Awards First In Category Award Nominee for Historical Fiction Pre-1750s (Shortlisted),1750,25183
21636,Prix Femina,1905,44639
4001,Prix Goncourt,1916,16206
16867,Pulitzer Prize for Novel,1919,10861
16866,Pulitzer Prize for Biography or Autobiography,1919,9215
14897,Grand Prix du Roman de l'Académie française,1919,27108
4002,Prix Goncourt,1919,4194


### What is the western book with the oldest award?

In [29]:
%%sql
select title, author, rating, publisher from publication join book on book.id=publication.book_id where publication.id = 25183;

 * postgresql://zivile:***@127.0.0.1:5432/books
1 rows affected.


title,author,rating,publisher
Apricots and Wolfsbane,K.M. Pohlkamp (Goodreads Author),4.35,"Filles Vertes Publishing, LLC."


### 5 most rated books (books with most number of star for 5 star rating) ?

In [30]:
%%sql
select publication_id, ratingsbystar from star where star='5' order by ratingsbystar desc limit 5;
select title, author, rating, publisher, ratingsbystar from publication
	join book on book.id=publication.book_id
	join star on star.publication_id=publication.id
	where publication.id in (select publication_id from star where star='5' order by ratingsbystar desc limit 5) and star='5'
order by ratingsbystar desc;


 * postgresql://zivile:***@127.0.0.1:5432/books
5 rows affected.
5 rows affected.


title,author,rating,publisher,ratingsbystar
Harry Potter and the Sorcerer's Stone,"J.K. Rowling, Mary GrandPré (Illustrator)",4.47,Scholastic Inc,4578137
The Hunger Games,Suzanne Collins,4.33,Scholastic Press,3444695
To Kill a Mockingbird,Harper Lee,4.28,Harper Perennial Modern Classics,2363896
Harry Potter and the Deathly Hallows,J.K. Rowling,4.62,Arthur A. Levine Books / Scholastic Inc.,2038930
Harry Potter and the Prisoner of Azkaban,"J.K. Rowling, Mary GrandPré (Illustrator)",4.57,Scholastic Inc.,1892635


### What are 5 books with most settings?

In [31]:
%%sql
 select title, author, v.setting_count from book join (select book_id, array_agg(setting) as settings, count(setting) as setting_count from setting group by book_id order by count(setting) desc limit 5) v on book.id=v.book_id limit 5;

 * postgresql://zivile:***@127.0.0.1:5432/books
5 rows affected.


title,author,setting_count
Mahabharata,C. Rajagopalachari (Translator),135
A Clash of Kings,George R.R. Martin,82
Confederates in the Attic: Dispatches from the Unfinished Civil War,Tony Horwitz,55
Julemysteriet,Jostein Gaarder,37
حول العالم في 200 يوم,أنيس منصور,25


### What are the most popular setting?

In [32]:
%%sql
select setting, count(setting) as settings_count from setting group by setting order by settings_count desc limit 10;

 * postgresql://zivile:***@127.0.0.1:5432/books
10 rows affected.


setting,settings_count
United States of America,873
"London, England",720
"New York City, New York (United States)",544
England,315
United Kingdom,312
Paris (France),264
New York State (United States),262
California (United States),214
"Chicago, Illinois (United States)",184
"Los Angeles, California (United States)",184


### What languages are in this dataset?

In [33]:
%%sql
select language, count(language) as count from publication group by language order by count desc limit 5;

 * postgresql://zivile:***@127.0.0.1:5432/books
5 rows affected.


language,count
English,42631
Arabic,1036
Spanish,684
French,576
German,525


### What are the 5 most popular books in lithuanian in this dataset and their genres ?

In [34]:
%%sql
select title, author, genres, firstpublishdate, numratings, description, bookformat, publisher from publication
join book on publication.book_id=book.id 
join (select book_id, array_agg(genre) as genres from genre group by book_id) g on book.id=g.book_id
where language='Lithuanian' order by numratings desc limit 5;

 * postgresql://zivile:***@127.0.0.1:5432/books
5 rows affected.


title,author,genres,firstpublishdate,numratings,description,bookformat,publisher
Apie fotografiją,Susan Sontag,"['Art History', 'Essays', 'Photography', 'Philosophy', 'Theory', 'Criticism', 'Art', 'Nonfiction', 'History', 'Art and Photography']",1973-11-06,38135,"Ši knyga - ne fotografijos istorija, o bandymas apmąstyti problemas, kurias kelia fotografinių atvaizdų įsigalėjimas dabarties pasaulyje. Šešiose koncentruotuose esė, kurios skaitomos beveik kaip grožinė literatūra, Susan Sontag daro vieną pjūvį po kito, nagrinėdama fotografijos atsiradimą ir raidą, raizgius santykius su daile, raštija, politika ir morale. Fotografija rašytojai yra modernybės simbolis ir drauge jos simptomas, atskleidžiantis tikrąją, dramatišką šiuolaikinių visuomenių būklę.",Paperback,Baltos lankos
Daniško gyvenimo metai. Atvirai apie laimingiausios pasaulio šalies paslaptis,Helen Russell,"['Self Help', 'Denmark', 'Audiobook', 'Biography', 'Memoir', 'Travel', 'Nonfiction', 'Autobiography', 'Humor', 'Biography Memoir']",2015-01-01,19269,"Denmark is officially the happiest nation on Earth. When Helen Russell is forced to move to rural Jutland, can she discover the secrets of their happiness? Or will the long, dark winters and pickled herring take their toll?A Year of Living Danishly looks at where the Danes get it right, where they get it wrong, and how we might just benefit from living a little more Danishly ourselves.",,Vaga
Paskutinė mergina. Mano nelaisvės ir kovos su Islamo vastybe istorija,Nadia Murad,"['Autobiography', 'Biography Memoir', 'Feminism', 'Politics', 'Religion', 'Nonfiction', 'Memoir', 'Biography', 'History', 'War']",2017-10-06,13545,"Buvusios „Islamo valstybės sekso vergės ir Nobelio taikos premijos nominantės bei JT geros valios ambasadorės atsiminimai.2014 metais „Islamo valstybė užpuolė Nadios Murad gimtąjį jazidų (kurdų religinė mažuma) kaimelį šiaurės Irake ir jos, 21 metų moksleivės, gyvenimas sudužo į šipulius. ISIS kareiviai žudė vyrus, kurie nesutiko atsiversti į islamą, ir moteris, kurios buvo per senos tapti sekso vergėmis. Nadios motiną ir šešis brolius taip pat nužudė, o ji pati buvo išvežta į Mosulą ir, kaip ir tūkstančiai kitų jazidų moterų, parduota į „Islamo valstybės sekso vergiją. Mergina buvo laikoma nelaisvėje, mušama ir prievartaujama, tačiau galiausiai jai pavyko pabėgti ir išsigelbėti.Nadia nė neįsivaizdavo, kad vieną dieną ji taps žmogaus teisių aktyviste. Ji metė iššūkį visoms etiketėms, kurias jai mėgino klijuoti gyvenimas: našlaitės, prievartos aukos, vergės, pabėgėlės. Vietoje jų ji susikūrė naujas: likusi gyva, jazidų lyderė, moterų užtarėja, Nobelio taikos premijos nominantė, Jungtinių Tautų geros valios ambasadorė, o dabar ir knygos autorė.Nadia ne tik sugebėjo išreikšti savo nuomonę, ji taip pat kalba už kiekvieną jazidą, nukentėjusį nuo genocido, vykdomo Irake, už kiekvieną prievartautą moterį ir už kiekvieną likimo valiai paliktą pabėgėlį. Ši knyga – tai didžiulio žmogaus noro gyventi liudijimas ir meilės laiškas – prarastai šaliai, trapiai bendruomenei ir karo išblaškytai šeimai.„Drąsus Nadios Murad liudijimas yra šiurpus, tačiau labai reikalingas ir svarbus skaitinys... Visi, kurie nori suprasti, ką daro vadinamoji „Islamo valstybė, privalo perskaityti šiuos atsiminimus.Economist„Neapsakomai vertinga knyga. Tai ne tik jazidų genocido liudijimas, bet ir švelni odė gyvenimo būdui, kuris jau sunaikintas.Jewish JournalNadia Murad – žmogaus teisių aktyvistė, nominuota Nobelio taikos premijai, apdovanota Vaclavo Havelo žmogaus teisių ir Andrejaus Sacharovo premijomis, pirmoji Jungtinių Tautų Prekybos žmonėmis aukų orumo geros valios ambasadorė. Kartu su jazidų teisių organizacija „Yazda rengia „Islamo valstybės nusikaltimų medžiagą, kad galėtų šią organizaciją paduoti į Tarptautinį baudžiamąjį teismą. Ji taip pat įkūrė programą „Nadios iniciatyva, kuri skirta genocidą ir prekybą žmonėmis išgyvenusiems padėti.Jenna Krajeski – žurnalistė, kurios reportažai iš Turkijos, Egipto, Irako ir Sirijos publikuojami tokiuose leidiniuose kaip „New Yorker, „Slate, „Nation, „Virginia Quarterly Review ir kt.",Hardcover,Baltos lankos
Civilizacijų susidūrimas ir pasaulio pertvarka,"Samuel P. Huntington, Ala Barkar (Translator)","['Nonfiction', 'History', 'Politics', 'Cultural', 'Religion', 'World History', 'Sociology', 'Political Science', 'Philosophy', 'International Relations']",1996-11-06,9911,"Knygos autorius Samuel P. Huntington – amerikiečių politologas, Harvardo universiteto profesorius, dėstęs jame penkis dešimtmečius.„Civilizacijų susidūrimas ir pasaulio pertvarka“ – stebinanti ir provokuojanti knyga apie kardinalius pokyčius pasaulio politikoje žlugus komunistinei santvarkai. Politologas aiškina, kaip neišvengiamas skirtingų civilizacijų susidūrimas po Šaltojo karo visiškai pakeitė tautų bei kultūrinių ideologijų padėtį šių dienų politikoje. Autorius analizuoja šiais laikais nuolat kintančią politinę kultūrą ir pateikia neįtikėtinų ateities prognozių.",Hardcover,Metodika
Dievų miškas,Balys Sruoga,"['Classics', 'Fiction', 'War', 'Historical Fiction', 'School', 'Read For School', 'World War II', 'Historical', '20th Century', 'Literature']",1957-10-30,4935,"„Dievų miškas“ — memuarinis lietuvių rašytojo ir poeto Balio Sruogos romanas, parašytas 1945 m. Jame atsispindi rašytojo išgyvenimai nacių Štuthofo koncentracijos stovykloje, į kurią B. Sruoga buvo išsiųstas 1943 m. kovą. Romanas kupinas ironijos ir pasišaipymo iš lagerių tvarkos, elgesio su kaliniais ir apskritai iš visos esamos situacijos, ryški sarkastiška ironija ir juodasis humoras (kalinių mušimo, lavonų tampymo scenos), kuris buvo vienintelis būdas, leidęs bent kiek atsitverti nuo šaltai apgalvotos, racionalizuotos žmonių naikinimo sistemos.Knygą B. Sruoga parašė vos per kelis mėnesius, tik grįžęs iš koncentracijos stovyklos į Lietuvą 1945 m. vasarą, besigydydamas Birštono sanatorijoje. Jos spausdinimas sovietinės priespaudos laikais buvo uždraustas.",,Šviesa


### What are 5 most expensive books?

In [35]:
%%sql
select title, author, price from publication join book on book.id=publication.book_id order by price desc nulls last limit 5;

 * postgresql://zivile:***@127.0.0.1:5432/books
5 rows affected.


title,author,price
"The Oxford India Ghalib: Life, Letters and Ghazals",Mirza Asadullah Khan Ghalib,8715.51
La estética musical desde la Antigüedad hasta el siglo XX,Enrico Fubini,2812.18
Capitale de la douleur suivi de L'amour la poésie,Paul Éluard,2751.41
Ferrari In Camera: From Ascari To Villeneuve,"Geoffrey Goddard, Geoff Goddard",2179.1
The Commander And The Den Asaan Rautu,Michelle Franklin (Goodreads Author),1775.18


In [36]:
# close connection
connection_dict = %sql --connections
connection_string = list(connection_dict.keys())[0]
connection_object = connection_dict[connection_string]
%sql --close $connection_object.url