# 2. Interacting with APIs to import data from the web

Dalam bab ini, Anda akan mendapatkan pemahaman yang lebih dalam tentang cara mengimpor data dari web. Anda akan mempelajari dasar-dasar mengekstraksi data dari API, mendapatkan wawasan tentang pentingnya API, dan berlatih mengekstraksi data dengan menyelam ke dalam OMDB dan Library of Congresss API.

## Introduction to APIs and JSONs

### What exactly is a JSON?

Manakah dari berikut ini yang TIDAK benar dari format file JSON?

**BENAR**
* JSON terdiri dari pasangan key-value
* JSON dapat dibaca manusia.
* Format file JSON muncul dari meningkatnya kebutuhan akan komunikasi server-ke-browser secara real-time.
* Fungsi `json.load()` akan memuat JSON ke dalam Python sebagai `dictionary`.

**TIDAK BENAR**
* Fungsi `json.load()` akan memuat JSON ke Python sebagai `list`.

### Loading and exploring a JSON

Sekarang setelah Anda tahu apa itu JSON, Anda akan memuatnya ke lingkungan Python dan menjelajahinya sendiri. Di sini, Anda akan memuat JSON `'a_movie.json'` ke dalam variabel `json_data`, yang akan menjadi `dictionary`. Anda kemudian akan menjelajahi konten JSON dengan mencetak pasangan *key-value* dari `json_data` ke shell.

In [4]:
import json

# Load JSON: json_data
with open("a_movie.json") as json_file:
    json_data = json.load(json_file)

# Print each key-value pair in json_data
for k in json_data.keys():
    print(k + ': ', json_data[k])

Actors:  Jesse Eisenberg, Rooney Mara, Bryan Barter, Dustin Fitzsimons
Awards:  Won 3 Oscars. Another 168 wins & 177 nominations.
BoxOffice:  $96,400,000
Country:  USA
DVD:  11 Jan 2011
Director:  David Fincher
Genre:  Biography, Drama
Language:  English, French
Metascore:  95
Plot:  As Harvard student Mark Zuckerberg creates the social networking site that would become known as Facebook, he is sued by the twins who claimed he stole their idea, and by the co-founder who was later squeezed out of the business.
Poster:  https://m.media-amazon.com/images/M/MV5BOGUyZDUxZjEtMmIzMC00MzlmLTg4MGItZWJmMzBhZjE0Mjc1XkEyXkFqcGdeQXVyMTMxODk2OTU@._V1_SX300.jpg
Production:  Columbia Pictures
Rated:  PG-13
Ratings:  [{'Source': 'Internet Movie Database', 'Value': '7.7/10'}, {'Source': 'Rotten Tomatoes', 'Value': '96%'}, {'Source': 'Metacritic', 'Value': '95/100'}]
Released:  01 Oct 2010
Response:  True
Runtime:  120 min
Title:  The Social Network
Type:  movie
Website:  N/A
Writer:  Aaron Sorkin (scree

### Exploring your JSON

Muat JSON `'a_movie.json'` ke dalam variabel, yang akan menjadi dictionary. Lakukan dengan menyalin, menempel, dan mengeksekusi kode berikut di IPython Shell:

In [5]:
import json
with open("a_movie.json") as json_file:
    json_data = json.load(json_file)

Cetak nilai yang sesuai dengan kunci `'Title'` dan `'Year'` dan jawab pertanyaan berikut tentang film yang dijelaskan JSON:

Manakah dari pernyataan berikut ini yang benar tentang film yang dimaksud?

In [9]:
print("The title is " + str(json_data['Title']) + " and the year is " + str(json_data['Year']))

The title is The Social Network and the year is 2010


## APIs and interacting with the world wide web

### What's an API?

Manakah dari pernyataan berikut tentang API yang TIDAK benar?

**BENAR**
* API adalah seperangkat protokol dan rutinitas untuk membangun dan berinteraksi dengan aplikasi perangkat lunak
* API adalah akronim dan merupakan kependekan dari *Application Program interface*
* Secara umum untuk menarik data dari API dalam format file JSON.
* API adalah sekelompok kode yang memungkinkan dua program perangkat lunak untuk saling berkomunikasi

**TIDAK BENAR**
* Semua API mengirimkan data hanya dalam format file JSON

### API requests

Sekarang giliran Anda untuk menarik beberapa data film dari Open Movie Database (OMDB) menggunakan API mereka. Film yang akan Anda query tentang API adalah *The Social Network*. Ingatlah bahwa, dalam video, untuk mengquery API tentang Hacker film, string permintaan adalah `'http://www.omdbapi.com/?t=hackers'` dan memiliki argumen tunggal `t=hackers`.

Catatan: baru-baru ini, OMDB telah mengubah API mereka: Anda sekarang juga harus menentukan kunci API. Ini berarti Anda harus menambahkan argumen lain ke URL: `apikey=72bc447a`.

In [10]:
# Import requests package
import requests

# Assign URL to variable: url
url = 'http://www.omdbapi.com/?apikey=72bc447a&t=the+social+network'

# Package the request, send the request and catch the response: r
r = requests.get(url)

# Print the text of the response
print(r.text)

{"Title":"The Social Network","Year":"2010","Rated":"PG-13","Released":"01 Oct 2010","Runtime":"120 min","Genre":"Biography, Drama","Director":"David Fincher","Writer":"Aaron Sorkin (screenplay), Ben Mezrich (book)","Actors":"Jesse Eisenberg, Rooney Mara, Bryan Barter, Dustin Fitzsimons","Plot":"As Harvard student Mark Zuckerberg creates the social networking site that would become known as Facebook, he is sued by the twins who claimed he stole their idea, and by the co-founder who was later squeezed out of the business.","Language":"English, French","Country":"USA","Awards":"Won 3 Oscars. Another 168 wins & 177 nominations.","Poster":"https://m.media-amazon.com/images/M/MV5BOGUyZDUxZjEtMmIzMC00MzlmLTg4MGItZWJmMzBhZjE0Mjc1XkEyXkFqcGdeQXVyMTMxODk2OTU@._V1_SX300.jpg","Ratings":[{"Source":"Internet Movie Database","Value":"7.7/10"},{"Source":"Rotten Tomatoes","Value":"96%"},{"Source":"Metacritic","Value":"95/100"}],"Metascore":"95","imdbRating":"7.7","imdbVotes":"581,767","imdbID":"tt1285

### JSON–from the web to Python

Wow, selamat! Anda baru saja mengquery API pertama Anda secara terprogram dengan Python dan mencetak teks respons ke shell. Namun, seperti yang Anda tahu, respons Anda sebenarnya adalah JSON, sehingga Anda dapat melakukan satu langkah lebih baik dan mendekode JSON. Anda kemudian dapat mencetak pasangan `key-value` dari `dictionary` yang dihasilkan. Itu yang akan kamu lakukan sekarang!

In [11]:
# Import package
import requests

# Assign URL to variable: url
url = 'http://www.omdbapi.com/?apikey=72bc447a&t=social+network'

# Package the request, send the request and catch the response: r
r = requests.get(url)

# Decode the JSON data into a dictionary: json_data
json_data = r.json()

# Print each key-value pair in json_data
for k in json_data.keys():
    print(k + ': ', json_data[k])

Title:  The Social Network
Year:  2010
Rated:  PG-13
Released:  01 Oct 2010
Runtime:  120 min
Genre:  Biography, Drama
Director:  David Fincher
Writer:  Aaron Sorkin (screenplay), Ben Mezrich (book)
Actors:  Jesse Eisenberg, Rooney Mara, Bryan Barter, Dustin Fitzsimons
Plot:  As Harvard student Mark Zuckerberg creates the social networking site that would become known as Facebook, he is sued by the twins who claimed he stole their idea, and by the co-founder who was later squeezed out of the business.
Language:  English, French
Country:  USA
Awards:  Won 3 Oscars. Another 168 wins & 177 nominations.
Poster:  https://m.media-amazon.com/images/M/MV5BOGUyZDUxZjEtMmIzMC00MzlmLTg4MGItZWJmMzBhZjE0Mjc1XkEyXkFqcGdeQXVyMTMxODk2OTU@._V1_SX300.jpg
Ratings:  [{'Source': 'Internet Movie Database', 'Value': '7.7/10'}, {'Source': 'Rotten Tomatoes', 'Value': '96%'}, {'Source': 'Metacritic', 'Value': '95/100'}]
Metascore:  95
imdbRating:  7.7
imdbVotes:  581,767
imdbID:  tt1285016
Type:  movie
DVD:  11

### Checking out the Wikipedia API

Anda melakukannya dengan sangat baik dan bersenang-senang sehingga kami akan melemparkan satu API lagi kepada Anda: Wikipedia API (didokumentasikan [di sini](https://www.mediawiki.org/wiki/API:Main_page)). Anda akan mengetahui cara menemukan dan mengekstrak informasi dari halaman Wikipedia untuk Pizza. Yang menjadi sedikit liar di sini adalah bahwa kueri Anda akan mengembalikan nested JSON, yaitu, JSON dengan JSON, tetapi Python dapat mengatasinya karena itu akan menerjemahkannya ke dalam dictionaries dalam dictionaries.

URL yang meminta kueri yang relevan dari Wikipedia API adalah

* `https://en.wikipedia.org/w/api.php?action=query&prop=extracts&format=json&exintro=&titles=pizza`

In [12]:
# Import package
import requests

# Assign URL to variable: url
url = 'https://en.wikipedia.org/w/api.php?action=query&prop=extracts&format=json&exintro=&titles=pizza'

# Package the request, send the request and catch the response: r
r = requests.get(url)

# Decode the JSON data into a dictionary: json_data
json_data = r.json()

# Print the Wikipedia page extract
pizza_extract = json_data['query']['pages']['24768']['extract']
print(pizza_extract)

<p class="mw-empty-elt">
</p>

<p><b>Pizza</b> (<small>Italian: </small><span title="Representation in the International Phonetic Alphabet (IPA)">[ˈpittsa]</span>, <small>Neapolitan: </small><span title="Representation in the International Phonetic Alphabet (IPA)">[ˈpittsə]</span>) is a savory dish of Italian origin, consisting of a usually round, flattened base of leavened wheat-based dough topped with tomatoes, cheese, and often various other ingredients (anchovies, olives, meat, etc.) baked at a high temperature, traditionally in a wood-fired oven. A small pizza is sometimes called a pizzetta.
</p><p>In Italy, pizza served in formal settings, such as at a restaurant, is presented unsliced and eaten with the use of a knife and fork. In casual settings it is cut into wedges to be eaten while held in the hand.
</p><p>The term <i>pizza</i> was first recorded in the 10th century in a Latin manuscript from the Southern Italian town of Gaeta in Lazio, on the border with Campania. Modern pi