# Webアプリに入る前に知っておくべきデータに関する前提知識

### 目標：APIを理解して使いこなし、そのデータを扱えるようになる事

目次
https://docs.google.com/document/d/1crmJ0DjAl77ab9aK8K9DshfQu25fS3EWXCC0m4AajZo/edit


## 3全体像：楽天のAPIから情報を取得する

### 3.1.おさらい：APIとは？

APIは、Application Programming Interfaceの略であり、プログラムやアプリケーション開発に必要な機能やデータを提供するインターフェースを指します。

例として、スマートフォンにはカメラアプリや音楽アプリ、地図アプリなどが存在します。これらのアプリケーションは、スマートフォンのOS（Operating System）が提供するAPIを用いて、カメラやGPS機能といったハードウェアやソフトウェアにアクセスしています。

APIはアプリケーションが他のアプリケーションやシステムと連携する手段であり、開発者が他のアプリケーションやサービスと容易に連携できるように設計されています。APIにはWeb API、データベースAPI、ソーシャルメディアAPIなど、多様な種類があります。

オンラインランキングやアカウントログイン機能の開発の際、GoogleやFacebookなどのサービスが提供するAPIを利用してアカウント情報を取得することができます。

APIは現代のソフトウェア開発において極めて重要な役割を担っており、様々なアプリケーションやサービスで利用されています。

今回取り上げる楽天APIを利用すれば、ホテルの価格比較サイトなどで活用することが可能です。

### 3.2.実際にやる事

SimpleHotelSearchにアクセスして、沖縄の那覇市のホテル情報を取得します。

<img src="img/img032.jpg">

参照：https://www.ebisumart.com/blog/ec-api/

In [1]:
#ライブラリrequestsを使うためにimportすることで機能を使う事が出来ます。
import requests

# アクセス先と認証と要求するデータの内容を指定します。
REQUEST_URL = "https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426"
 #アクセス先を指定する必要があるので、アクセス先をREQUEST_URLという変数に代入しておきます。
# アクセスを許可されたユーザーという事を証明するために、APP_IDに認証IDを代入しておきます。
APP_ID = "1090380199694035412"
# アクセス先と認証を用意できたので、なんのデータが欲しいかをparamsに代入しておきます。
# paramsでの指定方法はAPIの作成者によって変わりますので、事前に確認しておく必要があります。
params = {
    'format': 'json',
    'largeClassCode': 'japan',
    'middleClassCode': 'okinawa',
    'smallClassCode': 'nahashi',
    'applicationId': '1090380199694035412'
}

# アクセス先と認証と要求するデータの内容を指定出来たので、requestsのgetメソッドを使ってアクセスします。
# その結果をresに代入します。
res = requests.get(REQUEST_URL, params)

# 欲しいデータはresのjsonに格納されているので、res.json()をresultに代入しておきましょう。
# これでAPIで取得したデータはresultに代入されます。
result = res.json()


In [2]:
# 実際にresultに格納されたデータを見てみましょう。
result

{'pagingInfo': {'recordCount': 416,
  'pageCount': 14,
  'page': 1,
  'first': 1,
  'last': 30},
 'hotels': [{'hotel': [{'hotelBasicInfo': {'hotelNo': 182884,
      'hotelName': 'ホテルリソルトリニティ那覇',
      'hotelInformationUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/dQ4dX/?f_no=182884',
      'planListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/cHNRi/?f_no=182884&f_flg=PLAN',
      'dpPlanListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/TDZXm/?noTomariHotel=182884',
      'reviewUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/RmfmX/?f_hotel_no=182884',
      'hotelKanaName': 'ほてるりぞるとりにてぃなは',
      'hotelSpecial': '2022年4月1日開業。国際通りまで徒歩圏の絶好の立地。大浴場を備え、上質なくつろぎをご提供。',
      'hotelMinCharge': 4200,
      'latitude': 94341.93,
      'longitude': 459641.13,
      'postalCode': '900-0029',
      'address1': '沖縄県',
      'address2': '那覇市旭町7',
      'telephoneNo': '098-863-9269',
      'faxNo': '098-863-9279',
      'access': 'ゆいレール「旭橋駅」出入口2より徒歩3分',
      'pa

ブラウザでもrequestsがアクセスしてる先をブラウザでも見てみましょう

In [3]:
# requestsがどんなURLでリクエストしたかをres.urlで確認出来ます。
res.url

'https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426?format=json&largeClassCode=japan&middleClassCode=okinawa&smallClassCode=nahashi&applicationId=1090380199694035412'

res.urlで出力したURLを整理してみると

https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426?  
format=json  
&largeClassCode=japan  
&middleClassCode=okinawa  
&smallClassCode=nahashi  
&applicationId=1011509919335500197  

となり、?の後ろ側にリクエストしたいパラメーターがついている事がわかります。

これは楽天トラベルに書いてある

https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426?  
applicationId=[アプリID]  
&format=xml  
&largeClassCode=japan  
&middleClassCode=akita  
&smallClassCode=tazawa  

と要求してるパラメータの順番が違うだけで、同じ事を要求の仕方をしているのがわかると思います！

requestでは?の後ろのパラメータを

In [3]:
# paramの設定
params = {
    'format': 'json',
    'largeClassCode': 'japan',
    'middleClassCode': 'okinawa',
    'smallClassCode': 'nahashi',
    'applicationId': '1090380199694035412'
}

という形で格納し、requests.get(REQUEST_URL, params)で１つのリクエスト付きURLにしています。

よってURLの後ろにあるパラメータとrequestsのparamsが同じ変数を指定している事がわかりますね！

URL属性以外にもrequests.Responseクラスには以下のような属性がある（一部）。

| 属性 | 説明 |
| --- | --- |
| text | レスポンスの内容（content属性）を文字列にデコードしたもの |
| content | レスポントの内容（バイト列）。テキスト表現ではなくバイナリデータを扱うときにはこちらを使用する |
| encoding | content属性をtext属性にデコードする際に使用したエンコーディング |
| apparent_encoding | https://pypi.org/project/charset-normalizer/もしくはhttps://pypi.org/project/chardet/によって推測されたエンコーディング。encoding属性の値とapparent_encoding属性の値が異なることもある |
| headers | レスポンスヘッダーを大文字小文字の区別をしない辞書の形式で格納したもの |
| url | リクエストしたURL。リダイレクトが発生した場合には、リダイレクト先のURL |
| history | get関数でリクエストしたURLがリダイレクトされた場合に、リダイレクトされた結果を示すrequests.Responseクラスのインスタンスを古いものから順に並べたリスト |
|  |  |

requests.Responseクラスのインスタンスが持つ属性（一部）  
参照：https://atmarkit.itmedia.co.jp/ait/articles/2209/27/news035.html

では、http経由でデータを取得する所から演習しましょう。

### 3.3.http経由でデータを取得

#### http通信のリクエストをしてみよう

リクエストをするためのライブラリをインポートしておきましょう！

In [4]:
#ライブラリrequestsを使うためにimportすることで機能を使う事が出来ます。
import requests

インポートすることによってrequestsの機能を使う事ができます。
ではrequestsを使って、ブラウザのようにhtmlが取得できるかどうか確認してみましょう！
requests.get("ここに接続したいサイトのURL")とすることでhtmlが取得できます。

<img src="img/img025.png">

参照：https://www.itmanage.co.jp/column/about-http-https/

ブラウザと同じように取得できているかどうかは、ブラウザの検証機能にある、ページソース表示で確認できます！

In [5]:
#アクセスして取得したサイトデータをresに代入しておきます。今回はTech0のサイトにアクセス
res = requests.get('https://tech0-jp.com/')

In [6]:
#resに代入しておいたサイトデータprintでかくにんします。
print(res.text)

#これを得られた結果とブラウザのページソース表示で得られるhtmlを比較して、ブラウザと同じ機能であることを確認しましょう！

<!doctype html>
<html lang="ja">
<head>
	<meta charset="UTF-8">
	<meta property="og:type" content="website" />
	<meta name="viewport" content="width=device-width, initial-scale=1">
	<meta name="twitter:card" content="summary_large_image">
	<meta name="twitter:title" content="ビジネスxテクノロジーで新しい価値を生み出せるテック人材へ">
	<meta property="og:description" content="ビジネスxテクノロジーで新しい価値を生み出せるテック人材へ" >
	<meta property="og:url" content="https://tech0-jp.com/">
	<meta property="og:site_name" content="Tech0">
	<meta property="og:locale" content="ja_JP">
	<meta property="og:title" content="Tech0">
	<meta property="og:image" content="https://tech0-jp.com/wp-content/uploads/2023/07/Tech0_OGP_v2.png" >
	<link rel="profile" href="https://gmpg.org/xfn/11">
	<link rel="canonical" href="https://tech0-jp.com/">

	<title>Tech0</title>
<meta name='robots' content='max-image-preview:large' />
<link rel='dns-prefetch' href='//use.fontawesome.com' />
<link rel="alternate" type="application/rss+xml" title="Tech0 &raquo; フィード"

#### 楽天からデータを取得してみましょう

楽天側が用意した仕様に沿ったアクセス先とリクエストパラメータを設定していきましょう！
アクセス先とAPIキーとパラメーターを設定します

In [7]:
# アクセス先と認証IDと要求するデータを指定します。
REQUEST_URL = "https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426"
 #アクセス先を指定する必要があるので、アクセス先をREQUEST_URLという変数に代入しておきます。
# アクセスを許可されたユーザーという事を証明するために、APP_IDに認証IDを代入しておきます。
APP_ID = "1090380199694035412"


In [8]:
# param
params = {
    'format': 'json',
    'largeClassCode': 'japan',
    'middleClassCode': 'okinawa',
    'smallClassCode': 'nahashi',
    'applicationId': '1090380199694035412'
}

requests.get(アクセス先, リクエストパラメータ)を指定して、APIサーバーにデーターを要求しましょう！

In [9]:
# resにリクエストして得られた結果を代入します。
res = requests.get(REQUEST_URL, params)

リクエストが成功したか、ステータスの数字で確認しましょう！
- 200なら正常に通信完了
- 404ならアクセス先が間違えています。
- その他の400番台はパラメータが間違えています！

In [10]:
#変数だけを指定する事でprint()を省略できます。
res

<Response [200]>

通信の結果、返ってきたデータの中身を変数resultにjsonとして格納してから確認してみましょう！
res.json()とすることで、レスポンスデータの中にあるjsonデータをしてすることができます。

In [11]:
# resultにresの中にあるjsonデータを代入します。
result = res.json()

# 代入したデータを見てみましょう。
result

{'pagingInfo': {'recordCount': 416,
  'pageCount': 14,
  'page': 1,
  'first': 1,
  'last': 30},
 'hotels': [{'hotel': [{'hotelBasicInfo': {'hotelNo': 182884,
      'hotelName': 'ホテルリソルトリニティ那覇',
      'hotelInformationUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/dQ4dX/?f_no=182884',
      'planListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/cHNRi/?f_no=182884&f_flg=PLAN',
      'dpPlanListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/TDZXm/?noTomariHotel=182884',
      'reviewUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/RmfmX/?f_hotel_no=182884',
      'hotelKanaName': 'ほてるりぞるとりにてぃなは',
      'hotelSpecial': '2022年4月1日開業。国際通りまで徒歩圏の絶好の立地。大浴場を備え、上質なくつろぎをご提供。',
      'hotelMinCharge': 4200,
      'latitude': 94341.93,
      'longitude': 459641.13,
      'postalCode': '900-0029',
      'address1': '沖縄県',
      'address2': '那覇市旭町7',
      'telephoneNo': '098-863-9269',
      'faxNo': '098-863-9279',
      'access': 'ゆいレール「旭橋駅」出入口2より徒歩3分',
      'pa

## 4.全体像：取得したデータをエクセルのように扱う

### 4.1.実際にやる事

APIから得られたjsonで得られたデータを確認します。  
jsonだと人間にはわかりずらく、データ加工が難しいため、pandasを使ってエクセルのように変換します。

In [12]:
# result['hotels'][0]['hotel'][0]['hotelBasicInfo']['hotelName']　を変数を扱う事で、どのホテルのデータでも見れるようにしましょう。
# i = 0として１つ目のホテルの情報を見てみましょう。

i = 0
print(result['hotels'][i]['hotel'][0]['hotelBasicInfo']['hotelName'])
print(result['hotels'][i]['hotel'][0]['hotelBasicInfo']['hotelMinCharge'])
print(result['hotels'][i]['hotel'][0]['hotelBasicInfo']['reviewAverage'])
# printで表示

ホテルリソルトリニティ那覇
4200
4.4


### 4.2.データの確認と扱い方

取得しただけではデータを活用できないので、取得したデータを扱っていきます。  

全体像としては
- 取得したjsonデータを確認
- jsonでは確認しずらく、扱いずらいので、pandasというライブラリを使って扱いやすくする

#### 取得したデータの中身を詳しく確認してみましょう。

※取得したデータの全体像

<img style="background-color:#fff;" src="img/img034.png">
<img style="background-color:#fff;" src="img/img035.png">

参照：https://jsoncrack.com/editor

取得したデータの内容は result['hotels'][ここ行の場所]['hotel'][0]['hotelBasicInfo'] に格納されており、  
result['hotels'][0]['hotel'][0]['hotelBasicInfo']とすることで、１つ目に格納されているホテルの詳細を取得する事ができます

In [13]:
# データの中身を紐解いていく
result['hotels'][0]['hotel'][0]['hotelBasicInfo']

{'hotelNo': 182884,
 'hotelName': 'ホテルリソルトリニティ那覇',
 'hotelInformationUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/dQ4dX/?f_no=182884',
 'planListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/cHNRi/?f_no=182884&f_flg=PLAN',
 'dpPlanListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/TDZXm/?noTomariHotel=182884',
 'reviewUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/RmfmX/?f_hotel_no=182884',
 'hotelKanaName': 'ほてるりぞるとりにてぃなは',
 'hotelSpecial': '2022年4月1日開業。国際通りまで徒歩圏の絶好の立地。大浴場を備え、上質なくつろぎをご提供。',
 'hotelMinCharge': 4200,
 'latitude': 94341.93,
 'longitude': 459641.13,
 'postalCode': '900-0029',
 'address1': '沖縄県',
 'address2': '那覇市旭町7',
 'telephoneNo': '098-863-9269',
 'faxNo': '098-863-9279',
 'access': 'ゆいレール「旭橋駅」出入口2より徒歩3分',
 'parkingInformation': '機械式立体駐車場50台1泊1,500円 ※台風・災害時など利用不可※先着順予約不可',
 'nearestStation': '那覇空港',
 'hotelImageUrl': 'https://img.travel.rakuten.co.jp/share/HOTEL/182884/182884.jpg',
 'hotelThumbnailUrl': 'https://img.travel.rakuten

どんなホテルの詳細情報項目があるか確認してみましょう！  
result['hotels'][0]['hotel'][0]['hotelBasicInfo'].keys()で確認することができます。

In [14]:
# result['hotels'][0]['hotel'][0]['hotelBasicInfo']になんの項目が含まれているかをkeys()で確認できます。
result['hotels'][0]['hotel'][0]['hotelBasicInfo'].keys()

dict_keys(['hotelNo', 'hotelName', 'hotelInformationUrl', 'planListUrl', 'dpPlanListUrl', 'reviewUrl', 'hotelKanaName', 'hotelSpecial', 'hotelMinCharge', 'latitude', 'longitude', 'postalCode', 'address1', 'address2', 'telephoneNo', 'faxNo', 'access', 'parkingInformation', 'nearestStation', 'hotelImageUrl', 'hotelThumbnailUrl', 'roomImageUrl', 'roomThumbnailUrl', 'hotelMapImageUrl', 'reviewCount', 'reviewAverage', 'userReview'])

hotelNameという項目があるので、ホテルの名前などを取得してみましょう

In [15]:
# ホテル名の取得
result['hotels'][0]['hotel'][0]['hotelBasicInfo']['hotelName']

'ホテルリソルトリニティ那覇'

In [16]:
#URLの取得
result['hotels'][0]['hotel'][0]['hotelBasicInfo']['planListUrl']

'https://img.travel.rakuten.co.jp/image/tr/api/hs/cHNRi/?f_no=182884&f_flg=PLAN'

In [17]:
# 最低料金
result['hotels'][0]['hotel'][0]['hotelBasicInfo']['hotelMinCharge']

4200

In [18]:
# 平均レビュー
result['hotels'][0]['hotel'][0]['hotelBasicInfo']['reviewAverage']

4.4

#### データを扱いやすくするために可視化する

##### pandasを使ったデータの可視化

APIで得られたデータをpandasを用いてエクセルのような見やすいデータに変換してみましょう！

ライブラリのpandasをインポートしましょう！
as pdとつけて、短くpdとコーディングできるようにします。

In [19]:
#pandasのインポート
import pandas as pd

データをpandasのDataFrameに格納してみましょう！  
また、DataFrameとはどのような変換をしてくれるか確認してみましょう。


In [20]:
# １つめのホテルのデータをhotel_infoに代入します。
hotel_info = result['hotels'][0]['hotel'][0]['hotelBasicInfo']

# pd.DataFrame(ここに変換したいデータ,index=[ここにpandasに認識してほしい行数indexの番号])を代入します。
pd.DataFrame(hotel_info, index=[0])

Unnamed: 0,hotelNo,hotelName,hotelInformationUrl,planListUrl,dpPlanListUrl,reviewUrl,hotelKanaName,hotelSpecial,hotelMinCharge,latitude,...,parkingInformation,nearestStation,hotelImageUrl,hotelThumbnailUrl,roomImageUrl,roomThumbnailUrl,hotelMapImageUrl,reviewCount,reviewAverage,userReview
0,182884,ホテルリソルトリニティ那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,ほてるりぞるとりにてぃなは,2022年4月1日開業。国際通りまで徒歩圏の絶好の立地。大浴場を備え、上質なくつろぎをご提供。,4200,94341.93,...,"機械式立体駐車場50台1泊1,500円 ※台風・災害時など利用不可※先着順予約不可",那覇空港,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/18288...,,,https://img.travel.rakuten.co.jp/share/HOTEL/1...,243,4.4,あまり広いお部屋ではないですが、木を基調とした柔らかい雰囲気で清潔感があり、とても居心地がよ...


indexの数字を変数iにして、他のホテル情報も確認してみましょう！  
iの数字を変えると取得できるホテルを変更できる事も確認してみましょう

In [22]:
#index番号の指定。ここの数字を変えると格納されるデータが変わります。
i = 1
# その番号に対応するホテル情報を取得し、hotel_infoに代入
hotel_info = result['hotels'][i]['hotel'][0]['hotelBasicInfo']

# pd.DataFrame(ここに変換したいデータ,index=[ここにpandasに認識してほしい行数indexの番号])を代入します。
pd.DataFrame(hotel_info, index=[i])

# pd.DataFrame(ここに変換したいデータ,index=[ここにpandasに認識してほしい行数indexの番号])を代入します。


Unnamed: 0,hotelNo,hotelName,hotelInformationUrl,planListUrl,dpPlanListUrl,reviewUrl,hotelKanaName,hotelSpecial,hotelMinCharge,latitude,...,parkingInformation,nearestStation,hotelImageUrl,hotelThumbnailUrl,roomImageUrl,roomThumbnailUrl,hotelMapImageUrl,reviewCount,reviewAverage,userReview
1,128440,ダイワロイネットホテル那覇国際通り,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,だいわろいねっと　なはこくさいどおり,国際通りは目の前！ゆいレール「牧志」駅直結の好立地！！ビジネス・観光の拠点に最適♪,3830,94369.8,...,"当館裏手に提携駐車場（商業施設併設の立体駐車場）へのご案内となります（先着順：1泊1,000円）",,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/12844...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,1465,4.37,まず立地が抜群に良いです。天気悪くてもゆいレール牧志駅から屋根付きの連絡通路があり安心です。...


個別のデータを格納できたので、データ全体を格納してみましょう。

そのためにAPIで取得したホテルのデータ数を確認してみましょう！
len(確認したい配列)でデータ数を確認できます！

In [23]:
# len(ここに配列に含まれる要素)で配列に含まれる要素の数を取得できます。
len(result['hotels'])

30

30あるホテルのデータをfor文を使ってまとめてみましょう！

In [24]:

#空のpandasデータフレームを用意して、生成した1つ１つのデータフレームをこのdfに結合して１つにします。
df = pd.DataFrame()

# iにrange(0,len(result['hotels']))である0～29の数字が１つずつ代入されて実行されます。
# 今回は30のデータとわかっているのでfor i in range(0,30)でも問題ないですが、30とは限らないのでデータ園生数であるlen(result['hotels'])を使います。
for i in range(0, len(result['hotels'])):
    hotel_info = result['hotels'][i]['hotel'][0]['hotelBasicInfo']
    temp_df = pd.DataFrame(hotel_info, index=[i])
    df = pd.concat([df, temp_df])
#格納する配列をhotel_infoに代入する
#hotel_infoに代入されたホテルのデータをデータフレームに変換します。

#dfに結合して１つにまとめます。

まとめたデータをdisplay(df) で確認してみましょう！

In [25]:
# dfの表示
display(df)

Unnamed: 0,hotelNo,hotelName,hotelInformationUrl,planListUrl,dpPlanListUrl,reviewUrl,hotelKanaName,hotelSpecial,hotelMinCharge,latitude,...,parkingInformation,nearestStation,hotelImageUrl,hotelThumbnailUrl,roomImageUrl,roomThumbnailUrl,hotelMapImageUrl,reviewCount,reviewAverage,userReview
0,182884,ホテルリソルトリニティ那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,ほてるりぞるとりにてぃなは,2022年4月1日開業。国際通りまで徒歩圏の絶好の立地。大浴場を備え、上質なくつろぎをご提供。,4200,94341.93,...,"機械式立体駐車場50台1泊1,500円 ※台風・災害時など利用不可※先着順予約不可",那覇空港,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/18288...,,,https://img.travel.rakuten.co.jp/share/HOTEL/1...,243,4.4,あまり広いお部屋ではないですが、木を基調とした柔らかい雰囲気で清潔感があり、とても居心地がよ...
1,128440,ダイワロイネットホテル那覇国際通り,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,だいわろいねっと　なはこくさいどおり,国際通りは目の前！ゆいレール「牧志」駅直結の好立地！！ビジネス・観光の拠点に最適♪,3830,94369.8,...,"当館裏手に提携駐車場（商業施設併設の立体駐車場）へのご案内となります（先着順：1泊1,000円）",,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/12844...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,1465,4.37,まず立地が抜群に良いです。天気悪くてもゆいレール牧志駅から屋根付きの連絡通路があり安心です。...
2,134763,ダイワロイネットホテル那覇おもろまち,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,だいわろいねっとほてるなはおもろまち,海も見える最上階18階での朝食が評判！■客室階は全室10階以上♪■高速道路、西原IC近く観光にも◎,3800,94389.24,...,"1台1,100円(1泊)先着順。ホテル1階に専用P有＊満車時は提携P（1,100円）をご利用...",,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/13476...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,997,4.49,初めて利用しました非常に清潔、快適で素晴らしかったですまた利用したいホテルです　2023-1...
3,148000,ハイアットリージェンシー那覇沖縄,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,はいあっとりーじぇんしーなはおきなわ,グローバルブランドならではの洗練されたおもてなしと空間で上質なホテルステイをお楽しみください。,7926,94357.69,...,"立体駐車場・地下駐車場完備　１１３台　1泊1台あたり1,500円（税込）　（予約不要／出し入...",,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/14800...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,633,4.64,クラブアクセス付きにして大正解。お部屋も綺麗で快適でした。対応していただいたスタッフの皆様に...
4,16443,ロワジールホテル那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,ろわじーるほてるなは,空港から車で約7分。天然温泉大浴場、室内外プールと館内施設が充実♪■楽天認定プレミアムホテル■,5142,94355.14,...,"1泊1台1,800円",那覇空港,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/16443...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,1351,3.93,沖縄のリーズナブルなホテルは総じてですが、大浴場はそこまでよくありません。が、十分疲れが取れ...
5,181785,ヒューイットリゾート那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,ひゅーいっとりぞーとなは,2021年7月15日OPEN！朝食ブッフェは宿泊の皆様に無料でご提供いたします！,5110,94371.18,...,"有り　84台　1,650円（税込）/泊",那覇空港,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/18178...,,,https://img.travel.rakuten.co.jp/share/HOTEL/1...,270,4.29,高級宿の表記もあり、口コミを見て予約しましたが見た目綺麗なビジネスホテルという感じでした。枕...
6,104526,ダイワロイネットホテル沖縄県庁前,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,だいわろいねっとほてるおきなわけんちょうまえ,那覇空港より１５分。県庁等官庁街へ徒歩２分、人気の国際通りへは徒歩３分でビジネス・観光に好立地。,4500,94353.12,...,有り　１台　１０５０円（税込み／泊）　先着順（予約不可）*満車の際は、近隣の有料駐車場へご案内。,,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/10452...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,1152,4.19,近くにコンビニもあり、助かります。モノレールも近いので、空港へのアクセスもいいです。デスクが...
7,177761,東急ステイ沖縄那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,とうきゅうすてい　おきなわ　なは,食事評価4.2★沖縄料理が満載♪空港からゆいレールで4駅の好立地、全室洗濯乾燥機&ミニキッチ...,5550,94334.89,...,屋内契約駐車場30台 1500円 入出庫可 屋内提携駐車場123台 1200円 1回出庫毎に...,,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/17776...,,,https://img.travel.rakuten.co.jp/share/HOTEL/1...,570,4.48,立地がいい。下にドンキーがあるのもまたいいです。　2023-09-30 12:34:22投稿
8,167519,ノボテル沖縄那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,のぼてる　おきなわ　なは,国際通りから車で約５分、那覇にいてもリゾート気分を！クラブラウンジやインフィニティプールがあ...,5850,94374.6,...,"有り（1泊1台1,000円）　※事前予約不可",,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/16751...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,383,4.4,綺麗なホテルでサービスも◎テラス付きの部屋にしました。素敵でした。テラスの椅子が少し汚れてた...
9,176757,沖縄ハーバービューホテル,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,おきなわはーばーびゅーほてる,楽天トラベルからのご予約限定☆楽天専用ラウンジOPEN☆お飲み物やアメニティをご用意しております,3375,94336.98,...,有り　１９０台　１８００円（税込み／泊）　先着順,那覇空港,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/17675...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,483,4.27,地元民です。クラブラウンジ付プランを利用しました。ゆっくりとホテルステイでき満足しています。...


df.columnsで項目の確認ができます！  
これはresult['hotels'][0]['hotel'][0]['hotelBasicInfo'].keys()で取得した値と一致します

In [26]:
#カラムの表示
df.columns

Index(['hotelNo', 'hotelName', 'hotelInformationUrl', 'planListUrl',
       'dpPlanListUrl', 'reviewUrl', 'hotelKanaName', 'hotelSpecial',
       'hotelMinCharge', 'latitude', 'longitude', 'postalCode', 'address1',
       'address2', 'telephoneNo', 'faxNo', 'access', 'parkingInformation',
       'nearestStation', 'hotelImageUrl', 'hotelThumbnailUrl', 'roomImageUrl',
       'roomThumbnailUrl', 'hotelMapImageUrl', 'reviewCount', 'reviewAverage',
       'userReview'],
      dtype='object')

##### pandasを使ったデータ整理

まとめたデータから名前と値段と評価だけを取り出してみましょう！  
１つのカラムを取得する時は欲しいカラム名である"カラム名"を代入したdf["カラム名"]で取得できましたが、  
複数選択する場合は、の代わりに配列である["カラム名1","カラム名2","カラム名3"]を代入してdf[["カラム名1","カラム名2","カラム名3"]]とする必要があります。

In [27]:
#[ 'hotelName', 'hotelMinCharge', 'reviewAverage']を表示
df[[ 'hotelName', 'hotelMinCharge', 'reviewAverage']]

Unnamed: 0,hotelName,hotelMinCharge,reviewAverage
0,ホテルリソルトリニティ那覇,4200,4.4
1,ダイワロイネットホテル那覇国際通り,3830,4.37
2,ダイワロイネットホテル那覇おもろまち,3800,4.49
3,ハイアットリージェンシー那覇沖縄,7926,4.64
4,ロワジールホテル那覇,5142,3.93
5,ヒューイットリゾート那覇,5110,4.29
6,ダイワロイネットホテル沖縄県庁前,4500,4.19
7,東急ステイ沖縄那覇,5550,4.48
8,ノボテル沖縄那覇,5850,4.4
9,沖縄ハーバービューホテル,3375,4.27


欲しいデータに絞って出力してみましょう！  
pandasの機能であるto_csvを使うとcsvファイルとして保存ができます

In [28]:
# dfの'hotelName', 'hotelInformationUrl', 'hotelMinCharge', 'telephoneNo', 'reviewAverage'を指定して、
# ここにデータフレーム.to_csv(ここにファイル名,データフレームで認識されているindex数字も出力するかどうか)で保存できます。
# このデータではindexの数字は必要ないので、index = Falseにします。
df[['hotelName', 'hotelInformationUrl', 'hotelMinCharge', 'telephoneNo', 'reviewAverage']].to_csv('hotel2.csv', index=False)

今度は保存したcsvをdf2として読み込んでみましょう！

In [29]:
# pd.read_csv(ここにファイル名)でロードして、df2に代入します。
df2 = pd.read_csv('hotel2.csv')
df2

Unnamed: 0,hotelName,hotelInformationUrl,hotelMinCharge,telephoneNo,reviewAverage
0,ホテルリソルトリニティ那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,4200,098-863-9269,4.4
1,ダイワロイネットホテル那覇国際通り,https://img.travel.rakuten.co.jp/image/tr/api/...,3830,098-868-9055,4.37
2,ダイワロイネットホテル那覇おもろまち,https://img.travel.rakuten.co.jp/image/tr/api/...,3800,098-862-4555,4.49
3,ハイアットリージェンシー那覇沖縄,https://img.travel.rakuten.co.jp/image/tr/api/...,7926,098-866-8888,4.64
4,ロワジールホテル那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,5142,098-868-2222,3.93
5,ヒューイットリゾート那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,5110,098-943-8325,4.29
6,ダイワロイネットホテル沖縄県庁前,https://img.travel.rakuten.co.jp/image/tr/api/...,4500,098-860-1855,4.19
7,東急ステイ沖縄那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,5550,098-833-1090,4.48
8,ノボテル沖縄那覇,https://img.travel.rakuten.co.jp/image/tr/api/...,5850,098-887-1111,4.4
9,沖縄ハーバービューホテル,https://img.travel.rakuten.co.jp/image/tr/api/...,3375,098-853-2111,4.27


まとめたデータから評価が4.5以上のホテルを検索してみましょう！

In [30]:
# df[ ここにそれぞれの行に対して出力するかどうかの条件文　]でデータを抽出できます。
# 今回は評価が4.5以上なので、df['reviewAverage'] > 4.5を条件とします。
df[df['reviewAverage'] > 4.5]

Unnamed: 0,hotelNo,hotelName,hotelInformationUrl,planListUrl,dpPlanListUrl,reviewUrl,hotelKanaName,hotelSpecial,hotelMinCharge,latitude,...,parkingInformation,nearestStation,hotelImageUrl,hotelThumbnailUrl,roomImageUrl,roomThumbnailUrl,hotelMapImageUrl,reviewCount,reviewAverage,userReview
3,148000,ハイアットリージェンシー那覇沖縄,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,はいあっとりーじぇんしーなはおきなわ,グローバルブランドならではの洗練されたおもてなしと空間で上質なホテルステイをお楽しみください。,7926,94357.69,...,"立体駐車場・地下駐車場完備　１１３台　1泊1台あたり1,500円（税込）　（予約不要／出し入...",,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/14800...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,633,4.64,クラブアクセス付きにして大正解。お部屋も綺麗で快適でした。対応していただいたスタッフの皆様に...
15,136808,リーガロイヤルグラン沖縄,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,りーがろいやるぐらんおきなわ,【エントリーと予約でポイント増量参画中】「リーガ・マルシェ」スタッフ厳選の無料アメニティスタンド,7466,94344.0,...,"有り　料金：1台1泊1,500円（税・サ込）ご宿泊の皆様にバレーパーキング対応致します",旭橋,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/13680...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,615,4.67,今回初めて利用しましたが、ラグジュアリー感、清潔感、部屋も綺麗で最高でした!!スタッフさんの...
18,171943,沖縄かりゆしリゾートエグゼス那覇＜県庁前＞,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,おきなわ　かりゆし　りぞーと　えぐぜす　なは,那覇市内トップクラスの客室広さを誇るラグジュアリーホテル。朝食は全室ルームサービス（お部屋食）,8920,94353.21,...,有り　４２台　１５００円（税込／泊）　満車の場合は周辺のコインパーキングをご利用くださいませ。,那覇空港,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/17194...,,,https://img.travel.rakuten.co.jp/share/HOTEL/1...,112,4.61,前回同様プール付きの部屋を利用しました。観光目的ではなく部屋でのんびりするためにお世話になり...
22,40768,アルモントホテル那覇おもろまち(旧ホテル法華クラブ那覇新都心),https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,あるもんとほてるなはおもろまち,２０２０年４月１日から『アルモントホテル那覇おもろまち』へリブランド,3700,94395.88,...,"有り　30台　1,100円（税込／泊）　先着順",那覇空港,https://img.travel.rakuten.co.jp/share/HOTEL/4...,https://img.travel.rakuten.co.jp/HIMG/90/40768...,https://img.travel.rakuten.co.jp/share/HOTEL/4...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/4...,1512,4.54,朝食が美味しいホテルだと口コミがあったので宿泊しました。とても美味しかったです！エレベーター...


### 課題

検索して絞ったデータをdf2に格納して、ホテル名と評価とレビューだけ出力してみましょう！

In [32]:
# レビュー4.5以上を絞り込む
# ホテル名と評価とレビューだけ出力
df2 = df[df['reviewAverage'] > 4.5]
df2 = df2[['hotelName','reviewAverage','userReview']]
df2

Unnamed: 0,hotelName,reviewAverage,userReview
3,ハイアットリージェンシー那覇沖縄,4.64,クラブアクセス付きにして大正解。お部屋も綺麗で快適でした。対応していただいたスタッフの皆様に...
15,リーガロイヤルグラン沖縄,4.67,今回初めて利用しましたが、ラグジュアリー感、清潔感、部屋も綺麗で最高でした!!スタッフさんの...
18,沖縄かりゆしリゾートエグゼス那覇＜県庁前＞,4.61,前回同様プール付きの部屋を利用しました。観光目的ではなく部屋でのんびりするためにお世話になり...
22,アルモントホテル那覇おもろまち(旧ホテル法華クラブ那覇新都心),4.54,朝食が美味しいホテルだと口コミがあったので宿泊しました。とても美味しかったです！エレベーター...


- 同じ要領で楽天トラベル以外の楽天市場のデータを取得してください。
- たどったフローを箇条書きまたは図式化してTAに提出してチェックうけてください
- 発展
    - 他のサービスのAPIで自分で構造化データまで取得してください。
    - それを人に説明してください