# Webアプリに入る前に知っておくべきデータに関する前提知識

### 目標：APIを理解して使いこなし、そのデータを扱えるようになる事

目次
https://docs.google.com/document/d/1crmJ0DjAl77ab9aK8K9DshfQu25fS3EWXCC0m4AajZo/edit


## 3全体像：楽天のAPIから情報を取得する

### 3.1.おさらい：APIとは？

APIは、Application Programming Interfaceの略であり、プログラムやアプリケーション開発に必要な機能やデータを提供するインターフェースを指します。

例として、スマートフォンにはカメラアプリや音楽アプリ、地図アプリなどが存在します。これらのアプリケーションは、スマートフォンのOS（Operating System）が提供するAPIを用いて、カメラやGPS機能といったハードウェアやソフトウェアにアクセスしています。

APIはアプリケーションが他のアプリケーションやシステムと連携する手段であり、開発者が他のアプリケーションやサービスと容易に連携できるように設計されています。APIにはWeb API、データベースAPI、ソーシャルメディアAPIなど、多様な種類があります。

オンラインランキングやアカウントログイン機能の開発の際、GoogleやFacebookなどのサービスが提供するAPIを利用してアカウント情報を取得することができます。

APIは現代のソフトウェア開発において極めて重要な役割を担っており、様々なアプリケーションやサービスで利用されています。

今回取り上げる楽天APIを利用すれば、ホテルの価格比較サイトなどで活用することが可能です。

### 3.2.実際にやる事

SimpleHotelSearchにアクセスして、沖縄の那覇市のホテル情報を取得します。

<img src="img/img032.jpg">

参照：https://www.ebisumart.com/blog/ec-api/

In [4]:
import requests

#ライブラリrequestsを使うためにimportすることで機能を使う事が出来ます。
# アクセス先と認証と要求するデータの内容を指定します。
 #アクセス先を指定する必要があるので、アクセス先をREQUEST_URLという変数に代入しておきます。
# アクセスを許可されたユーザーという事を証明するために、APP_IDに認証IDを代入しておきます。
# アクセス先と認証を用意できたので、なんのデータが欲しいかをparamsに代入しておきます。
# paramsでの指定方法はAPIの作成者によって変わりますので、事前に確認しておく必要があります。

REQUEST_URL = 'https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426' 
APP_ID = "1034235205250283151"

params = {
    "format":"json",
    "largeClassCode": "japan",
    "middleClassCode":"okinawa",
    "smallClassCode":"nahashi",
    "applicationId":APP_ID
}


# アクセス先と認証と要求するデータの内容を指定出来たので、requestsのgetメソッドを使ってアクセスします。
# その結果をresに代入します。

res = requests.get(REQUEST_URL, params)

# 欲しいデータはresのjsonに格納されているので、res.json()をresultに代入しておきましょう。
# これでAPIで取得したデータはresultに代入されます。

result = res.json()

In [6]:
# 実際にresultに格納されたデータを見てみましょう。



ブラウザでもrequestsがアクセスしてる先をブラウザでも見てみましょう

In [7]:
# requestsがどんなURLでリクエストしたかをres.urlで確認出来ます。
res.url

'https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426?format=json&largeClassCode=japan&middleClassCode=okinawa&smallClassCode=nahashi&applicationId=1034235205250283151'

res.urlで出力したURLを整理してみると

https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426?  
format=json  
&largeClassCode=japan  
&middleClassCode=okinawa  
&smallClassCode=nahashi  
&applicationId=1011509919335500197  

となり、?の後ろ側にリクエストしたいパラメーターがついている事がわかります。

これは楽天トラベルに書いてある

https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426?  
applicationId=[アプリID]  
&format=xml  
&largeClassCode=japan  
&middleClassCode=akita  
&smallClassCode=tazawa  

と要求してるパラメータの順番が違うだけで、同じ事を要求の仕方をしているのがわかると思います！

requestでは?の後ろのパラメータを

In [8]:
# paramの設定

params = {
    "format":"json",
    "largeClassCode": "japan",
    "middleClassCode":"akita",
    "smallClassCode":"tazawa",
    "applicationId":APP_ID
}

In [10]:
res.url

'https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426?format=json&largeClassCode=japan&middleClassCode=okinawa&smallClassCode=nahashi&applicationId=1034235205250283151'

という形で格納し、requests.get(REQUEST_URL, params)で１つのリクエスト付きURLにしています。

よってURLの後ろにあるパラメータとrequestsのparamsが同じ変数を指定している事がわかりますね！

URL属性以外にもrequests.Responseクラスには以下のような属性がある（一部）。

| 属性 | 説明 |
| --- | --- |
| text | レスポンスの内容（content属性）を文字列にデコードしたもの |
| content | レスポントの内容（バイト列）。テキスト表現ではなくバイナリデータを扱うときにはこちらを使用する |
| encoding | content属性をtext属性にデコードする際に使用したエンコーディング |
| apparent_encoding | https://pypi.org/project/charset-normalizer/もしくはhttps://pypi.org/project/chardet/によって推測されたエンコーディング。encoding属性の値とapparent_encoding属性の値が異なることもある |
| headers | レスポンスヘッダーを大文字小文字の区別をしない辞書の形式で格納したもの |
| url | リクエストしたURL。リダイレクトが発生した場合には、リダイレクト先のURL |
| history | get関数でリクエストしたURLがリダイレクトされた場合に、リダイレクトされた結果を示すrequests.Responseクラスのインスタンスを古いものから順に並べたリスト |
|  |  |

requests.Responseクラスのインスタンスが持つ属性（一部）  
参照：https://atmarkit.itmedia.co.jp/ait/articles/2209/27/news035.html

では、http経由でデータを取得する所から演習しましょう。

### 3.3.http経由でデータを取得

#### http通信のリクエストをしてみよう

リクエストをするためのライブラリをインポートしておきましょう！

In [11]:
#ライブラリrequestsを使うためにimportすることで機能を使う事が出来ます。

import requests

インポートすることによってrequestsの機能を使う事ができます。
ではrequestsを使って、ブラウザのようにhtmlが取得できるかどうか確認してみましょう！
requests.get("ここに接続したいサイトのURL")とすることでhtmlが取得できます。

<img src="img/img025.png">

参照：https://www.itmanage.co.jp/column/about-http-https/

ブラウザと同じように取得できているかどうかは、ブラウザの検証機能にある、ページソース表示で確認できます！

In [12]:
#アクセスして取得したサイトデータをresに代入しておきます。今回はTech0のサイトにアクセス

res = requests.get("https://tech0-jp.com")

In [16]:
#resに代入しておいたサイトデータprintでかくにんします。

#これを得られた結果とブラウザのページソース表示で得られるhtmlを比較して、ブラウザと同じ機能であることを確認しましょう！

#### 楽天からデータを取得してみましょう

楽天側が用意した仕様に沿ったアクセス先とリクエストパラメータを設定していきましょう！
アクセス先とAPIキーとパラメーターを設定します

In [17]:
# アクセス先と認証IDと要求するデータを指定します。

REQUEST_URL = 'https://app.rakuten.co.jp/services/api/Travel/SimpleHotelSearch/20170426' 
APP_ID = "1034235205250283151"

In [18]:
# param

params = {
    "format":"json",
    "largeClassCode": "japan",
    "middleClassCode":"akita",
    "smallClassCode":"tazawa",
    "applicationId":APP_ID
}

requests.get(アクセス先, リクエストパラメータ)を指定して、APIサーバーにデーターを要求しましょう！

In [22]:
# resにリクエストして得られた結果を代入します。
res = requests.get(REQUEST_URL, params)
res.encoding
res
print(res)

<Response [200]>


リクエストが成功したか、ステータスの数字で確認しましょう！
- 200なら正常に通信完了
- 404ならアクセス先が間違えています。
- その他の400番台はパラメータが間違えています！

In [10]:
#変数だけを指定する事でprint()を省略できます。


通信の結果、返ってきたデータの中身を変数resultにjsonとして格納してから確認してみましょう！
res.json()とすることで、レスポンスデータの中にあるjsonデータをしてすることができます。

In [25]:
# resultにresの中にあるjsonデータを代入します。
result = res.json()

# 代入したデータを見てみましょう。
result

{'pagingInfo': {'recordCount': 75,
  'pageCount': 3,
  'page': 1,
  'first': 1,
  'last': 30},
 'hotels': [{'hotel': [{'hotelBasicInfo': {'hotelNo': 4624,
      'hotelName': '天然温泉\u3000田沢湖レイクリゾート',
      'hotelInformationUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/dQ4dX/?f_no=4624',
      'planListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/cHNRi/?f_no=4624&f_flg=PLAN',
      'dpPlanListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/TDZXm/?noTomariHotel=4624',
      'reviewUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/RmfmX/?f_hotel_no=4624',
      'hotelKanaName': 'てんねんおんせん\u3000たざわこれいくりぞーと',
      'hotelSpecial': '水深日本一の田沢湖の近く、スキー場・グラウンド・ゴルフ場認定コースあり',
      'hotelMinCharge': 5060,
      'latitude': 143059.23,
      'longitude': 506645.02,
      'postalCode': '014-1201',
      'address1': '秋田県',
      'address2': '仙北市田沢湖生保内字下高野82-117',
      'telephoneNo': '0187-46-2016',
      'faxNo': '0187-46-2241',
      'access': 'JR秋田新幹線田沢湖駅からバスで２０分、盛岡Ｉ

## 4.全体像：取得したデータをエクセルのように扱う

### 4.1.実際にやる事

APIから得られたjsonで得られたデータを確認します。  
jsonだと人間にはわかりずらく、データ加工が難しいため、pandasを使ってエクセルのように変換します。

In [26]:
# result['hotels'][0]['hotel'][0]['hotelBasicInfo']['hotelName']　を変数を扱う事で、どのホテルのデータでも見れるようにしましょう。
# i = 0として１つ目のホテルの情報を見てみましょう。

# printで表示

i = 0
print(result["hotels"][i]["hotel"][0]["hotelBasicInfo"]["hotelName"])
print(result["hotels"][i]["hotel"][0]["hotelBasicInfo"]["planListUrl"])
print(result["hotels"][i]["hotel"][0]["hotelBasicInfo"]["hotelMinCharge"])
print(result["hotels"][i]["hotel"][0]["hotelBasicInfo"]["reviewAverage"])


天然温泉　田沢湖レイクリゾート
https://img.travel.rakuten.co.jp/image/tr/api/hs/cHNRi/?f_no=4624&f_flg=PLAN
5060
4.1


### 4.2.データの確認と扱い方

取得しただけではデータを活用できないので、取得したデータを扱っていきます。  

全体像としては
- 取得したjsonデータを確認
- jsonでは確認しずらく、扱いずらいので、pandasというライブラリを使って扱いやすくする

#### 取得したデータの中身を詳しく確認してみましょう。

※取得したデータの全体像

<img style="background-color:#fff;" src="img/img034.png">
<img style="background-color:#fff;" src="img/img035.png">

参照：https://jsoncrack.com/editor

取得したデータの内容は result['hotels'][ここ行の場所]['hotel'][0]['hotelBasicInfo'] に格納されており、  
result['hotels'][0]['hotel'][0]['hotelBasicInfo']とすることで、１つ目に格納されているホテルの詳細を取得する事ができます

In [27]:
# データの中身を紐解いていく

result['hotels'][0]['hotel'][0]['hotelBasicInfo']

{'hotelNo': 4624,
 'hotelName': '天然温泉\u3000田沢湖レイクリゾート',
 'hotelInformationUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/dQ4dX/?f_no=4624',
 'planListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/cHNRi/?f_no=4624&f_flg=PLAN',
 'dpPlanListUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/TDZXm/?noTomariHotel=4624',
 'reviewUrl': 'https://img.travel.rakuten.co.jp/image/tr/api/hs/RmfmX/?f_hotel_no=4624',
 'hotelKanaName': 'てんねんおんせん\u3000たざわこれいくりぞーと',
 'hotelSpecial': '水深日本一の田沢湖の近く、スキー場・グラウンド・ゴルフ場認定コースあり',
 'hotelMinCharge': 5060,
 'latitude': 143059.23,
 'longitude': 506645.02,
 'postalCode': '014-1201',
 'address1': '秋田県',
 'address2': '仙北市田沢湖生保内字下高野82-117',
 'telephoneNo': '0187-46-2016',
 'faxNo': '0187-46-2241',
 'access': 'JR秋田新幹線田沢湖駅からバスで２０分、盛岡Ｉ．Ｃから５０分。田沢湖駅から送迎バスにて約15分（要事前予約）',
 'parkingInformation': '有り\u3000５００台\u3000無料',
 'nearestStation': '田沢湖',
 'hotelImageUrl': 'https://img.travel.rakuten.co.jp/share/HOTEL/4624/4624.jpg',
 'hotelThumbnailUrl': 'https:/

どんなホテルの詳細情報項目があるか確認してみましょう！  
result['hotels'][0]['hotel'][0]['hotelBasicInfo'].keys()で確認することができます。

In [28]:
# result['hotels'][0]['hotel'][0]['hotelBasicInfo']になんの項目が含まれているかをkeys()で確認できます。
result['hotels'][0]['hotel'][0]['hotelBasicInfo'].keys()

dict_keys(['hotelNo', 'hotelName', 'hotelInformationUrl', 'planListUrl', 'dpPlanListUrl', 'reviewUrl', 'hotelKanaName', 'hotelSpecial', 'hotelMinCharge', 'latitude', 'longitude', 'postalCode', 'address1', 'address2', 'telephoneNo', 'faxNo', 'access', 'parkingInformation', 'nearestStation', 'hotelImageUrl', 'hotelThumbnailUrl', 'roomImageUrl', 'roomThumbnailUrl', 'hotelMapImageUrl', 'reviewCount', 'reviewAverage', 'userReview'])

hotelNameという項目があるので、ホテルの名前などを取得してみましょう

In [29]:
# ホテル名の取得
result['hotels'][0]['hotel'][0]['hotelBasicInfo']["hotelName"]

'天然温泉\u3000田沢湖レイクリゾート'

In [30]:
#URLの取得
result['hotels'][0]['hotel'][0]['hotelBasicInfo']["hotelInformationUrl"]

'https://img.travel.rakuten.co.jp/image/tr/api/hs/dQ4dX/?f_no=4624'

In [32]:
# 最低料金
result['hotels'][0]['hotel'][0]['hotelBasicInfo']["hotelMinCharge"]

5060

In [33]:
# 平均レビュー
result['hotels'][0]['hotel'][0]['hotelBasicInfo']["reviewAverage"]

4.1

#### データを扱いやすくするために可視化する

##### pandasを使ったデータの可視化

APIで得られたデータをpandasを用いてエクセルのような見やすいデータに変換してみましょう！

ライブラリのpandasをインポートしましょう！
as pdとつけて、短くpdとコーディングできるようにします。

In [34]:
#pandasのインポート
import pandas as pd

データをpandasのDataFrameに格納してみましょう！  
また、DataFrameとはどのような変換をしてくれるか確認してみましょう。


In [37]:
# １つめのホテルのデータをhotel_infoに代入します。
hotel_info = result['hotels'][0]['hotel'][0]['hotelBasicInfo']

# pd.DataFrame(ここに変換したいデータ,index=[ここにpandasに認識してほしい行数indexの番号])を代入します。
pd.DataFrame(hotel_info, index=[0])

Unnamed: 0,hotelNo,hotelName,hotelInformationUrl,planListUrl,dpPlanListUrl,reviewUrl,hotelKanaName,hotelSpecial,hotelMinCharge,latitude,...,parkingInformation,nearestStation,hotelImageUrl,hotelThumbnailUrl,roomImageUrl,roomThumbnailUrl,hotelMapImageUrl,reviewCount,reviewAverage,userReview
0,4624,天然温泉　田沢湖レイクリゾート,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,てんねんおんせん　たざわこれいくりぞーと,水深日本一の田沢湖の近く、スキー場・グラウンド・ゴルフ場認定コースあり,5060,143059.23,...,有り　５００台　無料,田沢湖,https://img.travel.rakuten.co.jp/share/HOTEL/4...,https://img.travel.rakuten.co.jp/HIMG/90/4624.jpg,https://img.travel.rakuten.co.jp/share/HOTEL/4...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/4...,1448,4.1,露天風呂が利用でかなかったのが残念でした。部屋はきれいで気持ち良ったです。　2023-10-...


indexの数字を変数iにして、他のホテル情報も確認してみましょう！  
iの数字を変えると取得できるホテルを変更できる事も確認してみましょう

In [38]:
#index番号の指定。ここの数字を変えると格納されるデータが変わります。
i = 0

# その番号に対応するホテル情報を取得し、hotel_infoに代入
hotel_info = result['hotels'][i]['hotel'][0]['hotelBasicInfo']

# pd.DataFrame(ここに変換したいデータ,index=[ここにpandasに認識してほしい行数indexの番号])を代入します。
pd.DataFrame(hotel_info,index=[i])

Unnamed: 0,hotelNo,hotelName,hotelInformationUrl,planListUrl,dpPlanListUrl,reviewUrl,hotelKanaName,hotelSpecial,hotelMinCharge,latitude,...,parkingInformation,nearestStation,hotelImageUrl,hotelThumbnailUrl,roomImageUrl,roomThumbnailUrl,hotelMapImageUrl,reviewCount,reviewAverage,userReview
0,4624,天然温泉　田沢湖レイクリゾート,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,てんねんおんせん　たざわこれいくりぞーと,水深日本一の田沢湖の近く、スキー場・グラウンド・ゴルフ場認定コースあり,5060,143059.23,...,有り　５００台　無料,田沢湖,https://img.travel.rakuten.co.jp/share/HOTEL/4...,https://img.travel.rakuten.co.jp/HIMG/90/4624.jpg,https://img.travel.rakuten.co.jp/share/HOTEL/4...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/4...,1448,4.1,露天風呂が利用でかなかったのが残念でした。部屋はきれいで気持ち良ったです。　2023-10-...


個別のデータを格納できたので、データ全体を格納してみましょう。

そのためにAPIで取得したホテルのデータ数を確認してみましょう！
len(確認したい配列)でデータ数を確認できます！

In [39]:
# len(ここに配列に含まれる要素)で配列に含まれる要素の数を取得できます。
len(result["hotels"])

30

30あるホテルのデータをfor文を使ってまとめてみましょう！

In [42]:

#空のpandasデータフレームを用意して、生成した1つ１つのデータフレームをこのdfに結合して１つにします。
df = pd.DataFrame()

# iにrange(0,len(result['hotels']))である0～29の数字が１つずつ代入されて実行されます。
# 今回は30のデータとわかっているのでfor i in range(0,30)でも問題ないですが、30とは限らないのでデータ園生数であるlen(result['hotels'])を使います。
for i in range(0,len(result["hotels"])):
    hotel_info = result['hotels'][i]['hotel'][0]['hotelBasicInfo'] 
    temp_df = pd.DataFrame(hotel_info,index=[i]) 
    df = pd.concat([df,temp_df]) 
    
#格納する配列をhotel_infoに代入する
#hotel_infoに代入されたホテルのデータをデータフレームに変換します。

#dfに結合して１つにまとめます。

まとめたデータをdisplay(df) で確認してみましょう！

In [43]:
# dfの表示
display(df)

Unnamed: 0,hotelNo,hotelName,hotelInformationUrl,planListUrl,dpPlanListUrl,reviewUrl,hotelKanaName,hotelSpecial,hotelMinCharge,latitude,...,parkingInformation,nearestStation,hotelImageUrl,hotelThumbnailUrl,roomImageUrl,roomThumbnailUrl,hotelMapImageUrl,reviewCount,reviewAverage,userReview
0,4624,天然温泉　田沢湖レイクリゾート,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,てんねんおんせん　たざわこれいくりぞーと,水深日本一の田沢湖の近く、スキー場・グラウンド・ゴルフ場認定コースあり,5060,143059.23,...,有り　５００台　無料,田沢湖,https://img.travel.rakuten.co.jp/share/HOTEL/4...,https://img.travel.rakuten.co.jp/HIMG/90/4624.jpg,https://img.travel.rakuten.co.jp/share/HOTEL/4...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/4...,1448,4.1,露天風呂が利用でかなかったのが残念でした。部屋はきれいで気持ち良ったです。　2023-10-...
1,15408,日本の山岳温泉リゾート　新玉川温泉,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,にほんの山岳おんせんりぞーと　しんたまがわおんせん,強酸性日本一と言われる玉川温泉の源泉をそのまま掛け流し！,12100,143854.53,...,有り（無料）。　冬期間は田沢湖駅近くに無料駐車場有り。ご利用の際は、お問い合せ下さい。,田沢湖,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/15408...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,1006,4.39,昨年同時期に初めて伺い妻と又行きたいよね！って行ってたときに土日の現場がリスケになり急遽検索...
2,14338,効能溢れる癒しの湯治宿　玉川温泉,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,たまがわおんせん,日帰り入浴は午前9:00〜午後3:30までです。,5170,143858.55,...,宿から5分ほど離れた場所にあります。当日係がご案内致します。,田沢湖,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/14338...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,584,4.43,温泉は最高で雰囲も気最高でした。　2023-10-14 11:53:12投稿
3,70699,ホテルルートイン　大曲駅前,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,るーといん　おおまがりえきまえ,ＷＯＷＯＷ全室で無料視聴可■VODルームシアター無料視聴可能（一般映画のみ）（コンフォート特典）,5125,142062.57,...,有り　７０台　無料　予約不要 先着順 ※満車の際は近隣駐車場をご案内致します｡,大曲（秋田）,https://img.travel.rakuten.co.jp/share/HOTEL/7...,https://img.travel.rakuten.co.jp/HIMG/90/70699...,https://img.travel.rakuten.co.jp/share/HOTEL/7...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/7...,1204,4.09,楽天から予約時、2名予約のため禁煙、喫煙の区別ができず、喫煙を予約し、コメントに1名禁煙希望...
4,11222,亀の井ホテル　田沢湖,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,かめのいほてる たざわこ,2023年10月1日より「亀の井ホテル 田沢湖」へリブランドいたしました。,4200,143205.33,...,有り　100台　無料　先着順,田沢湖,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/11222...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,870,3.86,食事、部屋と大変満足して子供もまた泊まりに行きたいと言ってました。1つだけ残念だったのはチェ...
5,162983,リバーサイドホテル大曲,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,りばーさいどほてるおおまがり,【２０１７年８月 リニューアルオープン！！】 日本一の花火の街、大曲のビジネス・観光の新拠点♪,4500,142048.69,...,18台の無料駐車場有り（先着順となります）※満車の際は近隣の駐車場をご案内致します。,大曲（秋田）,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/16298...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,286,3.78,１泊２食付きで、このお値段なら満足です。ご飯のおかわりが自由なのも、ハラペコにはグッド。近く...
6,161208,町家ホテル角館,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,まちやほてるかくのだて,小京都角館にマッチした和風でモダンなホテル。武家屋敷通りまで徒歩２分・観光やビジネスにも最適...,7480,142533.62,...,有り　25台　無料,角館,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/16120...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,253,4.33,９月２２日に宿泊しました。近くに温泉もあり良かったです。　2023-09-30 10:26:...
7,72803,休暇村　乳頭温泉郷,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,きゅうかむら　にゅうとうおんせんぎょう,美しいブナ林に囲まれた静かな宿です。温泉浴や森林浴が楽しめ、ここでは時間がゆっくりと流れています。,15500,143273.15,...,有り　１００台　無料　予約不要,田沢湖,https://img.travel.rakuten.co.jp/share/HOTEL/7...,https://img.travel.rakuten.co.jp/HIMG/90/72803...,https://img.travel.rakuten.co.jp/share/HOTEL/7...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/7...,394,4.55,3月24日に宿泊しました。お風呂とお食事が素晴らしかったです。また、利用したい宿です。　20...
8,145044,大曲シティホテル,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,おおまがりしてぃほてる,立地良好,2750,142065.11,...,徒歩５分のところにあり　台数限りあり　先着順　２トン車まで 春、夏花火前後のは利用できません。,大曲（秋田）,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/14504...,,,https://img.travel.rakuten.co.jp/share/HOTEL/1...,427,2.38,簡易シャワーとは書いてあったがトイレにシャワーが付いているなかなかすごい部屋も古いなるべく安...
9,10867,グリーンホテル大曲,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,https://img.travel.rakuten.co.jp/image/tr/api/...,ぐりーんほてる　おおまがり,ビジネス、観光に便利なＪＲ大曲駅西口徒歩3分・全室インターネット接続可能（無線LAN),4250,142068.59,...,有り　８０台　先着順　無料,大曲（秋田）,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/90/10867...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,https://img.travel.rakuten.co.jp/HIMG/INTERIOR...,https://img.travel.rakuten.co.jp/share/HOTEL/1...,1198,3.93,急用ができたので一泊追加できて助かりました。ただ前日までの部屋から端の部屋に移ったらWi-F...


df.columnsで項目の確認ができます！  
これはresult['hotels'][0]['hotel'][0]['hotelBasicInfo'].keys()で取得した値と一致します

In [44]:
#カラムの表示
df.columns

Index(['hotelNo', 'hotelName', 'hotelInformationUrl', 'planListUrl',
       'dpPlanListUrl', 'reviewUrl', 'hotelKanaName', 'hotelSpecial',
       'hotelMinCharge', 'latitude', 'longitude', 'postalCode', 'address1',
       'address2', 'telephoneNo', 'faxNo', 'access', 'parkingInformation',
       'nearestStation', 'hotelImageUrl', 'hotelThumbnailUrl', 'roomImageUrl',
       'roomThumbnailUrl', 'hotelMapImageUrl', 'reviewCount', 'reviewAverage',
       'userReview'],
      dtype='object')

##### pandasを使ったデータ整理

まとめたデータから名前と値段と評価だけを取り出してみましょう！  
１つのカラムを取得する時は欲しいカラム名である"カラム名"を代入したdf["カラム名"]で取得できましたが、  
複数選択する場合は、の代わりに配列である["カラム名1","カラム名2","カラム名3"]を代入してdf[["カラム名1","カラム名2","カラム名3"]]とする必要があります。

In [45]:
#[ 'hotelName', 'hotelMinCharge', 'reviewAverage']を表示

df[[ 'hotelName', 'hotelMinCharge', 'reviewAverage']]

Unnamed: 0,hotelName,hotelMinCharge,reviewAverage
0,天然温泉　田沢湖レイクリゾート,5060,4.1
1,日本の山岳温泉リゾート　新玉川温泉,12100,4.39
2,効能溢れる癒しの湯治宿　玉川温泉,5170,4.43
3,ホテルルートイン　大曲駅前,5125,4.09
4,亀の井ホテル　田沢湖,4200,3.86
5,リバーサイドホテル大曲,4500,3.78
6,町家ホテル角館,7480,4.33
7,休暇村　乳頭温泉郷,15500,4.55
8,大曲シティホテル,2750,2.38
9,グリーンホテル大曲,4250,3.93


欲しいデータに絞って出力してみましょう！  
pandasの機能であるto_csvを使うとcsvファイルとして保存ができます

In [46]:
# dfの'hotelName', 'hotelInformationUrl', 'hotelMinCharge', 'telephoneNo', 'reviewAverage'を指定して、
# ここにデータフレーム.to_csv(ここにファイル名,データフレームで認識されているindex数字も出力するかどうか)で保存できます。
# このデータではindexの数字は必要ないので、index = Falseにします。

df[[ 'hotelName', 'hotelInformationUrl', 
       'hotelMinCharge', 'telephoneNo', 'reviewAverage',
       ]].to_csv('hotel.csv',index = False),

(None,)

今度は保存したcsvをdf2として読み込んでみましょう！

In [47]:
# pd.read_csv(ここにファイル名)でロードして、df2に代入します。
df2 = pd.read_csv("hotel.csv")

まとめたデータから評価が4.5以上のホテルを検索してみましょう！

In [61]:
# df[ ここにそれぞれの行に対して出力するかどうかの条件文　]でデータを抽出できます。
# 今回は評価が4.5以上なので、df['reviewAverage'] > 4.5を条件とします。

df[ df['reviewAverage'] > 4.5]

df2 = df[ df['reviewAverage'] < 3]
df2 = df2[['hotelName','reviewAverage','userReview']]
display(df2)

df2[['hotelName','reviewAverage','userReview']].to_csv("hotel2.csv", index=False)

Unnamed: 0,hotelName,reviewAverage,userReview
8,大曲シティホテル,2.38,簡易シャワーとは書いてあったがトイレにシャワーが付いているなかなかすごい部屋も古いなるべく安...


### 課題

検索して絞ったデータをdf2に格納して、ホテル名と評価とレビューだけ出力してみましょう！

In [29]:
# レビュー4.5以上を絞り込む
# ホテル名と評価とレビューだけ出力

- 同じ要領で楽天トラベル以外の楽天市場のデータを取得してください。
- たどったフローを箇条書きまたは図式化してTAに提出してチェックうけてください
- 発展
    - 他のサービスのAPIで自分で構造化データまで取得してください。
    - それを人に説明してください