In [64]:
## 変更履歴 ##

# 20231008 ver.1 作成
# 20231015 ver.2 作成
    # 住所のインプットについて、URLが入力された場合を判定し、スクレイピングで物件の所在地を取得し、URLと置き換える形に修正
    #   └ URLがsuumoの適正なページでない場合のエラー判定の仕組みは構築未済 (残課題)
    #   └ 画像の取得は未済 (残課題)
    # 重要度について、入力時に最後の一つは合計が100 (％) になるように逆算で入力する処理に変更
    # 通勤時間がやや短く出る事象を簡易調整 (電車の場合、待ち時間や駅からの徒歩分などで、車より5分以上多くかかると想定し、単純に5分を加算)
    #   └ 一方、評価スコアの算出における勤務時間の閾値もすべて5分を加算することで、評価上の影響がないように調整
    # 施設の検索方法を英語に置き換え
    #   └ 英語と日本語の対象範囲の違いを考慮し、「病院」、「消防署」、「警察署」(交番が含まれる) のみ日本語のままとしている
    # スコアリングにおける最低点は30点前後に留める形に変更し、それに伴うスコアリングロジックを調整 (例: 所要時間のスコア)
    # 飲食店のスコアリングにおいて、最高評価のスコアリングがマイナスになる事象を調整 (上記同様に最低点を30点とする形に変更)
    # 総合スコアに対するコメント


## 残課題 ##

# 優先度が高い改善点
    # URLからスクレイピングで写真を取得
    # URLが適正でない場合のエラー判定の仕組みの構築
    # ----

# 優先度が低い改善点
    # 地公体が出している育児補助金、医療補助制度を自前でDB化し、そこから出力するなどの対応が必要
    # 自分が気にしている観点に沿った定性情報 (口コミ) を拾ってくる
    # 通勤時間を電車で計算
    # 勤務地が60分を超える場合でも対応できるようにする (現状そんな遠方の候補物件を入力することを前提としていない)
    # 並列処理
    # 外部処理
    # 検索結果の揺らぎ (公園\parkの検索結果が過少になるケースあり ※地域による可能性)
    # 消防署は近すぎると騒音問題がある可能性
    # 候補物件が2件、1件未入力の時の処理方法 ※最終報告時点では3件入力の前提で進める。変更の際はStreamlit (pyファイル) 上で直接対応するのが効率的か

0. 事前準備

In [65]:
# ライブラリのインポート
import urllib.request
import urllib.parse
import datetime
import json
import pandas as pd
import googlemaps

# Google MapsのエンドポイントとAPIキーの入力
endpoint = 'https://maps.googleapis.com/maps/api/directions/json?'
api_key = 'AIzaSyBH_m_Cg48Sgp7fw_AwfITti0S9WcWKNf8'

In [97]:
# ライブラリのインポート (スクレイピング用)
from bs4 import BeautifulSoup
import requests
import re  # 正規表現を使用するためにインポート

1. インプット

1. インプット - A 住所 (候補物件のURLからの変換を含む)

In [114]:
## A-1: 3つの候補物件のURLまたは住所をリストとして受け取る ##

addresses = [
    input('候補物件①のURLまたは住所を入力: '),
    input('候補物件②のURLまたは住所を入力: '),
    input('候補物件③のURLまたは住所を入力: ')
]

# 入力内容の可視化
addresses

['新宿区中落合2丁目', '豊島区目白3丁目', 'https://suumo.jp/chintai/jnc_000078638862/']

In [132]:
## A-2: 入力内容がURLかを判定し、是ならスクレイピングで住所を取得 ##

## 設定・準備 ##

# 関数の定義: ①スクレイピングで物件情報を取得
def scraping_data(address):
    response = requests.get(address)
    soup = BeautifulSoup(response.text, 'html.parser')
    data = {}

    # データを特定のセレクタを使って取得
    rows = soup.find_all('tr')
    for row in rows:
        key = row.find('th', class_='property_view_table-title')
        value = row.find('td', class_='property_view_table-body')
        if key and value:
            key = key.text.strip()
            value = value.text.strip()
            data[key] = value

    # 特定のテーブルを取得
    table = soup.find('table', {'class': 'data_table table_gaiyou'})

    # テーブル内のtr要素を取得
    if table:
        rows = table.find_all('tr')
        for row in rows:
            th = row.find('th', class_='data_01')
            td = row.find('td')

            if th and td:
                key = th.text.strip()
                value = td.text.strip()
                data[key] = value

        # 特定のテーブル内のtr要素を取得
        rows = table.find_all('tr')
        for row in rows:
            th = row.find('th', class_='data_02')
            td = row.find('td')

            if th and td:
                key = th.text.strip()
                # 次の兄弟要素のtdを取得
                value = td.find_next_sibling('td').text.strip()
                data[key] = value

    return data

# 関数の定義: ②入力内容がURLかどうかを判定
def confirm_url(address):
    # 正規表現を使用してURLかどうかを確認
    url_pattern = re.compile(r'https?://\S+')
    if url_pattern.match(address):
        return scraping_data(address)  # URLの場合、scraping_data関数を適用
    else:
        return {"所在地": address}  # URLでない場合、所在地情報を含む辞書を返す

# 所在地情報を取得し、住所を更新
addresses = [confirm_url(address).get("所在地", "所在地情報なし") for address in addresses]

# 更新された住所を確認
addresses

['新宿区中落合2丁目', '豊島区目白3丁目', '東京都新宿区西早稲田１']

1. インプット - B 勤務地

In [68]:
# B: 勤務地の住所を入力
workplace = input('勤務地の住所を入力: ')

1. インプット - C カテゴリーの重要度

In [69]:
## C: カテゴリーの重要度を入力（Scoringに使用するWeightを受け取る) ##

# 入力値の合計が100でない場合は再入力
while True:
    weight_work = input('働きやすさの重要度を入力 (%): ')
    weight_life = input('暮らしやすさの重要度を入力 (%): ')
    weight_kids = input('育てやすさの重要度を入力 (%): ')

    # 各入力を数値に変換
    # 数値でなければ指摘
    try:
        weight_work = float(weight_work)
        weight_life = float(weight_life)
        weight_kids = float(weight_kids)
    except ValueError:
        print("数値を入力してください。")
        continue
    
    weight_safe = 100 - (weight_work + weight_life + weight_kids)
    
    # 最後の項目の重要度が0以上であることを確認
    if weight_safe < 0:
        print("重要度の合計が100を超えないように入力してください。")
    else:
        break

重要度の合計が100を超えないように入力してください。


1. インプット - D カテゴリー内の細目の重要度

In [70]:
## D: カテゴリー内の細目の重要度を入力（Scoringに使用するWeightを受け取る) ##

# ②暮らしやすさの細目の重要度を入力

# 入力値の合計が100でない場合は再入力
while True:
    weight_life_supermarket = input('スーパーの重要度を入力 (%): ')
    weight_life_hospital = input('病院の重要度を入力 (%): ')

    # 各入力を数値に変換
    # 数値でなければ指摘
    try:
        weight_life_supermarket = float(weight_life_supermarket)
        weight_life_hospital = float(weight_life_hospital)
    except ValueError:
        print("数値を入力してください。")
        continue
    
    weight_life_restaurant = 100 - (weight_life_supermarket + weight_life_hospital)

    # 最後の項目の重要度が0以上であることを確認
    if weight_life_restaurant < 0:
        print("重要度の合計が100を超えないように入力してください。")
    else:
        break

# ③育てやすさの細目の重要度を入力

# 入力値の合計が100でない場合は再入力
while True:
    weight_kids_nursery = input('保育園の重要度を入力 (%): ')
    weight_kids_kindergarten = input('幼稚園の重要度を入力 (%): ')
    weight_kids_elementary = input('小学校の重要度を入力 (%): ')

    # 各入力を数値に変換
    # 数値でなければ指摘
    try:
        weight_kids_nursery = float(weight_kids_nursery)
        weight_kids_kindergarten = float(weight_kids_kindergarten)
        weight_kids_elementary = float(weight_kids_elementary)
    except ValueError:
        print("数値を入力してください。")
        continue
    
    weight_kids_park = 100 - (weight_kids_nursery + weight_kids_kindergarten + weight_kids_elementary)

    # 最後の項目の重要度が0以上であることを確認
    if weight_kids_park < 0:
        print("重要度の合計が100を超えないように入力してください。")
    else:
        break

1. インプット - E 飲食店の好み

In [71]:
## E: 細目 (暮らしやすさ) における飲食店の好みを入力 (検索に入力する料理ジャンルを受け取る) ##

# 好みの料理店ジャンル
place_name_favorite = input('好みの食事ジャンルを入力 (例:ラーメン) : ')

1. インプット - インプット内容

In [118]:
# データを格納するためのリストを作成
data_input = []

# 必要なデータをリストに格納
data_input.append([addresses, workplace, 
                   weight_work, weight_life, weight_kids, weight_safe,
                   weight_life_supermarket, weight_life_hospital, weight_life_restaurant,
                   weight_kids_nursery, weight_kids_kindergarten, weight_kids_elementary, weight_kids_park,
                   place_name_favorite])

# データをDataFrameに変換
df_input = pd.DataFrame(data_input, columns=['候補物件住所', '勤務地住所',
                                             '重要度(%): 働きやすさ', '重要度(%): 暮らしやすさ', '重要度(%): 育てやすさ', '重要度(%): 安心しやすさ',
                                             '重要度(%): スーパー', '重要度(%): 病院', '重要度(%): 飲食店',
                                             '重要度(%): 保育園', '重要度(%): 幼稚園', '重要度(%): 小学校', '重要度(%): 公園',
                                             '好みの食事ジャンル'])

# データをアウトプット
df_input

Unnamed: 0,候補物件住所,勤務地住所,重要度(%): 働きやすさ,重要度(%): 暮らしやすさ,重要度(%): 育てやすさ,重要度(%): 安心しやすさ,重要度(%): スーパー,重要度(%): 病院,重要度(%): 飲食店,重要度(%): 保育園,重要度(%): 幼稚園,重要度(%): 小学校,重要度(%): 公園,好みの食事ジャンル
0,"[新宿区中落合2丁目, 豊島区目白3丁目, 東京都新宿区西早稲田１]",千代田区紀尾井町1丁目,25.0,25.0,25.0,25.0,40.0,30.0,30.0,25.0,25.0,25.0,25.0,ラーメン


2. アウトプット - ① 働きやすさ

In [119]:
# 今日の日付を取得し、文字列として表示（YYYY-MM-DD形式）
today = datetime.date.today()
today_str = today.strftime('%Y/%m/%d')

# データを格納するためのリストを作成
data_work = []

# スコアリングの定義: 勤務地までの時間
def calculation_work(duration_work):
    if duration_work <= 15:
        return 100
    elif duration_work <= 20:
        return 90
    elif duration_work <= 30:
        return 80
    elif duration_work <= 40:
        return 70
    elif duration_work <= 50:
        return 60
    elif duration_work <= 60:
        return 50
    else:
        return 30

# 各住所に対して処理を繰り返す
for address in addresses:
    nav_request = 'language=ja&origin={}&destination={}&key={}'.format(address, workplace, api_key) # 👈改善ポイント: 電車での出力は一意にならずDF化が難しいため車での時間表示となっている
    nav_request = urllib.parse.quote_plus(nav_request, safe='=&')
    request = endpoint + nav_request

    # Google Maps Platform Directions APIを実行
    response = urllib.request.urlopen(request).read()

    # 結果(JSON)を取得
    directions = json.loads(response)

    # 所要時間を取得
    for key in directions['routes']:
        for key2 in key['legs']:
            distance_work = key2['distance']['text']
            duration_work = key2['duration']['text']

            # 距離の文字列から"km"を取り除いて数値に変換
            distance_work = float(distance_work.replace(' km', '').replace(',', ''))

            # 時間の文字列から"分"を取り除いて数値に変換
            duration_work = int(duration_work.replace('分', '')) + 5 # 👈改善ポイント: ① 1時間を超えると"xx時間"と表示されるためエラーになる, ② 車の方が電車よりも時間が短くなるため、便宜的に一律5分上乗せ

            # スコアリング: 勤務地までの時間
            score_work = calculation_work(duration_work)
            
            # 必要なデータをリストに格納
            data_work.append([address, score_work, distance_work, duration_work])

# データをDataFrameに変換
df_work = pd.DataFrame(data_work, columns=['候補物件住所', '働きやすさスコア', '目的地までの距離(km)', '到着までにかかる時間(分)'])

# データをアウトプット
df_work

Unnamed: 0,候補物件住所,働きやすさスコア,目的地までの距離(km),到着までにかかる時間(分)
0,新宿区中落合2丁目,70,8.6,31
1,豊島区目白3丁目,80,9.1,28
2,東京都新宿区西早稲田１,80,5.3,22


2. アウトプット - ② 暮らしやすさ

2. アウトプット - ② 暮らしやすさ - A スーパー

In [120]:
### A: スーパーのスコアリング ###

## 設定・準備 ##

# クライアントの生成
gmaps = googlemaps.Client(key=api_key)

# 施設名の指定
place_name = "supermarket"

# データを格納するためのリストを作成
data_life_supermarket = []

# スコアリングの定義: 施設数
def calculation_life_supermarket_number(number_supermarket):
    if number_supermarket >= 3:
        return 100
    elif 2 <= number_supermarket < 3:
        return 75
    elif 1 <= number_supermarket < 2:
        return 50
    else:
        return 30

# スコアリングの定義: 所要時間
def calculation_life_supermarket_duration(nearest_supermarket_duration):
    duration_int = int(nearest_supermarket_duration.replace("分", ""))
    
    if duration_int <16:
        return 100 - (duration_int - 2) * 5
    else:
        return 30

# 検索範囲の指定
radius = 800


## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:
    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_supermarket = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_supermarket = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_supermarket <= radius:
            number_supermarket += 1

    # スコアリング: 施設数
    score_life_supermarket_number = calculation_life_supermarket_number(number_supermarket)
        
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_supermarket_distance = float('inf')
    nearest_supermarket_duration = None
    nearest_supermarket_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_supermarket = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_supermarket = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_supermarket < nearest_supermarket_distance:
                nearest_supermarket_distance = distance_supermarket
                nearest_supermarket_duration = duration_supermarket
                nearest_supermarket_name = place['name']
    
    # スコアリング: 所要時間
    score_life_supermarket_duration = calculation_life_supermarket_duration(nearest_supermarket_duration)
                
    #スコアリング: 施設数＋所要時間
    score_life_supermarket = (score_life_supermarket_number + score_life_supermarket_duration) / 2
            
    # 必要なデータをリストに格納
    data_life_supermarket.append([address, score_life_supermarket, score_life_supermarket_number, score_life_supermarket_duration, number_supermarket, nearest_supermarket_name, nearest_supermarket_duration])

# データをDataFrameに変換
df_life_supermarket = pd.DataFrame(data_life_supermarket, columns=['候補物件住所', 'スーパースコア', 'スーパー数スコア', 'スーパー所要時間スコア', 'エリア内のスーパー数', '最も近いスーパー名', '最も近いスーパーまでの所要時間(分)'])
    
# データをアウトプット
df_life_supermarket

Unnamed: 0,候補物件住所,スーパースコア,スーパー数スコア,スーパー所要時間スコア,エリア内のスーパー数,最も近いスーパー名,最も近いスーパーまでの所要時間(分)
0,新宿区中落合2丁目,90.0,100,80,4,マルエツ プチ 下落合駅前店,6分
1,豊島区目白3丁目,80.0,100,60,6,ピーコックストア 目白店,10分
2,東京都新宿区西早稲田１,102.5,100,105,10,こだわり商店,1分


2. アウトプット - ② 暮らしやすさ - B 病院

In [121]:
### B: 病院のスコアリング ###

## 設定・準備 ##

# 施設名の指定
place_name = "病院" # 👈改善ポイント: 英語の場合、「hospital」 → 「XX病院」、「clinic」 →　「XX病院」以外の「XXクリニック」しか検索できないため、暫定的に日本語で検索

# データを格納するためのリストを作成
data_life_hospital = []

# スコアリングの定義: 施設数
def calculation_life_hospital_number(number_hospital):
    if number_hospital >= 5:
        return 100
    elif 4 <= number_hospital < 5:
        return 90
    elif 3 <= number_hospital < 4:
        return 80
    elif 2 <= number_hospital < 3:
        return 65
    elif 1 <= number_hospital < 2:
        return 50
    else:
        return 30

# スコアリングの定義: 所要時間
def calculation_life_hospital_duration(nearest_hospital_duration):
    duration_int = int(nearest_hospital_duration.replace("分", ""))
    
    if duration_int <16:
        return 100 - (duration_int - 2) * 5
    else:
        return 30

# 検索範囲の指定
radius = 800


## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:
    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_hospital = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_hospital = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_hospital <= radius:
            number_hospital += 1

    # スコアリング: 施設数
    score_life_hospital_number = calculation_life_hospital_number(number_hospital)
        
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_hospital_distance = float('inf')
    nearest_hospital_duration = None
    nearest_hospital_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_hospital = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_hospital = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_hospital < nearest_hospital_distance:
                nearest_hospital_distance = distance_hospital
                nearest_hospital_duration = duration_hospital
                nearest_hospital_name = place['name']
    
    # スコアリング: 所要時間
    score_life_hospital_duration = calculation_life_hospital_duration(nearest_hospital_duration)
                
    #スコアリング: 施設数＋所要時間
    score_life_hospital = (score_life_hospital_number + score_life_hospital_duration) / 2
            
    # 必要なデータをリストに格納
    data_life_hospital.append([address, score_life_hospital, score_life_hospital_number, score_life_hospital_duration, number_hospital, nearest_hospital_name, nearest_hospital_duration])

# データをDataFrameに変換
df_life_hospital = pd.DataFrame(data_life_hospital, columns=['候補物件住所', '病院スコア', '病院数スコア', '病院所要時間スコア', 'エリア内の病院数', '最も近い病院名', '最も近い病院までの所要時間(分)'])
    
# データをアウトプット
df_life_hospital

Unnamed: 0,候補物件住所,病院スコア,病院数スコア,病院所要時間スコア,エリア内の病院数,最も近い病院名,最も近い病院までの所要時間(分)
0,新宿区中落合2丁目,95.0,100,90,6,聖母病院,4分
1,豊島区目白3丁目,100.0,100,100,11,東京目白クリニック,2分
2,東京都新宿区西早稲田１,92.5,100,85,9,本庄医院,5分


2. アウトプット - ② 暮らしやすさ - C 飲食店

In [122]:
### C: 飲食店のスコアリング ###

## 設定・準備 ##

# データを格納するためのリスト
data_life_restaurant = []

# スコアリングの定義: 高評価店数
def calculation_life_restaurant_number(number_restaurant_highrated):
    if number_restaurant_highrated >= 10:
        return 100
    elif 7 <= number_restaurant_highrated < 10:
        return 90
    elif 5 <= number_restaurant_highrated < 7:
        return 80    
    elif 4 <= number_restaurant_highrated < 5:
        return 70
    elif 3 <= number_restaurant_highrated < 4:
        return 60
    elif 2 <= number_restaurant_highrated < 3:
        return 50
    elif 1 <= number_restaurant_highrated < 2:
        return 40    
    else:
        return 30

# スコアリングの定義: 飲食店最高評価 (30点を底点として、Googleの飲食店スコア5点満点を (3点を引くことで) 2点満点に換算し、それを35倍することで70点分にスケーリング。最高評価が3.0以下の場合は0点 (/70点) とする)
def calculation_life_restaurant_rating(rating_restaurant_highest):
    if restaurant_highestrated:
        if rating_restaurant_highest > 3:
            return 30 + (rating_restaurant_highest - 3) * 35 
        else:
            return 30
    else:
        return 0


## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:
    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']

    # 検索範囲の指定
    radius = 800

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name_favorite, language='ja')

    # 検索範囲の評価が3.5以上の飲食店数をカウントする変数
    number_restaurant_highrated = 0

    # 検索結果をループして検索範囲の高評価店数をカウント
    for place in places_result['results']:
        # 施設までの所要時間(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の高評価店数をカウント
        if distance <= radius:
            rating_restaurant = place.get('rating', 0)
            if rating_restaurant >= 3.5:
                number_restaurant_highrated += 1
          
    # スコアリング: 高評価店数
    score_life_restaurant_number = calculation_life_restaurant_number(number_restaurant_highrated)
    
    # 最も評価の高い飲食店の評価を特定
    rating_restaurant_highest = 0
    restaurant_highestrated = None

    for place in places_result['results']:
        place_id = place['place_id']
        
        # Place Details APIを使用して評価情報を取得
        details_result = gmaps.place(place_id)
        
        if 'result' in details_result:
            rating_restaurant = details_result['result'].get('rating', 0)
            
            if rating_restaurant > rating_restaurant_highest:
                rating_restaurant_highest = rating_restaurant
                restaurant_highestrated= place['name']

    # スコアリング: 最高評価
    score_life_restaurant_rating = calculation_life_restaurant_rating(rating_restaurant_highest)
                
    #スコアリング: 高評価店数＋最高評価
    score_life_restaurant = (score_life_restaurant_number + score_life_restaurant_rating) / 2
        
    # 必要なデータをリストに格納
    data_life_restaurant.append([address, score_life_restaurant, score_life_restaurant_number, score_life_restaurant_rating, number_restaurant_highrated, restaurant_highestrated, rating_restaurant_highest])

# データをDataFrameに変換
df_life_restaurant = pd.DataFrame(data_life_restaurant, columns=['候補物件住所', '飲食店スコア', '飲食店数スコア', '飲食店評価スコア', 'エリア内の飲食店数', '最も評価の高い飲食店名', '最も評価の高い飲食店における評価(星)'])
            
# データをアウトプット
df_life_restaurant

Unnamed: 0,候補物件住所,飲食店スコア,飲食店数スコア,飲食店評価スコア,エリア内の飲食店数,最も評価の高い飲食店名,最も評価の高い飲食店における評価(星)
0,新宿区中落合2丁目,79.5,80,79.0,5,epilogue08,4.4
1,豊島区目白3丁目,66.0,60,72.0,3,無敵家,4.2
2,東京都新宿区西早稲田１,89.5,100,79.0,13,龍の羽 時色,4.4


2. アウトプット - ② 暮らしやすさ - 統合

In [123]:
### A+B+C: 暮らしやすさのスコアリング ###

## 設定・準備 ##

# クライアントの生成
gmaps = googlemaps.Client(key=api_key)

# データを格納するためのリストを作成
data_life = []

# スコアリングの定義: スーパー数
def calculation_life_supermarket_number(number_supermarket): 
    if number_supermarket >= 3:
        return 100
    elif 2 <= number_supermarket < 3:
        return 75
    elif 1 <= number_supermarket < 2:
        return 50
    else:
        return 30

# スコアリングの定義: スーパー所要時間
def calculation_life_supermarket_duration(nearest_supermarket_duration):
    duration_int = int(nearest_supermarket_duration.replace("分", ""))
    
    if duration_int <16:
        return 100 - (duration_int - 2) * 5
    else:
        return 30

# スコアリングの定義: 病院数
def calculation_life_hospital_number(number_hospital):
    if number_hospital >= 5:
        return 100
    elif 4 <= number_hospital < 5:
        return 90
    elif 3 <= number_hospital < 4:
        return 80
    elif 2 <= number_hospital < 3:
        return 65
    elif 1 <= number_hospital < 2:
        return 50
    else:
        return 30

# スコアリングの定義: 病院所要時間
def calculation_life_hospital_duration(nearest_hospital_duration):
    duration_int = int(nearest_hospital_duration.replace("分", ""))

    if duration_int <16:
        return 100 - (duration_int - 2) * 5
    else:
        return 30

# スコアリングの定義: 高評価飲食店数
def calculation_life_restaurant_number(number_restaurant_highrated):
    if number_restaurant_highrated >= 10:
        return 100
    elif 7 <= number_restaurant_highrated < 10:
        return 90
    elif 5 <= number_restaurant_highrated < 7:
        return 80    
    elif 4 <= number_restaurant_highrated < 5:
        return 70
    elif 3 <= number_restaurant_highrated < 4:
        return 60
    elif 2 <= number_restaurant_highrated < 3:
        return 50
    elif 1 <= number_restaurant_highrated < 2:
        return 40    
    else:
        return 30

# スコアリングの定義: 飲食店最高評価 (30点を底点として、Googleの飲食店スコア5点満点を (3点を引くことで) 2点満点に換算し、それを35倍することで70点分にスケーリング。最高評価が3.0以下の場合は0点 (/70点) とする)
def calculation_life_restaurant_rating(rating_restaurant_highest):
    if restaurant_highestrated:
        if rating_restaurant_highest > 3:
            return 30 + (rating_restaurant_highest - 3) * 35 
        else:
            return 30
    else:
        return 0
    

## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:

    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']

    
    ## スコアリング: スーパー ##

    # 施設名の指定
    place_name = "supermarket"

    # 検索範囲の指定
    radius = 800

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_supermarket = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_supermarket = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_supermarket <= radius:
            number_supermarket += 1

    # スコアリング: 施設数
    score_life_supermarket_number = calculation_life_supermarket_number(number_supermarket)
        
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_supermarket_distance = float('inf')
    nearest_supermarket_duration = None
    nearest_supermarket_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_supermarket = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_supermarket = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_supermarket < nearest_supermarket_distance:
                nearest_supermarket_distance = distance_supermarket
                nearest_supermarket_duration = duration_supermarket
                nearest_supermarket_name = place['name']
    
    # スコアリング: 所要時間
    score_life_supermarket_duration = calculation_life_supermarket_duration(nearest_supermarket_duration)
                
    #スコアリング: 施設数＋所要時間
    score_life_supermarket = (score_life_supermarket_number + score_life_supermarket_duration) / 2
    
    
    ## スコアリング: 病院 ##
    
    # 施設名の指定
    place_name = "病院" # 👈改善ポイント: 英語の場合、「hospital」 → 「XX病院」、「clinic」 →　「XX病院」以外の「XXクリニック」しか検索できないため、暫定的に日本語で検索
    
    # 検索範囲の指定
    radius = 800
    
    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_hospital = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_hospital = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_hospital <= radius:
            number_hospital += 1

    # スコアリング: 施設数
    score_life_hospital_number = calculation_life_hospital_number(number_hospital)
        
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_hospital_distance = float('inf')
    nearest_hospital_duration = None
    nearest_hospital_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_hospital = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_hospital = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_hospital < nearest_hospital_distance:
                nearest_hospital_distance = distance_hospital
                nearest_hospital_duration = duration_hospital
                nearest_hospital_name = place['name']
    
    # スコアリング: 所要時間
    score_life_hospital_duration = calculation_life_hospital_duration(nearest_hospital_duration)
                
    #スコアリング: 施設数＋所要時間
    score_life_hospital = (score_life_hospital_number + score_life_hospital_duration) / 2
    
    
    ## スコアリング: 飲食店 ##
    
    # 施設名はインプットした変数を引用
    
    # 検索範囲の指定
    radius = 800
    
    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name_favorite, language='ja')

    # 検索範囲の評価が3.5以上の飲食店数をカウントする変数
    number_restaurant_highrated = 0

    # 検索結果をループして検索範囲の高評価店数をカウント
    for place in places_result['results']:
        # 施設までの所要時間(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の高評価店数をカウント
        if distance <= radius:
            rating_restaurant = place.get('rating', 0)
            if rating_restaurant >= 3.5:
                number_restaurant_highrated += 1
          
    # スコアリング: 高評価店数
    score_life_restaurant_number = calculation_life_restaurant_number(number_restaurant_highrated)
    
    # 最も評価の高い飲食店の評価を特定
    rating_restaurant_highest = 0
    restaurant_highestrated = None

    for place in places_result['results']:
        place_id = place['place_id']
        
        # Place Details APIを使用して評価情報を取得
        details_result = gmaps.place(place_id)
        
        if 'result' in details_result:
            rating_restaurant = details_result['result'].get('rating', 0)
            
            if rating_restaurant > rating_restaurant_highest:
                rating_restaurant_highest = rating_restaurant
                restaurant_highestrated= place['name']

    # スコアリング: 最高評価
    score_life_restaurant_rating = calculation_life_restaurant_rating(rating_restaurant_highest)
                
    #スコアリング: 高評価店数＋最高評価
    score_life_restaurant = (score_life_restaurant_number + score_life_restaurant_rating) / 2
    
    
    ## スコアリング: 暮らしやすさ ##
    
    # 重要度を乗じてスコアを算出
    score_life = score_life_supermarket * weight_life_supermarket / 100 + score_life_hospital * weight_life_hospital / 100 + score_life_restaurant * weight_life_restaurant / 100
            
    # 必要なデータをリストに格納
    data_life.append([address, score_life, score_life_supermarket, score_life_hospital, score_life_restaurant,
                      score_life_supermarket_number, score_life_supermarket_duration, number_supermarket, nearest_supermarket_name, nearest_supermarket_duration,
                      score_life_hospital_number, score_life_hospital_duration, number_hospital, nearest_hospital_name, nearest_hospital_duration,
                      score_life_restaurant_number, score_life_restaurant_rating, number_restaurant_highrated, restaurant_highestrated, rating_restaurant_highest])

# データをDataFrameに変換
df_life = pd.DataFrame(data_life, columns=['候補物件住所', '暮らしやすさスコア', 'スーパースコア', '病院スコア', '飲食店スコア',
                                           'スーパー数スコア', 'スーパー所要時間スコア', 'エリア内のスーパー数', '最も近いスーパー名', '最も近いスーパーまでの所要時間(分)',
                                           '病院数スコア', '病院所要時間スコア', 'エリア内の病院数', '最も近い病院名', '最も近い病院までの所要時間(分)',
                                           '飲食店数スコア', '飲食店評価スコア', 'エリア内の飲食店数', '最も評価の高い飲食店名', '最も評価の高い飲食店における評価(星)'])
    
# データをアウトプット
df_life

Unnamed: 0,候補物件住所,暮らしやすさスコア,スーパースコア,病院スコア,飲食店スコア,スーパー数スコア,スーパー所要時間スコア,エリア内のスーパー数,最も近いスーパー名,最も近いスーパーまでの所要時間(分),病院数スコア,病院所要時間スコア,エリア内の病院数,最も近い病院名,最も近い病院までの所要時間(分),飲食店数スコア,飲食店評価スコア,エリア内の飲食店数,最も評価の高い飲食店名,最も評価の高い飲食店における評価(星)
0,新宿区中落合2丁目,88.35,90.0,95.0,79.5,100,80,4,マルエツ プチ 下落合駅前店,6分,100,90,6,聖母病院,4分,80,79.0,5,epilogue08,4.4
1,豊島区目白3丁目,81.8,80.0,100.0,66.0,100,60,6,ピーコックストア 目白店,10分,100,100,11,東京目白クリニック,2分,60,72.0,3,無敵家,4.2
2,東京都新宿区西早稲田１,95.6,102.5,92.5,89.5,100,105,10,こだわり商店,1分,100,85,9,本庄医院,5分,100,79.0,13,龍の羽 時色,4.4


2. アウトプット - ➂ 育てやすさ

2. アウトプット - ➂ 育てやすさ - A 保育園

In [124]:
### A: 保育園のスコアリング ###

## 設定・準備 ##

# クライアントの生成
gmaps = googlemaps.Client(key=api_key)

# 施設名の指定
place_name = "nursery"

# データを格納するためのリストを作成
data_kids_nursery = []

# スコアリングの定義: 施設数
def calculation_kids_nursery_number(number_nursery):
    if number_nursery >= 5:
        return 100
    elif 4 <= number_nursery < 5:
        return 95
    elif 3 <= number_nursery < 4:
        return 85
    elif 2 <= number_nursery < 3:
        return 70
    elif 1 <= number_nursery < 2:
        return 50
    else:
        return 30

# スコアリングの定義: 所要時間
def calculation_kids_nursery_duration(nearest_nursery_duration):
    duration_int = int(nearest_nursery_duration.replace("分", ""))
    
    if duration_int <16:
        return 100 - (duration_int - 2) * 5
    else:
        return 30

# 検索範囲の指定
radius = 800


## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:
    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_nursery = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_nursery = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_nursery <= radius:
            number_nursery += 1

    # スコアリング: 施設数
    score_kids_nursery_number = calculation_kids_nursery_number(number_nursery)
        
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_nursery_distance = float('inf')
    nearest_nursery_duration = None
    nearest_nursery_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_nursery = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_nursery = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_nursery < nearest_nursery_distance:
                nearest_nursery_distance = distance_nursery
                nearest_nursery_duration = duration_nursery
                nearest_nursery_name = place['name']
    
    # スコアリング: 所要時間
    score_kids_nursery_duration = calculation_kids_nursery_duration(nearest_nursery_duration)
                
    #スコアリング: 施設数＋所要時間
    score_kids_nursery = (score_kids_nursery_number + score_kids_nursery_duration) / 2
            
    # 必要なデータをリストに格納
    data_kids_nursery.append([address, score_kids_nursery, score_kids_nursery_number, score_kids_nursery_duration, number_nursery, nearest_nursery_name, nearest_nursery_duration])

# データをDataFrameに変換
df_kids_nursery = pd.DataFrame(data_kids_nursery, columns=['候補物件住所', '保育園スコア', '保育園数スコア', '保育園所要時間スコア', 'エリア内の保育園数', '最も近い保育園名', '最も近い保育園までの所要時間(分)'])
    
# データをアウトプット
df_kids_nursery

Unnamed: 0,候補物件住所,保育園スコア,保育園数スコア,保育園所要時間スコア,エリア内の保育園数,最も近い保育園名,最も近い保育園までの所要時間(分)
0,新宿区中落合2丁目,95.0,95,95,4,中落合第二保育園,3分
1,豊島区目白3丁目,90.0,95,85,4,ベネッセ目白保育園,5分
2,東京都新宿区西早稲田１,87.5,85,90,3,西早稲田保育園,4分


2. アウトプット - ➂ 育てやすさ - B 幼稚園

In [125]:
### B: 幼稚園のスコアリング ###

## 設定・準備 ##

# 施設名の指定
place_name = "kindergarten"

# データを格納するためのリストを作成
data_kids_kindergarten = []

# スコアリングの定義: 施設数
def calculation_kids_kindergarten_number(number_kindergarten):
    if number_kindergarten >= 5:
        return 100
    elif 4 <= number_kindergarten < 5:
        return 95
    elif 3 <= number_kindergarten < 4:
        return 85
    elif 2 <= number_kindergarten < 3:
        return 70
    elif 1 <= number_kindergarten < 2:
        return 50
    else:
        return 30

# スコアリングの定義: 所要時間
def calculation_kids_kindergarten_duration(nearest_kindergarten_duration):
    duration_int = int(nearest_kindergarten_duration.replace("分", ""))
    
    if duration_int < 16:
        return 100 - (duration_int - 2) * 5
    else:
        return 30

# 検索範囲の指定
radius = 800


## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:
    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_kindergarten = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_kindergarten = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_kindergarten <= radius:
            number_kindergarten += 1

    # スコアリング: 施設数
    score_kids_kindergarten_number = calculation_kids_kindergarten_number(number_kindergarten)
        
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_kindergarten_distance = float('inf')
    nearest_kindergarten_duration = None
    nearest_kindergarten_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_kindergarten = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_kindergarten = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_kindergarten < nearest_kindergarten_distance:
                nearest_kindergarten_distance = distance_kindergarten
                nearest_kindergarten_duration = duration_kindergarten
                nearest_kindergarten_name = place['name']
    
    # スコアリング: 所要時間
    score_kids_kindergarten_duration = calculation_kids_kindergarten_duration(nearest_kindergarten_duration)
                
    #スコアリング: 施設数＋所要時間
    score_kids_kindergarten = (score_kids_kindergarten_number + score_kids_kindergarten_duration) / 2
            
    # 必要なデータをリストに格納
    data_kids_kindergarten.append([address, score_kids_kindergarten, score_kids_kindergarten_number, score_kids_kindergarten_duration, number_kindergarten, nearest_kindergarten_name, nearest_kindergarten_duration])

# データをDataFrameに変換
df_kids_kindergarten = pd.DataFrame(data_kids_kindergarten, columns=['候補物件住所', '幼稚園スコア', '幼稚園数スコア', '幼稚園所要時間スコア', 'エリア内の幼稚園数', '最も近い幼稚園名', '最も近い幼稚園までの所要時間(分)'])
    
# データをアウトプット
df_kids_kindergarten

Unnamed: 0,候補物件住所,幼稚園スコア,幼稚園数スコア,幼稚園所要時間スコア,エリア内の幼稚園数,最も近い幼稚園名,最も近い幼稚園までの所要時間(分)
0,新宿区中落合2丁目,72.5,70,75,2,愛心幼稚園,7分
1,豊島区目白3丁目,100.0,100,100,7,草苑幼稚園,2分
2,東京都新宿区西早稲田１,67.5,70,65,2,日本女子大学 附属豊明幼稚園,9分


2. アウトプット - ➂ 育てやすさ - C 小学校

In [126]:
### C: 小学校のスコアリング ###

## 設定・準備 ##

# 施設名の指定
place_name = "elementary school" 

# データを格納するためのリストを作成
data_kids_elementary = []

# スコアリングの定義: 所要時間
def calculation_kids_elementary(nearest_elementary_duration):
    duration_int = int(nearest_elementary_duration.replace("分", ""))
    
    if duration_int < 20:
        return 100 - (duration_int - 2) * 4
    else:
        return 30

# 検索範囲の指定
radius = 1600


## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:
    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')
    
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_elementary_distance = float('inf')
    nearest_elementary_duration = None
    nearest_elementary_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_elementary = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_elementary = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_elementary < nearest_elementary_distance:
                nearest_elementary_distance = distance_elementary
                nearest_elementary_duration = duration_elementary
                nearest_elementary_name = place['name']
    
    # スコアリング: 所要時間
    score_kids_elementary = calculation_kids_elementary(nearest_elementary_duration)
            
    # 必要なデータをリストに格納
    data_kids_elementary.append([address, score_kids_elementary, nearest_elementary_name, nearest_elementary_duration])

# データをDataFrameに変換
df_kids_elementary = pd.DataFrame(data_kids_elementary, columns=['候補物件住所', '小学校スコア', '最も近い小学校名', '最も近い小学校までの所要時間(分)'])
    
# データをアウトプット
df_kids_elementary

Unnamed: 0,候補物件住所,小学校スコア,最も近い小学校名,最も近い小学校までの所要時間(分)
0,新宿区中落合2丁目,100,新宿区立落合第一小学校,2分
1,豊島区目白3丁目,84,豊島区立目白小学校,6分
2,東京都新宿区西早稲田１,72,新宿区立鶴巻小学校,9分


2. アウトプット - ➂ 育てやすさ - D 公園

In [127]:
### D: 公園のスコアリング ###

## 設定・準備 ##

# 施設名の指定
place_name = "park"

# データを格納するためのリストを作成
data_kids_park = []

# スコアリングの定義: 施設数
def calculation_kids_park(number_park):
    if number_park >= 4:
        return 100
    elif 3 <= number_park < 4:
        return 90
    elif 2 <= number_park < 3:
        return 75
    elif 1 <= number_park < 2:
        return 60
    else:
        return 30

# 検索範囲の指定
radius = 600


## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:
    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_park = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_park = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_park <= radius:
            number_park += 1

    # スコアリング: 施設数
    score_kids_park = calculation_kids_park(number_park)
            
    # 必要なデータをリストに格納
    data_kids_park.append([address, score_kids_park, number_park])

# データをDataFrameに変換
df_kids_park = pd.DataFrame(data_kids_park, columns=['候補物件住所', '公園スコア', 'エリア内の公園数'])
    
# データをアウトプット
df_kids_park

Unnamed: 0,候補物件住所,公園スコア,エリア内の公園数
0,新宿区中落合2丁目,100,6
1,豊島区目白3丁目,90,3
2,東京都新宿区西早稲田１,100,4


2. アウトプット - ➂ 育てやすさ - 統合

In [128]:
### A+B+C+D: 育てやすさのスコアリング ###

## 設定・準備 ##

# クライアントの生成
gmaps = googlemaps.Client(key=api_key)

# データを格納するためのリストを作成
data_kids = []

# スコアリングの定義: 保育園数
def calculation_kids_nursery_number(number_nursery):
    if number_nursery >= 5:
        return 100
    elif 4 <= number_nursery < 5:
        return 95
    elif 3 <= number_nursery < 4:
        return 85
    elif 2 <= number_nursery < 3:
        return 70
    elif 1 <= number_nursery < 2:
        return 50
    else:
        return 30

# スコアリングの定義: 保育園所要時間
def calculation_kids_nursery_duration(nearest_nursery_duration):
    duration_int = int(nearest_nursery_duration.replace("分", ""))
    
    if duration_int < 16:
        return 100 - (duration_int - 2) * 5
    else:
        return 30

# スコアリングの定義: 幼稚園数
def calculation_kids_kindergarten_number(number_kindergarten):
    if number_kindergarten >= 5:
        return 100
    elif 4 <= number_kindergarten < 5:
        return 95
    elif 3 <= number_kindergarten < 4:
        return 85
    elif 2 <= number_kindergarten < 3:
        return 70
    elif 1 <= number_kindergarten < 2:
        return 50
    else:
        return 30

# スコアリングの定義: 幼稚園所要時間
def calculation_kids_kindergarten_duration(nearest_kindergarten_duration):
    duration_int = int(nearest_kindergarten_duration.replace("分", ""))
    
    if duration_int < 16:
        return 100 - (duration_int - 2) * 5
    else:
        return 30

# スコアリングの定義: 小学校所要時間
def calculation_kids_elementary(nearest_elementary_duration):
    duration_int = int(nearest_elementary_duration.replace("分", ""))
    
    if duration_int < 20:
        return 100 - (duration_int - 2) * 4
    else:
        return 30

# スコアリングの定義: 公園数
def calculation_kids_park(number_park):
    if number_park >= 4:
        return 100
    elif 3 <= number_park < 4:
        return 90
    elif 2 <= number_park < 3:
        return 75
    elif 1 <= number_park < 2:
        return 60
    else:
        return 30


## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:

    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']


    ## スコアリング: 保育園 ##

    # 施設名の指定
    place_name = "nursery"

    # 検索範囲の指定
    radius = 800

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_nursery = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_nursery = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_nursery <= radius:
            number_nursery += 1

    # スコアリング: 施設数
    score_kids_nursery_number = calculation_kids_nursery_number(number_nursery)
        
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_nursery_distance = float('inf')
    nearest_nursery_duration = None
    nearest_nursery_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_nursery = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_nursery = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_nursery < nearest_nursery_distance:
                nearest_nursery_distance = distance_nursery
                nearest_nursery_duration = duration_nursery
                nearest_nursery_name = place['name']
    
    # スコアリング: 所要時間
    score_kids_nursery_duration = calculation_kids_nursery_duration(nearest_nursery_duration)
                
    # スコアリング: 施設数＋所要時間
    score_kids_nursery = (score_kids_nursery_number + score_kids_nursery_duration) / 2
    
    
    ## スコアリング: 幼稚園 ##
    
    # 施設名の指定
    place_name = "kindergarten"
    
    # 検索範囲の指定
    radius = 800
    
    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_kindergarten = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_kindergarten = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_kindergarten <= radius:
            number_kindergarten += 1

    # スコアリング: 施設数
    score_kids_kindergarten_number = calculation_kids_kindergarten_number(number_kindergarten)
        
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_kindergarten_distance = float('inf')
    nearest_kindergarten_duration = None
    nearest_kindergarten_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_kindergarten = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_kindergarten = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_kindergarten < nearest_kindergarten_distance:
                nearest_kindergarten_distance = distance_kindergarten
                nearest_kindergarten_duration = duration_kindergarten
                nearest_kindergarten_name = place['name']
    
    # スコアリング: 所要時間
    score_kids_kindergarten_duration = calculation_kids_kindergarten_duration(nearest_kindergarten_duration)
                
    #スコアリング: 施設数＋所要時間
    score_kids_kindergarten = (score_kids_kindergarten_number + score_kids_kindergarten_duration) / 2
    
    
    ## スコアリング: 小学校 ##
    
    # 施設名の指定
    place_name = "elementary school"

    # 検索範囲の指定
    radius = 1600
    
    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')
    
    # 最も近い施設までの所要時間を整数に変換してスコアリング
    nearest_elementary_distance = float('inf')
    nearest_elementary_duration = None
    nearest_elementary_name = None
    
    for place in places_result['results']:
        # 施設までの所要時間を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        duration_elementary = distance_matrix_result['rows'][0]['elements'][0]['duration']['text']

        # 最も近い施設を更新
        if 'distance' in distance_matrix_result['rows'][0]['elements'][0]:
            distance_elementary = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']
            if distance_elementary < nearest_elementary_distance:
                nearest_elementary_distance = distance_elementary
                nearest_elementary_duration = duration_elementary
                nearest_elementary_name = place['name']
    
    # スコアリング: 所要時間
    score_kids_elementary = calculation_kids_elementary(nearest_elementary_duration)
    
    
    ## スコアリング: 公園 ##
    
    # 施設名の指定
    place_name = "park"

    # 検索範囲の指定
    radius = 600
    
    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_park = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_park = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_park <= radius:
            number_park += 1

    # スコアリング: 施設数
    score_kids_park = calculation_kids_park(number_park)
    
    
    ## スコアリング: 育てやすさ ##
    
    # 重要度を乗じてスコアを算出
    score_kids = score_kids_nursery * weight_kids_nursery / 100 + score_kids_kindergarten * weight_kids_kindergarten / 100 + score_kids_elementary * weight_kids_elementary / 100 + score_kids_park * weight_kids_park / 100
            
    # 必要なデータをリストに格納
    data_kids.append([address, score_kids, score_kids_nursery, score_kids_kindergarten, score_kids_elementary, score_kids_park, 
                      score_kids_nursery_number, score_kids_nursery_duration, number_nursery, nearest_nursery_name, nearest_nursery_duration, 
                      score_kids_kindergarten_number, score_kids_kindergarten_duration, number_kindergarten, nearest_kindergarten_name, nearest_kindergarten_duration,
                      nearest_elementary_name, nearest_elementary_duration,
                      number_park])

# データをDataFrameに変換
df_kids = pd.DataFrame(data_kids, columns=['候補物件住所', '育てやすさスコア', '保育園スコア', '幼稚園スコア', '小学校スコア', '公園スコア', 
                                           '保育園数スコア', '保育園所要時間スコア', 'エリア内の保育園数', '最も近い保育園名', '最も近い保育園までの所要時間(分)', 
                                           '幼稚園数スコア', '幼稚園所要時間スコア','エリア内の幼稚園数', '最も近い幼稚園名', '最も近い幼稚園までの所要時間(分)',
                                           '最も近い小学校名', '最も近い小学校までの所要時間(分)',
                                           'エリア内の公園数'])
    
# データをアウトプット
df_kids

Unnamed: 0,候補物件住所,育てやすさスコア,保育園スコア,幼稚園スコア,小学校スコア,公園スコア,保育園数スコア,保育園所要時間スコア,エリア内の保育園数,最も近い保育園名,最も近い保育園までの所要時間(分),幼稚園数スコア,幼稚園所要時間スコア,エリア内の幼稚園数,最も近い幼稚園名,最も近い幼稚園までの所要時間(分),最も近い小学校名,最も近い小学校までの所要時間(分),エリア内の公園数
0,新宿区中落合2丁目,91.875,95.0,72.5,100,100,95,95,4,中落合第二保育園,3分,70,75,2,愛心幼稚園,7分,新宿区立落合第一小学校,2分,6
1,豊島区目白3丁目,91.0,90.0,100.0,84,90,95,85,4,ベネッセ目白保育園,5分,100,100,7,草苑幼稚園,2分,豊島区立目白小学校,6分,3
2,東京都新宿区西早稲田１,81.75,87.5,67.5,72,100,85,90,3,西早稲田保育園,4分,70,65,2,日本女子大学 附属豊明幼稚園,9分,新宿区立鶴巻小学校,9分,4


2. アウトプット - ④ 安心しやすさ

In [129]:
### 安心しやすさのスコアリング ###

## 設定・準備 ##

# クライアントの生成
gmaps = googlemaps.Client(key=api_key)

# データを格納するためのリストを作成
data_safe = []

# スコアリングの定義:
def calculation_safe(score_safe_fire, score_safe_police):
    if score_safe_fire == 1 and score_safe_police ==1:
        return 100
    elif score_safe_fire == 1 and score_safe_police ==2:
        return 85
    elif score_safe_fire == 1 and score_safe_police ==3:
        return 70
    elif score_safe_fire == 2 and score_safe_police ==1:
        return 85
    elif score_safe_fire == 2 and score_safe_police ==2:
        return 70
    elif score_safe_fire == 2 and score_safe_police ==3:
        return 55
    elif score_safe_fire == 3 and score_safe_police ==1:
        return 70
    elif score_safe_fire == 3 and score_safe_police ==2:
        return 55
    elif score_safe_fire == 3 and score_safe_police ==3:
        return 40
    else:
        return 30


## スコアリング ##

# 各住所に対して処理を繰り返す
for address in addresses:
    # 住所から緯度経度を取得
    geocode_result = gmaps.geocode(address)
    location = geocode_result[0]['geometry']['location']
    
    # スコアリング: 消防署
    
    # 施設名の指定
    place_name = "消防署" # 👈備考: 英語の場合、「fire department」 → ヒット数少ない、「fire」 →　料理店が含まれやすい、という事情から日本語で検索
    
    # 検索範囲の指定
    radius = 600

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_fire_near = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_fire = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_fire <= radius:
            number_fire_near += 1
    
    # 検索範囲の指定
    radius = 1200

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_fire_far = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_fire = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_fire <= radius:
            number_fire_far += 1

    # スコアリング: 消防署
    if number_fire_near >= 1:
        score_safe_fire = 1
    elif number_fire_far >= 1:
        score_safe_fire = 2
    else:
        score_safe_fire = 3
        
    # スコアリング: 交番
    
    # 施設名の指定
    place_name = "警察署" # 👈備考: 英語「police」 → 交番が含まれないケースがあるため、日本語で検索。「交番」 →　警察署が含まれない、「警察署」 → 交番が含まれる、という包含関係から「警察署」で検索
    
    # 検索範囲の指定
    radius = 500

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_police_near = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_police = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_police <= radius:
            number_police_near += 1
    
    # 検索範囲の指定
    radius = 1000

    # 検索結果を取得
    places_result = gmaps.places_nearby(location=location, radius=radius, keyword=place_name, language='ja')

    # 検索範囲の施設数を格納する変数を作成
    number_police_far = 0

    # 検索結果をループして検索範囲の施設数をカウント
    for place in places_result['results']:
        # 施設までの距離(徒歩)を取得
        distance_matrix_result = gmaps.distance_matrix(location, place['geometry']['location'], mode='walking', language='ja', units='metric')
        distance_police = distance_matrix_result['rows'][0]['elements'][0]['distance']['value']

        # 検索範囲の場合にカウント
        if distance_police <= radius:
            number_police_far += 1

    # スコアリング: 交番
    if number_police_near >= 1:
        score_safe_police = 1
    elif number_police_far >= 1:
        score_safe_police = 2
    else:
        score_safe_police = 3
                
    #スコアリング: 施設数＋所要時間
    score_safe = calculation_safe(score_safe_fire, score_safe_police)
            
    # 必要なデータをリストに格納
    data_safe.append([address, score_safe, score_safe_fire, score_safe_police])

# データをDataFrameに変換
df_safe = pd.DataFrame(data_safe, columns=['候補物件住所', '安心しやすさスコア', '消防署スコア_3段階', '交番スコア_3段階'])
    
# データをアウトプット
df_safe

Unnamed: 0,候補物件住所,安心しやすさスコア,消防署スコア_3段階,交番スコア_3段階
0,新宿区中落合2丁目,100,1,1
1,豊島区目白3丁目,85,2,1
2,東京都新宿区西早稲田１,85,2,1


3. アウトプット - 総合スコア

In [130]:
## 設定・準備 ##

# 総合スコアに対する表示コメントの定義
def generate_comment(score_total):
    if score_total >= 90:
        return '運命の出会いとなる物件です！！チャンスを逃さないようすぐに契約に進みましょう！！'
    elif score_total >= 80:
        return 'あなたにあった物件です！これ以上魅力的な物件はそうそう見つからないでしょう！'
    elif score_total >= 70:
        return 'バランスのよい物件です！スコアが低い部分が問題ないか確認することをお勧めします。'
    elif score_total >= 60:
        return '良い物件かもしれません。ただ大きな弱点がありますので、よく確認しましょう。'
    elif score_total >= 50:
        return '間取りや築年数だけで選んでいませんか？詳細を見て具体的に生活をイメージしてみましょう。'
    else:
        return 'Suumoではもっとよい物件があなたを待っています！オススメ物件を参考に再トライしましょう！'


# データフレームを '候補物件住所' 列をキーに横方向に結合
df_total = df_work.merge(df_life, on='候補物件住所', how='inner').merge(df_kids, on='候補物件住所', how='inner').merge(df_safe, on='候補物件住所', how='inner')

# '総合スコア' 列を算出しデータフレームに追加
df_total['総合スコア'] = df_total['働きやすさスコア'] * weight_work /100 + df_total['暮らしやすさスコア'] * weight_life / 100 + df_total['育てやすさスコア'] * weight_kids /100 + df_total['安心しやすさスコア'] * weight_safe /100

# '評価コメント' 列を追加
df_total['評価コメント'] = df_total['総合スコア'].apply(generate_comment)

# 総合スコアを左から2番目、評価コメントを左から3番目に持ってくる
column_order = list(df_total.columns)
column_order.insert(1, column_order.pop(column_order.index('総合スコア')))
column_order.insert(2, column_order.pop(column_order.index('評価コメント')))
df_total = df_total[column_order]

# 新しいデータフレームを表示
df_total

Unnamed: 0,候補物件住所,総合スコア,評価コメント,働きやすさスコア,目的地までの距離(km),到着までにかかる時間(分),暮らしやすさスコア,スーパースコア,病院スコア,飲食店スコア,...,幼稚園所要時間スコア,エリア内の幼稚園数,最も近い幼稚園名,最も近い幼稚園までの所要時間(分),最も近い小学校名,最も近い小学校までの所要時間(分),エリア内の公園数,安心しやすさスコア,消防署スコア_3段階,交番スコア_3段階
0,新宿区中落合2丁目,87.55625,あなたにあった物件です！これ以上魅力的な物件はそうそう見つからないでしょう！,70,8.6,31,88.35,90.0,95.0,79.5,...,75,2,愛心幼稚園,7分,新宿区立落合第一小学校,2分,6,100,1,1
1,豊島区目白3丁目,84.45,あなたにあった物件です！これ以上魅力的な物件はそうそう見つからないでしょう！,80,9.1,28,81.8,80.0,100.0,66.0,...,100,7,草苑幼稚園,2分,豊島区立目白小学校,6分,3,85,2,1
2,東京都新宿区西早稲田１,85.5875,あなたにあった物件です！これ以上魅力的な物件はそうそう見つからないでしょう！,80,5.3,22,95.6,102.5,92.5,89.5,...,65,2,日本女子大学 附属豊明幼稚園,9分,新宿区立鶴巻小学校,9分,4,85,2,1
