# Libraries


In [14]:
import requests
from requests.adapters import HTTPAdapter
from urllib3.util.retry import Retry
import json
import pandas as pd
from collections import OrderedDict

# Scrape using APIs
### City Names


<b>Extract city names and their keys in website. </b>

In [3]:
url          = "https://www.delino.com/init"
page         = requests.get(url)
j            = json.loads(page.text)
city_name_id = {}


for i in range (len(j['city'])):
    city_name_id[j['city'][i]['id']] = j['city'][i]['text']
    
    
city_name = list(city_name_id.values())
city_id   = list(city_name_id.keys())

city_name.remove("بوکان") # No records for Bukan
city_id.remove(1036)
city_name_id

{1: 'تهران',
 1003: 'قم',
 1005: 'بندرعباس',
 1007: 'کرج',
 1008: 'رشت',
 1009: 'گرگان',
 1011: 'همدان',
 1012: 'یزد',
 1013: 'ارومیه',
 1015: 'گنبد کاووس',
 1033: 'اراک',
 1036: 'بوکان'}

# Scrape using APIs
### Food Tags


<b>Extract food tags and their keys in website. </b>

In [5]:
url          = "https://www.delino.com/init"
page         = requests.get(url)
j            = json.loads(page.text)
food_text_id = {}
for i in range(len(j['foodTagList'])):
    food_text_id[j['foodTagList'][i]['id']] = [j['foodTagList'][i]['text'], j['foodTagList'][i]['tag']]
    
text_id   = list(food_text_id.keys())
food_text = list(food_text_id.values())
food_text_id

{1: ['غذای مقرون به صرفه', 'economic'],
 2: ['غذای تند', 'chili'],
 3: ['غذای سلامت', 'healthy'],
 5: ['غذای رژیمی', 'diet'],
 6: ['غذای دریایی', 'seafood'],
 8: ['غذای بین المللی', 'international'],
 9: ['غذای محلی', 'local'],
 10: ['صبحانه', 'breakfast'],
 11: ['غذای کودک', 'kids'],
 13: ['Vegan (فاقد لبنیات)', 'Vegan'],
 14: ['حاوی نوتلا', 'Nutella included!'],
 15: ['فاقد قند', 'No sugar'],
 16: ['حاوی کافئین (اسپرسو یا نسکافه)', 'Caffeinated'],
 17: ['کتوژنیک', 'Ketogenic'],
 18: ['ماست بستنی', 'Frozen Yogurt'],
 19: ['انرژی زا', 'Energizer'],
 21: ['کباب ها', 'Kabab'],
 25: ['غذای اصلی', 'main food'],
 26: ['غذای ملل', 'food melal'],
 27: ['دسر', 'deser'],
 29: ['سوپ وسالادها', 'apllitizer'],
 30: ['صبحانه', 'Berakfast'],
 31: ['فست فود', 'Fast Food'],
 32: ['شیرینی تر', 'wet sweet'],
 33: ['شیرینی خشک', 'dry sweet'],
 34: ['کیک', 'cake'],
 35: ['کیک سفارشی', 'custom special cake'],
 36: ['برگر', '????'],
 37: ['بدون سوسیس', '???? ?????'],
 38: ['پیتزا', '?????'],
 39: ['شکلاتی!'

# Scrape using APIs
### Food Category


<b>Extract food category and their keys in website. </b>

In [6]:
url         = "https://www.delino.com/init"
page        = requests.get(url)
j           = json.loads(page.text)
food_cat_id = {}
for i in range(len(j['foodCategoryList'])):
    food_cat_id[j['foodCategoryList'][i]['id']] = j['foodCategoryList'][i]['text']
    
cat_id   = list(food_cat_id.keys())
food_cat = list(food_cat_id.values())
food_cat_id

{1: 'پیتزا',
 2: 'کباب',
 18154: 'سوپ',
 7: 'ساندویچ',
 3: 'غذای ایرانی',
 4: 'سوخاری',
 9: 'پاستا',
 8838: 'سالاد',
 4650: 'صبحانه',
 8: 'استیک'}

# Scrape using APIs
### Areas


<b>Extract Areas in each city and their keys in website. </b>

In [4]:
url          = "https://www.delino.com/init"
page         = requests.get(url)
j            = json.loads(page.text)
area_lat_lng = {}
city         = j['city']

for i in range(len(city)-1):
    city_zone = city[i]['zone']
    
    for j in range(len(city_zone)):
        city_zone_area = city_zone[j]['area']
        
        for k in range(len(city_zone_area)):
            
            if city_zone_area[k]['text'] != None:
                
                area_lat_lng[city_zone_area[k]['text']] = [round(city_zone_area[k]['lat'],6), round(city_zone_area[k]['lng'],6)]

area    = list(area_lat_lng.keys())
lat_lng = list(area_lat_lng.values())
area_lat_lng

{'110': [35.741645, 51.003857],
 '30متری اسلام آباد': [36.544042, 46.21974],
 'آجودانیه': [35.805894, 51.487985],
 'آزادگان': [37.244465, 55.18438],
 'آصف': [35.81007, 51.411542],
 'آقا بزرگی': [35.795121, 51.425468],
 'اتوبان ارتش': [35.79714, 51.509142],
 'ادب جنوبی': [36.482337, 46.210363],
 'ادب شمالی': [36.486512, 46.210041],
 'اراج': [35.799507, 51.487684],
 'ازگل': [35.78976, 51.512146],
 'استاد بی که س': [36.511028, 46.202896],
 'استاد ترجانی زاده': [36.504574, 46.200213],
 'استاد حقیقی': [36.526464, 46.211264],
 'استاد هیمن': [36.520783, 46.204011],
 'اقدسیه': [35.793694, 51.48747],
 'الهیه': [34.104577, 49.743285],
 'امامزاده قاسم': [35.815516, 51.433096],
 'اندرزگو': [35.801525, 51.453867],
 'انستیتو پاستور': [35.691078, 51.396618],
 'انقلاب': [31.901948, 54.356888],
 'اوشان': [35.820214, 51.478329],
 'اوین': [35.794947, 51.392241],
 'بابان': [36.521455, 46.21709],
 'باغ فردوس': [35.800464, 51.423569],
 'بام تهران': [35.815777, 51.409428],
 'باهنر (نیاوران)': [35.812497, 51.

# Scrape using APIs
### Records


<b>Extract Number of records for each city and area. </b>

In [7]:
records=[]
for cityid in city_id:
    url1  = "https://www.delino.com/restaurant/search/?cityid="+str(cityid)+"&offset=0&limit=12&_=1675373603471"
    page1 = requests.get(url1)
    j1    = json.loads(page1.text)
    records.append(j1['total'])

    
records2 = []
for geo in lat_lng:
    url1    = "https://www.delino.com/restaurant/search/?lat="+str(geo[0])+"&lng="+str(geo[1])+"&sort=distance&limit=12&_=1675705029664"
    session = requests.Session()
    retry   = Retry(connect=3, backoff_factor=0.5)
    adapter = HTTPAdapter(max_retries=retry)
    session.mount('http://', adapter)
    session.mount('https://', adapter)
    page1   = session.get(url1)
    j1      = json.loads(page1.text)
    records2.append(j1['total'])

# Scrape using APIs
### Restaurants


<b>Extract restaurants and their information. </b>

In [8]:
All_restaurants = []
for cityid, record in zip(city_id, records):
    url_record  = record // 12 + 1
    for i in range(0,url_record):
        url2    = "https://www.delino.com/restaurant/search/?cityid="+str(cityid)+"&offset="+str(12*i)+"&limit=12&_=1675373603471"
        session = requests.Session()
        retry   = Retry(connect=3, backoff_factor=0.5)
        adapter = HTTPAdapter(max_retries=retry)
        session.mount('http://', adapter)
        session.mount('https://', adapter)
        page2   = session.get(url2)
        j2      = json.loads(page2.text)
        for k in range(len(j2['result'])):
            restaurants_info                   = {}
            restaurants_info['Restaurant_Id']  = j2['result'][k]['id']
            restaurants_info['Name']           = j2['result'][k]['name']
            restaurants_info['Rate']           = j2['result'][k]['rate']
            restaurants_info['Count of Rates'] = j2['result'][k]['rateCount']
            restaurants_info['deliveryTime']   = j2['result'][k]['deliveryTime']
            restaurants_info['City Name']      = city_name_id[j2['result'][k]['cityId']]
            restaurants_info["Address"]        = j2['result'][k]['fullAddress']
            restaurants_info['Latitude']       = j2['result'][k]['lat']
            restaurants_info['Longitude']      = j2['result'][k]['lng']
            All_restaurants.append(restaurants_info)
            
            
df = pd.DataFrame(All_restaurants)
df.to_csv('All_Restaurants_in_Delino.csv')
df

Unnamed: 0,Restaurant_Id,Name,Rate,Count of Rates,deliveryTime,City Name,Address,Latitude,Longitude
0,4d6f01fe-3279-4064-9c1c-6693cf533e54,کافه رستوران نایریکا,4.06,96.0,30 تا 55 دقیقه,تهران,خیابان پونک، خیابان مخبری (35 متری گلستان)، نر...,35.756177,51.324939
1,fdfa5aaf-2d9b-4b0e-a2ec-25fdaab3f835,رستوران شاندیز گالریا,4.73,75.0,35 تا 65 دقیقه,تهران,خیابان ولنجک، خیابان13، پلاک 5، طبقه 6,35.807416,51.404868
2,ebb5ece2-07e6-4900-85e0-3c353fa449ac,رستوران چاشنی,3.90,102.0,60 تا 90 دقیقه,تهران,شریعتی، ابتدای دولت، جنب حسینیه یزدی ها، پلاک 403,35.777941,51.443020
3,f90df589-1b38-49d4-92ff-615f26de5863,رستوران طهرونچی,4.16,43.0,40 تا 60 دقیقه,تهران,خیابان میرداماد، کوچه دفینه، رستوران طهرونچی,35.762086,51.413706
4,cf9670ae-ebb1-4f9f-9689-7feb1f09aaeb,آش و حلیم سید مهدی,3.99,123.0,40 تا 55 دقیقه,تهران,اندرزگو، نرسیده به میدان صالحی، پلاک 16,35.801636,51.458502
...,...,...,...,...,...,...,...,...,...
1237,17f25b56-79b9-49d4-b55e-ac70c1d2d060,رستوران بانی چو,0.00,0.0,30 تا 60 دقیقه,اراک,اراک، خیابان شریعتی، نبش کوچه بانک ملت,34.077674,49.688839
1238,0c04b0eb-2f81-4661-b2e9-7aabd2d9c2f8,رستوران ژیوان,0.00,0.0,20 تا 40 دقیقه,اراک,اراک، خیابان شریعتی، نبش کوچه پامچال,34.076947,49.697736
1239,1f43d015-821b-4b52-b5db-8a677056efd4,پیتزا تک,0.00,0.0,40 تا 60 دقیقه,اراک,اراک، سه راه ابوذر، خیابان ابوذر، روبروی نانوا...,34.095735,49.682997
1240,e4173814-c658-4a0d-8cf4-39b16ded7714,تهیه غذای غذاچی,0.00,0.0,30 تا 50 دقیقه,اراک,اراک-میدان امام حسین-جنب مسجد امام حسین,34.120778,49.704163


# Scrape using APIs
### Restaurants


<b>Extract resaurants and their areas. </b>

In [9]:
All_restaurants_by_area=[]
for geo, record2 in zip(lat_lng, records2):
    url_record2 = record2 // 12 + 1
    for offset in range(url_record2):
        url0    = "https://www.delino.com/restaurant/search/?lat="+str(geo[0])+"&lng="+str(geo[1])+"&offset="+str(12*offset)+"&limit=12"
        session = requests.Session()
        retry   = Retry(connect=3, backoff_factor=0.5)
        adapter = HTTPAdapter(max_retries=retry)
        session.mount('http://', adapter)
        session.mount('https://', adapter)
        page0   = session.get(url0)
        j0      = json.loads(page0.text)
        for i in range(len(j0['result'])):
            restaurant_area         = {}
            restaurant_area['Name'] = j0['result'][i]['name']
            restaurant_area['City'] = city_name_id[j0['result'][i]['cityId']]
            restaurant_area['area'] = j0['area']['text']
            All_restaurants_by_area.append(restaurant_area)
            
df0 = pd.DataFrame(All_restaurants_by_area)
df0.to_csv('All_Restaurants_by_area_in_Delino.csv')
df0

Unnamed: 0,Name,City,area
0,فست فود صاب وی,کرج,110
1,آبمیوه و بستنی تو دلیا,کرج,110
2,خروس,تهران,110
3,رستوران شاندیز گالریا,تهران,آجودانیه
4,کافه GRAB & GO,تهران,آجودانیه
...,...,...,...
63856,رستوران بانی چو,اراک,کوی کوثر
63857,کافه رستوران اسکای,اراک,کوی کوثر
63858,رستوران عقیق اراک,اراک,کوی کوثر
63859,پیتزا سنگی,اراک,کوی کوثر


# Scrape using APIs
### Foods


<b>Extract foods of each restaurant and their information. </b>

In [10]:
All_foods = []
for i in range(len(All_restaurants)):
    id1     = All_restaurants[i]['Restaurant_Id']
    url3    = "https://www.delino.com/restaurant/menu/" + id1
    session = requests.Session()
    retry   = Retry(connect=3, backoff_factor=0.5)
    adapter = HTTPAdapter(max_retries=retry)
    session.mount('http://', adapter)
    session.mount('https://', adapter)
    page3   = session.get(url3)
    if (
    page3.status_code != 204 and
    page3.headers["content-type"].strip().startswith("application/json")
    ):
        try:
            j3 = json.loads(page3.text)
        except ValueError:
            continue
    for j in range(len(j3['categories'])):
        for jj in range(len(j3['categories'][j]['sub'][0]['food'])):
            Restaurants_food                          = {}
            Restaurants_food["Id"]                    = id1
            Restaurants_food["Name"]                  = All_restaurants[i]["Name"]
            Restaurants_food["City Name"]             = All_restaurants[i]["City Name"]
            Restaurants_food["Food_Category"]         = j3['categories'][j]['title']
            Restaurants_food["Title"]                 = j3['categories'][j]['sub'][0]['food'][jj]['title']
            Restaurants_food["Ingredient"]            = j3['categories'][j]['sub'][0]['food'][jj]['ingredient']
            Restaurants_food["Price"]                 = j3['categories'][j]['sub'][0]['food'][jj]['price']
            Restaurants_food["Discount(%)"]           = j3['categories'][j]['sub'][0]['food'][jj]['discountPercentage']
            try:
                Restaurants_food["Food Tag"]          = j3['categories'][j]['sub'][0]['food'][jj]['foodTag'][0]['tag']
            except IndexError:
                Restaurants_food["Food Tag"]          = '-------------'
            Restaurants_food["Sale On Ramadan"]       = j3['categories'][j]['sub'][0]['food'][jj]['saleOnRamadan']
            Restaurants_food["Sale On Breakfast"]     = j3['categories'][j]['sub'][0]['food'][jj]['saleOnBreakfast']
            Restaurants_food["Sale On Noon"]          = j3['categories'][j]['sub'][0]['food'][jj]['saleOnNoon']
            Restaurants_food["Sale On Night"]         = j3['categories'][j]['sub'][0]['food'][jj]['saleOnNight']
            Restaurants_food["Delino Recommendation"] = j3['categories'][j]['sub'][0]['food'][jj]['delinoRecommendation']
            All_foods.append(Restaurants_food)



df1 = pd.DataFrame(All_foods)
df1.to_csv("All_foods_in_Delino.csv")
df1

Unnamed: 0,Id,Name,City Name,Food_Category,Title,Ingredient,Price,Discount(%),Food Tag,Sale On Ramadan,Sale On Breakfast,Sale On Noon,Sale On Night,Delino Recommendation
0,4d6f01fe-3279-4064-9c1c-6693cf533e54,کافه رستوران نایریکا,تهران,پیتزا,پیتزا باهاماس,ژامبون گوشت، ژامبون مرغ، سوسیس ژاپنی، سس مخصوص...,156000,0,-------------,False,False,True,True,False
1,4d6f01fe-3279-4064-9c1c-6693cf533e54,کافه رستوران نایریکا,تهران,پیتزا,پیتزا پپرونی,پپرونی، سس مخصوص، قارچ، زیتون، ذرت,154000,0,-------------,False,False,True,True,False
2,4d6f01fe-3279-4064-9c1c-6693cf533e54,کافه رستوران نایریکا,تهران,پیتزا,پیتزا آفریکانو,فیله مرغ، سس مخصوص، قارچ، زیتون، فلفل دلمه,162000,0,-------------,False,False,True,True,False
3,4d6f01fe-3279-4064-9c1c-6693cf533e54,کافه رستوران نایریکا,تهران,پیتزا,پیتزا سوپریم,بیکن، کراکف، سس مخصوص، قارچ، ذرت، گوجه گیلاسی,163000,0,-------------,False,False,True,True,False
4,4d6f01fe-3279-4064-9c1c-6693cf533e54,کافه رستوران نایریکا,تهران,پیتزا,پیتزا مخصوص نایریکا,گوشت استیک، گوشت مرغ، قارچ، سس مخصوص، زیتون، ذ...,171000,0,-------------,False,False,True,True,False
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
66479,e34a4d8e-1e2a-4703-ab34-1efb3938946a,کافه رستوران ماتادور,اراک,نوشیدنی,دلستر لیمو,,12500,0,-------------,False,False,True,True,False
66480,e34a4d8e-1e2a-4703-ab34-1efb3938946a,کافه رستوران ماتادور,اراک,نوشیدنی,دلستر هلو,,12500,0,-------------,False,False,True,True,False
66481,e34a4d8e-1e2a-4703-ab34-1efb3938946a,کافه رستوران ماتادور,اراک,نوشیدنی,دلستر استوایی,,12500,0,-------------,False,False,True,True,False
66482,e34a4d8e-1e2a-4703-ab34-1efb3938946a,کافه رستوران ماتادور,اراک,نوشیدنی,لیموناد ماتادور,,12500,0,-------------,False,False,True,True,False


# Save CSV dataset


<b>Save CSV datasets using the dataframes. </b>

In [11]:
import zlib
import zipfile


def compress(file_names):
    print("File Paths:")
    print(file_names)
    compression = zipfile.ZIP_DEFLATED
    with zipfile.ZipFile("project1.zip", mode="w") as zf:
        for file_name in file_names:
            zf.write('./' + file_name, file_name, compress_type=compression)


file_names = ["All_Restaurants_in_Delino", "All_foods_in_Delino.csv", 'All_Restaurants_by_area_in_Delino.csv', "Delino_WS.ipynb"]
compress(file_names)

File Paths:
['All_Restaurants_in_Delino', 'All_foods_in_Delino.csv', 'All_Restaurants_by_area_in_Delino.csv', 'Delino_WS.ipynb']
