Skip to content

Commit

Permalink
added huadong
Browse files Browse the repository at this point in the history
  • Loading branch information
simonzg committed Jul 7, 2011
1 parent 7915de5 commit d78a98a
Showing 1 changed file with 53 additions and 29 deletions.
82 changes: 53 additions & 29 deletions dianping/dianping/settings.py
Original file line number Diff line number Diff line change
@@ -1,21 +1,23 @@
# coding=utf-8
# Scrapy settings for dianping project
#
# For simplicity, this file contains only the most important settings by
# default. All the other settings are documented here:
#
# http://doc.scrapy.org/topics/settings.html
#

from os.path import dirname, join

province_dict = {
# 华东地区
# 华东地区:山东、江苏、浙江、安徽、江西、福建、台湾
'shandong':( # 山东
# 济南市 青岛市 淄博市 枣庄市 东营市 烟台市
'jinan', 'zibo', 'zaozhuang', 'dongying', 'yantai',
# 潍坊市 济宁市 泰安市 威海市 日照市 莱芜市 临沂市
'weifang', 'jining', 'taian','weihai','rizhao','laiwu','linyi'
# 德州市 聊城市 滨州市 菏泽市
'dezhou', 'liaocheng', 'binzhou','heze'),

'jiangsu': ( # 江苏
# 南京市 无锡市 徐州市 常州市 苏州市 南通市
'nanjing', 'wuxi', 'xuzhou', 'changzhou', 'nantong',
# 连云港市 淮安市 盐城市 扬州市 镇江市 泰州市 宿迁市
'lianyungang', 'huaian', 'yancheng', 'zhenjiang', 'taizhou', 'suqian'),

'shanghai':('shanghai',),

'zhejiang': ( # 浙江
# 杭州市 宁波市 温州市 嘉兴市 湖州市 绍兴市
'hangzhou','ningbo','wenzhou','jiaxing','huzhou','shaoxing',
Expand All @@ -25,11 +27,40 @@
'anhui':( #安徽
# 合肥市 芜湖市 蚌埠市 淮南市 马鞍山市 淮北市
'hefei','wuhu','bangbu','huainan','maanshan','huaibei',
# 铜陵市 安庆市 黄山市 滁州市 阜阳市 宿州市
'tongling','anqing','huangshan','chuzhou','buyang','suzhou',
# 巢湖市 六安市 亳州市 池州市 宣城市
# 铜陵市 安庆市 黄山市 滁州市 阜阳市 *宿州市
'tongling','anqing','huangshan','chuzhou','buyang','anhuisuzhou',
# 巢湖市 六安市 亳州市(点评不存在) 池州市 宣城市
'chaohu','liuan','haozhou','chizhou','xuancheng'),

'jiangxi':( #江西
# 南昌市 景德镇市 萍乡市 九江市 新余市 鹰潭市
'nanchang','jingdezhen','pingxiang','jiujiang','xinyu','yingtan',
# 赣州市 吉安市 *宜春市 *抚州市 上饶市
'ganzhou','jian','jiangxiyichun','jiangxifuzhou','shangrao'),

'fujian':( # 福建
# 福州市 厦门市 莆田市 三明市 泉州市 漳州市
'fuzhou', 'xiamen' 'putian', 'sanming', 'quanzhou','zhangzhou'
# 南平市 龙岩市 宁德市
'nanping', 'longyan', 'ningde'),

'taiwan':( 'taiwan', ), # 台湾

# 华南地区
'guangdong':(# 广东
# 广州市 韶关市 深圳市 珠海市 汕头市 佛山市
'guangzhou','shaoguan','shenzhen','zhuhai','shantou','foshan',
# 江门市 湛江市 茂名市 肇庆市 惠州市 梅州市
'jiangmen','zhanjiang','maoming','zhaoqing','huizhou','meizhou',
# 汕尾市 河源市 阳江市 清远市 东莞市 中山市
'shanwei','heyuan','yangjiang','qingyuan','dongguan','zhongshan'
# 潮州市 揭阳市 云浮市
'chaozhou','jieyang','yunfu'),

'hainan':(# 海南
# 海口市 三亚市
'haikou','sanya'),

'guangxi':( # 广西
# 南宁市 柳州市 桂林市 梧州市 北海市 防城港市
'nanning', 'liuzhou', 'guilin' 'wuzhou', 'beihai', 'fangchenggang',
Expand All @@ -38,23 +69,16 @@
# 来宾市 崇左市
'laibin', 'chongzuo'),

'shandong':( # 山东
# 济南市 青岛市 淄博市 枣庄市 东营市 烟台市
'jinan', 'zibo', 'zaozhuang', 'dongying', 'yantai',
# 潍坊市 济宁市 泰安市 威海市 日照市 莱芜市 临沂市
'weifang', 'jining', 'taian','weihai','rizhao','laiwu','linyi'
# 德州市 聊城市 滨州市 菏泽市
'dezhou', 'liaocheng', 'binzhou','heze'),

'fujian':( # 福建
# 福州市 厦门市 莆田市 三明市 泉州市 漳州市
'fuzhou', 'xiamen' 'putian', 'sanming', 'quanzhou','zhangzhou'
# 南平市 龙岩市 宁德市
'nanping', 'longyan', 'ningde'),
# 华中地区:河南、湖北、湖南
'henan':(# 河南
# 郑州市 开封市 洛阳市 平顶山市 安阳市 鹤壁市
'zhengzhou','kaifeng','luoyang','pingdingshan','anyang','hebi'
# 新乡市 焦作市 濮阳市 许昌市 漯河市 三门峡市
'xinxiang','jiaozuo','puyang','xuchang','luohe','sanmenxia',
# 南阳市 商丘市 信阳市 周口市 驻马店市
'nanyang','shangqiu','yinyang','zhoukou','zhumadian'),


# 直辖市
'shanghai':('shanghai',),
'beijing':('beijing',),
'chongqing':('chongqing',),
'tianjin':('tianjing',),
Expand Down Expand Up @@ -94,7 +118,7 @@
# LOG_FILE = 'crawl.log'
ITEM_PIPELINES = ['dianping.pipelines.DianpingPipeline']

TARGET_PROVINCE = ['jiangsu','zhejiang','shanghai']
TARGET_PROVINCE = ['jiangsu','zhejiang','shanghai','shandong','anhui','fujian','jiangxi','taiwan',]
cities = set()
for p in TARGET_PROVINCE:
cities = cities.union(province_dict[p])
Expand Down

0 comments on commit d78a98a

Please sign in to comment.