手撕包菜网站
使用CentOS7操作系统。
- 按照MongoDB
yum install mongodb mongodb-server
- 运行MongoDB
service mongod start
- 按照nodejs10
curl -sL https://rpm.nodesource.com/setup_10.x | bash -
yum install nodejs
- 安装pm2
npm install -g pm2
- 运行环境
cd spider && npm install && cd ..
cd web && npm install && npm run build && cd ..
- 启动爬虫
cd spider/ && pm2 start ecosystem.config.js && cd ..
- 启动web
cd web && pm2 start ecosystem.config.js && cd ..
- 配置web 配置nginx访问web页面。
yum install nginx
service nginx start
vim /etc/nginx/conf.d/ssbc.conf
加入以下配置。
server {
listen 80;
server_name www.xxx.com;
location / {
proxy_pass http://localhost:3001;
}
}
- 安装SphinxSearch
yum install http://sphinxsearch.com/files/sphinx-2.3.2-1.rhel7.x86_64.rpm
- 创建目录
mkdir -p /data/bt/index/db /data/bt/index/binlog
- 初始化索引
cd spider indexer -c sphinx.conf hash searchd -c sphinx.conf
这是 www.shousibaocai.org 的网站源代码。 开源的目的是为了促进技术交流和相互学习,把DHT与搜索引擎技术应用到更广泛的领域去。
本站于2015年5月使用django改写。 本站于2019年使用nodejs改写。 与爬虫相关的代码都在目录spider目录下。
相关文章请查看作者博客: http://xiaoxia.org/2015/05/15/shousibaocai-opensource/