-
Notifications
You must be signed in to change notification settings - Fork 2
Members jinqi
jinqi edited this page Oct 11, 2018
·
21 revisions
- GitLab Shared Runner创建
- 已经完成搭建服务的文档整理,详见这里
- 由于Jumpserver coco不能自动推送服务器用户账号,所以会改用Ansible方式对服务器进行账号推送(进行中) 明天继续整理未完成部分文档;完成Ansible管理服务器账号功能代码;熟悉dockerize_
- Jumpserver terminal 问题排查
- 重新注册terminal(已经完成)
- Gitlab runner完成ansible部署程序
- 升级Gitlab到11.3.4
取消Jira的Ansible部署方案(涉及版权)
明天整理已经完成服务部分的文档整理;启动docker部署研究
- Jumpserver ldap登录尝试(未成功)
- Jumpserver内网数据整理
- 整理机器(已经完成)
- 查找密码(待验证)
- 搭建并启用openldap web工具phpLdapAdmin, 域名:ldap.eefocus.qa (192.168.0.201)
- 尝试Jumpserver的OpenLDAP登录,进行中...
- 所有配置相关的Ansible代码已经上传到 http://git.eefocus.qa/eefocus/playbooks
- Confluence wiki服务搭建,域名:wiki.eefocus.qa(192.168.0.201)
- 调试并完成Confluence使用OpenLdap账号登录功能
- 调试并完成Nextcloud使用openldap账号登录功能
- 调试并完成Gitlab使用OpenLdap账号登录功能
- 尝试调试并使用OpenLDAP账号登录Jumpserver服务,但是尚未成功(配置反馈已经成功,但是登录貌似没有默认开启,待查)
- openldap账号管理研究
- 完成内网gitlab搭建, 域名:git.eefocus.qa (192.168.0.201)
- 完成openldap服务搭建
- 完成内网gitlab搭建, 域名:git.eefocus.qa (192.168.0.201)
- openldap服务搭建,进行中
- 完成内网Jumpserver问题调试, 域名:j.eefocus.qa (192.168.0.201)
- 完成内网Nextcloud搭建,域名:f.eefocus.qa (192.168.0.201)
- 完成内网Docker Registry搭建, 域名:h.eefocus.qa (192.168.0.201)
192.168.0.201同时是个域名服务器,如果把本机的dns指向201,可以省去上述hosts配置过程
- 完成内网Jumpserver安装的Ansible程序
- 日志分析结果
1.访问页面占比分析
- /tag/xxxx 页面访问量占31.19%
- /news/xxxx 页面访问量占28.54%
- /wp-admin/xxxx 页面访问量占22.55%
2.UserAgent占比分析
- 百度蜘蛛访问量占68.74%
- Windows访问量占10.67%
- Google蜘蛛访问量占4.29%
- yisouspider访问量占2.44%
- bing, iphone, android 访问量各占2%左右
- 剩余是其他占比
- 请求方法占比分析
- GET 占 98.31%
- POST 占 1.47%
- HEAD 占 0.21%
- OPTIONS 占 0.02%
- 返回状态码占比分析
- 200码占79.95%
- 301码占13.1%
- 302码占3.38%
- 404码占1.97%
- 502码占1.4%
- 剩余为其他状态码
- 基于docker环境部署jumpserver的Ansible程序调试(CentOS 6),遇到Docker-CE已经不支持CentOS 6问题,放弃CentOS的Docker环境,改用CentOS 7
- 内网创建CentOS 7环境,调整部分Ansible程序来适配CentOS 7
- eeboard日志分析(页面访问量统计)
- 基于docker环境部署jumpserver的Ansible程序调试(CentOS 6)
- eeboard日志分析(ip/访问量,UserAgent/访问量统计)
- jumpserver线上环境数据备份(备用)
- 192.168.0.140服务器高负载问题追踪
- 负载有高于8的情况出现,
- Jumpserver的安装尝试与试用
- 找到5000端口的websocket服务无法正常启动问题的原因:需要先在web中注册终端后方能正常启动;
- 整理服务器资源,按服务器与域名两个维度进行。
- 192.168.0.140服务器高负载问题追踪
- 跟踪负载基本低于8
- Jumpserver的安装尝试与试用
- 尝试在外网产品环境部署Jumpserver,遇到5000端口的websocket服务无法正常启动问题,调研进行中
- 关于用户统一问题,考虑使用LDAP服务统一用户基本信息管理。
- 192.168.0.140服务器高负载问题追踪
- 一天负载基本低于8
- WARNING: [pool nobody] seems busy (you may need to increase pm.start_servers, or pm.min/max_spare_servers)的错误继续出现。
根据一个fpm进程占用75M左右内存,nginx,varnish需要使用2-3G左右的内在,即(8000-1024*2)/75 = 79个,目前设置成70个还算比较合理。即内存使用上已经达到极限。
- Jumpserver的安装尝试与试用
- 在Docker中运行Jumpserver
- 尝试使用Jumpserver登录服务器
目前key的加载有些问题,但是可以使用用户名与密码对服务器进行登录。
-
192.168.0.140服务器高负载问题追踪
- 调试发现首页有大于1M图片,页面整体大小大于3.4M左右,页面加载完成时间耗时50s左右(预计使用CDN对静态资源加速后,可以再缩小页面加载时间);
- 禁用SlowLog加快php处理、减小响应时间;
- 启动并使用Supervisor管理fpm;
- 今天140机器负载维持在小于15,对比昨天有所降低。继续观察。
-
核对内网部分服务器
- 18台可用
- 7台不可用
- (其余继续尝试连接并整理中)
- 192.168.0.140服务器负载高问题查看中
- 改动与尝试:
- 启用php-fpm慢日志(之前没有开启);
- 尝试加大pm.max_children, pm.start_servers等值,但是修改后服务器负载直冲60~70,放弃;
- 停用/usr/local/script/check_httpd-new.sh脚本,它会让fpm无故重启,已经改用Supervisord监控fpm;
- 停用SWAP,调整部分Kernel参数
- 开启fpm的status页面,供调试参考
- 发现:
- vmstat 结果发现cs与in值偏高,暂时没有深入追查引起偏高的具体原因
- netstat 统计发现TIME_WAIT状态的连接明显高于其他状态连接
- 改动与尝试:
- 熟悉运维交接文档资料
- 启动eeboard服务器负载高问题查找
- 完成工作电脑环境配置
- 熟悉nagios中服务器与分组情况
- 系统权限管理方案(RBAL)讨论
- 入职手续办理
- 工作电脑环境准备
- 熟悉项目wiki