小伙伴你好!欢迎申请【第一财经数据科技公司】的【爬虫开发工程师】职位。
【第一财经数据科技公司】是【阿里巴巴】和【第一财经】的合资子公司,主要业务为B端数据咨询与数据新媒体。【爬虫开发工程师】这一职位属于本公司【技术创新部】中的【数据工程组】,在公司业务中发挥重要角色。
作为【爬虫工程师】,你的工作成果直接或间接贡献于:
- 数据媒体与数据报告
- 第一财经商业数据中心CBNData
- 数据媒体【DT财经】
- 明星大数据【星数】
- 蚂蚁财富投研资讯
- 数据建模与挖掘
- 商业咨询与运营策略制定
- 客户涵盖”阿迪达斯“、”卡西欧“等知名企业
- 跨领域数据数据服务(城市与商业数据)
在这里,你将与以下部门的同事一起合作:
- 技术创新部的工程师(大多为985/211,海归硕士,BAT等大厂背景)
- 算法科学家、ETL工程师,数据分析师、行业研究员
- 数据可视化设计师、数据报告编辑、渠道运营等
【数据工程组】常用的技术栈和工具包含但不限于:
- Requests, Scrapy, Scrapy-Redis, Scrapy-Splash
- Charles, mitmproxy, Appium, Selenium, PhantomJS
- PostgreSQL, MongoDB, Redis
- numpy, pandas, scikit-learn
- Docker, Kubernetes
- 阿里云系列:OSS, 数据工厂(Dataworks), 数据湖(DataLakeAnalytics)
- 克隆或下载本代码仓库到本地
- 安装Python3和Jupyter notebook开发环境(如果没有安装的话)
- 启动 Jupyter notebook,并根据本目录下【第一财经数据科技公司——爬虫开发工程师】笔试题.ipynb 文件说明完成。