Skip to content

JustinLee32/qiu_zhao_jing_yan

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 

Repository files navigation

2020届秋招血泪史——算法工程师(凉经+面经)+ 推荐书目、课程(不定期更新)

先说说互联网各岗位的招聘难度吧。总的来讲:算法(图像 > 自然语言 > 机器学习) > 开发(后端 > 前端) > 测试、运维

再说说本人今年的情况,秋招共投递70余家公司,岗位主要是算法、数据挖掘。

秋招投递情况:

  • 简历挂:PayPal,博世,平安科技,字节跳动,东方财富,智加科技,顺丰科技,阿里巴巴,网宿科技,paypal,友塔,银联,莉莉丝游戏,米哈游
  • 笔试挂(包括笔试完没消息的):360,拼多多,京东,网易严选,滴滴,奇安信,巨人网络,依图科技,爱奇艺,美团点评,网易云音乐,网易游戏,腾讯,震坤行,心动网络,商汤科技,唯品会,工商银行,科大讯飞,中金所
  • 面试挂:携程,58,中国电信-云计算,第四范式,同花顺,上海银行,akuna,甜橙金融,通联数据,触宝,哈啰出行,招银网络科技,喜马拉雅
  • 面试流程走完: 小红书,乐鑫,酷家乐


个人认为,想要在校招中斩获较好的算法工程师offer的话,那么以下几点是必须的。


  1. 实习经历,这一点很重要。因为大的公司虽然每年校招进去的有很多,但是在面试的时候公司还是会青睐于有实习经历的学生。(毕竟招进去是打工干活的-.-)
  2. 项目经历。个人简历上除了教育经历和获奖经历之外,很大一部分就是项目经历了。项目经历在简历上一定要有完整的体现。包括项目基本情况介绍,用了什么技术栈等等。因为在面试的时候,面试官会问你的项目。
  3. 论文。好的论文能直接获得面试官的认可,还能弥补实习或项目经历的不足。
  4. 多打比赛,如kaggle,天池等,可以将这些比赛作为你的项目经历写在简历上。
  5. 数据结构!数据结构!数据结构!不解释,学不好连面试机会都没有!
  6. 熟练掌握一门主语言(算法工程师建议python)。熟练掌握是指你能单独进行开发工作。比如算法开发等等。了解一门或多门副语言(建议C++和Java),副语言最好是能够达到刷题的水平。因为有些公司的笔试会限定编程语言,如果你只会python,那就对着屏幕哭吧……
  7. 最好可以熟练使用Linux系统,毕竟是攻城狮(码农……)
  8. 最好要会写SQL!如果懂数据库原理那更好!因为算法工程师他也是开发人员,理论上来讲,应该先具备计算基本的开发能力,然后再是算法的开发。



接下来的一部分用来记录秋招的面试。(按时间先后排列)

********************九月份面试******************************


2019-09-20 58集团(算法工程师,一面,凉)

(15min)

58集团我感觉是招偏开发的算法工程师。开始之后自我介绍,然后面试官装模作样问了我5分钟机器学习的东西。然后,切入正题,你Linux用的熟吗?数据库会吗?面试官见我都不会,自然就凉了。最后丢给我一句有点像安慰但更像讽刺的一句话:虽然数学是学科之母,但是我们还是想要招计算机的。我:告辞!


2019-09-24 携程(机器学习,一面,凉)

(15min)

这算是面试体验最差的一次,进去先自我介绍,介绍完讲实习讲项目。讲完项目面试官说我这个项目不行,然后怼了我一番。最后问我有什么想要问他的,我就知道凉了。总共时间不超过15分钟。一个字:惨。


2019-09-25 上海银行(IT科技岗<数据挖掘>,一面,凉)

(30min)

第一次银行面试,特点就是需要正装,且等候时间较长。面试是五个面试官对三个学生。 先自我介绍。然后看你投了什么方向对应面试官问你。

  1. 有没有用过机器学习模型?
  2. 用它来跑了哪些数据集?
  3. 数据集有多大?
  4. 特征怎么筛选?
  5. 损失函数是什么?
  6. 评估指标是什么?
  7. 最后结果怎么样? 面完一周没消息,凉。(这里需要注意,对于流程不长的公司,如果面完一周都没消息的话,基本认定自己凉了)


2019-09-26 中国电信-云计算(算法工程师,一面,凉)

(20min)

照常先自我介绍,研究生阶段的研究方向,paper情况。

  1. rpc与http的区别?(项目中用到)
  2. 你用什么语言?IDE?遇到bug怎么办? 总的面试时间不超过20分钟,凉(如果发现自己面试时长很短,那基本也是凉)


2019-09-27 招银网络科技(算法工程师base杭州,电话一面,凉)

(15min)

先自我介绍,问项目。

  1. word2vec的两种模式?叫什么?
  2. 神经网络模型怎么防止过拟合?
  3. 随机梯度下降法的原理? 总共不到15分钟,答得不好,凉凉。


2019-09-28 第四范式(机器学习建模工程师base上海,视频一面,凉)

(45min)

先自我介绍,问实习,问项目,问数学建模。

  1. 机器学习的算法有哪些?
  2. 随机森林能讲讲吗?
  3. Leetcode1004 (Medium) 由于代码没撕出来,所以凉了。怪自己太菜,一面总共45min.


2019-09-28 同花顺(机器学习base杭州,电话一面,凉)

(30min)

先自我介绍,问实习,问项目。

  1. 用过哪些神经网络模型?
  2. 用神经网络模型跑过哪些数据集?
  3. 怎么进行优化?
  4. 损失函数是什么?
  5. 怎么防止过拟合?
  6. 用的什么框架?
  7. TensorFlow中,CNN的卷积核怎么定义?
  8. TensorFlow中怎么定义一个占位符?
  9. 聊聊家里情况?
  10. 最近看了什么书?
  11. 能来杭州面试吗? 自己作死,说如果火车票报销就去杭州面试,还以为稳进终面,结果反手一个挂……事实证明,公司招算法真的不缺求职者。


至此,国庆节之前一家走完流程的都没有,打算国庆节回家几天,调整心态,返校再战。


********************十月份面试******************************


2019-10-15 Akuna capital(初级量化研究员base上海,电话一面,凉)

(40min)

全英文面试,用我捉急的口语讲完自我介绍,开始问问题。

  1. 机器学习哪些模型?
  2. 随机森林怎么进行特征的选取?
  3. 一道概率题:四个点组成一个环。可以认为四个点分别是东、南、西、北,一个人从东开始走,往顺时针走,逆时针走的概率均为50%,当他走遍东南西北四个点时,停止。问:他最终停在南的概率是多大?进一步,如果是N个点围成一个圈的情况呢? 概率题没做出来,凉。


2019-10-17 哈啰出行(算法工程师,一面,凉)

(45min)

自我介绍。

  1. 讲实习,讲项目。
  2. Bagging和boosting的区别?
  3. 你知道ARIMA?讲一下?它在什么数据集中不适用?
  4. EM算法原理?
  5. 给定1-N这N个自然数,问总共能形成多少种不同的搜索二叉树?
  6. LR损失函数的推导?
  7. SVM判别函数?SVM对偶形式的推导?
  8. 知道哪些聚类算法?选一个详细讲讲?这些聚类算法有没有用到EM算法的思想?
  9. K-means的损失函数是什么? 部分机器学习问题答得不好,公式没推出来,凉凉。


2019-10-17 甜橙金融(数据建模工程师,一面,凉)

(15min)

自我介绍。

  1. 做过哪些机器学习的项目?
  2. 知道哪些机器学习的模型?
  3. bagging和boosting的区别?
  4. 信息熵的定义?用程序实现一下? 答得还可以,面试官也跟我说有接下来的面试,然后接下来莫名其妙的没消息了???


2019-10-17 酷家乐(算法工程师-EGS图形渲染方向,电话面)

(20min)
自我介绍
  1. 讲实习,讲项目。
  2. 学校里学了哪些内容?
  3. 了解过计算机图形相关的内容吗?
  4. 愿意过来实习吗?什么时候? 电面结束,面试官叫我先看看计算机图形学的知识,过一段时间现场面试。


2019-10-18 小红书(算法工程师,一面,二面)

一面:(80min)
  1. 自我介绍
  2. 代码题:Leetcode120 三角形的最短路径和(Medium)
  3. 代码题:已知两个数组,分别表示一棵二叉树的前序遍历和中序遍历,打印这棵二叉树的后序遍历?(要求:不能生成树)
  4. 简单的项目介绍。

二面:(90min)

  1. 自我介绍
  2. 实习介绍,项目介绍
  3. 研究生阶段学过哪些课程?主要研究方向是什么?
  4. 代码题:实现一个Max-pooling的程序。(要求:不能用暴力法)
  5. 逻辑回归损失函数的推导。
  6. 正则化常用的方法?为什么L1正则化能够使得模型的特征权值变稀疏?
  7. AUC值的含义是什么?它越靠近什么代表模型越好?
  8. 如果随机删除90%的正样本,那么AUC值(或ROC曲线)会如何变化? 由于约的是下午3点钟开始,导致技术面面完两轮已经晚上6:30了。所以只能另选日期进行面试,然后约了下周进行第三轮技术面。


2019-10-19 通联数据(算法工程师,一面,二面,凉;量化工程师,一面,凉)

算法一面:(30min)

自我介绍。

  1. 知道哪些深度学习模型。
  2. 神经网络防止梯度消失的方法。
  3. RNN知道吗?
  4. 知道哪些机器学习模型?
  5. HMM是什么,解释一下?

量化一面:(30min)

  1. ARIMA模型解释一下?
  2. 逻辑回归怎么处理多分类问题?
  3. 笔试编程题复现。
  4. 知道哪些金融学模型?
  5. 如何使得在投资组合的时候风险最小化?
  6. PE是什么?写一下公式? 量化很多金融知识没接触过,直接凉。

算法二面:(30min)

自我介绍。

  1. TF-IDF是什么?
  2. Word-embedding的方式有哪些?
  3. Word2vec的两种模式?它的原理能讲讲吗?
  4. Bert知道吗?讲一下?
  5. 给你很多文本,如何进行文本关键词的抓取?
  6. 设计一个算法,实现新闻搜索的推荐。要求:考虑时间复杂度和空间复杂度。
  7. PageRank是什么,能讲一下吗?它的公式是什么?
  8. LSTM用过吗?如何设计一个LSTM结构,来完成命名实体识别任务? 算法二面答得不好,凉凉。


2019-10-21 小红书(算法工程师,三面)

(60min)

自我介绍

  1. 讲实习,讲项目(三面项目问得很细)。
  2. 概率题:一个盒子中有n个红球,m个绿球,p个蓝球。现在不放回地取球(每次取一个),问取到的球的顺序恰好与给定序列(如:“红绿蓝红绿*蓝*红”,其中“*”表示红绿蓝均可以)一致的概率是多少?
  3. 谈谈你对推荐系统的了解?
  4. 谈谈如何进行冷启动?
  5. 知道深度学习的那些模型?
  6. 对于DNN,dropout技术有人有不同的看法。在给定百分比a之后,有人说训练时按照这个百分比忽略边,而有人说训练时按照这个百分比忽略节点。请问这两种作法有什么不同?
  7. 你怎么对数据集做特征筛选? 三面结束没有HR面,一度认为自己凉了,结果一周后打电话说面试通过……


2019-10-22 乐鑫(AI鑫星,一面,HR面,等总裁面)

一面(20min)

自我介绍。

  1. 讲实习,讲项目。
  2. 研究生阶段的研究方向介绍。
  3. 笔试复现:lstm公式
  4. 笔试复现:一道笔试的编程题,笔试的时候只写了递归的方法,面试官问有复杂度较低的方法。写了个记忆化搜索,面试官说其实直接动态规划就好了。

HR面(20min) 秋招以来第一次HR面…… 查户口,问理想中的公司是什么样的,个人发展方向,期望工资,兴趣爱好。 然后跟我说等总裁面。


2019-10-23 喜马拉雅(AI算法,一面,凉)

(40min)

自我介绍。

  1. 讲实习,将项目。
  2. 什么是似然?
  3. word-embedding的方式有哪些?
  4. Word2vec原理?它是怎么学习词向量的?
  5. 神经网络如何防止过拟合?
  6. 计算机基础准备得怎么样?
  7. 给你一颗二叉树,层序遍历打印这棵树的节点。
  8. 写sql,给一个学生成绩表,列为std_id, course_name, score,尝试找出每个学生考得第二高的学科的名称。
  9. 谈谈假设检验里的p值的意思。
  10. 谈谈你对矩阵的秩的理解。
  11. 如何快速生成1-100这100个自然数。 有几个问题答得不好,sql不会,凉凉。


2019-10-25 触宝(大数据研发,二面,凉)

一面(45min)

自我介绍。 面试官看我是本来想投算法的,因为hc的关系转投了大数据,所以说两个都会问我一些。

  1. 大数据了解哪些?
  2. 分布式计算是什么意思?
  3. 数据库原理知道吗?
  4. 知道哪些word-embedding的方式?
  5. Word2vec的原理能解释一下吗?
  6. Word2vec怎么学习近义词?(以苹果和香蕉为例)
  7. 编程题,类似于leetcode855(Medium)

二面(40min) 自我介绍。

  1. 介绍实习,介绍项目。
  2. 你了解触宝吗?
  3. 给你一个没有词频的字典和一个句子,尝试将这个句子分词?(代码实现)
  4. 假设检验,显著性水平?
  5. 数学专业主要学什么?就业方向是什么?


2019-10-28 乐鑫(AI鑫星,总裁面)

(40min)
  1. 知道Chebyshev Polynomial, Legendre Polynomial吗?写一下。
  2. 本科,研究生学过什么?
  3. 矩阵的逆怎么求?如果不是方阵呢?
  4. 广义逆有几种?写一下?
  5. 高等代数讲了什么?
  6. 讲一下你对特征值,特征向量的理解。
  7. 复变函数是什么?
  8. 讲一下Cauchy-Riemann Theorem.
  9. 讲一下Residue Theorem.
  10. 一道概率题,若四个小孩至少有一个是男孩,问这四个小孩中年龄最小的是男孩的概率是多少?
  11. 讲一下batch-Normalization.
  12. 你期望的薪资是多少?哪里听来的消息?
  13. 还有什么想问的?


2019-10-29 酷家乐(算法工程师-EGS图形渲染方向,一面,二面,三面)

一面:(30min)

自我介绍

  1. 讲实习,讲项目。
  2. 对计算机图形学的了解程度?
  3. 写一下曲面的第一基本形式。
  4. 空间中一个点绕一条已知直线旋转一定的角度,求旋转后这个点的坐标?
  5. 解释一下两个向量向量积为什么可以写成一个三阶行列式的形式?
  6. 一个向量到另一个向量的投影是什么?
  7. 点到直线的距离公式?
  8. 空间两条异面直线的距离?
  9. 空间两条异面直线与两直线的交点坐标怎么求?如果用几何法怎么解?
  10. 智力题:几个人过河最短时间问题

二面:(30min) 自我介绍

  1. 讲实习,讲项目。
  2. 了解OpenGL吗?知道哪些图形渲染的技术?
  3. Leetcode11(Medium)

三面:(30min) 自我介绍

  1. 讲实习和项目。
  2. 计算机图形学看得怎么样?
  3. 我这有三篇论文(计算机图形学领域的英文文章),你选一篇看15分钟,然后跟我讲大致写了什么。
  4. 什么时候能来实习?


附录一:个人刷题代码和校招笔试题代码


附上自己刷题记录(有一些模板,持续更新)

https://github.com/JustinLee32/cai_niao_shua_ti

和今年校招的真题代码思路(不完整)

https://github.com/JustinLee32/2020_chun_qiu_zhao

附录二:一些比较好的课程


数据结构与算法:

左程云(左神)基础班 + 进阶班就可以了。资金充足可以在牛客网上报名,网上也有免费的资源(不全,但是足够了)

基础班链接
若无法点击请复制:https://www.bilibili.com/video/av53422535?from=search&seid=9953885936505675938

进阶班链接
若无法点击请复制:https://www.bilibili.com/video/av69111252/?spmidfrom=333.788.videocard.0

机器学习与深度学习:

吴恩达,李宏毅,斯坦福大学公开课这些经典资源,可以自行在网络上搜索。

机器学习白板推导系列
若无法点击请复制:https://github.com/shuhuai007/Machine-Learning-Session

个人觉得《机器学习白板推导》系列视频注重数学的推导,由于在面试过程中我们不免会遇到一些面试官要求你推导数学公式,所以看看这个视频还是非常有帮助的!


附录三:一些比较好的书籍和讲义


编程语言基础:

《Python编程从入门到实践》

数据结构与算法:

《算法导论》
《剑指offer》
《数据结构(Python)语言描述》

机器学习与深度学习:

《统计学习方法(第二版)》
《深度学习》(花书)
《百面机器学习》(葫芦书)

自然语言处理:

《统计自然语言处理》
《python自然语言处理实战:核心技术与算法》
提取码:y01b

推荐系统:

《推荐系统开发实战》
《推荐系统算法实践》

语音识别:

《解析深度学习语音识别实践》

其他资源:

《菜菜sklearn讲义》
提取码:0rh5
该视频课程完整版需要付费,这个是完整课程的配套讲义,可以在B站上找到课程的免费版本。
机器学习-算法校招面试题库(附答案与解析)电子版
提取码:o549

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published