Skip to content

Latest commit

 

History

History
87 lines (44 loc) · 5 KB

lab03.md

File metadata and controls

87 lines (44 loc) · 5 KB

实验三、数学之美文献阅读

文献简介

几年前,“数学之美”系列文章原刊载于谷歌黑板报,获得上百万次点击,并被热情的读者广为传播,得到高度评价。读者说,读了“数学之美”,才发现大学时学的数学知识,比如马尔科夫链、矩阵计算,甚至余弦函数原来都如此亲切,并且栩栩如生,才发现自然语言和信息处理这么有趣,才真正明白“数学是科学的皇后”这句名言。

今年,作者吴军博士几乎把所有的文章都重写了一遍,为的是能把高深的原理讲得更加通俗易懂,让非专业读者也能领略数学的魅力。经过改写和重构后,《数学之美》在整体和细节的度上控制得更好。希望读者通过具体的例子学到的是思考问题的方式,学会如何化繁为简,如何用数学去解决工程问题,如何跳出固有思维不断去思考创新。同时书中也留了很多问题给愿意钻研的人做进一步深入思考。

作者简介

吴军博士,现任腾讯公司主管搜索、在线广告和云计算基础架构的副总裁,毕业于清华大学(本科、硕士)和美国约翰·霍普金斯大学(博士)。在清华大学和约翰·霍普金斯大学期间,吴军博士致力于语音识别、自然语言处理,特别是统计语言模型的研究。他曾获得 1995 年全国人机语音智能接口会议的最佳论文奖和 2000 年 Eurospeech 的最佳论文奖。

吴军博士于 2002 年加入 Google 公司。在 Google ,他和 Amit Singhal( Google 院士,世界著名搜索专家)、Matt Cutts( Google 反作弊官方发言人)等三位同事一起开创了网络搜索反作弊的研究领域,并因此获得 Google 工程奖。2003 年,他和 Google 全球架构的总工程师朱会灿博士等共同成立了中日韩文搜索部门。吴军博士是当前 Google 中日韩文搜索算法的主要设计者。在 Google 期间,他还领导了许多研发项目,包括许多与中文相关的产品和自然语言处理的项目,并得到了当时公司首席执行官埃里克·施密特和创始人谢尔盖·布林的高度评价。

吴军博士在国内外发表过数十篇论文,并获得和申请了十余项美国和国际专利。他撰写的《浪潮之巅》一书深受业界的好评。他于 2007 年起担任风险投资基金中国世纪基金的董事。2011 年起,当选为约翰·霍普金斯大学工学院董事会董事,并在该校的国际事务委员会担任顾问。他是国家重大专项“新一代搜索引擎和浏览器”项目的总负责人,从 2012 年起任职工业与信息化部的专家和顾问。

阅读途径

下载地址:百度网盘

文献目录

数学之美一、统计语言模型

数学之美二、谈谈中文分词

数学之美三、隐含马尔可夫模型在语言处理中的应用

数学之美四、怎样度量信息?

数学之美五、简单之美:布尔代数和搜索引擎的索引

数学之美六、图论和网络爬虫 (Web Crawlers)

数学之美七、信息论在信息处理中的应用

数学之美八、贾里尼克的故事和现代语言处理

数学之美九、如何确定网页和查询的相关性

数学之美十、有限状态机和地址识别

数学之美十一、Google 阿卡 47 的制造者阿米特.辛格博士

数学之美十二、余弦定理和新闻的分类

数学之美十三、信息指纹及其应用

数学之美十四、谈谈数学模型的重要性

数学之美十五、繁与简——自然语言处理的几位精英

数学之美十六、不要把所有的鸡蛋放在一个篮子里——最大熵模型

数学之美十七、闪光的不一定是金子——谈谈搜索引擎作弊问题(Search Engine Anti-SPAM)

数学之美十八、矩阵运算和文本处理中的分类问题

数学之美十九、马尔可夫链的扩展——贝叶斯网络 (Bayesian Networks)

数学之美二十、自然语言处理的教父——马库斯

数学之美二十一、布隆过滤器(Bloom Filter)

数学之美二十二、由电视剧《暗算》所想到的——谈谈密码学的数学原理

数学之美二十三、输入一个汉字需要敲多少个键——谈谈香农第一定律

数学之美二十四、从全球导航到输入法——谈谈动态规划

推荐阅读

数学之美三、隐含马尔可夫模型在语言处理中的应用

数学之美四、怎样度量信息?

数学之美七、信息论在信息处理中的应用

数学之美十四、谈谈数学模型的重要性

数学之美十六、不要把所有的鸡蛋放在一个篮子里最大熵模型

数学之美十九、马尔可夫链的扩展——贝叶斯网络 (Bayesian Networks)

数学之美二十三、输入一个汉字需要敲多少个键——谈谈香农第一定律

数学之美二十二、由电视剧《暗算》所想到的——谈谈密码学的数学原理