书名:文本上的算法——深入浅出自然语言处理
作者:路彦雄
译者:
ISBN:9787115475879
出版社:人民邮电出版社
出版时间:2018-3-1
格式:epub/mobi/azw3/pdf
页数:212
豆瓣评分: 6.2
书籍简介:
本书结合作者多年学习和从事自然语言处理相关工作的经验,力图用生动形象的方式深入浅出地介绍自然语言处理的理论、方法和技术。本书抛弃掉繁琐的证明,提取出算法的核心,帮助读者尽快地掌握自然语言处理所必备的知识和技能。本书主要分两大部分。第一部分是理论篇,包含前3章内容,主要介绍一些基础的数学知识、优化理论知识和一些机器学习的相关知识。第二部分是应用篇,包含第4章到第8章,分别针对计算性能、文本处理的术语、相似度计算、搜索引擎、推荐系统、自然语言处理和对话系统等主题展开介绍和讨论。本书适合从事自然语言处理相关研究和工作的读者参考,尤其适合想要了解和掌握机器学习或者自然语言处理技术的读者阅读。
作者简介:
路彦雄,西安电子科技大学硕士毕业,从事自然语言处理和机器学习相关工作多年,具有丰富经验。曾任微信小微机器人技术负责人,现任微信整合搜索算法组组长。
目录
书友短评:
@ 旺财 通俗易懂 @ Seal Huang 通俗易懂 @ ericuni 比较通俗, 但是公式还是有很多不懂的, 不太适合初级入门 @ Mihai 感觉写的比较散乱。。。都是蜻蜓点水 @ 此间的少年 3.5星,前几章不行,后面渐入佳境,看得出来作者是有搜索和推荐领域实际经验又没有放松对业界论文学习的 @ 旺财 通俗易懂 @ Seal Huang 通俗易懂 @ ColinMacmillan 3.5星,前几章不行,后面渐入佳境,看得出来作者是有搜索和推荐领域实际经验又没有放松对业界论文学习的 @ 要减肥的小楠 打分的都是水军吗?内容这么浅显,逻辑这么混乱的书也能有这么高的分数?我觉得这本书上的内容写成博客就成了……根本没有成为书的必要。
理 论 篇
第1章 你必须知道的一些基础知识………………………………………3
1.1 概率论 ……………………………………………………………3
1.2 信息论 ……………………………………………………………4
1.3 贝叶斯法则 ………………………………………………………7
1.4 问题与思考 ………………………………………………………10
第2章 我们生活在一个寻求最优解的世界里……………………………11
2.1 最优化问题 ………………………………………………………11
2.2 最大似然估计/最大后验估计 …………………………………15
2.3 梯度下降法 ………………………………………………………17
2.4 问题与思考 ………………………………………………………22
第3章 让机器可以像人一样学习…………………………………………23
3.1 何谓机器学习 ……………………………………………………23
3.2 逻辑回归/因子分解机 …………………………………………29
3.3 最大熵模型/条件随机场 ………………………………………34
3.4 主题模型 …………………………………………………………40
3.5 深度学习 …………………………………………………………50
3.6 其他模型 …………………………………………………………88
3.7 问题与思考 ………………………………………………………97
应 用 篇
第4章 如何计算得更快…………………………………………………101
4.1 程序优化 ………………………………………………………101
4.2 分布式系统 ……………………………………………………105
4.3 Hadoop …………………………………………………………107
4.4 问题与思考 ……………………………………………………114
第5章 你要知道的一些术语……………………………………………115
5.1 tf/df/idf …………………………………………………………115
5.2 IG/CHI/MI ………………………………………………………116
5.3 PageRank ………………………………………………………118
5.4 相似度计算 ……………………………………………………119
5.5 问题与思考 ……………………………………………………125
第6章 搜索引擎是什么玩意儿…………………………………………126
6.1 搜索引擎原理 …………………………………………………126
6.2 搜索引擎架构 …………………………………………………129
6.3 搜索引擎核心模块 ……………………………………………130
6.4 搜索广告 ………………………………………………………148
6.5 问题与思考 ……………………………………………………153
第7章 如何让机器猜得更准……………………………………………155
7.1 基于协同过滤的推荐算法 ……………………………………156
7.2 基于内容的推荐算法 …………………………………………158
7.3 混合推荐算法 …………………………………………………159
7.4 问题与思考 ……………………………………………………163
第8章 理解语言有多难…………………………………………………164
8.1 自然语言处理 …………………………………………………164
8.2 对话系统 ………………………………………………………176
8.3 语言的特殊性 …………………………………………………186
8.4 问题与思考 ……………………………………………………190
结语…………………………………………………………………………191
参考文献……………………………………………………………………193
· · · · · ·
异步图书深度学习系列(共37册),这套丛书还有《PyTorch深度学习实战》《TensorFlow深度学习项目实战》《深度学习与围棋》《PyTorch生成对抗网络编程》《精通数据科学:从线性回归到深度学习》等。
添加微信公众号:好书天下获取
评论前必须登录!
注册