智能Web算法(第2版)

书名:智能Web算法(第2版)
作者:【英】DouglasG.McIlwraith(道格拉斯G.麦基尔雷思)/【美】HaralambosMarmanis(哈若拉玛玛若曼尼斯)/【美】DmitryBabenko(德米特里•巴邦科)
译者:达观数据/陈运文等
ISBN:9787121317231
出版社:电子工业出版社
出版时间:2017-7
格式:epub/mobi/azw3/pdf
页数:248
豆瓣评分:

书籍简介:

机器学习一直是人工智能研究领域的重要方向,而在大数据时代,来自Web 的数据采集、挖掘、应用技术又越来越受到瞩目,并创造着巨大的价值。本书是有关Web数据挖掘和机器学习技术的一本知名的著作,第2 版进一步加入了本领域最新的研究内容和应用案例,介绍了统计学、结构建模、推荐系统、数据分类、点击预测、深度学习、效果评估、数据采集等众多方面的内容。《智能Web算法(第2版)》内容翔实、案例生动,有很高的阅读价值。 《智能Web算法(第2版)》适合对算法感兴趣的工程师与学生阅读,对希望从业务角度更好地理解机器学习技术的产品经理和管理层来说,亦有很好的参考价值。

作者简介:

Haralambos (Babis) Marmanis 博士是一个把机器学习技术应用于工业界的先行者,也是供应管理的世界级专家。Dmitry Babenko曾经为银行、保险、供应链管理与商务智能公司设计过应用与基础架构。

本书拥有者可以通过 www.manning.com/AlgorithmsoftheIntelligentWeb在线获得作者的信息、样例代码与免费的电子版本。

Dr. Haralambos (Babis) Marmanis is a pioneer in the adoption of machine learning techniques for industrial solutions, and also a world expert in supply management. He has about twenty years of experience in developing professional software. Currently, he is the director of R&D and chief architect, for expense management solutions, at Emptoris, Inc. Babis holds a Ph.D. in applied mathematics from Brown University, an M.S. degree in theoretical and applied mechanics from the University of Illinois at Urbana-Champaign, and B.S. and M.S. degrees in civil engineering from the Aristotle University of Thessaloniki in Greece. He was the recipient of the Sigma Xi award for innovative research in 2000, and he is the author of numerous publications in peer-reviewed international scientific journals, conferences, and technical periodicals.

Dmitry Babenko is the lead for the data warehouse infrastructure at Emptoris, Inc. He is a software engineer and architect with 13 years of experience in the IT industry. He has designed and built a wide variety of applications and infrastructure frameworks for banking, insurance, supply-chain management, and business intelligence companies. He received a M.S. degree in computer science from Belarussian State University of Informatics and Radioelectronics.

书友短评:

@ 堪察加灯塔 观其大略 @ 赤橙酱 看此书有种看论文的感觉,时不时丢出几个没见过的术语,但从不多花一点笔墨介绍,只有页脚给的一个参考文献。我有一点python编程经验,有基础的机器学习知识,看起来很吃力,到后来索性就随便翻翻,了解下大概原理就行,纯当开阔眼界了。如果你没有编程、机器学习、统计,任何一方面的知识,那就更难了 @ 达观数据 由达观数据翻译的新版《智能Web算法》,读者可以看到智能算法是怎样从数据中抽取出真实有价值的信息的,核心的机器学习概念也通过scikit-learn的Python代码示例进行讲解。 @ 堪察加灯塔 观其大略 @ 赤橙酱 看此书有种看论文的感觉,时不时丢出几个没见过的术语,但从不多花一点笔墨介绍,只有页脚给的一个参考文献。我有一点python编程经验,有基础的机器学习知识,看起来很吃力,到后来索性就随便翻翻,了解下大概原理就行,纯当开阔眼界了。如果你没有编程、机器学习、统计,任何一方面的知识,那就更难了 @ 达观数据 由达观数据翻译的新版《智能Web算法》,读者可以看到智能算法是怎样从数据中抽取出真实有价值的信息的,核心的机器学习概念也通过scikit-learn的Python代码示例进行讲解。

书籍目录

第1章 为智能Web建立应用1
1.1 智能算法的实践运用:Google Now 3
1.2 智能算法的生命周期5
1.3 智能算法的更多示例6
1.4 不属于智能应用的内容 7
1.4.1 智能算法并不是万能的思考机器 7
1.4.2 智能算法并不能成为完全代替人类的工具8
1.4.3 智能算法的发展并非一蹴而就 8
1.5 智能算法的类别体系9
1.5.1 人工智能 9
1.5.2 机器学习10
1.5.3 预测分析 11
1.6 评估智能算法的效果 13
1.6.1 评估智能化的程度 13
1.6.2 评估预测14
1.7 智能算法的重点归纳 16
1.7.1 你的数据未必可靠 16
1.7.2 计算难以瞬间完成 17
1.7.3 数据规模非常重要 17
1.7.4 不同的算法具有不同的扩展能力 18
1.7.5 并不存在万能的方法 18
1.7.6 数据并不是万能的 18
1.7.7 模型训练时间差异很大18
1.7.8 泛化能力是目标19
1.7.9 人类的直觉未必准确 19
1.7.10 要考虑融入更多新特征 19
1.7.11 要学习各种不同的模型 19
1.7.12 相关关系不等同于因果关系 20
1.8 本章小结20
第2章 从数据中提取结构:聚类和数据变换21
2.1 数据、结构、偏见和噪声 23
2.2 维度诅咒26
2.3 k-means算法27
2.3.1 实践运用 k-means31
2.4 高斯混合模型 34
2.4.1 什么是高斯分布34
2.4.2 期望最大与高斯分布 37
2.4.3 高斯混合模型 37
2.4.4 高斯混合模型的学习实例 38
2.5 k-means和GMM的关系41
2.6 数据坐标轴的变换 42
2.6.1 特征向量和特征值 43
2.6.2 主成分分析 43
2.6.3 主成分分析的示例 45
2.7 本章小结47
第3章 推荐系统的相关内容48
3.1 场景设置:在线电影商店 49
3.2 距离和相似度 50
3.2.1 距离和相似度的剖析 54
3.2.2 最好的相似度公式是什么 56
3.3 推荐引擎是如何工作的57
3.4 基于用户的协同过滤 59
3.5 奇异值分解用于基于模型的推荐 64
3.5.1 奇异值分解 64
3.5.2 使用奇异值分解进行推荐:为用户挑选电影66
3.5.3 使用奇异值分解进行推荐:帮电影找到用户71
3.6 Net.ix竞赛74
3.7 评估推荐系统 76
3.8 本章小结78
第4章 分类:将物品归类到所属的地方79
4.1 对分类的需求 80
4.2 分类算法概览 83
4.2.1 结构性分类算法84
4.2.2 统计性分类算法86
4.2.3 分类器的生命周期 87
4.3 基于逻辑回归的欺诈检测 88
4.3.1 线性回归简介 89
4.3.2 从线性回归到逻辑回归91
4.3.3 欺诈检测的应用94
4.4 你的结果可信吗 102
4.5 大型数据集的分类技术 106
4.6 本章小结 108
第5章 在线广告点击预测.109
5.1 历史与背景 110
5.2 广告交易平台 112
5.2.1 cookie 匹配 113
5.2.2 竞价(bid) 113
5.2.3 竞价成功(或失败)的通知 114
5.2.4 广告展示位 114
5.2.5 广告监测 115
5.3 什么是bidder 115
5.3.1 bidder的需求 116
5.4 何为决策引擎 117
5.4.1 用户信息 117
5.4.2 广告展示位信息 117
5.4.3 上下文信息 117
5.4.4 数据准备 118
5.4.5 决策引擎模型 118
5.4.6 将点击率预测值映射为竞价价格 118
5.4.7 特征工程 119
5.4.8 模型训练 119
5.5 使用Vowpal Wabbit进行点击预测 120
5.5.1 Vowpal Wabbit的数据格式 120
5.5.2 准备数据集123
5.5.3 测试模型 128
5.5.4 模型修正 131
5.6 构建决策引擎的复杂问题132
5.7 实时预测系统的前景 133
5.8 本章小结 134
第6章 深度学习和神经网络.135
6.1 深度学习的直观方法 136
6.2 神经网络 137
6.3 感知机 139
6.3.1 模型训练 141
6.3.2 用 scikit-learn训练感知机142
6.3.3 两个输入值的感知机的几何解释144
6.4 多层感知机146
6.4.1 用反向传播训练 150
6.4.2 激活函数 150
6.4.3 反向传播背后的直观理解152
6.4.4 反向传播理论 153
6.4.5 scikit-learn中的多层神经网络 155
6.4.6 训练出来的多层感知机 158
6.5 更深层:从多层神经网络到深度学习 159
6.5.1 受限玻耳兹曼机 160
6.5.2 伯努利受限玻耳兹曼机 160
6.5.3 受限玻耳兹曼机实战 164
6.6 本章小结 167
第7章 做出正确的选择168
7.1 A/B测试 170
7.1.1 相关的理论170
7.1.2 评估代码 173
7.1.3 A/B测试的适用性174
7.2 多臂赌博机175
7.2.1 多臂赌博机策略 176
7.3 实践中的贝叶斯赌博机策略 180
7.4 A/B测试与贝叶斯赌博机的对比 191
7.5 扩展到多臂赌博机192
7.5.1 上下文赌博机 193
7.5.2 对抗赌博机193
7.6 本章小结 194
第8章 智能Web的未来196
8.1 智能Web的未来应用197
8.1.1 物联网 197
8.1.2 家庭健康护理 198
8.1.3 自动驾驶汽车 198
8.1.4 个性化的线下广告199
8.1.5 语义网 199
8.2 智能Web的社会影响200
附录A 抓取网络上的数据.201
· · · · · ·

  • the similarity matrix is symmetrical. This simply means that if user A is similarity to user B with a similarity value X then user B will be similar to user A with a similarity value equal to X.
    —— 引自第84页
  • Bell and Keorren are leading the Netflix prize competitioin (at the time of this writing), and their assessment was the following: "we found no perfect models. Instead, our best results came from combining predictions of models that complemented each other."
    —— 引自第118页
  • 添加微信公众号:好书天下获取

    添加微信公众号:“好书天下”获取书籍好书天下 » 智能Web算法(第2版)
    分享到: 更多 (0)

    评论 抢沙发

    评论前必须登录!

     

    添加微信公众号:“好书天下”获取书籍

    当当网十五万种图书