算法霸权-好书天下

书名：算法霸权数学杀伤性武器的威胁
作者：[美]凯西·奥尼尔
译者：马青玲
ISBN：9787508692067
出版社：中信出版社
出版时间：2018-9-1
格式：epub/mobi/azw3/pdf
页数：320
豆瓣评分： 7.2

书籍简介：

数据科学家凯西•奥尼尔认为，我们应该警惕不断渗透和深入我们生活的数学模型——它们的存在，很有可能威胁到我们的社会结构。我们生活在一个依赖“算法”的时代，它对我们生活的影响越来越大，我们去哪里上学，我是不是应该贷款买车，我们应该花多少钱来买健康保险，这些都不是由人来决定的，而是由大数据模型来决定的。从理论上来说，这一模型应该让社会更加公平，每一个人的衡量标准都是一样的，偏见是不存在的。但是，正如凯西•奥尼尔书里所揭示的那样，事实并非如此。我们今天所使用的这些数学模型是不透明的、未经调节的、极富争议的，有的甚至还是错误的。最糟糕的是，数学模型和大数据算法加剧了偏见与不公。例如，一个贫困学生想申请贷款交付学费，但是银行大数据算法根据他居住地的邮政编码判断将钱带给他存在风险，因此，拒绝给他提供贷款。他因此失去了受教育的机会，而这个机会可能帮助他摆脱贫困。大数据算法做的常常只是锦上添花的事儿，有时甚至是落井下石。通过个案追踪，凯西•奥尼尔揭示了大数据是如何影响我们将来的，它不仅影响着个人，也影响着整个社会。这些数据评价着我们的老师、学生，筛选着我们的简历，审核着我们的贷款资格，衡量着员工的工作态度，监视着投票者，监控着我们的健康。凯西•奥尼尔呼吁数据模型的创造者们要对算法负责，政策的制定者及执行者们在使用这一威力极大的“武器”前应该更加慎重。最后，作者指出，大数据几乎掌控着我们的生活，我们应该增加对它的了解。这本书相当的重要，它让我们有能力去问一些十分尖锐的问题，帮助我们了解事实的真相，提出需要改变的地方，探索更好的生活。【编辑推荐】  案例丰富，内容兼具深度与话题性未来20年，算法和大数据将席卷世界，接管我们的生活、社会和经济。我们生活中的很多方面都将落入自动化的数据分析之下。确保算法和大数据的公平性将是一项重大的任务，数据伦理的价值和意义将不断凸显出来。在作者看来，大数据犹如一个黑盒，规模、伤害和隐秘共存，她在书中引用了大量发生在美国当下的、基于大数据和算法的、改变个人生活的案例，并对影响这些城市生活经验的算法做了特别的观察和研究。作者认为，数据和算法的关系就像枪械和军火，数据没有价值观，是中立的，但来自人类行为的输入，难免隐含偏向，而算法创造的数据又对人类行为产生反作用，从而导致更多的不公。凯西在书中指出：算法模型一旦运转，执法行为就会增多，产生的新数据又会进一步证明加强执法的必要性。形象地说，就是哪里“前科”越多，哪里就越受算法“关照”，最终形成一个失真，甚至有害的回馈环路。这个观点也正是近来Facebook干预美国大选，国内很多专家学者热议“今日头条”推送模式的核心所在。  权威作者的深刻洞见本书作者是哈佛大学的数学博士，研究方向是数论和代数几何，毕业之后在麻省理工学院执教，并在互联网公司做过很长时间的数据科学家，如今致力于教育和媒体行业的数据知识普及工作，因此，这并不是一本传统意义上唱衰大数据的书，相反，作者希望让更多的人通过了解大数据、了解算法，反思模型，以及通过政府和相关机构的合理监管，不断改善各类设计评价体系，让更多的人受益，维护社会的公平与民主。【英文版获奖情况】《纽约时报》（New York Times）年度书籍《波士顿环球报》年度最佳图书《连线》杂志年度必读书目之一《财富》年度最受欢迎的书之一《柯克斯评论》年度最佳作品芝加哥公共图书馆年度最佳图书《自然》网站年度最佳图书《麻省理工科技评论》年度最佳科技图书

作者简介：

凯西•奥尼尔（Cathy O'Neil）

数据科学家，mathbabe.org的博主。博士毕业于哈佛大学，主修数学专业。她曾在巴纳德学院任教，之后为私营企业服务，例如避险基金。她还在各类新型公司担任数据科学家，预测消费者购买与点击趋势。每周她都会出现在“财富记账”的播客上。

书友短评：

@ slavezero 1、公平是模糊的，很难量化，关键在于如何界定公平；2、作者提到，“电子评分建模者回答的是，像你这样的一类人过去的行为表现如何。理想情况下，应该问的问题是，你过去的行为表现如何。但是这很难区分；3、作者认为，“数据越多越好是信息时代的指导原则，但是考虑到社会公平，一部分数据理应被排除在外”。怎么办：1、确保信用评分的公平性；2、确保消费者可以看到数据档案对评分的影响，禁止在信用评分中纳入种族或者性别因素；3、参考欧洲模式：规定收集任何数据都必须经过用户的批准，用户有选择权，禁止将数据用于其他目的；4、对生活有重大影响的模型，包括信用评分系统和各类电子评分系统，都应该对公众公开 @ 柚儿圆科普闲聊的写法，内容和想法好过某些社会学的博论 @ Friedhelm 有价值的是列举了出了许多非常具有探讨意义的算法模型。（目前国内的算法模型感觉还处于黑箱） @ 兰斯洛特大学教育和算法排名那一章给我很多启发，非常通俗易懂，几乎每个提出的领域都值得更深入的探讨研究 @ 流奎感谢这样的学者和专家，对“人”的关注。算法是信息化时代科技进步的产物，算法在现代生活中看不见、摸不着，却又无处不在，个人认为算法本身没有好坏之分，但是算法背后的偏见与冷漠却是可以人为控制的。对算法的监管和审查制度的完善是改善算法霸权现象是一条可行路径，以此倒逼算法的纠正与正向进化。不要把所有的希望和解决办法都寄托与科技的乌托邦中，制造问题的是人，解决问题的同样是人。 @ momo 数学杀伤性武器的三个特征：不透明、规模化、毁灭性 @ 寒绥作为数据科学家，很明白有的弱智为什么会认为其例子既夸张，又充满偏见。操作过实例模型的最知道技术是如何冰冷的推脱责任的。 @ 足浅有评论说这本书对数据和算法的批判充满了偏见。我觉得，这本书着重批评的是算法使用者利用算法看似客观的外壳注入自己的价值判断，从而更规模化地损害社会公平，重点并不全在批判算法本身。所以，这本书其实是把技术伦理而非技术哲学问题，带到公众视野之中。当然，这本书的确案例冗长、理论分析较少，但作为一本畅销书而不是学术著作，理论分析或许也不是它最大的价值所在。

书籍目录

引文
第一章盲点炸弹
不透明、规模化和毁灭性
第二章操控与恐吓
弹震症患者的醒悟
第三章恶意循环
排名模型的焦虑和杀伤性的对立面
第四章数据经济
掠夺式广告的赢家
第五章效率权衡与逻辑漏洞
大数据时代的正义
第六章筛选
颅相学的偏见强化
第七章反馈
辛普森悖论的噪声
第八章间接损害
所有数据都是信用数据？
第九章 “一般人”公式
沉溺与歧视
第十章正面的力量
锁定微目标的出发点
结束语
注释
索引
· · · · · ·

出于提升排名名次的需要，各个大学就像管理投资组合一样管理着自己的学生。这在大数据领域里很常见，小到广告业大到政治领域都是如此。在校领导看来，每一个准大学生都代表着一组资产和一两项债务。比如，一名高中生在体育赛事上的优秀表现就被视为一种资产，但同时她的成绩可能处于中下游水平，后者就是她背负的债务。她可能还需要申请助学金，这又是一项债务。为了平衡投资组合，他们应该发掘其他能自费上学并且成绩优秀的考生。但是那些理想考生即使被录取了也可能会选择去其他更好的学校。这也是一个必须要量化的风险。鉴于整个评估体系非常复杂，为了“优化招生”，教育咨询产业兴起了。教育咨询公司诺埃尔–莱维茨(Noel-Levitz)开发了一个被称为“预告+”(Forecast Plus)的预测性分析软件包。该软件包允许招生老师根据地理位置、性别、种族、研究领域、学术地位及“任何其他特征”对准大学生的情况进行评估。另一个名叫“定位学生”(Right Student)的咨询机构则致力于收集、买卖相关数据以帮助大学客户找到最适合录取的学生人选，包括可以支付全额学费的学生，以及可能有资格获得校外奖学金的学生。就这个意义而言，学习障碍对于大学录取可能反而是个优势。……教育公司的专业人士了解每个学校的招生模型，所以他们知道怎样让一个准大学生被纳入其目标学校的“投资组合”之中。一位加州的企业家在教育产业把市场分析法发挥到了极致。他叫马振翼，是美国星腾科国际教育集团的创始人。他用自己开发的模型评估准大学生，计算他们被目标院校录取的可能性。他对《彭博商业周刊》的记者表示，假设一个美国高中生的平均学分绩点(GPA)为3.8，SAT成绩为2000分，课外活动时间为800小时，那么他被纽约大学录取的概率为20.4%，被南加州大学录取的概率为28.1%。然后，星腾科将提供一份有担保的建议组合。如果这个学生接受了咨询公司的建议辅导并…

—— 引自章节：排名模型的焦虑和杀伤性的对立面

在研究数学杀伤性武器的时候，我们常常需要在公平和效率之间进行权衡。我们的法律传统更倾向于公平。例如，宪法就假定一个人是清白的。站在建模者的立场，无罪推定是一个约束条件，其带来的副作用让一些确实有罪的人被判无罪释放，特别是那些能够请得起优秀律师的人。即使是那些被判有罪的人也有权对判决提出上诉，而这又会消耗大量的时间和资源。因此，我们的法律体系在很大程度上牺牲了效率来保证公平。宪法的隐含判断是，相比监禁或处决一个无辜的人，因缺乏证据释放一个很可能犯了罪的人对我们的社会造成的危害更小。相反，数学杀伤性武器更倾向于效率。本质上，数学杀伤性武器建基于可测量和可计算的数据。但公平是模糊的，很难量化，它是一个抽象概念。我们的计算机程序尽管在语言学习和逻辑学习方面有所进步，但仍然不能很好地理解抽象概念。它们所理解的“美”只是一个与大峡谷、海洋日落和时尚杂志的美容美发相关联的词，它们试图通过计算脸书上的点赞数和关系网来衡量“友谊'”。而到目前为止，计算机还完全不理解公平这个概念。程序员不知道该如何为公平编码，他们的老板也很少会要求他的做这件事。

—— 引自第103页

添加微信公众号:好书天下获取

算法霸权

书籍简介：

作者简介：

书友短评：

相关推荐

评论抢沙发

评论前必须登录！

添加微信公众号:“好书天下”获取书籍

书籍简介：

作者简介：

书友短评：

相关推荐

评论 抢沙发

评论前必须登录！

添加微信公众号:“好书天下”获取书籍

评论抢沙发