各种缺失的数据成为暗数据。关注的就是那些你并未拥有的数据——也许是你想要拥有、希望拥有,或者认为自己已经拥有但实际上并未拥有的数据。
作者从统计学的角度,在书中提出并用许多例子证明:那些缺失的数据至少与你实际拥有的数据同样重要。你看不见的数据有可能误导你,有时甚至会造成灾难性的后果。作者阐释了这些情况如何发生,以及为什么会发生。
进一步阐释如何运用暗数据视角,改变传统的数据分析方式,更好地优化决策,更合理地选择行动方案。
前言
部分暗数据:原因与结果
章暗数据:塑造世界的无形力量
幽灵数据
你真的拥有全部数据吗?
被忽略的“无事发生”
暗数据的力量
就在我们身边
第2章探索暗数据:收集到的与没收集到的
来自各方的暗数据
数据废气、选择和自我选择
以小见大
实验数据
注意人性的弱点
第3章定义与暗数据:你想知道什么?
定义差异与错误测量
你不能测量所有事物
筛查
基于过往表现的选择
第4章非故意的暗数据:
说一套,做一套
大视界
汇总
人为差错
仪器限制
连接数据集
第5章方略性暗数据:博弈、反馈和信息不对称
博弈
反馈
信息不对称
逆向选择和算法
第6章故意的暗数据:欺诈与欺骗
欺诈
身份盗用与网络诈骗
个人财务诈骗
金融市场欺诈与内幕交易
保险诈骗
其他欺诈形式
第7章科学与暗数据:科学发现的本质
科学的本质
早知道就好了
暗数据碰出新世界
暗数据打开大视野
隐瞒事实
撤回
出处和可信度:谁告诉你的?
第二部分阐明和使用暗数据
第8章处理暗数据:让光照进来希望
在已观测数据与缺失的数据之间建立关联
识别数据缺失机制
利用已有数据开展工作
超越数据:如果你先死怎么办?
超越数据:插补
迭代
错误数据
第9章从暗数据中获益:重构问题
隐藏数据
对自己隐藏数据:随机对照试验
可能发生的事
复制的数据
想象的数据:贝叶斯先验性
隐私与机密保护
从暗处收集数据
0章暗数据分类:走出迷宫之路
暗数据分类法
启示
参考文献
译者后记发自暗处的光