计算社会学

good

有关这项实验的学术部分我将在第4章进行介绍,但现在,我将告诉你们一件我的毕业论文或其他任何论文都未涉及的事情。 P6

例如,这本书不会教你如何使用现有的推特应用程序界面(Twitter API),相反,它会教你如何受益于大数据资源(第2章)。 P7

因此,相比于其目前的发展水平,它的变化速度更让我感到兴奋不已。 P8

在一个为期一学期的课程中,你也可以每周给学生分配一些任务。 P9

研究人员从卢旺达最大手机供应商的数据库中随机抽样进行调查,以完成对财富与贫困的研究,这个数据库中有150万名客户。 P11

研究人员现在能以不久前还几乎不可能的方式观察行为、提出问题、开展实验以及彼此协作。 P12

这些变化为社会研究人员创造了不可思议的机会。 P13

例如,一个网上商店很容易就可以搜集到精确的数百万顾客的购买行为数据。 P14

一方面,这本书是写给社会科学家的,他们接受过社会行为研究方面的训练,也有这方面的经验,但对数字时代所带来的机会不是很熟悉。 P15

第一个主题可以通过对比马塞尔·杜尚(Marcel Duchamp)和米开朗琪罗(Michelangelo)这两位伟人来阐述。 P16

而《大卫》则是有意创造的艺术品,是一件非现成品艺术作品。 P17

因此,即便是善意的研究人员,在面对强大的控制力和模糊的指导方针时,可能也会被迫去做一些艰难的抉择。 P18

也就是说,如果选择对参与者提问,那我们将获得仅通过观察行为无法获得的信息。 P19

为解决这一问题,我认为研究人员应该采用基于原则的方法。 P20

例如,每当你点开一个网站,用手机打一个电话,或用信用卡付款,商家就会创建并存储一条有关你行为的数字记录。 P22

许多人接触到数字时代社会研究的第一种方式是通过人们通常所说的大数据。 P23

首先是现实世界中数字设备所产生的越来越多的公司的大数据资源。 P24

因此,我将介绍大数据资源的10个一般性特征,而不是采用一种平台化的方法(例如分别介绍对推特、谷歌等平台,你需要知道什么)。 P25

)但是,每当看到类似的数据时,你都应该提出这样的问题:这些数据真的有用吗?如果数据的长度只够从地球到月球往返一次,那么人们还能做同样的实验吗?如果数据的长度只能到达珠穆朗玛峰的顶部或者埃菲尔铁塔的顶部又会怎么样呢?事实上,针对谷歌图书语料库的这一研究确实需要一个收录有多年词汇量的巨大语料库。 P26

尽管海量数据确实会减少随机误差出现的概率,但它实际上又增加了系统误差出现的概率。 P27

与关注示威期间参与者的典型研究相比,事后纵向数据增加了:(1)示威前、后参与者的数据;(2)示威前、中、后非参与者的数据。 P28

社会科学家通常把这一现象称为反应性(Webb et al. 1966)。 P29

2.3.4 不完整性不管你的大数据有多大规模,其中仍可能没有你想要的信息。 P30

对不熟悉构念效度的研究人员来说,可以参阅表2.2中使用数字痕迹测量理论构念的研究实例。 P31

一份报告称,该数据中心能够存储和处理所有形式的通信信息,包括“私人电子邮件、手机通话和谷歌搜索的完整内容,以及停车收据、旅行路线、书店采购记录和其他‘口袋垃圾’等各种形式的个人数字痕迹”(Bamford 2012)。 P32

其次,你能提出的问题可能是有限的,因为公司不太可能允许你开展有损其形象的研究。 P33

然而,如果要回答另外一个也很重要的问题——在疫情暴发期间,伦敦的霍乱患病率是多少,上述两家公司的数据就不再适用了,我们需要的是一个能代表全伦敦人口的代表性样本。 P34

换句话说,基本免费的推特数据似乎可以取代传统的民意调查,传统的民意调查往往比较昂贵,因为它注重搜集的是代表性数据。 P35

2.3.7 漂移用户漂移、行为漂移以及系统漂移使利用大数据资源研究长期趋势变得困难。 P36

第三种漂移是系统漂移。 P37

在线社交网络中的可迁性是一种由述行性引发的规律。 P38

研究人员一般会用通过数月甚至数年搜集而来的回顾性数据研究人们对悲惨事件的反应。 P39

然而,这些表面看起来包含愤怒情绪的信息大多是由一个自动传呼机产生的。 P40

这些信息可以被用于针对健康的重要研究,但如果将其公之于众,就可能导致情感伤害(例如尴尬)或经济伤害(例如失业)。 P41

接下来我们将探讨适用于这些数据的研究策略。 P42

这些策略并不相互矛盾,也并非详尽全面的。 P43

根据经济学中的新古典主义模型,出租车司机的小时收入高时,其一天的工作小时数也会更高。 P44

但在这里,我想集中介绍的是一种特殊的预测——临近预测(nowcasting),这个术语来源于“现在”和“预测”的结合。 P45

谷歌流感趋势最初的预测还是很准确的,但随着时间的推移,其预测的准确度也开始逐渐下降(Cook et al. 2011; Olson et al. 2013; Lazer et al. 2014)。 P46

因为漂移和算法干扰,谷歌流感趋势的第二个重要局限是,从短期来看,对美国疾病控制与预防中心的流感数据,谷歌流感趋势易于给出错误的预测;从长期来看,它的预测能力在逐渐减弱。 P47

第二个策略是对非实验数据进行统计调整,使其不受两类人在研究开展前就存在的差异的影响。 P48

我们可以通过亚历山大·马斯(Alexandre Mas)和恩里科·莫雷蒂(Enrico Moretti)在2009年的一项研究进一步了解数字时代的这一策略。 P49

在第4章进一步探讨实验时,我们将再次回归到这两个重要的话题——处理效应的异质性和原理。 P50

安格里斯特想要评估的是服兵役对收入的影响,但在该事例中,服兵役并不是随机分配的,随机的是被征召的对象。 P51

他们对易贝上的拍卖比较感兴趣,在介绍他们的研究时,我将侧重于他们有关起拍价对拍卖结果(例如成交价或成交可能性)的影响的研究。 P52

经美国经济学会转自Einav et al.(2015),图1b。 P53

对在0.05~0.85之间的起拍价来说,其对成交价的影响是很小的。 P54

与自然实验一样,利用匹配进行因果推断在很多情况下也会产生错误的结论。 P55

今天的大数据资源往往具有以下10个特征,未来的大数据资源也可能如此。 P56

与人交谈在过去是社会研究的一个重要组成部分,我希望将来也是如此。 P59

表3.1 调查研究的三个时代/调查研究第二个时代和第三个时代之间的过渡并不是一帆风顺的,关于研究人员应如何继续开展调查研究,一直存在激烈的争论。 P60

但其实并不是这么简单,我认为研究人员还会继续将提问作为获取数据的一种方法,主要原因有两个。 P61

有时这个差异很小,所以也就不重要了,但遗憾的是,有时这个差异很大且很重要。 P62

但在现实中,他们经常需要在偏差和方差之间进行权衡。 P63

每小时,在《文学文摘》自己的邮局里,三台铿铿作响的邮资机在为白色的长方形信封加盖戳记并封上信封,熟练的邮政员工将这些信封放入鼓鼓的邮袋中,邮袋经《文学文摘》的卡车被快速送至专门的邮车……一周后,1000万张选票会被陆续返回,上面填有相应的答案,我们会对其进行三次检查核实、五次交叉分类,然后汇总。 P64

那些被成功采访的人叫受访者。 P65

然后多明我会的教士问道:“你的神父怎么说?”耶稣会的回答道:“他说是没问题的。 P66

改编自Schumann and Presser(1996),表8.1。 P67

正如上述有关问题形式和提问方式效应的事例所表明的一样,研究人员搜集的答案可能会受到他们提问方式的影响。 P68

3.3.3 成本调查不是免费的,这也是一个实际存在的限制因素。 P69

尽管在抽样的早期,这两种方法都在被使用,但如今概率抽样处于主导地位,而且许多社会研究人员被教导要对非概率抽样持极其怀疑的态度。 P70

改编自Meyer, Mok, and Sullivan(2015),图1。 P71

尽管“杜威击败杜鲁门”事件发生在1948年,但它仍然是许多研究人员对非概率样本持怀疑态度的原因之一。 P72

研究人员招募的受访者来自Xbox游戏系统,而且如你可能预料的一样,该样本偏男性化、年轻化。 P73

事后分层的关键是正确分组。 P74

也就是说,王伟和同事结合了事后分层和分层回归两种方法,因此他们将该策略称为事后分层及分层回归,或更亲切地称之为“P先生”。 P75

但有一件事是可以肯定的,那就是如果你不得不使用非概率样本或不具代表性的大数据资源(回想一下第2章),那你有充分的理由相信,相比于利用未经调整的原始数据得出评估结论,通过事后分层和相关技术得出的评估结论会更好。 P76

调查误差总框架促使研究人员将调查研究作为一个由两部分组成的过程来思考,这两个部分分别是招募受访者和向他们提问。 P77

接下来,我将介绍两种提问的方法,表明研究人员如何借助数字时代的工具以不同的方式发问:用来在更合适的时间和地点测量内部状态的生态瞬时评估法(3.5.1小节)以及结合了开放式问题和封闭式问题优点的维基调查(3.5.2小节)。 P78

除了这些调查问题以外,手机还会定期记录他们的地理位置,并以加密的方式记录有关打电话和发短信的元数据。 P79

3.5.2 维基调查维基调查为封闭式问题和开放式问题的结合提供了新的可能。 P80

尽管开放式问题和封闭式问题可以产生完全不同的信息,而且两种形式的问题在调查研究的早期都很受欢迎,现在处于主导地位的却是封闭式问题。 P81

/ 图3.10 一个维基调查的界面。 P82

到目前为止,我已经向大家介绍了一些新的提问方法,而计算机管理的调查则对这些方法的出现起到了促进作用。 P83

首先,相比于陌生人,朋友更可能给出相同的答案,但即使是很亲密的朋友,也在约30%的问题上持不同的观点;其次,参与者往往高估自己与朋友的相似度,换句话说,朋友之间在看法上的大多数差异都没有被注意到;最后,在有关政治的严肃问题上以及有关喝酒和超能力的轻松问题上,参与者对自己与朋友在看法上的差异的感知基本是一样的。 P84

它们没有以彼此为基础,也没有借助世界上现有的其他数据。 P85

在扩充型提问(3.6.2小节)中,大数据资源中没有研究人员感兴趣的核心数据,但研究人员可以用它来扩充调查数据。 P86

因此,安索拉比赫和赫什借助本章前面提到的大型社会调查——合作国会选举研究,搜集了他们想要的数据。 P87

这一过程,无论多么小心,都会使原始数据资源中的错误得以传播,同时还会引发新的错误。 P88

在过去,搜集此类数据的研究人员一般只能采取以下两种方法中的一种:抽样调查或人口普查。 P89

这一步中至关重要的一点是,好的特征工程需要研究人员了解研究环境。 P90

在该事例中,一个简单的替代方法就是预测每个人都会给出最常见的回答。 P91

他们还利用通话记录中的位置信息(通话记录中有每次通话时用户离得最近的手机信号塔的位置)评估了每个人大致的居住地(图3.16)。 P92

接下来,他们创建了一个监督式学习模型,以通过上述矩阵预测调查答案。 P93

但我认为这并不是解读该研究的正确方式,原因有以下两点。 P94

然后,我总结了在调查研究的前两个时代发展起来的调查误差总框架,该框架有助于研究人员开发和评估调查研究第三个时代的方法(3.3节)。 P96

当研究人员开展实验时,他们会系统性地干预世界,以创造出最适合因果关系问题的数据。 P98

我曾听过这种方法被描述为“干扰观察法”。 P99

例如,在过去,要想测量数百万人的行为可能很困难,但现在这已经是许多数字系统的常规了。 P100

这一点很重要,因为这意味着可以将两组在结果上的任何差异归因于处理,而不是混杂因素。 P101

在过去,研究人员发现,实验室实验和实地实验是一个实验连续体的两端,介于这两者之间组织实验是有帮助的。 P102

对于这一现象有许多可能的解释,其中一个是雇主对有孩子的女性存有偏见。 P103

最后,许多实地实验的支持者批判了实验室实验对特殊参与者的依赖,这些特殊参与者主要来自西方、文化水平高,是工业化、富裕和民主的国家的学生(Henrich, Heine, and Norenzayan 2010a)。 P104

改编自Bohanon(2016)。 P105

利用不间断运行的测量系统(更多有关不间断运行的测量系统的内容可参见第2章)开展实验,是最有可能具备这三点的,即规模、预处理信息以及纵向处理和结果数据。 P106

相反,该类型实验其实是为了回答一个更具体的问题:在特定的时间对特定数量的参与者进行此次特定的实验,会产生怎样的平均效应呢?我个人会把以这种范围狭小的问题作为出发点的实验称为简单实验。 P107

每次拜访时,研究人员都需手动记录下相应家庭电表的读数。 P108

但是,第二栏表明,该平均处理效应实际上包含了两种相互抵消的效应。 P109

采用被试间设计的实验的一个典型例子就是雷斯蒂沃和范德里杰特进行的实验,该实验旨在研究谷仓之星与用户对维基百科的贡献之间的关系:研究人员把参与者随机分为实验组和对照组,并给实验组的参与者每人一枚谷仓之星,然后比较两组的结果。 P110

设计和分析实验所需的统计原则不在本书的内容范畴内,但数字时代的到来并没有让这些原则发生根本的改变。 P111

因此,欧电公司和合作伙伴以低可变成本的方式在大规模范围内成功地开展了这些半数字实地实验。 P112

阿尔科特认为,这一现象主要是因为用户环保意识越强的地方会越早加入这一项目。 P114

但在大多数模拟实验中,研究人员关注的是平均处理效应,因为实验只有少量参与者,而且研究人员对他们也知之甚少。 P115

科斯塔和卡恩对整个样本产生的平均处理效应的估值是–2.1%(–1.5%,–2.7%)。 P116

维生素C缺乏病是一种可怕的疾病,所以这是一个非常有用的信息。 P117

采取分类处理的这类实验是找出处理的哪一部分或哪些部分是造成影响的原因的一种好方法(Gerber and Green 2012, section 10.6)。 P118

实际研究材料可参见Bernedo, Ferraro, and Price(2014)。 P119

在这一点上,我希望大家对自己有望开展数字实验感到兴奋。 P120

此外,他们还借助实验的规模评估了什么时候该影响会更大(处理效应的异质性),并对该影响产生的可能原因(原理)给予了一些解释。 P121

这些结果均无法准确地解释为什么黑人卖家的销售情况会较差,但是,如果将这些结果与其他研究结果相结合,研究人员便能对不同类型的经济交易中种族歧视的原因给出一些理论上的解释了。 P122

改编自van de Rijt et al.(2014),图2。 P123

该方法主要的优势是可控性,也就是说,如果你自行创建实验的话,就可以创建自己想要的环境和处理。 P124

但在这些早期的研究中,研究人员很难将上述任何一个因素与真实复杂的选举中的其他事情隔离开来。 P125

改编自Huber, Hill, and Lenz(2012),图5。 P126

有些研究人员会在创建自己的实验这一方法上更进一步,进而创建自己的产品。 P127

例如,后文有一个实验共有6100万名参与者,这是任何一个研究人员都无法单独实现的规模。 P128

巴斯德针对将甜菜汁转化为酒精的研究,提出了疾病细菌学说,这就是一个既为解决实际问题又为寻求基本认识的研究示例。 P129

竖线代表估算的95%的置信区间。 P130

对研究人员来说,这样不均衡的分配从统计学角度讲很低效,更好的分配方式是每组有1/3的参与者。 P131

对习惯于开展实验的研究人员来说,这似乎是显而易见的,但对习惯于利用大数据资源的研究人员来说,这是非常值得注意的(参见第2章)。 P133

不同的成本结构意味着数字实验能达到模拟实验不可能达到的规模。 P134

我的论文最初是想探究那些令人费解的文化产品的成功。 P135

/ 图4.21 音乐实验室的实验设计。 P136

计算社会学 数据时代的社会研究 计算机与互联网电子书 第2张

其次,给参与者的酬劳是免费的音乐,所以不会产生可变的参与者报酬成本。 P137

也是因为我的导师邓肯·瓦茨获得了一些支持该类研究的资助款项,它才得以实现。 P138

但也可能恰好相反,也许看到你的朋友玩得开心会让你也感到快乐。 P139

竖线代表估算的标准误差。 P140

除了这些科学问题,克雷默和同事的论文在《美国国家科学院院刊》(Proceedings of the National Academy of Sciences)上发表后没几天就引来了研究人员和媒体的强烈抗议(具体争论的观点我将在第6章更详细地描述)。 P141

就克雷默和同事的实验而言,因为没有原始数据,所以我们很难确切地知道双重差分估计量法的效率比原来方法的效率具体高出了多少,但可以通过其他相关的实验获得一个大致的概念。 P142

这些实验可以在完全数字化的环境中进行,也可以在物理世界中使用数字设备来进行。 P143

维基百科成功的关键不是新知识,而是新的协作形式。 P145

最后,分布式数据采集项目非常适合大规模的数据采集。 P146

在人本计算项目中,每个人接到的都是简单的小任务,但将所有人的成果整合后就能解决那些对一个人来说过于宏大的问题。 P147

但问题是现有的分类算法还不足以用于科学研究。 P148

有雇用大学生做研究助理经验的研究人员可能会立刻对数据质量产生怀疑。 P149

最后,研究人员需要用一种方法把消除偏差后的个体分类数据结合起来,得出一个一致的分类。 P150

班纳吉和同事方法的核心实际上和社会研究中常用的技术非常相似,尽管乍一看这种相似性可能并不明显。 P151

在这个简化的例子中,星系图像有三个特征(图像中蓝色像素点数量、像素亮度方差、非白像素比例)。 P152

星系动物园很好地表明了许多人本计算项目是如何逐步发展的。 P153

然后,工人运用编码方案对每句话进行编码。 P154

改编自Benoit et al.(2016),图3。 P155

这类项目会采取分解–运用–整合这一策略将一个大问题分解成许多简单的、没有专业技能的人也能完成的微任务。 P156

也就是说,如果凯文·肖文斯基有无限的时间的话,他自己也能完成对100万个星系的分类。 P158

而检验该算法的方法就是比较其预测评分与网飞的留存评分,这一明确且易行的检验方案意味着网飞奖的设计遵循了这样的理念:让检验解决方案比想出解决方案更容易。 P159

它描述的是一个好的解决方案,还是完全没用的东西?如果这不是一个公开征集项目的话,该解决方案可能永远也不会被认真评估。 P160

因此,生物学家开发了许多巧妙的算法来有效地寻找最低能量的构象。 P161

尽管大多数玩家都不是特别擅长,但也有少量个体玩家和小团队玩家例外。 P162

阿尔伯特是否应该授予这项申请20年的垄断权呢?是否存在会使它无法获得专利的现有技术?许多专利的利害关系很大,但不幸的是,阿尔伯特不得不在没有太多他可能需要的信息的情况下做出这个决定。 P163

在通过公众专利评审所完成的66个专利申请中,有近30%主要是因为评审小组发现的现有技术而被拒绝授予专利权的(Bestor and Hamp 2010)。 P164

更普遍地讲,许多政府和公司都有需要公开征集解决的问题,因为公开征集能够产生预测算法,而这些预测可以成为行动的重要指南(Provost and Fawcett 2013; Kleinberg et al. 2015)。 P165

事实上,大量的定量社会科学研究已经开始雇用工作人员进行分布式数据采集了。 P167

之后,这些被标记的报告就会被发送给数百名区域志愿者专家中的一位进一步审查。 P168

例如,萨米尔·阿加瓦尔(Sameer Agarwal)和同事就曾尝试利用这些照片“在一天内建成罗马”,具体来说就是利用15万张罗马的照片对这个城市进行三维重建。 P169

/ 图5.12 照片城这款游戏使研究人员能够利用参与者上传的照片构建高质量的建筑物三维模型。 P170

这些陈述表明,当参与者得到适当的反馈时,他们就能在搜集研究人员感兴趣的数据方面成为专家。 P171

表5.3 社会研究中分布式数据采集项目的例子/本节所述的所有例子都涉及主动参与:“记者”记录了他们所听到的对话,观鸟者上传了他们的观鸟报告,玩家上传了他们的照片。 P172

相比于前面章节所描述的方法,例如调查和实验,大家对大规模协作可能不是很熟悉,但这并不意味着大规模协作本身比上述方法要难。 P173

这是一种错误的设计大规模协作项目的方式。 P174

在星系动物园的项目中,研究人员可以反复呈现每个星系的图像,直到参与者对其形状达成共识为止。 P175

5.5.5 合乎道德伦理合乎道德伦理这条建议适用于本书所描述的所有研究。 P176

”但其实你应该先从所有能连接到互联网的人开始,然后向内缩小,而不是先从自己开始并向外扩展。 P177

与过去仅和少数同事或研究助理协作不同的是,现在我们可以与世界上能够连接到互联网的每一个人协作。 P178

本章的目的在于为你们提供相应的工具,用以负责地处理这些道德伦理的挑战。 P180

接着在6.3节中,我会将这些具体的事例抽象化,以此描述产生道德伦理不确定性的一些基本原因:迅速提高的研究人员相关能力,使得他们在未经参与者同意甚至在其毫不知情的情况下对人类进行观察与实验。 P181

我选择这些特别的研究项目主要基于两个理由。 P182

然后研究人员将这些包含了好友信息与文化品位的脸谱网数据与包含了学术主攻方向和在校园内居住信息的校方数据进行了合并。 P183

更进一步来说,所有的步骤都不可见,除非你调用网页的源文件进行检查。 P184

这种类似的附属声明从未在数据通信专业组会议上被使用过,这个事例引发了计算机科学家对他们的研究中有关伦理性质问题的讨论(Narayanan and Zevenbergen 2015; Jones and Feamster 2015)。 P185

但在数字时代,社会研究的情况截然不同。 P186

上图由威利·雷瓦尔利(Willey Reveley)于1791年绘制。 P187

但是,当世道改变的时候,纳粹党获得权力,这些数据都出乎意料地被二次使用。 P188

其中一些事例涉及数据意料之外的二次使用,但并非全部如此。 P189

总的来说,这两项特征,即能力的增强和应该如何使用能力的共识的缺乏,都意味着数字时代的研究人员将在可预见的未来面临道德伦理的挑战。 P190

尽管如此,研究人员还是可以通过早期构建的伦理思想来应对这些挑战。 P191

重要的是,即使研究人员认为发生的事情是无害的,甚至是有益的,也应该遵守对人的尊重原则。 P192

作为风险/收益分析的结果,一名研究人员可以调整研究的设计方案,以降低不良事件发生的概率(比如排除心理脆弱的参与者),或者在其发生后减轻事件的严重程度(比如向有需求的参与者提供咨询服务)。 P193

《贝尔蒙报告》认为,公正原则涉及分配研究产生的风险与收益。 P194

《门罗报告》认为,对法律和公共利益的尊重原则隐含在有利化原则之中,但它也认为前者值得被明确考虑。 P195

总而言之,《贝尔蒙报告》和《门罗报告》提出了四项可用于评估科学研究的原则:对人的尊重原则、有利化原则、公正原则以及对法律和公共利益的尊重原则。 P196

理解这两种框架有所裨益,因为它们将可以让你识别并推断出伦理研究中最根本的紧张关系之一:使用潜在的不道德手段达到道德目的。 P197

结果主义者与义务论者就此渐行渐远。 P198

在接下来的几个小节中,我将描述这四项要点的具体内容并提供如何处理它们的一些建议。 P199

因此,在未经同意的情况下进行实地调查符合既有的道德原则与规则(至少符合在美国的规则)。 P200

不幸的是,获取每一个使用比特币的人的知情同意是不可能的,因为大多数人都是匿名的。 P201

尽管如此,该方法远不如许多人以为的那样有效,事实上,这种方法的深度和广度均受到限制。 P202

/ 图6.5 “匿名化”数据的再识别。 P203

除了这种针对单人的目标攻击之外,纳拉亚南与施马季科夫还表明,通过将网飞数据与某些人选择在互联网电影数据库(IMDb)上发布的电影评级数据合并,可以进行广泛攻击,即涉及多人的攻击。 P204

但是将它们组合在一起,则可以有力降低信息化风险。 P205

这条曲线的确切形状取决于数据和研究目标的具体情况(Goroff 2015)。 P206

”(Lowrance 2012)尽管如此,隐私权是一个众所周知的混乱的概念(Nissenbaum 2010)。 P207

·情境2:发送部分匿名记录(属性);给受尊敬的大学研究人员(角色);用以应对埃博拉疫情,并接受大学机构委员会的监督(传输原则)。 P208

不幸的是,这些决策往往基于不完整的信息。 P209

尽管一些研究人员倾向于让他们的研究规模尽可能大,但研究伦理建议研究规模应该尽可能小。 P210

只有在I期与II期试验完成后,新的药物才被允许投入大规模的随机对照实验中。 P211

6.7.1 机构审查委员会是底线,不是上线一方面,许多研究人员似乎与机构审查委员会持相反的观点;另一方面,他们认为机构审查委员会就是装模作样的官僚机构。 P212

这样的短视可能会造成伦理上的错误判断。 P213

这种二元思维使讨论变得极端,阻碍了开发共享规范的努力,使思想懒惰。 P214

本章表达了我试图将我们推向这个方向的想法,并且我认为,关键是研究人员应该采取基于原则的思维方式,同时继续遵守适当的规则。 P215

这其中最糟糕的就是塔斯基吉梅毒实验(表6.4)。 P216

作为对巴克斯顿的回应,美国公共卫生局在1969年召集了一个小组,对该研究进行了完整的伦理审查。 P217

《贝尔蒙报告》的第二部分和第三部分提出了三个道德原则,即对人的尊重原则、有利化原则和公正原则,并描述了这些原则要如何应用于研究实践中。 P218

首先,《门罗报告》再次重申了《贝尔蒙报告》中涉及的三项基本原则,即对人的尊重原则、有利化原则以及公正原则,并附带了一项新的原则:对法律和公共利益的尊重原则。 P219

利用这些机会的研究人员还必须面对困难而模棱两可的道德伦理并做出决策(第6章)。 P221

在简介部分,我将马塞尔·杜尚的现成品艺术风格与米开朗琪罗的非现成品艺术风格进行了对比。 P222

参与者通常与研究人员相距甚远,两者之间的相互作用通常由计算机来协调。 P223

但我认为,逃避作为一种策略将变得越来越不可靠。 P224

乔舒亚·布卢门斯托克和他的同事将来自约150万人的详细通话记录与约1000人的调查数据进行了整合,以估算卢旺达的财富地理分布情况。 P225

对此,我非常感激。 P226

如果你的书也想接受公开评审,请访问http://www.openreviewtoolkit.org。 P227

在写这本书的时候,我得到了三个非常棒的机构的支持:普林斯顿大学、微软研究院和康奈尔科技园区。 P228

就普林斯顿大学出版社而言,我要感谢从一开始就相信这个项目能成功的埃里克·施瓦茨(Eric Schwartz),以及帮助实现这个项目的米根·莱文森。 P229

good

标签