修改“批量效应和卵巢癌”

此网页旨在将更新或更改保存到我们的网站补充的稿件运行批处理效应可能会危及卵巢癌基因组标记的有用性，由Keith A. Baggerly，E. Shannon Neeley和Kevin R.Coombes。

内容

我们最初检查的错误数据的存档是这里。
初次反驳: 我们对Dressman等人的回复(KRC;2008年3月10日)。
通讯已发布: 我们的通讯出现了，以及德国，Potti，Nevins和Lancaster（KRC; 2008年3月1日）的回复。

初次反驳

发表于2008年3月10日（KRC）

的体积临床肿瘤学杂志我们的通信被发布的地方包含addingman等人的回复。毫不奇怪，我们不同意他们的几个断言。在这里，我们提供了一种点评的反驳。

我们指出，从量化到样本标识符的映射被扰乱。他们承认争先恐后的争吵。他们断言它发生在将数据组装到网站上的数据时，并且对分析没有影响。后一种断言不是可验证的。他们也断言现在已经发布了正确的数据，但截至今天早上，错误尚未得到纠正。
我们指出，在他们发表的多项研究中，患者的状态(生存时间不变)从活着变为死亡，或从死亡变为活着。他们承认错误。他们断言错误发生了错误，因为当数据发布到Web时，它们省略了审查变量。由于发布的数据包含了审查变量，因此我们不明白这种断言。他们进一步断言，此错误不会影响其分析。此断言似乎是不正确的，因为它们的论文中的图2可以很容易地看到使用错误截取的数据。
我们说，“我们确定了与Cressman等人报道的”最佳“100基因相对应的107倍的探针ID。注释中的歧义导致了一些重复。”作为回应，他们说，由于模型识别一组独特的探测器ID，而不是基因，因此“具有基因的Probeset ID匹配与基因匹配的模糊性不相关。”他们的回复是不诚实的。我们同意模型标识探针集ID。但是，他们永远不会报道探针集ID;相反，它们仅报告了基因名称和符号。未能报告实际结果是对可重复性的障碍。
我们说“Cel文件可以根据运行日期分组。响应和生存与运行日期混淆，特别是在最早处理的样本。”他们首先声称这一断言不是真的。他们跟着这一点，因为他们“分析方法......纠正因批次而纠正差异而无关紧要。”它并不完全清楚为什么他们将纠正不存在的效果。他们提供的完整描述是如何做到这一点是：“通过应用稀疏回归模型方法[33]来纠正测定伪像进一步处理剩余的RMA数据。”我们发现，此描述提供了不足的细节，以便我们尝试完全可重复性。
然而，他们的主要观点是我们自己的报告“明确表示......就临床反应没有明显的混乱方面”。我们承认我们的报告中的摘要（OVCA04）错误地陈述了“大多数临床数据（阶段，等级，拒绝，响应）似乎没有与运行日期混淆。”在我们写这套摘要时，我们更关注生存的混杂。在OVCA04的第6页上，我们指出一些批次被响应混淆。对于我们忘记的概要造成的混乱，我们深表歉意。我们仍然争辩说，OVCA04的实际分析表明，生存率与批次强烈混淆，并且有明确的证据表明，应对至少一些批次混淆。
Dressman等人拒绝了我们信中其余的观点，坚称它们是无效的，因为我们并没有完全使用他们的方法。他们反复强调“复制”的意思是“重复，遵循原来的方法”。我们非常希望能够通过在完全相同的数据上运行完全相同的计算机代码来评估他们的主张。我们执行和报告的分析符合这一高标准，因为我们提供了实际的计算机代码。然而，Dressman等人只是用文字描述了他们的方法，没有提供完整的代码。如上所述，他们还在回复中承认，他们发布的数据中有几个错误。没有相同的数据和相同的代码，任何人都不可能在这种强烈的意义上重现他们的分析。
幸运的是，“繁殖”的真正定义并不是如此限制。（在线）Merriam-Webster字典定义了“重现”作为“再次生成”;导致再次存在或重新生成;要密切地模仿;再次展示;提出代表性;恢复精神上。“我们报告的分析是一个诚信的努力，即他们的方法，根据我们对他们所提供的口头描述的解释为基础。我们展示了我们所做的事情。德国队等人。没有表明我们报告的任何步骤都是错误的。他们不同意我们的结论，因为这些方法是不同的。我们将继续检查数据，随着更多信息可用，测试我们如何重现它们的方法。

通讯已发布

发表于2008年3月1日（KRC）

我们的信临床肿瘤学杂志发表于2008年3月1日。全面参考是：Baggerly，Ka，Neeley，ES。运行批量效应可能会损害卵巢癌基因组特征的有用性。中华肿瘤防治杂志，2008;26（7）：1186-1187。