再現できなければ意味がない

数年前、理化学研究所の研究者がNatureに発表した論文が元で1人の自殺者と多額のお金を使った再現性検証実験、多数の人を巻き込んだだけでなく、世間の注目を浴びる大事件になりました。その騒動の一部始終と詳細はここでは扱いませんが、科学(Science)に関わる者として最も致命的と感じることは、論文で発表された研究が本人でさえも再現できなかったということです。

何故、その実験は再現できなかったのか?

公式見解は詳細すぎるので省略しますが、研究者の端くれとしての私の印象は、実験の記録とサンプルと試薬の管理がお粗末だったこと、データのまとめ方と発表の仕方に誠意が全く感じられないことが再現できなかった原因でしょう。

再現できる研究のためには?

再現できる実験とは、その結果が偶然(by chance)ではないということです。つまりその実験を繰り返すと同じ結果が出るということです。そのために研究者は何回も実験をして、自分が再現できるかを確かめ、できるだけ再現性の高い方法を見つけようとするのです。そのために大切なことは、

  1. 実験記録を実験ノートに正確で分かりやすく書くこと
  2. データの入力を正確かつ単純にすること。
  3. データの解析方法を正確かつ分かりやすい方法で行うこと
  4. 実験(=仕事)を効率よく行うこと

でしょう。

それぞれの研究環境、内容によってどのようにこれらのことを行うかは違い、様々な方法があるので別に紹介します。ここでは私がこれまで分子生物学と表現系解析を研究室のメンバーとやってきた方法について紹介します。殆どのツールは無料です。

実験記録を実験ノートに正確で分かりやすく書くこと

図1 Fig.1. Google Drive directory example1

研究室のボスが物理的に遠い距離に居たり、ボスが忙しくてあまり会って話す機会がないことは珍しくないと思います。そのような時は、EvernoteGoogle Docのようなインターネットを使ってボスや共同研究者と実験ノートを共有する仕組みが便利です。日付や第三者の目撃が重要になるパテント用の記録としては不適切かもしれないので、その場合は従来の紙に書く方法をお薦めします。 私は、できるだけ元データも電子記録してオンラインストレージ(詳しくはここを参照)を利用しています。Directoryの構造は色々あると思いますが私は図1のようにしてます1

データの入力を正確かつ単純にすること。

図2 Fig.2. Google Form as a data input tool

大量のサンプルを扱っていると、データの入力にミスが出ます。例えば、“Col”、“coi1-16”、“coi1-1”はほかの人が書いたラベルを別の人(もしくは本人でさえも)が読み間違えるといった事態が容易にお!きます。このようなことを防ぐ方法の一つは、Google Formを使うことです(図2)。Google Formは主にアンケートで使われると思いますが、すでにある名前をチェックボックスやプルダウンメニューから選ぶことでラベルの入力ミスが避けられます。別の方法は、自作のバーコードやQRコードを利用することです。Microsoft Wordでラベルのシールにバーコードを印刷し、ポットやポットに挿すプラスティックのタグにシールを貼ります。背の高さなどを測定する時にバーコードリーダーでバーコードをエクセルシートに読み込み、データを入力する方法です。最近は色々進歩があったのでGoogle Sheetとスマートフォンを使って2018版にしました。

データの解析方法を正確かつ分かりやすい方法で行うこと

R/bioconductor + RStudio + Github + Shiny app (必要ならば)。

実験(=仕事)を効率よく行うこと

これは全ての仕事に言えることで、私は仕事のマネジメントをするためにTrelloというプロジェクトマネジメントソフトを使っています。



  1. 本当はこのdirectoryの中を説明したREADmeファイルがあると良い(参照)。