メタゲノムに関するお話を聞いてきました

恵比寿であったiPABの10周年のシンポジウムで、東工大の黒川先生のメタゲノムのお話を聞きに行ってきました。
いつもどおり自分なりのメモなのでわかりにくいかもしれません


メタゲノム解析とは?
群集まるごとゲノム解析

細菌は群集で活動し、生きている環境に密接にかかわってくる。
自然環境中(海洋、河川、土壌・・)
ヒト、動物(腸内、口腔、皮膚・・・)

大多数の微生物は培養が困難
今までは培養できる一部のみが研究対象だった。

シーケンサーとPCの発達によりまるごとゲノム解析できるようになった

ヒト腸内細菌叢の解析
HMP
ヒトの各部位のメタゲノム解析を行う

日本人でも調べてる
健康なヒトのおなかの中はどうなっているのか?を調べる。

これを調べることで病気のヒトとの違いを比べて新しい発見に活かす。

大人と離乳前の赤ん坊とでは結構違う。
赤ん坊では個人差もかなりあり。

家族間の類似性はこの解析ではわからなかった。

ヒトの腸内細菌叢で頻度を調べてみると
炭水化物を分解したりするDNA
DNAの修復をするDNA
が多い


今ではわからないDNAをクラスタリングして解析をしている。


情報科学的にはなにが難しいのか
細菌叢は多種な種から構成されている

  • アセンブルが困難
  • 遺伝子予測が困難
  • 遺伝子意味意味づけが困難

サンプルに含まれる個体数が不明

  • 母集団の推定が必要

などなど

新型シーケンサーのメタゲノム解析の可能性
新型シーケンサーは454以外は50bpとか短い配列しか読めない。

60bpのもので試しに従来の結果とどう違うかを検証すると
ほぼ十分な結果を得られる。

現在は土壌のメタゲノムをシーケンサーにかけるということをやっている。
メタゲノムとメタデータとの関係性を明らかにする!ということをやっている。

汚染物質で汚染された土壌を何週間に1回シーケンサーにかけてみる。
1回で1億本くらいシーケンサーからデータが出てくる
これを東工大TSUBAMEの120CPU使って解析するのに2、3週間ぐらいかかる。


結果としてはだんだんDNAが変化していることがわかる。



2010年にはもっとすごいシーケンサーが!!
PacBioが開発中
Produce 100G/h
ヒトゲノムでは4分で全部読めるww