GTC2014の参加レポート!

GTCとは?

NVIDIAが主催しているGPUを使った技術についてのカンファレンスです。GPUといえば画像処理を思い浮かべるかもしれませんが、General-purpose computing on graphics processing units (GPGPU)と呼ばれるような画像処理だけでなくGPUを使ったものなら何でもありカンファレンスです。
日本でもここ最近は毎年5月くらいにGTC Japanとして開催されていますが、今回は2014年3月24日〜3月27日まで開催された本家のGTCのレポートです。

GTCの公式サイトは以下のところです。
http://www.gputechconf.com/page/home.html

また、以前のGTCのトークは以下のところで見れます。
http://www.gputechconf.com/gtcnew/on-demand-gtc.php

今年の注目トピック

今年はなんと言っても機械学習に関するセッションです。数年前からDeep Neural Network (DNN) が話題になってますが、このDNNの学習でGPUがよく使われます。
この関係で今回はKeynote機械学習について言及された他、機械学習に関する多くのトークがりました。
DNNについて詳しく知りたい人はPFIのブログのDNNの記事を見るとわかりやすいのでお勧めです。
http://research.preferred.jp/2012/11/deep-learning/

DNNを使って画像認識をはじめ、音声認識などにも活用した話がありました。
DNNでTheano使うって話良く聞くけど音声認識ならkaldiを使うっててもあるらしいです。
また、私が見ていた限りではDNN以外にもRandom Forestの構築にGPUを使った話がいくつかあったようです。

個人的な感想

自分がバイオインフォな研究を行っている関係でそれっぽいものを見てましたが今年はバイオインフォっぽい話が去年よりも多かったように思います。

中でも個人的に気になったのは以下のもの。

GPU Accelerated Genomics Data Compression (BingQiang Wang)

この業界で超有名な中国のBGIの方が発表してたfastqファイルの圧縮の話。いくつかの圧縮手法のGPU版を実装して、それらを組み合わせて圧縮率、圧縮の計算時間、解凍の計算時間について発表してました。特に気になったのがクオリティスコアの部分でMarkov transform + Huffmanで40〜50%くらいの圧縮率を出してました。クオリティスコアってほぼランダムな配列って聞いてたんですが、Markov transform効くんですね。多少は前の文字と相関があるのかな?

BWT Indexing: Big Data from Next Generation Sequencing and GPU (Jeanno Cheung)

FM-indexをGPUで構築する話。BWAなど多くのDNAのmapperでFM-indexが使われますが、これ速くしても?って思ったら2010年くらいにFM-indexを使ったde novo assemblerが発表されてて、それを意識して行われた研究の話らしいです。このassemblerがとっても気になるので後で調べる予定。

Introducing NVBIO: High Performance Primitives for Computational Genomics (Jonathan Cohen, Nuno Subtil)

NVIDIAが作っているDNAなどの配列解析をGPUで手軽に行うためのライブラリで、アラインメントなど基本的なことのいくつかはすでにライブラリの中に入ってて簡単な関数呼び出しでGPUで計算することができます。去年発表で気になってたBowtie2のGPU版もこのライブラリで実装されたものらしいです。
このライブラリの場所は以下のところ。
https://github.com/NVlabs/nvbio

最後に

GPUがどんどん進化してきたり、新しい手法で前まではあまりGPU向きでないと思われてきたものもGPUで計算できるようになってきたりしているので今後もGPUに注目ですね。