Gregg Semenza氏のセミナーのお知らせです
Gregg Semenza氏のセミナーのお知らせです
令和元年9月26日(木)
関西医科大学 第二講義室 18:00〜
大学院講座第788講として行われます。
100人は入れます。
学外からの聴講も、大歓迎です。
多分他所では聴けない内容になるかもです。
「生命科学者のためのDr.Bonoデータ解析実践道場」
DBCLSの坊農秀雅さんの「生命科学者のためのDr.Bonoデータ解析実践道場」が上梓されました。
御恵投いただきぱっと眼を通した段階での書評(のようなもの)を書いてみます。
2017年の9月に出版された「Dr.Bonoの生命科学データ解析」#drbonobon の続編ですが前作が教科書的な役割が担われていたのに対して今回の実践道場本 #drbonodojo は実践に重きが置かれています。本人も言うように「写経」できる本です。
amazonのページには序文が掲載されています。引用してみましょう。
2001 年にmacOS にUNIX が採用される前から,生命科学分野ではmacOSが好んで使われてきた。グラフィカルなインターフェースが生命科学研究者にとって親しみやすかったのだろう。そればかりでなくOS Xとなってからは,UNIXが使える生命科学研究ツールとしてmacOSの利用価値が高くなった。UNIXとしてのMacの素晴らしさを紹介した『バイオ研究が10倍はかどるMacOS X活用マニュアル』(中村保一,礒合敦,荻島創一著,羊土社,2003)が2003年に発刊された。当時のmacOSのバージョンは10.2で,それをベースとして執筆されていたが,macOSはその後なんどもアップデートし,16年経った2019年4月現在,バージョン10.14.4となっている。
2017年に上梓した拙著『Dr. Bonoの生命科学データ解析』(以下,Bono本)は幸いにも好評をもって多くの生命科学研究者に迎えられた。発売後間もない2017年12月に静岡,2018年4月に大阪にて読書会が開催され,この本に書いてあることに対する自分の解釈を発表し,参加者たちとの議論がなされた。著者であるDr. Bonoも参加したのだが(大阪での会はtwitter参加であったが),その際に指摘されたことが「本に掲載されているコマンドをそのとおり打ちこんでも動かない」ということであった。確かにBono本には実践的な内容は盛りこまれてないので,書いてあるコマンドはまったく同じようには実行できないものも多くあるし,そもそもテストデータなども提供されていない。教科書として,コマンドとはどういうものかを知ってもらう例としてあげていただけで,読者が実際にそれをコンピュータ上で打ちこんでたどっていくことまでは想定していなかった。
他方,Bono本よりも先に出版され,次世代シークエンサー(NGS)のデータ解析におけるバイブル的な存在となっている書籍として『次世代シークエンサーDRY 解析教本』(清水厚志,坊農秀雅監修,学研メディカル秀潤社,2015)がある(以下,DRY本)。このDRY本は,NGSを利用したプロトコル本で,極めて実践的な内容であり,実際にコマンドを打ちこんで(同じ文字を打ちこむことから写経して,といういい方をする)独習するタイプの本である。これまで日本語での学習リソースがほぼなかったNGSデータ解析分野においては非常に有用なのだが,生命科学のデータ解析は広く多様なため,すべての生命科学データ解析をカバーすることはできてない。すなわち,NGSが登場する前からあった基本的なバイオインフォマティクスのスキル,例えば,配列類似性検索や系統樹作成,タンパク質ドメイン解析が抜けているのだ。
そんな中,メディカル・サイエンス・インターナショナルの星山大介さんから生命科学者向けのプログラミングの本を出したいという話があった。生命科学データを題材としてPythonなどのプログラミング言語を紹介する書籍はあるものの,それらのプログラミングだけできても生命科学データ解析の達人にはなれない。それならば,生命科学データ解析のためのコンピュータリテラシーをきっちりと身につけられるコンテンツにしたほうがよいだろうと考えた。そこで,Dr. Bonoが普段から共同研究として行っている生命科学データ解析の現場から実践的な内容を紹介する形で,Bono本の実践編として出してはどうかと提案した。それが本書である。
Bono本でカバーしきれなかったUNIXコマンドラインの使い方から,データ解析の実践的な手順を詳しく,ハンズオンで追っていけるようなレベルで解説した。また,それらを併せて解釈するために必要なちょっとしたテクニックを,本筋からは脱線気味になることは承知の上でふんだんに紹介した。写経できるコンテンツももちろん多くあるのだが,本に書いてあるとおりにそのまま打ちこんでいけば解析ができるのではなく,読者であるあなたが意味をきちんと理解してコマンドを入力していく,そんなスタイルをめざした。基本的にmacOSでの実行を前提として書かれているが,UNIXであれば問題なく,クラウド上のLinuxでの利用も想定している。
本書を執筆するに当たり,東京農工大学大学院グローバルイノベーション研究院の天竺桂弘子准教授との数々の共同研究がその屋台骨となっている。また,本書にある多くのコマンドを試していただき,わかりにくい点を指摘してくれた,天竺桂研究室の大学院生,坂本卓磨さんに感謝する。 本書を参考に,読者のみなさんがより自在に生命科学データ解析されんことを祈る。
2019年春 雪解けの富士山麓,三島にて 坊農秀雅
出版社のページから章立てを引用しました。
-
1章 準備編
1.1 Mac を買おう
1.2 Mac をセットアップしよう
1.3 周辺機器の設定
-
2章 基礎編
2.1 UNIX コマンドラインを使ってみよう
2.2 コマンドラインの基本操作
2.3 シェルプログラミングのための環境構築
2.4 ネットワークを介して遠隔のコンピュータを操作する
-
3章 実践編
3.1 公共データベースからのデータ取得
3.2 配列類似性検索
3.3 系統樹作成
3.4 ドメイン解析
3.5 発現定量解析
3.6 データ統合解析
2章 基礎編はぼくには大変役に立ちそうです。
ぼくのように「写経」でDry解析を覚えていった人間には基礎知識の理解が欠けています。これを大分補ってくれそうです。
特に役立ちそうなのは「2.4 ネットワークを介して遠隔のコンピュータを操作する」 です。
実際これやってみたいのです。でも職場のネット環境で無理そうな気も…
「3.1 公共データベースからのデータ取得」も懇切丁寧です。
SRAの配列のデータ取得は実は坊農さんの「生徒」であるぼくはマスターはしていたのですがその他のデータの取得についても解説がされています。
その他部分は、現時点ではかなり駆け足で眼を通しただけなのですが「3.5 発現定量解析」については全部読んでみました。 阪大python会謹製の某ikraについての言及もありました。
というように初心者としては初めから終わりまで通読すると御利益がある本だと思いました。
今日はこれくらいです。
明日から開催される日本癌学会の会場では売り出されるようです。
自分のコピーをゲットしましょう。