Gregg Semenza氏のセミナーのお知らせです

Gregg Semenza氏のセミナーのお知らせです

令和元年9月26日(木)

関西医科大学 第二講義室 18:00〜

大学院講座第788講として行われます。

100人は入れます。

学外からの聴講も、大歓迎です。

多分他所では聴けない内容になるかもです。

 

生命科学者のためのDr.Bonoデータ解析実践道場

DBCLSの坊農秀雅さんの「生命科学者のためのDr.Bonoデータ解析実践道場」が上梓されました。

御恵投いただきぱっと眼を通した段階での書評(のようなもの)を書いてみます。

2017年の9月に出版された「Dr.Bonoの生命科学データ解析」#drbonobon の続編ですが前作が教科書的な役割が担われていたのに対して今回の実践道場本 #drbonodojo は実践に重きが置かれています。本人も言うように「写経」できる本です。 

amazonのページには序文が掲載されています。引用してみましょう。

2001 年にmacOS にUNIX が採用される前から,生命科学分野ではmacOSが好んで使われてきた。グラフィカルなインターフェースが生命科学研究者にとって親しみやすかったのだろう。そればかりでなくOS Xとなってからは,UNIXが使える生命科学研究ツールとしてmacOSの利用価値が高くなった。UNIXとしてのMacの素晴らしさを紹介した『バイオ研究が10倍はかどるMacOS X活用マニュアル』(中村保一,礒合敦,荻島創一著,羊土社,2003)が2003年に発刊された。当時のmacOSのバージョンは10.2で,それをベースとして執筆されていたが,macOSはその後なんどもアップデートし,16年経った2019年4月現在,バージョン10.14.4となっている。

2017年に上梓した拙著『Dr. Bonoの生命科学データ解析』(以下,Bono本)は幸いにも好評をもって多くの生命科学研究者に迎えられた。発売後間もない2017年12月に静岡,2018年4月に大阪にて読書会が開催され,この本に書いてあることに対する自分の解釈を発表し,参加者たちとの議論がなされた。著者であるDr. Bonoも参加したのだが(大阪での会はtwitter参加であったが),その際に指摘されたことが「本に掲載されているコマンドをそのとおり打ちこんでも動かない」ということであった。確かにBono本には実践的な内容は盛りこまれてないので,書いてあるコマンドはまったく同じようには実行できないものも多くあるし,そもそもテストデータなども提供されていない。教科書として,コマンドとはどういうものかを知ってもらう例としてあげていただけで,読者が実際にそれをコンピュータ上で打ちこんでたどっていくことまでは想定していなかった。

他方,Bono本よりも先に出版され,次世代シークエンサー(NGS)のデータ解析におけるバイブル的な存在となっている書籍として『次世代シークエンサーDRY 解析教本』(清水厚志,坊農秀雅監修,学研メディカル秀潤社,2015)がある(以下,DRY本)。このDRY本は,NGSを利用したプロトコル本で,極めて実践的な内容であり,実際にコマンドを打ちこんで(同じ文字を打ちこむことから写経して,といういい方をする)独習するタイプの本である。これまで日本語での学習リソースがほぼなかったNGSデータ解析分野においては非常に有用なのだが,生命科学のデータ解析は広く多様なため,すべての生命科学データ解析をカバーすることはできてない。すなわち,NGSが登場する前からあった基本的なバイオインフォマティクスのスキル,例えば,配列類似性検索や系統樹作成,タンパク質ドメイン解析が抜けているのだ。

そんな中,メディカル・サイエンス・インターナショナルの星山大介さんから生命科学者向けのプログラミングの本を出したいという話があった。生命科学データを題材としてPythonなどのプログラミング言語を紹介する書籍はあるものの,それらのプログラミングだけできても生命科学データ解析の達人にはなれない。それならば,生命科学データ解析のためのコンピュータリテラシーをきっちりと身につけられるコンテンツにしたほうがよいだろうと考えた。そこで,Dr. Bonoが普段から共同研究として行っている生命科学データ解析の現場から実践的な内容を紹介する形で,Bono本の実践編として出してはどうかと提案した。それが本書である。

Bono本でカバーしきれなかったUNIXコマンドラインの使い方から,データ解析の実践的な手順を詳しく,ハンズオンで追っていけるようなレベルで解説した。また,それらを併せて解釈するために必要なちょっとしたテクニックを,本筋からは脱線気味になることは承知の上でふんだんに紹介した。写経できるコンテンツももちろん多くあるのだが,本に書いてあるとおりにそのまま打ちこんでいけば解析ができるのではなく,読者であるあなたが意味をきちんと理解してコマンドを入力していく,そんなスタイルをめざした。基本的にmacOSでの実行を前提として書かれているが,UNIXであれば問題なく,クラウド上のLinuxでの利用も想定している。

本書を執筆するに当たり,東京農工大学大学院グローバルイノベーション研究院の天竺桂弘子准教授との数々の共同研究がその屋台骨となっている。また,本書にある多くのコマンドを試していただき,わかりにくい点を指摘してくれた,天竺桂研究室の大学院生,坂本卓磨さんに感謝する。 本書を参考に,読者のみなさんがより自在に生命科学データ解析されんことを祈る。

2019年春 雪解けの富士山麓,三島にて 坊農秀雅

出版社のページから章立てを引用しました。

  • 1章 準備編 

    1.1 Mac を買おう

    1.2 Mac をセットアップしよう

     1.3 周辺機器の設定

  • 2章 基礎編 

    2.1 UNIX コマンドラインを使ってみよう

     2.2 コマンドラインの基本操作 

    2.3 シェルプログラミングのための環境構築 

    2.4 ネットワークを介して遠隔のコンピュータを操作する

  • 3章 実践編 

    3.1 公共データベースからのデータ取得

     3.2 配列類似性検索 

    3.3 系統樹作成 

    3.4 ドメイン解析 

    3.5 発現定量解析 

    3.6 データ統合解析

     

2章 基礎編はぼくには大変役に立ちそうです。

ぼくのように「写経」でDry解析を覚えていった人間には基礎知識の理解が欠けています。これを大分補ってくれそうです。

特に役立ちそうなのは「2.4 ネットワークを介して遠隔のコンピュータを操作する」 です。

実際これやってみたいのです。でも職場のネット環境で無理そうな気も…

 

3.1 公共データベースからのデータ取得」も懇切丁寧です。

SRAの配列のデータ取得は実は坊農さんの「生徒」であるぼくはマスターはしていたのですがその他のデータの取得についても解説がされています。

その他部分は、現時点ではかなり駆け足で眼を通しただけなのですが「3.5 発現定量解析」については全部読んでみました。 阪大python会謹製の某ikraについての言及もありました。

というように初心者としては初めから終わりまで通読すると御利益がある本だと思いました。

今日はこれくらいです。

 

明日から開催される日本癌学会の会場では売り出されるようです。

自分のコピーをゲットしましょう。

生命科学者のためのDr.Bonoデータ解析実践道場


PDF
Tagged with:  

随分間が空きましたが元気でやっております。

結構すべき色んな事ができて結構忙しかったのです。


「Dr. Bonoの生命科学データ解析-読書会」

この秋に坊農秀雅さんが「Dr. Bonoの生命科学データ解析#drbonobonという本を出版されました。

ぼくも読んで書評のようなものを発表しました。

この本の読書会(というか一種のreaders’ meeting、白ミサ) (Dr. Bonoの生命科学データ解析-読書会)が先日静岡で開かれてぼくも参加しました。

坊農さんを含んだ5人の読書子が一章づつを30分で読み解くという趣向で会が行われました。

 

教科書の読書会に出たのは今までなかったことで得難い体験をしました。 -ちなみに大学生の時に3年くらい読書会やっていましたけど小説を読んでその感想を話すみたいな読書会やっていました。ブロンテ姉妹やオースティンを読んでいたんですよ!!)

実は25年くらい前、週に一回、静岡に通っていたことがあります。新幹線を降りてすたすた歩き県庁の横にある某病院で麻酔を担当していました。当時常勤の麻酔の医者がいない病院で日替りでぼくらが出かけて病院内からローテしてきている先生方と一緒に麻酔をするというような勤務を一年近く続けていました。 というような思い出がある街なのですがその後25年位全く縁が途絶えていました。 新幹線を降りて病院まで歩いて見ました。

 

駅を降りであまりに綺麗になっていたのでびっくり。 すごく長い行列があるので何かと思っていたら宝くじの行列でびっくり。 女子高生がすごく多いのでびっくり。 病院もすっかり現代的な物になっていました。

その後駅前に戻り会場入りしました。

駅から至近な場所にあんなスペースがあるのですね。調べると値段も手頃です。さすが静岡です。 結局参加者は35人ほどになり盛会でした。(参照1,参照2)

基本的にはDr. Bonoの生命科学データ解析を解説する形式でした。#drbonobon を通読していたぼくでも読み落としの部位などに気づき大変ためになりました。

理系の技術書などでも読書会というか勉強会はよく開かれるのだそうですね。

面白い論文を読んだ時著者が近くにいる場合にお呼びして一時間くらいで解説をしていただくという事はしたことがあるのですが今回のような読書会(readers’ meeting)は初めての体験でした。

今回の読書会のもう一つの特徴は著者ご自身が参加していたということでした。 ぼくも「第5章」を担当したのですが本人の前で本を解説するのはとても緊張しますね。

と言う訳で日頃余りしない経験をしました。

読書会の後は、駅前のお店で有識者会議の参加して20:30頃新幹線で帰阪しました。

今度大阪でもこんな会合を開こうという計画があります。


PDF

#drbonobon

ライフサイエンス統合データベースセンター(DBCLS: DataBase Center for Life Science)の坊農秀雅さんが本を上梓されました。

Dr. Bonoの生命科学データ解析」 メディカル・サイエンス・インターナショナル 本体価格 3,000円 ISBN 9784895929011 です。 #drbonobon

 

今日が発売日ということですが癌学会の会場では昨日から販売をはじめているようです。

 

ちょっとしたきっかけで発売前に読ませていただきました。

坊農さんとはぼくらがやっている「がんとハイポキシア研究会」の縁でもう10年以上のお付き合いがあります。 関西のご出身でいわゆる実家がぼくの家と近いということもあり,お盆・正月に会う事もありましたがぼくにdry解析の必要が無かった事もあり共同研究未満の状況でした。

「次世代シークエンサーDRY解析教本」が出版され読んでみると俺でもできるんじゃないかという気が湧いてきて挑戦を試みました。

自前の配列と公共データベースの配列を使ったRNA-Seqです。

ちょうど職場の講演会に坊農さんをお招きした次の日face-to-faceで必要なアプリのインストールから付き合っていただき解析がはじまりました。とてもよく書かれた本なのですがやっぱりこけるわけです。これはある種の基本的な知識(リテラシーともいいます)がぼくに欠けていたというとに起因するとレトロスペクティブには思えました。

今回のbono本はこの部分に主眼が置かれているとぼくには感じました。

実際どこかで聞いたことがあるなという話が満載なのですがこれは坊農さんから文字通り「聞いた」話なのです。

皆さんの中にもバイオインフォマティクス解析に興味を持っている方がいると思います。隣に「坊農さん」がいない研究者がまずはじめに読むべきなのがこの本です。

「Bono本」から「Dry解析本」でRNA-Seq解析を行い論文の図表を自分で作成しデデータマイニングすることができるようになることをぼくが保証します。

 

解析はお金があれば外注でもできると思いますが,自由度に乏しくなんちゃって「データマイング」という域にも至りません。研究に活かそうと思えば,なので自分である程度できるようになることが肝要です。

近くに専門家がいても彼らとて研究者でありこちらの都合のよい時間にやってきて問題を解決してくれるとは限りません。自分のmacで思いついたらちょっとできるというのが重要だとぼくは感じています。

 

読み進めるとちょっと躓く箇所が初心者にはあると思います。キーワードに赤線を引いてそこは読み飛ばしましょう。

この #drbonobon は辞書的な使い方をする便利本ではなくまず基本知識を得るための教科書ですのでまず一回は通読してください。 読者の理解度に合わせて得るものがあります。

 

Dr. Bonoの生命科学データ解析次世代シークエンサーDRY解析教本 (細胞工学別冊)

 

 ご本人もブログで話題提供しておられます。

 

 

最後にいつぞやの分子生物学会+生化学会のシンポジウムを坊農さんとぼくで企画したときの惹句を掲げておきます。

巷間,ビッグデータの時代だといわれる。生命科学の分野での典型例は本邦のDDBJも参加する「DDBJ/EMBL/Genbank国際塩基配列データベース」であろう。その活用も重要な役割を占めるようになってきた。公共データベースを利用した遺伝子発現動向の精査に基づいた研究戦略の策定により「山中因子」の同定に至ったという逸話を持ち出すまでもなく,利用は今や研究者に取って必須である。 講習会,チュートリアルビデオなどを活用した学びの機会は数多く提供されているものの「自分」に必要なデータベースを探し出し,ツールを見つけて自家薬籠中のものとするのは容易ではない。 本ワークショップでは,キュレーション・メタ情報の付加を含んだ公共データベース構築,それを活用するためのアルゴリズム作成とプログラミングを含む活用ツール作り,また研究者とデータベースの関わりの実際を紹介して誰でも”バイオインフォマティシャン時代”を俯瞰する。


「いつかできるから今日できる」

 

映画「あさひなぐ」の主題歌がビデオで見れるようになっています。 西野さんの切ない歌い出しがたまりません。

タイトルは「いつかできるから今日できる」ってぼくにとってのDry解析みたいなものですね。


PDF
Tagged with:  
madeonamac.gif Creative Commons License