「第1回 D-STEP 講習会」開催のお知らせ(第36回 DDBJing講習会)

このたび DDBJでは、生命データアナリスト養成プログラム「D-STEP 講習会」(DDBJ-Supercomputer Training & Educational Program)を開始いたします。本プログラムは、ROIS 機構長裁量プログラム(データサイエンス高度人材育成プログラム)への取り組みの一環として、ビッグデータの解析、主として次世代ゲノムシーケンス(NGS)解析需要に対応できる人材を国内で育成することを目的としています。また本プログラムで、DDBJはデータサイエンス共同利用基盤施設ゲノムデータ解析支援センターならびにライフサイエンス統合データベースセンターとの連携を強化します。
2017年度より2020年度までの間に、NGS データの様々な配列解析手法やゲノム以外のビッグデータ解析(機械学習、AIなど)について、DDBJ内外からの幅広い分野の講師によるハンズオンを主とした講習会を実施する予定です。第1回目の講習会を、下記の様に2018年1月26日に開催いたします。皆様のご参加をお待ちしています。

「第1回 DSTEP 講習会 in 三島」について

  • 日 時:2018年1月26日(金)10:00~16:00 
  • 場 所:国立遺伝学研究所 生命情報研究センター4階会議室(国立遺伝学研究所へのアクセス
  • 定 員:午前20名・午後10名
  • 参加費:無料
  • P  C:ハンズオン中心の講習会ですので、無線LAN 接続が可能なPC をご持参ください。
    PC の OS は Windows, Mac のどちらでも、またサポートがあれば最新のバージョンでなくても構いませんが、いずれの場合もウイルスチェックを行って下さい。
    ハンズオンをスムーズに行うために、各講義それぞれに、所定の準備作業をお願いいたします。
  • プログラム:
  • 時間 タイトル 講師
       9:30-10:00 受付
    10:00-12:00 NGS解析を始めた時にぶつかりがちな小さい壁あれこれ 川島 武士(国立遺伝学研究所 ゲノムネットワーク研究室 助教)
    12:00-13:00 昼休み
    13:00-15:00 ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類 神沼 英里(国立遺伝学研究所 大量遺伝情報研究室 助教)
  • 申し込み:申し込みフォームよりお願いいたします。( 講習会についての連絡は、入力されたメールアドレス宛に送信いたします。そのため、DDBJ からのメールを迷惑メールとしないように設定 をお願いいたします。)
  • 主 催:日本DNAデータバンク(DDBJ)
  • 後 援:ROIS(大学共同利用機関法人 情報・システム研究機構)(機構長裁量プログラム)
  • お問い合わせ:お問い合わせの「講習会」からご連絡下さい。
    DDBJing がこれまでに開催した講習会についてはこちらをご覧下さい。
  • 講習の内容・要旨・事前準備
  • NGS解析を始めた時にぶつかりがちな小さい壁あれこれ    川島 武士
     
    今回の講習では、マッピング等の基本解析ができるようになるまでを目標とし、ハンズオンの実習を行います。
    前半(最初の1時間程度)には、Windows や Mac のラップトップパソコンから UNIX 上で解析を行う際に、よくあるトラブルの具体例を示し、解決方法をお示しします。例えば、gnuplot や R で解析した結果画像をターミナル上に表示する。 NIG のスパコン上にインストールしてある各種ツールを使う。DRA 上にあるデータの一括ダウンロードのスクリプトの作成。その他、NIG のスパコンで配列解析を開始してすぐにぶつかりがちなトラブルと、その解決ノウハウを体験してもらいます。
    後半は、リンク先のマッピング解析を題材にします。この際、時間に余裕があれば、NIG のスパコンにまだインストールされていないマッピングツールを例にとり、自身のローカルのディレクトリにツールをインストールするときの簡単なノウハウを解説します。
    ご自身のラップトップを実際に使って、NIG スパコンをより気軽に使う日常を、一緒に目指しましょう。

    <注意>
    · 遺伝研スーパーコンピュータにログインしての作業があります。

    <事前準備>

     

  • ディープラーニングによる出芽酵母蛍光画像の細胞内タンパク質局在の分類    神沼 英里
     
    深層学習を使ったライフサイエンス研究の研究発表が増えています。しかし、日本ではライフサイエンス分野の深層学習の情報が少なく、実験研究者が保持データへ深層学習を適用する方法を、学び難い状況です。本講習では、前半で深層学習分類タスクの定番モデルであるCNN(畳み込みニューラルネットワーク)の概要を説明します。また他の定番モデル(時系列解析用モデルのLSTM、学習データ生成に用いられるGAN)もライフサイエンス分野の応用事例を紹介します。後半では、出芽酵母蛍光画像のオープンデータを用いて、細胞内タンパク質局在の分類モデルを構築する実習を行います。Googleの深層学習ライブラリTensorFlowと、モデルを簡潔に記述できるライブラリKerasを使い、CNNモデルを構築して分類精度を評価します。

    <使用技術>
    · Python :プログラミング言語
    · Jupyter notebook :対話型実行環境
    · TensorFlow :深層学習ライブラリ
    · Keras :深層学習用上位ラッパーライブラリ

    <事前準備>
    · 下記のツールをインストールして下さい。

    • Anacondaをインストール済
      ・ダウンロードURL: https://www.anaconda.com/download/
      ・Anacondaはデータサイエンスツールを含むpythonパッケージです。
      ・Anacondaに含まれるJupyter notebookを使います。
    • tensorflow, kerasをインストール済
      ・anaconda promptでpip install tensorflow
      ・anaconda promptでpip install keras
      - anaconda promptでconda list
      リスト中に「tensorflow」「tensorflow-tensorboard」「Keras」がある事を確認します。
      ※Anaconda root環境へのインストールになります。

    <注意>
    · 遺伝研スーパーコンピュータは使用しません。持参PCでの実習になります。

国立遺伝学研究所のスパコンアカウントの取得方法

アカウントの申請は、スパコンホームページ(新規ユーザ登録申請)より行います。アカウント取得に際しては、以下のページをお読みください。

アカウントは、申請後に審査を行った上で、郵送にて登録証をお送りします。申請からお手元に登録証が届くまでに数日の時間が掛かりますので時間に余裕を持って申請して下さい。

 
 

「第1回 DSTEP 講習会」参加申し込みフォーム

ページの先頭へ戻る