1. NGSデータに関して(2023年度6月版)
このセクションでは、Galaxy/NAACを利用したゲノムデータ解析に先立ち、NGS技術や解析の際に利用するデータ形式について解説いたします。
- 次世代シーケンス(NGS)技術やシーケンサーについて
- NGS 解析で用いられるデータ形式について
- FASTAファイル
- FASTQファイル
- SAM/BAM形式ファイル
- VCF形式ファイル
- GFF/GTF/BEDファイル
2. Galaxyを用いた解析方法の紹介
このセクションでは、Galaxyの概要について紹介した後、実際の解析ツールを使用しながら、Galaxyの操作方法や機能を解説します。
- Galaxyシステムとは?
- Galaxy/NAACを利用するための準備
- Galaxy/NAACに関する説明
- Galaxy/NAAC の画面の説明
- ヒストリー操作方法(データの削除など)
- データを Galaxy に入れる方法
- Galaxy/NAACを用いた解析手順の説明
3. ワークフローを利用した解析
このセクションでは、ワークフロー機能を用いた解析パイプラインなどについて解説します。
- ワークフローとは
- ワークフローの作り方1.既存ワークフローを用いる
- ワークフローの作り方2.エディターを使用して新規作成する
- ワークフローの作り方3.ヒストリーから作成する
4. Galaxyを使ったNGSデータ解析:その他機能
ここでは解析結果の可視化やデータバックアップとジョブの監視などの機能について解説します。
4-1. 可視化ツールについて
4-1-1. 可視化ツールご利用の案内
アカウントの登録をされた方を対象に、NGSデータ可視化のための2種類の環境を提供しております。Galaxy/AAC上から簡単な操作で解析結果の可視化を行うことができます。
ゲノムブラウザはGalaxyと同様にパスワードにより保護されます。
様々なファイル形式に対応したゲノムブラウザです。
マッピング結果、Variant情報などNGSデータの解析結果をブラウザ上で閲覧することができます。
*Galaxy/AACではFASTA, BAM, VCF, GFF3のファイル形式に対応しています。
TASUKE : http://tasuke.dna.affrc.go.jp/
TASUKEはリシーケンシングデータなど複数ゲノムを可視化するゲノムブラウザです。100以上の大規模なデータにも対応しています。
Variant情報,Depth情報,アノテーションなどを高速に閲覧することができます。
*Galaxy/AACではBAM, VCF, GFF3などのファイル形式に対応しています。
*リファレンスゲノムとしてイネゲノム(IRGSP-1.0)とダイズゲノム(Wiliams82.a2.v1)のみを提供しております。
Os-Nipponbare-Reference-IRGSP-1.0: http://rapdb.dna.affrc.go.jp
Wiliams82 assembly version 2 annotation version 1: https://www.soybase.org/
4-1-2. 利用するには
までメールにて申請をお願いいたします。その際、下記の必要事項の記入をお願いいたします。
[ユーザID] Galaxy/AACのユーザID
[利用したい環境] JBrowse or TASUKE
[使用するゲノムの種類] (TASUKEを利用したい方のみ)現在は、イネゲノム(irgsp-1.0)とダイズゲノム(Wiliams82.a2.v1)をご利用いただけます。
※1アカウントにつき1ゲノムのみ使用することができます。
[登録するデータの情報] (TASUKEを利用したい方のみ)登録用フォーマットをダウンロードし、登録するデータの情報を記入してください。ブラウザに登録されたデータが表示されます。表示例は公開版TASUKE(http://rice50.dna.affrc.go.jp)をご覧ください。
登録用フォーマットのダウンロードはこちら:csv download
申請後に登録方法と閲覧用のURLについてご連絡いたします。
4-1-3.利用方法
・4-1-3-1. JBrowse
利用申請が完了しますとGalaxy上からJBrowseのインストール作業(データの追加/削除)を行うことができます。まずは閲覧用URLへのアクセスが可能かご確認ください。
データ追加/削除はツールパネルの"JBrowse_tools"内のツール群を使用します。
1. JBrowse List
このツールは現在JBrowseに登録されているReference配列名の一覧と閲覧用のURLを取得します。
2. JBrowse make Reference
リファレンス配列をJBrowseに登録します。
3. JBrowse add BAM
BAMファイルを新規トラックとして登録します。
アライメント情報を閲覧できます。
4. JBrowse add GFF
GFFファイルを新規トラックとして登録します。
5. JBrowse add VCF
VCFファイルを新規トラックとして登録します。
6. JBrowse generate index
アノテーション情報やIDで検索をするためのインデックスを生成します。
7. JBrowse delete Track
指定のトラックを削除します。
8. JBrowse delete Reference
登録されたリファレンス配列を削除します。
インストール作業が終了しましたら、閲覧用URLへアクセスして
データ追加/削除が行われているかご確認ください。
・4-1-1-2. TASUKE
利用申請が完了しますとGalaxy上からJBrowseのインストール作業(データの追加/削除)を行うことができます。まずは閲覧用URLへのアクセスが可能かご確認ください。
データ追加/削除はツールパネルの"TASUKE_tools"内のツール群を使用します。
1. tasuke accession list
このツールはユーザーに割り当てられたIDを取得します。
ここから取得できるIDを対象にBAMやVCFファイルのアップロードを行うことができます。
2. tasuke bam upload
BAMファイルをTASUKEに反映させます。
アップロード先のIDとBAMファイルを指定して実行すると
指定したIDのRead depth情報をTASUKE上で閲覧できます。
3. tasuke bam delete
アップロードしたBAMファイルを削除します。
削除したいIDを指定することでTASUKE上からdepth情報が削除されます。
4. tasuke vcf upload
VCFファイルをTASUKEに反映させます。
アップロード先のIDとVCFファイルを指定して実行すると
指定したIDのvariant情報をTASUKE上で閲覧できます。
5. tasuke vcf delete
アップロードしたVCFファイルを削除します。
削除したいIDを指定することでTASUKE上からvariant情報が削除されます。
インストール作業が終了しましたら、閲覧用URLへアクセスして
データ追加/削除が行われているかご確認ください。
・4-2. ジョブ監視機能
ジョブの状態をGalaxy上から閲覧可能です。Toolsから「Job moitor」を選択すると実行中のジョブや過去のジョブについて状態を閲覧することができます。
また、日付による絞り込み検索が可能です。
・4-3. バックアップ機能 ※本機能は現在停止しています
すぐに使わないファイルなど、退避させておきたいファイルをヒストリーの外の領域にコピーすることが可能です。
コピーされたファイルはSFTPクライアント等で操作可能です。