ようこそ!

ようこそ UT Genome Browser (University of Tokyo Genome Browser) へ。このゲノムブラウザでは,対象生物(現在は medaka)のゲノム情報を様々な側面から観察することができます。例えば,以下のようなことを様々に組み合わせて行うことができます。

  • 遺伝子名,クローン名,クラスタ名などからの遺伝子を検索して,その周りにある遺伝子群を表示する。
  • あなたが持っている塩基配列をゲノム配列上に写像して,周囲の様子を観察する。
  • 塩基配列そのものを得る。

UT Genome Browser についてのご質問,ご意見,ご感想などは,是非 webmaster@utgenome.org までお寄せください。

キーワード検索

keyword_top.png

トップ画面のトップには,図のようなキーワード検索画面があります。ここにキーワードを入力すると,それに関するゲノム上の位置を表示することができます。キーワードの詳細な入力方法については,同じ画面内にある解説をご覧ください。なお,クエリーの一部を含んでいるキーワードは全て表示されます。例えば "BCD" というクエリーは "ABCD" "ABCDE" "BCD" "BCDF" などにマッチします(sary を用いて実現しています)。

遺伝子一覧

keyword_genes.png

キーワードにマッチする遺伝子が複数あった場合,その遺伝子の一覧が表示されます。表の左にあるマークをクリックすると,その遺伝子が写像されている位置に移動することができます。この様な一覧を利用するのは,例えばキーワードとしてクラスタ名をしていた場合や,遺伝子名の一部しか指定しなかったような場合です。もし完全な Genbank Accession などをキーワードとして指定した場合,この一覧画面は省略されます。

写像位置一覧

keyword_locs.png

対象の遺伝子が複数の箇所に写像されていた場合,その位置の一覧が表示されます。表の左にあるマークをクリックすると,その遺伝子が写像されている位置に移動することができます。もし写像された位置が 1 つしか存在しなかった場合,この一覧画面は省略されます。

塩基配列の写像

トップ画面の下部にあるonline mappingのフォームから塩基配列を入力し、 アライメントサーバーALPSに対して配列を投げることで、ゲノム配列へのマッピングを行うことができます。

online01.PNG

アライメントの対象生物とそのゲノム配列のリビジョンを選択してSearchボタンをクリックすると、入力した配列を 指定のゲノム配列に対してアライメントされます。

online05.PNG
online02.PNG

アライメント結果ページにある、上図のようなボタンをクリックするとブラウザーでアライメントされた配列を表示できます。 下図はALPS mappingが追加された状態

online03.PNG

メイン画面

browser_main.png

トップ画面から遺伝子名などを入力していくと,最終的には図のようなメイン画面に到達します。この画面はゲノム配列中の特定の部分を,様々なトラックを使ってみることができるもので,UT Genome Browser の主要な画面です。この画面では次のようなことが行えます。

  • 観察する範囲を移動したり拡大縮小したり反転したりする。塩基レベルまで拡大したり,染色体を一望したりする。
  • トラックを削除したり,追加したり,順番を入れ替える。
  • 各トラックの表示方法をカスタマイズする。
  • 今表示している範囲の塩基配列を FASTA 形式で得る。
  • 再度キーワード検索をする。

以下では,それぞれの機能について詳細な解説を行います。

移動と拡大縮小

メイン画面上では,観察している範囲を移動したり拡大縮小したりして切り替えることができます。その方法には次のようなものがあります。

  • 入力ボックスに値を入力する方法
  • 移動ボタンを利用する方法
  • Overview, Ruler, Zooming トラックを利用する方法
browser_params.png

まず,メイン画面中にある上図のような入力ボックスに値を入力する方法があります。この方法だと,入力した値を使って見たい位置に直接移動することができます。それぞれの項目の意味は以下の通りです。

species表示する種を選択します。種によって選択可能なリビジョンは変化します。現在は medaka のみが選択可能です。
revision表示する種のゲノム配列のリビジョンを指定します。medaka に関してリビジョン名は yyyymm 形式になっています。リビジョンによって選択可能な対象は変化します。
target選択された種とリビジョンの中での,表示する対象を選択します。例えば medaka の 200406 リビジョンでは scaffold123 などスキャフォルド名を指定することができますが,chr3 などの染色体名を指定することはできません。これはもっと後のリビジョンで可能になります。
start表示する対象の配列の中での,表示開始位置を指定します。数値は 1-origin で指定し,配列の最初の塩基は 1 塩基目です。
end表示する対象の配列の中での,表示終了位置を指定します。数値は 1-origin で指定します。表示開始位置より大きい値が指定された場合は正方向に配列を表示し,小さい値が指定された場合は逆方向に配列を表示します。いずれの場合も,表示終了位置として指定された塩基を含んだ配列を表示します。
width出力するトラックの画像の幅を指定します。見やすい大きさに調整してください。通常は画面の幅程度での利用を想定していますが,その 10 倍程度の値を指定して幅の長いトラックを出力して,ブラウザを使ったスクロールをするのも便利です。

それぞれの項目を操作して Apply ボタンを押すと,指定された位置に移動することができます。

browser_moves.png

さらに,上図のような操作ボタンを利用する方法があります。先の入力ボックスを使う方法は観察する範囲を厳密に指定することができますが,数値を入力する必要があるのでやや煩雑です。この問題を解消するため,より直感的に操作できるボタンが用意されています。ボタンには以下のようなものがあります。

移動 (rr.png, r.png, f.png, ff.png)
rr.png, r.png, f.png, ff.png は移動のためのボタンです。rr.png は左方向に一画面分スクロールし,r.png だと半画面分となります。逆向きのボタンは右方向へ向かうものです。
倍率指定 (zoomout.png, zoomin.png, zoom10x.png, zoom1x.png, zoom01x.png, zoom001x.png, zoom0001x.png)
zoomout.png, zoomin.png は縮小および拡大を行うものです。ボタンを押すと,表示倍率が今の半分または倍になります。分数形式になっているボタンは倍率を直接指定するものです。倍率の単位は pixel/bp となっています。例えば,zoom1x.png であれば 1bp が 1pixel に表示されていることを意味し,zoom01x.png であれば 10bp が 1pixel に表示されていることを意味します。ですので,zoom10x.png は塩基レベルまで拡大表示する倍率であり,zoom0001x.png は 1Mbp 程度の長さを一望できる程度にまで縮小した倍率です。なお,拡大縮小をした場合に位置の移動は伴わず,視点の中央の位置が維持されます。ただし,縮小した結果配列の端に到達してしまった場合はこの限りではありません。

また,Overview, Ruler, Zooming トラックを利用した移動の方法があります。これらのトラックはその適当な位置をクリックすると,全体の視点を移動させることができます。詳しくは Overview トラックRuler, Zooming トラック の説明を参照してください。

各ボタンの説明

(rev)

UT Genome Browser では,配列を反転させて表示することができます。通常,塩基配列は左から右へと表示されますが,これを逆向きに表示することができます。逆向きに表示させる方法は,移動のための入力ボックスで start を end よりも大きくすることで実現できます。また,これを簡単に行うために (rev) ボタンを押すのも良い方法です。(rev) ボタンは,表示している範囲の start と end を逆転させることができるため,正方向で見ていた場合は逆方向に,逆方向で見ていた場合は正方向に,それぞれ表示を切り替えることができます。

また,反転状態で (fasta) ボタンを押した場合,正方向の塩基配列の相補鎖の配列が出力されます。

(top)

トップ画面に戻ります。現在見ている表示範囲,トラック,各トラックの設定などの情報は保持されます。

(clear)

トップ画面に戻ります。現在見ている表示範囲,トラック,各トラックの設定などの情報はは全て消去され,初めてサイトを訪れた状態と同様になります。

(track)

現在表示中のトラックの追加,削除,並べ替えを行うことができます。詳しくは後述します。

(fasta)

現在表示している範囲のゲノム配列を,FASTA 形式で出力します。名前を付けて保存しようとした場合,適切なファイル名で保存するよう指示されます。例えば medaka-200406-scaffold429(64587-66612).fasta などというファイル名になります。

トラックの追加,削除,並べ替え

browser_track.png

メイン画面中の (track) ボタンを押すと,上図のようなトラック編集画面がポップアップ表示されます。ここではトラックの追加,削除,並べ替えなどを行うことができます。この編集画面は大きく displaying tracks, removed tracks, add new track に分かれており,それぞれの領域で違った操作が可能になっています。

displaying tracks
ここでは表示中のトラックの一覧に対して,削除と順番の変更を行うことができます。削除されたトラックは次の removed tracks 領域に移動されます。
removed tracks
ここは displaying tracks の中で削除されたトラックの一覧が表示される,いわばゴミ箱のような領域です。ここに表示されるトラックに対しては unremove という操作を行うことができ,削除したトラックを再び表示させることができます。
add new track
現在の一覧にないトラックを追加することができます。トラックの URL を指定して add ボタンを押すと,トラックが正しく読み込まれれば displaying tracks の最後に追加されます。

各トラックの表示設定

browser_optparam.png

メイン画面中で,トラック名の横の cfg.png ボタンを押すと,そのトラックの表示を上図のようにカスタマイズすることができます。カスタマイズできる内容はトラックによって違い,カスタマイズできないトラックもあります。詳細については各トラックの説明を参照してください。

主要なトラックの説明

Overview トラック

track_overview.png

Overview トラックは,今表示している範囲が全体の中でどこなのかを示すトラックです。上図のような Overview トラックの場合,配列全体の長さは 150k 程度で,今は 125k-145k 程度の範囲の領域を表示していることを示しています。

Overview トラックの適当な位置をクリックすると,配列中のその位置が中央になるように視点が移動します。例えば上図のような状態から 100k と書いてある付近をクリックした場合,90k-110k 程度の範囲の領域へと視点が移動されます。

Ruler, Zooming トラック

track_ruler.png
track_zoomer.png

Ruler トラックと Zooming トラックは,ともに同じ内容を色違いで表示しています。この 2 角トラックは,今表示している範囲が全体の中で何塩基目に当たるのかを数値で表示しています。

Ruler トラックの適当な位置をクリックした場合,その位置が中央になるように視点が移動されます。例えば Ruler の右端をクリックした場合,メイン画面の >> ボタンを押したのとほぼ同じ効果が得られます。メイン画面の倍率ボタンを使用する前は Ruler トラックで興味のある領域をセンタリングしておくと,その後の拡大をスムーズに行うことができるでしょう。

Zooming トラックの適当な位置をクリックした場合,Ruler トラックの効果に加えて 2 倍の拡大が行われます。例えば Zooming の中央をクリックすればメイン画面の [+] ボタンと同様の効果となり,右端をクリックすれば >> ボタンを押してから [+] ボタンを押したのと同じ効果となります。何か興味のある情報が表示された場合に,それを拡大して見ていく場合に便利に利用できます。

BaseColor トラック

track_basecolor.png
track_basecolor2.png

BaseColor トラックは,塩基配列をそのまま色に置換したものです。ATGC の 4 種類の塩基が,そのまま色に置換されて表示されています。1pixel あたり 1bp で表示している状態が,このトラックとしては最も自然です。トラックを縮小して表示すると,その領域にある適当な塩基の色を代表値として表示します(上図上)。拡大して表示すると,一定のところで塩基配列を文字で見ることができます(上図下)。

また,塩基を色に変換する方法についてはカスタマイズが可能です。例えば,GC だけを着色するようにすれば,簡易 GC Content トラックなどとして利用することができます。

もし,配列そのものをテキストで必要な場合は FASTA 出力を使うと良いでしょう。

gap トラック

track_gap.png

gap トラックはscaffold中のgapの位置を黒く表現したものです。gap以外のところをクリックすると対応するcontig全体の 配列をFASTA形式で取得することができます。FASTA 出力とは違い、表示されている範囲ではなく contig全体が出力されます。

GC Content トラック

track_gccontent_index.pngtrack_gccontent.png

GC ContentトラックとはGCの含まれる割合をほぼ5pixelごとにグラフで表現したトラックです。1塩基に対応するpixel数が 5pixel以上になるとその塩基がGCかATかの色分けが表現されることになります。

Mapped Gene トラック

track_mappedgene_index.pngtrack_mappedgene.png

mappdGeneトラックはmedaka,zebrafish,fuguのESTをALPS(http://alps.gi.k.u-tokyo.ac.jp)を 使ってマッピングした結果を表示したものです。遺伝子のマッピングされた領域は直線、exon部分が長方形で表現 され、マッピングされた向きは矢印で表現しています。 上図はpack styleでmedakaのESTを黒、fuguのcDNAを緑に色分けして表示しています。表示設定については以下に 詳しくまとめます。

マッピングした遺伝子

  • medaka UniGene Build#10
  • zebrafish UniGene#71
  • fugu Ensembl Pufferfish v21.2c.1 (10 May 2004)

表示設定

mappdGeneと書かれた横の cfg.png ボタンを押すと表示設定が出てきます。その設定について説明していきます。 設定には大きく分けて3種類あって、表示スタイル全体を変更するもの、ある遺伝子のマッピング結果を表示するか しないかを変更するもの、遺伝子の色を変更するものの3種類あります。表示するかしないかの条件設定はすべて 満たしたものだけ表示されます。色指定は横にある"use this color"というボタンを押してある設定が採用されます。

  • style select settig
    mappingされた遺伝子の表示スタイルを変更することができます。表示スタイルにはfull,pack,small,denseの4つが あります。
  • full
    1行あたりに1つの遺伝子のマッピングされた位置を表示しています。左端に各遺伝子のGenbank Acc.もしくはEnsembl Gene IDが 書かれています。
    genestyle_full.PNG
  • pack
    ESTのマッピングした位置とその横の遺伝子名(Genbank Acc. または Ensembl Gene ID) を1行に複数表示することにより、 表示スタイルfullよりも表示をコンパクトにしています。
    genestyle_pack.PNG
  • small
    1つの遺伝子のの表示される上下の幅を最小限にしたスタイルです。full,packとは違い、遺伝子名は 表示されません。
    genestyle_small.PNG
  • dense
    すべての遺伝子のマッピング位置を一行にまとめて表示したスタイルです。
    genestyle_dense.PNG

また、現在full以外のスタイルでは表示する遺伝子の数が200以上で50k以上の範囲を表示させたときには 遺伝子のグラフが表示されるようになっています。

  • fromSpecies disp setting
    medaka,fugu,zebrafishの3つの種のどの種のマッピングされた遺伝子を表示するかあるいは非表示にするかを設定します。 デフォルトでは すべての種が表示されます。チェックボックスにチェックされた種の遺伝子が表示されます。
  • fromSpecies color setting
    medaka,fugu,zebrafishの3つの種の遺伝子を色分けする設定です。
  • matchRatio gradation setting
    遺伝子のアラインメントのマッチ率によって遺伝子の色を変化させることができます。マッチ率1.0のときの色と マッチ率0.7のときの色を指定することにより、マッチ率に従いその中間色で色づけされます。
  • matchRatio ulbound setting
    ここで指定したマッチ率の範囲内の遺伝子のマッピング結果のみ表示されます。
  • coverRatio gradation setting
    遺伝子のアラインメントのカバー率によって遺伝子の色を変化させることができます。カバー率1.0のときの色と カバー率0.4のときの色を指定することにより、マッチ率に従いその中間色で色づけされます。
  • coverRatio ulbound setting
    ここで指定したカバー率の範囲内の遺伝子のマッピング結果のみ表示されます。
  • stage disp setting
    どの発生段階で発現されたESTを表示するかを選択することができます。
  • stage color setting 発生段階により色分けすることが出来ます。

遺伝子のリンク先

各遺伝子はstyleがfull,pack,smallの時にクリックすることが出来ます。クリックするとその遺伝子の 詳細情報のページが出力されます。

genscan トラック

track_genscan.png

このトラックはGenscanで予測された遺伝子を表示します。予測さらた遺伝子は直線、Exon は長方形で表示されます。それから、遺伝子の向きは矢印で表示されます。上図では、pack 方法で表現した遺伝子予測結果が表示されています。

表示設定

Genscanと書かれた横の cfg.png ボタンを押すと表示設定が出てきます。その設定について説明していきます。 ここで予測さらた遺伝子の表示スタイルを変更することができます。表示スタイルにはfull, pack,small,denseの4つがあります。

  • style select setting
    • full
      1行あたりに1つの遺伝子の位置を表示しています。ここでは各遺伝子のエキソンやイントロンの位置などが観察されます。
    • pack
      予測された遺伝子の位置情報とその横の遺伝子名 を1行に複数表示することにより、表示スタイルfullよりも表示をコンパクトにしています。
    • small
      1つの遺伝子の表示される上下の幅を最小限にしたスタイルです。full, packとは違い、遺伝子名は表示されません。
    • dense
      すべての遺伝子の位置を一行にまとめて表示したスタイルです。

予測遺伝子の詳細へリンク

各遺伝子はstyleがfull,pack,smallの時にクリックすることが出来ます。予測された遺伝子の位置や名前をクリックすると、予測された遺伝子のゲノム上の位置、長さ、全エキソン座標、全エキソンの塩基配列、予測されたタンパク質と予測されたタンパク質のホモロジー検索結果などの詳細情報が得られる。

comparative genomics トラック

FuguScaffold トラック

  • トラックの説明
    ALPSによるアラインメントで得られた、メダカのスキャフォールドに対して相同性のあるフグのスキャフォールドを遺伝子の表示スタイルで表示します。長方形で表示される領域は高い相同性(マッチ率60%以上)を表し、直線は相同性の低い領域か、フグゲノムにギャップがあることを示しています。矢印はフグメダカアラインメントの向きを表しています。フグスキャフォールドをクリックすると、そのスキャフォールドと対応するメダカスキャフォールドのドットプロットが表示されます。フグスキャフォールドの配列はドットプロットと同じページから得られます。フグの配列はFugu v.3.0です。

表示設定に関してはmappedGeneのstyle select settigと同じものが提供されています。

  • 方法
    フグの配列は重複のない300塩基長配列に切り、ALPSを使ってメダカスキャフォールドに対してマッピングされました。マッチ率60%以上の配列は"Longest Monotone Subsequence"アルゴリズムによってつなぎ合わされて相同領域とみなされ、10個以上のアラインメントを含む相同領域がトラックに表示されています。フグメダカスキャフォールド対一つに対して一番大きなの相同領域一つだけが表示されるため、インバージョンやマイクロリアレンジメントは表示されません。

ドットプロット

  • 説明
    フグメダカスキャフォールド間に相同性があれば、対角線上に並ぶ点が表示されます。点を打つ基準は配列類似度スコアによって決められており、対応する領域間のseedが多くマッチする時にスコアが大きくなります。seedマッチに対して、そのseedが多く出現するならばスコアを小さくし、あまり出現しないならばスコアを大きくすることで、タンデムリピートの影響を小さくしています。
dotplot.png

UT Genome Browser について

Ramen Assembler / UT Genome Browser Team Members

Development of "Ramen" genome assembler and assembly of medaka genome:
Masahiro Kasahara and Shin Sasaki
Development of "Ramen Viewer" for genome assembly:
Yukinobu Nagayasu
Design and development of UT Genome Browser, keyword search function, libraries for describing tracks:
Yukinobu Nagayasu and Koichiro Doi
Online mapping function for query sequences:
Tomoyuki Yamada
Comparative Genomics Track:
Yoichiro Nakatani and Wei Qu
Gene Prediction:
Ahsan Budrul
Mapped Gene Track:
Yasuhiro Kasai
Database access accelerators:
Takehiro Furudate and Atsushi Mori
Overall management:
Koichiro Doi and Shinichi Morishita

Acknowledgements

This work has been supported by Grant-in-Aid for Scientific Research on Priority Areas (Grant#12209003) to Shinichi Morishita.

Ramen Assembler Development Team members are indebted to Yuji Kohara and Tadasu Shin-i for their technical discussions on the whole genome shotgun assembly.

Members in the UT Genome Browser Development Team are grateful to Kiyoshi Naruse, Daisuke Kobayashi, and Takanori Narita for their valuable input to improve the functions of the browser in a variety of ways.