​解析ツール

HOME  >  ソフトウェアリソース  >  解析ツール

ヒトゲノム解析センターが関わる研究グループにより開発されたゲノムデータを解析するための様々なツールです。ツールに個別の質問は、個々のツールの開発グループへお問い合わせください。

Neoantimon

Neoantimon は R 環境(Mac/Linux)において、がん細胞に特異的なネオ抗原 (neo-antigens) を探索するためのパッケージです。入力ファイルとして、当センターで開発された Genomon の出力する結果ファイル(テキストファイル)や他の変異解析プログラムにより作られた VCF ファイルなどを用いることが可能であり、一塩基変異 (SNV) や挿入欠失 (Indel)、構造多型 (SV) などから生成され得る変異ペプチド断片と HLA の親和性を網羅的に計算し、抗原掲示能力の高いペプチド (ネオ抗原) を抽出することが可能です。

EEM

EEM 法は遺伝子セット情報に基づいて発現データ中で共発現している遺伝子群、発現モジュールを抽出するツールです。

 
 
 
 
 
 
 
 
 
 
 

Genomon

Genomon はヒトゲノムの Exon 領域をシークエンスした結果ファイル (FASTQ) を、リファレンスゲノム (hg19) にマッピングし、 データ解析を行い、Mutation 候補の一覧を Excel で表示可能な TSV 形式で出力します。Genomon は、BWA、GATK、Picard、Annovar、cutadapt などの様々なオープンソフトウェアを組み合わせたパイプラインと呼ばれるソフトウェアです。

Open source clustering software

このソフトウェアはマイクロアレイデータなどの遺伝子発現データを分析するための C 言語で書かれたライブラリです。このライブラリは階層クラスタリング、k-means、 k-median クラスタリング、 2 次元自己組織化マップから構成されます。さらに、このライブラリのための Python と Perl のモジュールを用意しています。

SiGN-BN

SiGN-BN は遺伝子ノックダウン実験、患者組織由来細胞データ、薬剤投与時系列データなど、様々な条件下で観測された遺伝子発現データから静的・動的な遺伝子ネットワークを推定するためのソフトウェアです。小規模高精細な遺伝子ネットワークからヒト全遺伝子(プローブ)を含む超巨大な遺伝子ネットワークまで推定可能です。また推定した遺伝子ネットワークは Cell Illustrator Online で解析が可能です。

SiGN-SSM

SiGN-SSM は時系列で観測された遺伝子発現データから動的遺伝子ネットワークを推定するためのソフトウェアです。発現データに特徴的な、繰り返し測定された短時点かつ不等間隔のデータを適用可能です。推定した遺伝子ネットワークを用いて、発現制御解析だけでなく、異なる条件下での発現差解析などを行うことも可能です。また推定した遺伝子ネットワークは Cell Illustrator Online で解析が可能です。

BioRuby

BioRuby は国産の Ruby 言語のためのバイオインフォマティクス用ライブラリです。
様々なデータベースや解析ソフトウェア、各種ウェブサービスを利用する際に便利な機能を持ち、研究のためのデータ操作を行うツールボックスとして用いたり、複雑な解析パイプラインを自動化するために利用することができます。

Cell Illustrator Online

Cell Illustrator Online は、生体内パスウェイを描く機能とシミュレーションの機能が一つになったソフトウェアのセルイラストレータのオンライン版です。インターネット経由で起動するオンラインアプリケーションであるという特性を生かした拡張が数多くあります。ユーザ登録することで、 1 か月間 Cell Illustrator Online を利用できます。また、Cell Illustrator Online Player はユーザ登録することなく利用することができます。

PSORT, PSORT II, iPSORT

中井教授 (HGC) が開発に関与した、アミノ酸配列とその生物種 (例: グラム陽性細菌) の情報から細胞内のタンパク質局在部位を予測するためのプログラム群です。

Melina & Melina2

中井教授 (HGC) らによる、機能的に関連した一群の DNA 配列から共通のモチーフを抽出する作業を支援するツールです。 すなわち、既存のモチーフ抽出プログラムにおいて、異なるパラメータセットに基づく抽出結果を比較したり、異なるアルゴリズムによる抽出結果を比較する作業を支援します。

 

EGassembler

EGassembler は、特定生物種の EST 配列をマルチファスタ形式で与えることで、配列のクリーニング、ベクターやリピートのマスク、アセンブルまでを自動的に行うことのできるツールです。

TFBIND

角田チームリーダー (理研 SRC) による、独自の閾値を用いた転写因子結合 部位 (TATA box, GC box, CCAAT box, 転写開始部位 (TSS) を含む)検索のた めのソフトウェアです。彼のアルゴリズムは、転写因子結合部位の局所的 な過剰表現を発見し、結合スコアの最適な閾値を決定します。この最適値 と Wingender 博士らによる転写因子データベース TRANSFAC R.3.4 を用いて、 ゲノム DNA 中の転写因子結合部位を (特に主要な結合配列については) 高い精度で発見することができます。

  • Twitter @schgc

ALL RIGHTS RESERVED. COPYRIGHT © HUMAN GENOME CENTER, THE INSTITUTE OF MEDICAL SCIENCE, THE UNIVERSITY OF TOKYO