田部井 靖生 博士(科学)

[English | Japanese]
プロフィール
名前
        田部井 靖生 (たべい やすお)
所属
        理化学研究所革新知能統合研究センター
圧縮情報処理ユニット (ユニットリーダー)
メール
yasuo.tabei (at)riken.jp
ブログ
日本語 英語
雇用
        2013-2016 科学技術振興機構 さきがけ 「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」 さきがけ研究者
        2010-2013 科学技術振興機構ERATO湊離散構造処理系プロジェクト研究員
        2009-2010 日本学術振興会特別研究員 (PD)
        2008-2009 日本学術振興会特別研究員 (DC2)
        2006-2008 産業技術総合研究所・生命情報工学研究センター
インターン
        2009 プリファードインフラストラクチャー
        2008 Max Planck Institute for Biological Cybernetics
リンク
Google Scholar
DBLP
SlideShare 
arXiv
github

理化学研究所・革新知能統合研究センターでの人材募集
理研・革新知能研究センター・圧縮情報処理ユニットでは、簡潔データ構造などのデータ圧縮技術、人工知能、機械学習、データマイニングなどの基礎技術とそのバイオインフォマティクスやケモインフォマティクスへの応用に関する研究を一緒にしていただける方を募集しています。勤務地は理研AIPオフィス(東京・日本橋)となります。以下のポストにご興味のある方はまずはメールにてご連絡ください。
  • 博士研究員 : 博士号を取得している方が対象となります。
  • テクニカルスタッフまたは技師 : 博士号を取得していない方が対象となります。
  • リサーチアソシエイト(RA) : 大学院修士・博士課程に在籍している学生が対象となります。理研に在籍し研究を行います。学振と同程度のサポートもあります。
  • インターン: 大学院修士・博士課程に在籍している学生が対象となります。2,3ヶ月の間、理研に在籍し研究を行います
最近のニュース
  • Min-Max距離のためのSketchSortの実装を公開しました。Link (2017年8月25日)
  • 化合物ディスクリプターの高速類似度検索手法に関する論文が類似度検索に関する国際会議SISAP'17に採択されました。(2017年7月17日)
  • ベイズ動的モード分解に関する論文が人工知能分野のトップ国際会議IJICAI'17に採択されました。(2017年5月13日)
  • 機械学習のドラッグターゲットと代謝パスウェイ予測への応用論文が採択されました。(2017年4月4日)
  • 理化学研究所革新知能統合研究センター圧縮情報処理ユニットリーダーに着任致しました。(2017年4月1日)

過去のニュース


今後の予定

  • 2017年10月16日17日にドイツ・ミュンヘンで開催される類似度検索に関する国際会議SISAP'17にて高速類似度検索アルゴリズムの研究発表を行います。
  • 2017年10月13日,16日,17日にstringmasters'17をAIP日本橋オフィスで開催します。link
  • 2017年5月12日(金) 情報処理学会九州支部報告会で講演します。

研究トピック

ビッグデータを効率的に処理するための人工知能技術とその応用に関する技術の研究をしています。開発した技術を実データに応用することにも重点をおいています。これまでの研究のキーワードは以下となります。

機械学習
全ペアー類似度検索, 類似度検索
条件付確率場
ブースティング
データーマイニング
グラフ類似度検索
グラフマイニング
頻出パターンマイニングアルゴリズム
データ圧縮
簡潔データ構造
透過的データ圧縮
文法圧縮
Lempel-Ziv圧縮
バイオインフォマティクス・ケモインフォマティクス
化合物フィンガープリントの類似度検索
化合物-タンパク質相互作用予測
代謝パスウェイ予測
RNA配列の構造アライメントアルゴリズム

ジャーナル論文

  • (new) Yoshihiro Yamanishi, Yasuo Tabei, Masaaki Kotera: Statistical machine learning for agriculture and human healthcare based on biomedical big data, to be appeared in the Proceedings of Forum "Math-for-Industry" 2017.
  • Yasuo Tabei, Yoshihiro Yamanishi, Masaaki Kotera: Simultaneous prediction of enzyme orthologs from chemical transformation patterns for de novo metabolic pathway reconstruction, Bioinformatics, 32, i278-i287, 2016. Link to the paper
  • Yoshimasa Takabatake, Kenta Nakashima, Yasuo Tabei and Hiroshi Sakamoto: siEDM: an efficient string index and search algorithm for edit distance with moves, Algorithms, 9, 26. Link to the paper
  • Yoshihiro Yamanishi*, Yasuo Tabei*, Masaaki Kotera:  Metabolome-scale de novo pathway reconstruction using regioisomer-sensitive graph alignments, Bioinformatics, 31, i161-i170, 2015. (*joint first author) Link to the paper
  • Masaaki Kotera*, Yasuo Tabei*, Yoshihiro Yamanishi*, Ai Muto, Yuki Moriya, Toshiaki Tokimatsu, Susumu Goto: Metabolome-scale prediction of intermediate compounds in multi-step metabolic pathways with a recursive supervised approach, Bioinformatics, 30(12), i165-i174, 2014. (*joint first author) Link to the paper
  • Masaaki Kotera*, Yasuo Tabei*, Yoshihiro Yamanishi*, Toshiaki Tokimatsu, Susumu Goto: Supervised de novo reconstruction of metabolic pathways from metabolome-scale compound sets, Bioinformatics, 29(13), i135-i144, 2013. (*joint first author) Link to the paper
  • Yasuo Tabei, Edouard Pauwels, Veronique Stoven, Kazuhiro Takemoto, Yoshihiro Yamanishi: Identification of chemogenomic features from drug-target interaction networks using interpretable classifiers, Bioinformatics, 28(18), i487-i494, 2012. Link to the paper
  • Junichi Ito, Yasuo Tabei, Kana Shimizu, Koji Tsuda and Kentaro Tomii: PoSSuM: a database of similar protein–ligand binding and putative pockets, Nucl. Acids Res., DB issue 2012;40:D541-8. Link to the paper
  • Junichi Ito, Yasuo Tabei, Kana Shimizu, Kentaro Tomii and Koji Tsuda: PDB-scale analysis of known and putative ligand binding sites with structural sketches, Proteins, 80, 747-763, 2012. Link to the paper
  • Yasuo Tabei and Koji Tsuda: SketchSort: Fast all pairs similarity search for large databases of molecular fingerprints, Molecular Informatics, 30(9), 801-807, 2011. Link to the paper
  • Yasuo Tabei and Kiyoshi Asai: A local multiple alignment method for detection of non-coding RNA sequences, Bioinformatics, 25(12), 1498-1505, 2009. Link to the paper
  • Kiyoshi Asai, Hisanori Kiryu, Michiaki Hamada, Yasuo Tabei, Kengo Sato, Hiroshi Matsui, Yasubumi Sakakibara, Goro Terai and Totai Mituyama: Software.ncrna.org: web servers for analyses of RNA sequences, Nucl. Acids Res., 36, W75-W78, 2008. Link to the paper
  • Yasuo Tabei, Hisanori Kiryu, Taishin Kin and Kiyoshi Asai: A fast structural multiple alignment method for long RNA sequences, BMC Bioinformatics, 9(33), 2008. Link to the paper
  • Hisanori Kiryu, Yasuo Tabei, Taishin Kin, and Kiyoshi Asai: Murlet: A practical multiple alignment tool for structural RNA sequences, Bioinformatics, 23(13), 1588-1598, 2007. Link to the paper
  • Yasuo Tabei, Koji Tsuda, Taishin Kin, and Kiyoshi Asai: SCARNA: fast and accurate structural alignment of RNA sequences by matching fixed-length stem fragments, Bioinformatics, 22(14), 1723-1729, 2006. Link to the paper

国際会議/ワークショップ論文(refereed)

  • (new) Yasuo Tabei and Simon J. Puglisi: Scalable similarity search for molecular descriptors, 10th International Conference on Similarity Search and Applications (SISAP), 2017. 
  • (new) Naoya Takeishi, Yoshinobu Kawahara, Yasuo Tabei, Takehisa Yairi: Bayesian dynamic mode decomposition, 26th International Joint Conference on Artificial Intelligence (IJCAI), 2017. Link to the paper
  • Yasuo Tabei, Hiroto Saigo, Yoshihiro Yamanishi, Simon J. Puglisi: Scalable partial least squares regression on grammar-compressed data matrices, 22nd ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2016. (acceptance rate:(142/784=)18%) Link to the paper
  • Yasuo Tabei, Yoshihiro Yamanishi, Masaaki Kotera: Simultaneous prediction of enzyme orthologs from chemical transformation patterns for de novo metabolic pathway reconstruction, 23rd International Conference on Intelligent Systems for Molecular Biology (ISMB), 2016. (acceptance rate: (41/187)=21%) Link to the paper
  • Yoshimasa Takabatake, Yasuo Tabei, Hiroshi Sakamoto: Online self-indexed grammar compression, 22nd edition of the International Symposium on String Processing and Information Retrieval (SPIRE), 2015. 
  • Djamal Belazzougui, Patrick Cording, Simon J. Puglisi, Yasuo Tabei: Access, rank, and select in grammar-compressed strings, 23rd European Symposium on Algorithms (ESA), 2015. (acceptance rate: (85/320=)26%)
  • Yoshihiro Yamanishi*, Yasuo Tabei*, Masaaki Kotera: Metabolome-scale de novo pathway reconstruction using regioisomer-sensitive graph alignments, ISMB/ECCB, 2015. (*joint first author) (acceptance rate: (43/241=)18%) Link to the paper
  • Djamal Belazzougui, Travis Gagie, Paweł Gawrychowski, Juha Kärkkäinen, Alberto Ordóñez, Simon J. Puglisi, Yasuo Tabei: Queries on LZ-Bounded Encodings, Data Compression Conference (DCC), 2015. (selected as a full paper and an oral presentation) full-version(arXiv)
  • Yoshimasa Takabatake, Yasuo Tabei, Hiroshi Sakamoto: Online pattern matching for string edit distance with moves, 21st International Symposium on String Processing and Information Retrieval (SPIRE), 2014. full-version(arXiv)
  • Masaaki Kotera*, Yasuo Tabei*, Yoshihiro Yamanishi*, Ai Muto, Yuki Moriya, Toshiaki Tokimatsu, Susumu Goto: Metabolome-scale prediction of intermediate compounds in multi-step metabolic pathways with a recursive supervised approach, 22nd Annual International Conference on Intelligent Systems for Molecular Biology (ISMB), 2014. (*joint first author) (acceptance rate:(37/191=)19%) Link to the paper
  • Yoshimasa Takabatake, Yasuo Tabei, Hiroshi Sakamoto: Improved ESP-index: a practical self-index for highly repetitive texts, 13th International Symposium on Experimental Algorithms (SEA), 2014. full-version(arXiv) proceeding(pdf)
  • Shirou Maruyama and Yasuo Tabei: Fully Online Grammar Compression in Constant Space, Data Compression Conference (DCC), 2014. (selected as a full paper and an oral presentation) full-version(arXiv) proceeding(pdf)  
  • Yasuo Tabei and Yoshihiro Yamanishi: Scalable prediction of compound-protein interactions using minwise hashing, 24th International Conference on Genome Informatics (GIW), 2013. Link to the paper slide(slideshare)
  • Masaaki Kotera, Yasuo Tabei, Yoshihiro Yamanishi, Yuki Moriya, Toshiaki Tokimatsu, Minoru Kanehisa and Susumu Goto: KCF-S: KEGG Chemical Function and Substructure for improved interpretability and prediction in chemical bioinformatics, 24th International Conference on Genome Informatics (GIW), 2013. Link to the paper
  • Hiroaki Iwata, Sayaka Mizutani, Yasuo Tabei, Masaaki Kotera, Susumu Goto and Yoshihiro Yamanishi: Inferring protein domains associated with drug side effects based on drug-target interaction network, 24th International Conference on Genome Informatics (GIW), 2013. Link to the paper
  • Shirou Maruyama, Yasuo Tabei, Hiroshi Sakamoto, Kunihiko Sadakane: Fully-Online Grammar Compression, 20th String Processing and Information Retrieval Symposium (SPIRE), 2013. paper(pdf) slide(slideshare)
  • Yasuo Tabei, Akihiro Kishimoto, Masaaki Kotera, Yoshihiro Yamanishi: Succinct Interval-Splitting Tree for Scalable Similarity Search of Compound-Protein Pairs with Property Constraints, 19th ACM SIGKDD Conference on Knowledge Discovery and Data Mining (KDD), 2013. (acceptance rate:(126/726=)17%) paper(pdf)
  • Masaaki Kotera*, Yasuo Tabei*, Yoshihiro Yamanishi*, Toshiaki Tokimatsu, Susumu Goto: Supervised de novo reconstruction of metabolic pathways from metabolome-scale compound sets, ISMB/ECCB2013 (*joint first author) (acceptance rate:(40/247=)16%) Link to the paper
  • Yasuo Tabei, Yoshimasa Takabatake, Hiroshi Sakamoto: A Succinct Grammar Compression, 24th Annual Symposium on Combinatorial Pattern Matching (CPM), 2013. paper(pdf) slide(slideshare)
  • Yoshimasa Takabatake, Yasuo Tabei, Hiroshi Sakamoto: Variable-Length Codes for Space-Efficient Grammar-Based Compression, 19th International Symposium on String Processing and Information Retrieval (SPIRE), Cartagena, Colombia, 2012. paper(pdf) 
  • Yasuo Tabei: Succinct Multibit Tree: Compact Representation of Multibit Trees by Using Succinct Data Structures in Chemical Fingerprint Searches, 12th Workshop on Algorithms in Bioinformatics (WABI) ALGO, Ljubljana, Slovenia, 2012. paper(pdf) slide(slideshare)
  • Yasuo Tabei, Edouard Pauwels, Veronique Stoven, Kazuhiro Takemoto, Yoshihiro Yamanishi: Identification of chemogenomic features from drug-target interaction networks using interpretable classifiers, 11th European Conference on Computational Biology (ECCB), Basel, Switzerland, 2012. (acceptance rate:(48/341=)14%) Link to the paper
  • Yasuo Tabei, Daisuke Okanohara, Shuichi Hirose, Koji Tsuda: LGM: Mining Frequent Subgraphs from Linear Graphs, The 15th Pacific-Asia Conference on Knowledge Discovery and Data Mining(PAKDD), Shenzhen, China, 2011. (acceptance rate:(90/331=)27%) paper(pdf) slide(pdf)
  • Yasuo Tabei and Koji Tsuda: Kernel-based Similarity Search in Massive Graph Databases with Wavelet Trees, Eleventh SIAM International Conference on Data Mining (SDM), Arizona, USA, 2011. (acceptance rate:(86/343=)25%) paper(pdf) slide(pdf)
  • Yasuo Tabei, Takeaki Uno, Masashi Sugiyama, Koji Tsuda: Single Versus Multiple Sorting in All Pairs Similarity Search, The 2nd Asian Conference on Machine Learning (ACML), Tokyo, Japan, 2010. (acceptance rate:(23/74=)31%) paper(pdf)  slide(pdf) slide(pptx)
  • 田部井靖生, 浅井潔, RNAを発見するためのローカルマルチプルアライメント手法, 第11回RNAミーティング 2009, 27--29 July, 新潟, 2009.
  • Yasuo Tabei, Daisuke Okanohara, Koji Tsuda: Mining Frequent Patterns from Linear Graphs, The Fourth International Workshop on Data-mining Statistical Science(DMSS), 7--8 July, Kyoto, Japan, 2009.

受賞

  • 第19回情報論的学習理論ワークショップ, ベストプレゼンテーション賞, 2016年11月17日(木) Link
招待講演
  • 圧縮情報処理とその周辺, 情報処理学会九州支部報告会, 2017年5月12日(金)
  • 文法圧縮の理論と実践, 第27回RAMPシンポジウム, セッション「離散構造とアルゴリズム」, 2015年10月15日(木)
  • コンパクトなデータ表現による機械学習, 第14回情報科学フォーラム(FIT), イベント企画, ビッグデータ解析のための機械学習技術, 2015年9月17日(木)
  • 透過的データ圧縮法による高速かつ省メモリーなビッグデータ活用技術の創出, 第77回情報処理学会全国大会, CREST・さきがけ「ビッグデータ」2領域 成果報告会, 2015年3月18日 (火)
  • Dictionary based compression for processing massive genome sequences, ゲノムテクノロジー164委員, 産総研, ホスト:渋谷哲朗准教授, 2014年12月18日(木)
  • 透過的データ圧縮法による高速かつ省メモリーなビッグデータ活用技術の創出, ビッグデータ時代に向けた革新的アルゴリズム基盤, 京都リサーチパーク, 2014年1月11日(土)12日(日)
  • Kernel-based Similarity Search in Massive Graph Databases with Wavelet Trees, The 5th DMSS Workshop, 大阪大学中之島センター, 2011年3月29日(火),30日(水)

講演

  • Succinct Data Structure for Scalable Knowledge Discoveries, チュートリアルセッション, The 20th Pacific Asia Conference on Knowledge Discovery and Data Mining (PAKDD), 2016年4月19日(火)
  • Fast Similarity Search by Wavelet Tree, Similarity Search Seminar, IT University of Copenhagen, ホスト:Rasmus Pagh教授, 2014年12月5日(金)
  • Fast Graph Search by Wavelet Tree, University of Leister,  ホスト:Prof. Rajeev Raman, 2012年9月6日(木)
  • ウェーブレット木によるグラフデータベースの高速検索 , NTTコミュニケーション科学基礎研究所, ホスト:木村昭悟博士, 2012年3月5日(月)
  • Kernel-based Similarity Search in Massive Graph Databases with Wavelet Trees, Curie Institute Paris France, ホスト:山西芳裕博士, 2011年9月9日(月)
  • Kernel-based Similarity Search in Massive Graph Databases with Wavelet Trees, Max Planck Institute for Intelligent Systems Tübingen Germany, Hosted by Prof. Karsten Borgwardt, Sep. 14, 2011 (Wed.)
  • ウェーブレット木によるバイナリコードの高速検索, 第5回情報論的学習理論と機械学習研究会(IBISML), 2011年6月20-21日, 東京大学武田ホール
  • SketchSort: Fast All Pairs Similarity Search Method, 東京工業大学杉山研究室, ホスト:杉山将教授, 2010年10月26日(木) slide(pdf)
  • SketchSort: Fast All Pairs Similarity Search Method, お茶の水女子大学, ホスト:瀬々潤教授, 2010年10月14日(木) slide(pdf)
  • Mining Frequent Subgraphs from Linear Graphs, Max Planck Institute for Informatics Germany, ホスト:西郷浩人博士, 2010年2月26日(金)
  • Mining Frequent Subgraphs from Linear Graphs, Max Planck Institute for Biological Cybernetics Germany, Hosted by Philipp Drewe, February 25, 2010 (Thr.)
  • SketchSort: An Efficient Method for All Pairs Similarity Search, Max Planck Institute for Informatics Germany, ホスト:西郷浩人博士, 2010年2月23日(火)
  • Mining Frequent Subgraphs from Linear Graphs, Curie Institute Paris France, ホスト: 山西芳裕博士, February 22, 2010 (Mon.)
  • Mining Frequent Subgraphs from Linear Graphs, 産業技術総合研究所生命情報工学研究センター, 2010年2月12日 (金)
  • Mining Frequent Subgraphs from Linear Graphs, 北海道大学, 湊真一教授, 2010年1月7日 (火)
  • Mining Structured Patterns from Linear Graphs, IBM 東京基礎研究所, ホスト: 鹿島久嗣博士, 2009年1月7日 (水)
  • A fast structural multiple alignment method for long RNA sequeces, Max Planck Institute for Informatics, ホスト:西郷浩人博士, 2008年9月11日(木) pdf
  • A local alignment model for non-coding RNA sequences and its application to local multiple alignment, 産業技術総合研究所生命情報工学研究センター, 2008年7月11日 (金) pdf

記事

  • 情報処理学会誌 57巻2号「文法圧縮最前線」2016年11月15日 link
  • 人工知能学会誌 私のブックマーク「簡潔データ構造」 2011年11月 link
  • 技術評論社 新春特別企画 「NIPS2010における発表論文に見る機械学習最前線」 2011年1月3日 (月曜日) link

セミナー資料

  • LPBoostの基礎と応用, 中川研究室機械学習勉強会, 2007年10月4日 (木曜日) ppt
  • Deep Belief Nets, CBRC ジャーナルクラブ, 2008年1月18日 (木曜日) pdf

研究助成

  • 戦略的創造研究推進事業(科学技術振興機構)
    • さきがけ「ビッグデータ統合利活用のための次世代基盤技術の創出・体系化」 (平成25年度第一期採択) 
  • 科学研究費補助金(日本学術振興会)
    • 基盤研究 B (分担) (平成28-30年度)
    • 基盤研究 B (分担) (平成26-28年度) 
    • 若手研究 B (代表) (平成24-26年度) 
    • 特別研究員奨励費 (代表) (平成20-22年度)

ソフトウェア

データマイニングと機械学習
  • SMBT (Succinct multibit tree for fast similarity searches of large-scale fingerprints)
  • gWT (Fast graph similarity search for massive graph databases)
  • SketchSort (Fast all pairs Similarity Search for cosine distance)
  • SketchSortE (Fast all pairs similarity search for Euclidean distance)
  • SketchSortJ (Fast all pairs similarity search for Jaccard-Tanimoto distance)
  • SketchSort-minmax (all pairs similarity search for minmax distance)
  • SACHICA++ (Scalable Algorithm for Characteristic/Homogeneous Interval Calculation)
  • LCM (Linear time Closed itemset Miner)
  • PrefixSpan (Frequent Sequential Pattern Miner)
  • iboost (Itemset Boosting)
  • データ構造
  • FM-index++ (c++ implementation of FM-index)
  • olca++ (c++ implementation of online grammar-based compression)
  • バイオインフォマティクス
  • PACHA (Pairwise Chemical Aligner)
  • SCARNA (fast and accurate structural pairwise alignment software for RNA sequences)
  • MXSCARNA (Multiple alignment software for RNA sequences)
  • SCARNA_LM (Local multiple alignment software for RNA sequences)

  • サブページ (1): 過去のニュース