ガイド

この本を全部読むのは大変かもしれません。まずは興味のあるトピックから始めることをおすすめします。

事前に読んでおいたほうがいい本はありますか

自然言語処理や機械学習についての事前知識があったほうがいいと思います。

    • 「言語処理のための機械学習入門」
    • 「パターン認識と機械学習 : ベイズ理論による統計的予測」

オープンソースの機械翻訳システムを理解したい

この本はマニュアルではありませんので、もし使い方を知りたいのでしたら、各ホームーページを参考にしてください。

    • Moses: "Statistical Machine Translation"という本を読めば基本的なことがわかります。本書の場合、1.4節 → 5.1節 → 3.1節 (→ 4.3節) → 5.2節 → 5.3節 → 5.4節 (→ 2.3節)→ 7.2節 です。
    • Joshua/Cdec/Moses_chart: Mosesを理解したあとで、6.2節を読んでください。
    • Travatar: Mosesを理解したあとで、(6.2節 →) 6.3節
    • Cicada: Mosesを理解したあとで、6.2節 → 6.3節 (→ 7.3節)

高速に機械翻訳したい

    • 5.5節を参照してください。原言語および目的言語両言語を理解する技術者なら比較的簡単に高速かつ高精度に翻訳できるシステムを構築できます。

機械翻訳の方式の違いがよくわかりません

1章を読んでください。統計的機械翻訳以外に興味がありましたら、他の本を読んでください。

翻訳結果を評価したい

2章を読んでください。主観評価および自動評価の各手法についてはそれぞれ傾向が違いますので、機械翻訳の目的に沿ったものを選択してください。

単語アライメントを理解したい

    • GIZA++などで用いられているIBMモデル: 4.1節および4.2節
    • IBMモデルを改善する手法: 4.3節
    • 識別学習による単語アライメント: 4.4節
    • 構文などの木構造を利用した単語アライメント: 6.4節

探索問題に興味がある

    • グラフ構造: 5.4節
    • 超グラフ構造あるいは木構造: 6.1.3節〜6.1.5節、6.2.5節、6.2.6節、6.4節

チューニングを理解したい

この時点ででかなりマニアックです。

    • 一般的な機械翻訳システムで使われている手法: 7.2節
    • 大規模データあるいは高速に学習したい: 7.3節

機械翻訳の研究をしたい

トピックを絞って、一つの章を全部読んでください。もし質問等ございましたら、著者までご連絡ください。また、各章のまとめにある参考文献を読むことで重要な研究を知ることができます。