home‎ > ‎

翻訳支援ツールとは何か

発表機会:2008年12月15日 『翻訳事典2010年度版』(アルク)向けに執筆した原稿をもとに大幅加筆

ムックのために執筆した原稿をもとに大幅に加筆したものです。

翻訳支援ツールとは何か

翻訳支援ツールとは何か?

代表的な翻訳支援ツールには「翻訳メモリ」(TM=Translation Memory)と「機械翻訳ソフト」(MT=Machine Translation)の2種類がある。一般的には機械翻訳ソフトのほうがよく知られているが、翻訳業界では翻訳メモリのほうが利用機会が多い。機械翻訳は人間に代わってソフトウェアが翻訳を行う仕組みであり、翻訳メモリは翻訳者が同じ文章をくりかえし翻訳しなくてすむように効率的にリサイクルする仕組みである。

産業翻訳には多くの分野があるが、翻訳支援ツールは主にマニュアルを翻訳するローカリゼーション(以下L10n)と呼ばれる分野を中心に導入されてきた。90年代後半には顧客企業の要請に応じる形で翻訳メモリの代表的ソフトであるTRADOSがL10n分野の翻訳会社に導入され、2000年代にはユーザーサポート用のウェブサイトで機械翻訳した文書を編集せずに公開する企業がでてきた。

これらの分野は翻訳メモリと機械翻訳がそれぞれの導入コストに見合う経済性を発揮できるニッチ市場である。L10n業界に定着している「バージョンアップ」のビジネスモデルと翻訳メモリの親和性が高いこと、L10n業界には短期間で多言語に翻訳する大量の需要があること、L10n業界の顧客企業はソフト開発の専門家としてツールの活用法を把握していたことが背景にある。

産業翻訳の他分野ではまだL10n分野ほど翻訳支援ツールの導入が進んでいないが、翻訳メモリと機械翻訳は現在も積極的な技術開発が続いており、従来は翻訳支援ツールの導入を見送ってきた産業翻訳分野でもいずれは検討に値する新しいツールが登場してくる可能性が高い。翻訳支援ツールの進歩が社会における翻訳のあり方を変え、その結果として翻訳業界が変わる可能性もある。翻訳者は翻訳支援ツールの動向から目が離せない。

翻訳メモリ(TM)とは何か?

翻訳メモリ(以下TM)とは、自分または他人が過去に行った翻訳をTMと呼ばれるデータベースに登録しておきリサイクルするツールである。TMには原文と訳文のペアが大量に蓄積されており、翻訳者はWordもしくはエディタなどで翻訳中に翻訳済みの文をTMに登録する操作と、TMを参照してリサイクルできる訳文を探す操作を交互に繰り返す。

TMは90年代後半のTRADOS登場とともに本格的に普及した。ソフトウェア会社にとって、それまで人手に頼っていたバージョンアップ時の旧版リサイクルを自動化して得られるコストダウンの効果は大きいため、トップダウンにより発注元>翻訳会社>翻訳者へとサプライチェーンにおけるTMの導入が急速に進んだ。  利用経験の蓄積に伴ってTM特有の問題点も明らかになってきた。品質の悪い翻訳がいったんTMに登録されると新版の翻訳にも流用されるため悪影響が続く、翻訳者は文単位で流用されるTMの隙間をぬって翻訳を進めることになりコンテキストを翻訳に反映させられない、TMはまず末端である翻訳者の手元に蓄積されるため全体のTMを統合するのに人手がかかる等がそれである。

現在のTMツールは、TMの自動的収集やワークフローの管理を組み込んだTMS=Translation Management Systemへと進歩している。Idiomが先鞭をつけたTMSでは蓄積されたTMを「言語資産」と呼び、その品質管理が従来以上に重視されるようになった。TMを企業間で共有する試みも始まっている。特定ベンダーの製品に拘束されることを避けようとする顧客企業によってTMXやXLIFFなどの共通フォーマットが整備されたことと、利用しやすくなった要素技術を組み合わせて個人でもTMツールを開発できるようになったことの結果として、TMおよびTMSツールの市場が流動化する可能性もある。

翻訳ソフト(MT)とは何か?

機械翻訳(以下MT)ソフトは人工知能の応用分野として学術研究が開始され、90年前後の商品化、その後の低価格化による個人市場開拓などの転機を経てきた。従来のMTでは元言語の構文を解析し、構造変換した後に目的言語を生成する処理を行っており、文法規則の改良と辞書の充実により品質が改善される。

これに対して用語の出現頻度や前後の用語と共に出現する確率などの統計的情報を活用する「統計翻訳」と呼ばれるMT技術が90年代に登場し、後にGoogleのMTなどに採用された。統計翻訳では文法規則を利用しない代わりに、統計情報を得る元になる対訳データベース(コーパス)の充実が不可欠になる。

ユーザーから見たMTの歴史は期待と失望の繰り返しだが、開発側では地道な改良を積み重ねている。英日間のMTでは進歩を実感しにくいが、韓日間や欧米言語間のように顕著な改善が見られる言語ペアもあり、多言語展開する製品のマニュアル翻訳にMTを活用したいという経営側からの要請は強い。MTを翻訳支援ツールとして評価する場合、過去の経験をもとに最新の製品を色眼鏡で見ないよう注意したい。同時に、周囲はMTに大きすぎる期待を抱きがちなので、現場から現実をうまく伝える必要がある。MT活用で得られる当面の生産性向上は10~20%程度と期待するのが妥当だろう。

原文の書き方次第でMTの精度に差が出ることはよく知られており、産業翻訳へのMT活用ではMTの精度が上がるような原文を書くことがライターに求められる。チェックを自動化するツールも商品化されている。他にも、翻訳対象文書をXML化することによって翻訳不要箇所や固有名詞の特定にXMLのタグを活用する工夫や、翻訳メモリとして蓄積された言語資産を統計翻訳のコーパスに転用することでMTとTMを複合する技術が可能である。MTの改良はまだまだ続く。