home‎ > ‎

技術革新は翻訳産業をどう変えるか

発表機会:2011年7月7日 日本翻訳ジャーナル 別冊1号(2011年9/10月号)記事

インバウンドの翻訳とアウトバウンドの翻訳

産業翻訳においてツールに象徴される技術革新の影響は大きいことは機械翻訳の台頭を考えればわかりやすい。現時点ですでに、機械により翻訳される文書の量は人間により翻訳される文書の量を凌駕しているといわれる。今後機械翻訳はどこまで社会に浸透し、人間翻訳とはどのようなかたちで住み分けていくことになるだろうか? 

このテーマを考えるときに、翻訳をインバウンドとアウトバウンドの二種類に分けて考えるのが有効であることが経験的にわかっている。 インバウンド1は自分が読むために訳す翻訳(外部から自分への方向なのでインバウンド)、アウトバウンドは他者に読ませるための翻訳(自分から外部への方向なのでアウトバウンド)を指す。顧客(発注元)から支払いをうけて翻訳会社や翻訳者がビジネスとして行う翻訳は、通常はすべてアウトバウンドの翻訳になる。


インバウンド翻訳の場合、機械翻訳のユーザーは自己責任でサービスを利用する。大意がわかればよいという意味で翻訳品質への要求もそれなりの水準であり、機械翻訳の出力がポストエディット2なしに利用される自動翻訳が開発目標となる。従来の機械翻訳開発はおそらくほとんどがこの「自動翻訳」を目指してきたようだ。

一方、アウトバウンド翻訳の場合は外国に自社製品を販売する目的で相手の言語に説明書を翻訳するケースを考えれば分かるように、少なくとも目標として翻訳にミスがないことが求められる。チョムスキーが言うように言語は無限の組み合わせで原文を作り出せるが、無限の組み合わせの原文をすべて正確に自動翻訳できる機械翻訳の手法は現在誰も思いついておらず、優秀な人間翻訳に匹敵する品質の自動翻訳は存在しない。したがって、アウトバウンド翻訳に求められる品質要求をクリアするには人間の介在が必要となる。そこに機械翻訳を持ち込むとすれば、機械翻訳の機能を組み込んだ翻訳支援ツールを提供して翻訳者を支援する形をとるのが順当な考え方といえる。

ポストエディットは解決にならない

機械翻訳と翻訳者を組み合わせる方法として現在広く行なわれているのは機械翻訳の出力を人間の翻訳者がポストエディットするという組み合わせ方であるが、この考え方は自動翻訳を目指して開発されたツールを目的が異なる翻訳支援ツールとして安易に転用しようとするアプローチであり、作業効率の点からも翻訳者にかかる負担の点からも過渡的な手法と考えるのが適当である。もっと分かりやすく言えば、ポストエディットをやらされることは翻訳者にとってはいい迷惑であり、発注元や翻訳会社において投資の決定権を持つ人はポストエディットよりももっと賢い機械翻訳の利用方法の開発に投資すべきである。 

ところで、アウトバウンド翻訳は産業として成立しているため市場原理が機能する。必ずしも高品質とは限らないが必ず存在する一定の品質基準を維持する前提条件を満たしたうえで、価格と納期の競争が発生する。ツールを有効に活用できる翻訳者/翻訳会社はツールを活用できない翻訳者/翻訳会社に対して品質・価格・納期のすべての点で優位に立てる可能性が高い。これはローカリゼーション翻訳で過去の十年間におきた現実であり、おそらく今後の十年間に他分野の翻訳にも少しずつ形を変えたうえで波及していくと考えるのが自然だろう。 

この場合、翻訳支援ツール=機械翻訳ではないのがこれまで一般的だったが、すでにいくつも先行する製品がでてきるように今後は機械翻訳を組み込んだ翻訳支援ツールが主流になると思われる。これは、機械翻訳の有効性が翻訳現場で実証的に証明されたからというよりも、機械翻訳を翻訳支援ツールに組み込むほうが品質・納期・価格で有利にたてる可能性が高いと多くのツール開発元が判断しており、またそれらの開発元の判断を多くの投資家が支持しているためである。しかし、そこで従来からある自動翻訳の出力をそのまま人間にポストエディットさせようとするのは、前述したとおり短絡的発想である。現在利用できる機械翻訳はすべて前述したインバウンド翻訳の目的のために開発された自動翻訳を目指すものであり、翻訳支援は目的が異なるからである。

求められる次世代の翻訳支援ツール

ここで最初の重要な理解に到達する。すなわち、機械翻訳で培われた技術や技法を翻訳者を支援する目的にそって配置した、いわば次世代の翻訳支援ツールはまだ登場していない。そのような次世代の翻訳支援ツールは運がよければこれから現場に登場してくるだろうが、そこで行なわれる作業はもはや「ポストエディット」ではなく、シンプルに「翻訳」と呼ばれるべきだろう。すなわち、産業として行う翻訳ではそのような次世代翻訳支援ツールを使用して翻訳を行うことが一般的になるだろう。そうなったとき、産業翻訳用途に限っては翻訳支援ツールを利用できない翻訳者の多くは翻訳支援ツールを活用する翻訳者に対して市場競争で非常に不利になるので、多くの翻訳分野で淘汰されていくことになるだろう。ローカリゼーション翻訳の分野では2011年現在、Tradosなどの翻訳支援ツールを利用しない翻訳者にはほとんど仕事がいかない。同じようなことが今後の十年間に他の多くの産業翻訳分野で起きる可能性がある。

まとめると、アウトバウンド翻訳では機械翻訳技術を利用した次世代翻訳支援ツールを活用する翻訳者が主流となり、そこで展開されるのは一定以上の翻訳品質を前提条件としたうえで、可能な限りの短納期と低価格を目指すような市場競争である。 

言語資産の重要性 

次世代翻訳支援ツールの機能と性能を考えるうえで、用語集や翻訳メモリに代表される「言語資産」をどうとりあつかうかは最も重要な要件のひとつである。機械翻訳の方式のうち、統計的機械翻訳の場合は大量のパラレルコーパス(翻訳メモリ)が存在することが性能発揮の前提条件となっているし、統計的機械翻訳を使わない場合でも翻訳メモリを効率よく蓄積・クリーンナップ3・再利用するサイクルは産業翻訳では不可欠である。統計的機械翻訳を行なう場合は、翻訳支援ツールを使って蓄積された翻訳メモリをもとに「翻訳モデル」と「言語モデル」という大きな表を生成し、その表をもとにデコーダーという処理を行って新規の原文を翻訳することになる。機械翻訳の世界では翻訳メモリのことをパラレルコーパスと呼ぶが、結果的には同じものを指すと考えてよい。


用語集を活用できれば用語統一ができて翻訳品質があがるし、翻訳メモリを活用できれば翻訳コストの削減と納期の短縮が実現できる。品質の悪い翻訳が翻訳メモリにとりこまれていつまでもリサイクルされ続けるなどの副作用もあるが、発注元からみれば導入時には欠点は実態より小さく、また利点は実態より大きく見え、投資金額が大きいためにいったん導入されると後戻りはできないことから、言語資産の活用を前提とした翻訳方式は(特に顧客における)市場での認知度が上がるにつれて不可逆的に普及していくことになるだろう。もっと分かりやすく言えば、ローカリゼーション分野以外の実務翻訳者は今後ますます得意先から翻訳支援ツールと翻訳メモリを使って翻訳するように指示される機会が増えるだろう。

誰が言語資産を管理するか

いま述べたように言語資産は上手に活用できれば利点が多いが、問題は誰が活用のカギを握るかである。一番翻訳の現場に近くて翻訳という工程を理解している翻訳者は、多くの場合に言語資産の管理者としては不利な立場にある。これがこの問題の難しいところになっている。翻訳業界では、言語資産が一番蓄積されるはずなのは発注元、次が翻訳会社、そして翻訳者の順だが、言語資産の重要性を一番理解しているのは翻訳者、次が翻訳会社、最後が発注元という逆転が起きている場合が多い。発注元は翻訳会社を選べるし、実際に複数の翻訳会社を組み合わせて利用することが多い。そして翻訳会社は多数の翻訳者に分割して翻訳を発注する。すなわち、末端に向かうほど翻訳対象は分割されるので、そこから還元的に蓄積される翻訳メモリも用語集も分割されてしまう。立場のうえでは分割されて発生する翻訳メモリや用語集を集約するのは発注元がもっとも望ましいが、翻訳のことがよく分かっていない発注元が言語資産を管理しようとして現場が苦労するような言語資産管理ツールを導入してしまうリスクがある。ローカリゼーション分野はおそらく例外的で、発注元であるソフトウェアベンダーが最初から言語資産(翻訳メモリ)の重要性をよく理解していたために実際に翻訳メモリや用語集を集積できたが、他の分野の言語資産集積はもう少し時間がかかるかもしれない。

そうだとしても、おそらく言語資産の重要性を発注元が理解するのは時間の問題だろう。いずれはIT以外の分野の顧客も翻訳メモリと用語集を自分の手元で管理することが重要という認識が共通了解になる。しかし、その認識を活かすには、言語資産の蓄積・クリーンナップ・再利用を支援するツールが必要になる。

言語資産管理システムの普及は時間の問題

初期の翻訳支援ツールでは翻訳者の手元で生成される翻訳メモリや用語集を自動的にサーバーに回収する仕組みが組み込まれていないため、手作業や後工程で言語資産を回収することになる。しかしこれは、ツールでやるべきことを人間がやっているので効率も精度も悪い。翻訳メモリの回収が翻訳完了後になるということは、言語資産の再利用が可能になるのがすべての参加翻訳者の翻訳が終わった後ということであり、これが非効率であることは誰が考えても明らかだ。 

同じプロジェクト内で用語の統一をはかる必要性が高いのは当然だし、たまたま翻訳者単位でスプリットした翻訳対象が翻訳者をまたいで共通表現を持つことはよくあることである。その問題を解決するには言語資産を翻訳中に準リアルタイムで翻訳者が共有できる必要がある。ネットを介して言語資産を準リアルタイムで共有できる翻訳支援ツールはすでに登場している。翻訳中に言語資産を共有できる翻訳支援ツールが、翻訳後にしか言語資産を共有できない翻訳支援ツールに対して持つ優位性は誰にも理解できるから、後者が前者を駆逐するのは時間の問題である。 

人間には作業環境に対する慣性があり、慣れ親しんだ作業環境を簡単に切り替えることができる人はごくわずかである。大部分の翻訳者も翻訳会社も、いま使い慣れている作業環境を変更することに対しては精神的に抵抗を感じ、その抵抗感を弁護してくれる理由を探すのが一般的である。しかし、慣れ親しんだ作業環境を捨て去る不快感を主張できるのも仕事がある間だけで、失業する不安感が現実味を帯びてくるとそのような気分もふっとんでしまう。作業環境の変更に文句を言っていられるのは文句を言ってもどうせ仕事は自分に来るという見通しが持てる間だけである。ローカリゼーション翻訳における経験によれば、作業環境の変更に対して抵抗感が声高に主張されるのは最初の三年間ほどのことである。その後は上に述べたように新しい作業環境に対応することを拒絶する翻訳者や翻訳会社が市場を去ることで市場は新しい作業環境に対応したものになる。 

翻訳支援ツールの開発においても競争が存在するので、機能や性能に劣ったツールは遅かれ早かれ淘汰され、技術的に実現可能な機能と性能の上限により近くて妥当な価格のツールが普及していく。一時的に寡占や妨害によりその流れに抵抗することはできても、結局は市場原理に誰も勝てない。妥当な翻訳支援ツールがあれば、翻訳会社と翻訳者は言語資源にスムーズにアクセスできるようになる。そこから先は、より優れた言語資源にアクセスできるかどうかが翻訳の品質と速度を左右する最重要な要素になる。つまりやっと、言語資源の品質の勝負になっていく。高品質かつ大量の言語資源にアクセスできるかどうかが翻訳会社(翻訳者)の業績を直接左右するようになっていく。しかし、ここから先の検討は、統計的機械翻訳の挑戦が成功するか期待はずれに終わるか、その動向に左右されると思われるので、別に項目を起こして検討することにする。 

言語資産を誰が「所有する」か

統計的機械翻訳には、(1) 言語の文法構造がわからなくてもパラレル(対言語)コーパスがあれば翻訳できる、(2) 推定の根拠となるパラレルコーパスが良質かつ大量にあればあるほど翻訳精度があがる、(3) 言語構造の近さがプラスに作用する、という特徴がある。しかし、統計的機械翻訳の技術のみを用いて翻訳性能を改善するアプローチは現在すでに限界に達しているとも言われ、ルールベースの機械翻訳を組み合わせるなどの方法で性能改善を目指しているようである。日本語と英語のように言語構造の違いが大きい言語間で統計的機械翻訳による自動翻訳および翻訳支援が有効性を発揮できるほど高性能になるだろうか?その問いにはまだ答えが出ていない。 

たとえば日韓のように、統計的機械翻訳の技術が有効であるとすでに実証されている言語ペアもある。そのような言語ペアの場合、高品質で大量の言語資源(パラレルコーパス)をどうやって入手するかが翻訳の品質・価格・納期を直接左右する大きな課題となる。統計的機械翻訳が有効であることが実証された言語ペアについては、次のようにまとめることができるだろう、「言語資産を制する者は産業翻訳を制する」と。しかし「言語資産を制する」ことはそれほど簡単ではない。まず、言語資産はドメインごとに分化して高密度なものを用意しなければならない。Googleは言語資産をおそらく世界でもっとも大量に所有している会社の一つだが、個別のドメインに整理して所有しているわけではない。 

統計的機械翻訳の技術開発では学界の研究者が中心になっているが学界でも研究の素材となる言語資源(コーパス)の収集には苦労しているくらいだからコーパス収集は別の主体に期待するしかない。翻訳支援ツールのメーカーも同様である。翻訳者は同一製品の翻訳すら単独では受注できず、複数の翻訳者に分散されているものを集めることができないから、翻訳者がある分野(ドメイン)の言語資産を収集する主体となる可能性もほとんどない。そう考えると、特定ドメイン(分野・製品)の言語資産を収集できる主体として可能性があるのは発注元か翻訳会社しかない。発注元には著作権があるが収集する手法を持っていないケースが多い。一方の翻訳会社には手法はあっても発注元に言語資産の集積をアドバイスする動機に欠ける。 

それでも統計的機械翻訳の有効性が実証された言語ペアにおいては、壁を超えて発注元と翻訳会社が協力して言語資産を集積・クリーンナップ・再利用するサイクルをだんだん作り上げていくだろう。経済的有利はあきらかだからだ。 
その際、翻訳支援ツールの開発においては学界やツールメーカーの協力が必要になる。これも経済的合理性がある以上、壁を超えて学界・ツールメーカー・翻訳会社・発注元はなんらかの協力のかたちを見出していくだろう。最初は細い道でも、いったん優位性が実証されれば普及する。 

集積された言語資源の所有者は誰になるのかは興味深い問題である。個別の企業が自社のドキュメントに対して発注元としてオーナーシップを主張するのは当然だが、大量の言語資産を蓄積するという意味では、企業の壁を超えたTAUSのTDAのような枠組みが有利かもしれない。 

もしもGoogleが試みているような一般的な言語資産集積が将来的に高い翻訳品質を提供できるようになったら、Googleはその言語資産を使ってビジネスが展開できるようになる。それはある意味、究極の翻訳業となる可能性もある。 

Googleが検索エンジンでこれだけの世界的寡占状態を実現してもそこに直接は課金していないことを考えると、Googleが将来形成する言語資産による翻訳提供も、最初に述べたインバウンド翻訳に対する無償提供としてはビジネスにならない気もする。ビジネスになりえるとしたら、翻訳者が翻訳支援ツールを通じて言語資産を活用するアウトバウンド翻訳において成立する可能性のほうが高い、それは現在でも有償の翻訳として市場が成立している分野だから。そこではすぐれた言語資産の提供者はそこから収益を上げられるだろう。しかし、製品単位の言語資産であれば発注元がその収益を回収できるような仕組みを要請するだろうし、分野単位の言語資産であればある分野のなかで言語資産のスタイル統一が実現されていなければなかなか共有することの利点がでにくい可能性もある。一筋縄ではいかない点が多い。 

特定分野の言語資産を特定企業が集積し、それを寡占的に提供する「言語資産におけるベンダーロックイン」は発生するだろうか?統計的機械翻訳技術のぶつかっている性能改善の壁の厚さや、企業間でのスタイル統一を阻む困難の現状をみているとロックインは発生しない可能性が高い。しかし、ロックイン発生の可能性の高さ低さにかかわりなく、資産の移植可能性を高く保っていくことはユーザーのためになる。一方でサービスの提供者は囲い込みを目指す。この対立軸は翻訳支援ツールでも展開されてきたし技術のカギが言語資産に移行してからも展開されていく。重要なことはこれまでXLIFF、TMX,UTX4のような形で発想され提唱されて実現されてきた「共有のためのオープンな技術標準」の意義と価値を業界関係者がますます深く理解し、持続し、発展させていくことだろう。 

翻訳会社の言語資産戦略

もしも統計的機械翻訳が期待どおりの成果をおさめるとすれば、高品質と大量性を兼ね備えたパラレルコーパス(=翻訳メモリ)を利用できる翻訳会社は他社に対して大きく有利になる。もしそうなら、高品質大量のコーパスをもてるかどうかは翻訳会社にとって死活問題になる。ここでは言語資産のボリュームについて検討する。パラレルコーパスを蓄積する立場として翻訳会社が有利であることはすでに述べたが、翻訳会社はどの程度の速度でコーパスを蓄積できるか検討してみる。

売上10億円の翻訳会社があったとして、計算を簡単にするため英文和訳を1ワード20円で販売していると仮定し、1文は平均して10ワードだと仮定する。そうすると1文の売上は200円となり、10億円を200円で割った答え、すなわち500万文が年間の翻訳量となる。統計的機械翻訳ではパラレルコーパスの分量が100万文を超えるとある程度優れた翻訳品質が得られると言われているから、500万文というは翻訳品質を得る上でまずまずのボリュームと考えられる。 

もしもコーパスの性能がそのボリュームだけで決定されるのであれば、大量のコーパスを蓄積できる翻訳会社ほど有利ということになる。MLV5とSLV6には一般に企業規模の格差があるので、ボリュームに着目して売上と蓄積できるコーパスの大きさの関係をグラフにすると図3のようになる。


しかしこの図は言語ペアごとにコーパスが異なることを無視しているからその点を修正する必要がある。また、コーパスが有効に使えるためにはドメイン(分野や製品)を限定する必要があるという条件を考慮する必要がある点も無視されているのでそれを加味する必要がある。用語集も翻訳メモリも、対象分野(ドメイン)が細分化されるほど有効性が増す。特定の製品について100万文の翻訳メモリを持つことは一般的な文章100万文の翻訳メモリと比較してはるかに価値がある。 

コーパスの視点から観たときには翻訳会社の総売上には意味がなく、言語ペア別、そしてドメイン別の単位に分割した上でのいわば「種目別」の売上を比較する必要がある。この点を模式的に示したのが図4である。図4はドメインを行、言語ペアを列にとった行列になっている。


言語ペアとドメインで区切った市場グリッド別に分けて売上とコーパス蓄積速度の関係グラフを描き直してみると図5のように、MLVとSLVの関係が逆転する可能性があることが分かる。


もともとMLVが台頭したのはローカリゼーションの分野においてであり、ローカリゼーション分野では営業窓口の単独化、原文のフォーマットの均一性、翻訳支援ツールとの親和性の高さなどMLVが成立するような市場の条件がよく満たされていた。しかし、すべてのドメインでローカリゼーションと同程度にMLVの成立条件がよく満たされるわけではないようだ。発注元が各国に分散している特許のようなケースや、翻訳対象言語数が数言語に限られるドメインではMLVというビジネスモデルの優位性はローカリゼーションより低い。 

MLVには言語ペアを多数集めることで売上を高め、結果的により高い資本力を発揮できる強みがあり、それを技術開発に投入することで翻訳支援ツールの開発をリードしてきた。機能性能が言語ペアの相違にかかわりなく共通する部分についてはこの論理は成立する。しかし、統計的機械翻訳のように言語構造の違いが性能を直接左右するような言語の種別に依存する技術についてはMLVが個別言語に投資できる資本が分散されるため、共通部分と同様の技術優位性を発揮できる根拠が失われるかもしれない。 

MLVであれSLVであれ、言語ペア別かつ分野別のグリッド分割された市場で個別最善のコーパス蓄積に成功した翻訳会社が他社に対して優位に立てる。そういう時代になるかもしれない。ただし、以上の議論はコーパスの有効性が評判通りだった場合の話であり、もしも統計的機械翻訳の品質改善が期待通りに進まなければ、この議論で述べたことはすべて崩れる。統計的機械翻訳が成功するか期待はずれに終わるか、どちらに賭けるかで対応策もかなり異なる。翻訳会社の経営戦略を立案する上で、この点が思案のしどころになる。 

未来の翻訳会社に求められる機能とは

視点を変えて、ここまで検討してきた翻訳産業の変化が将来翻訳会社をどう変えていくかを考える。そもそも、TMS (翻訳管理システム)7が発達した未来の社会に、翻訳会社の居場所があるのだろうか? 

冒頭のモデルにもどるとインバウンド翻訳において翻訳会社の介在する余地はない。翻訳会社が必要になる可能性があるとすればアウトバウンド翻訳である。そこは翻訳者が次世代翻訳支援ツールを使って今の二倍の生産性・二分の一の単価で翻訳する世界である。アウトバウンド翻訳の世界に発注元は存在するし翻訳者も間違いなく存在する。しかし、その世界でどのような〈翻訳会社〉が必要になるのかは検討に値する問いだろう。従来と同じようなことをやる翻訳会社はもういらないかもしれないが、翻訳者に還元できない新しい役割を担う主体が翻訳業界に必要であることは明らかで、その新しい役割を見極めることができれば未来の翻訳会社を設計できるだろう。

未来の翻訳会社の役割を現在の翻訳会社から外挿して考えるのはやめて、まず、近い将来のアウトバウンド翻訳の世界で〈翻訳会社〉に期待されると思われる社会的機能を演繹して考えてみることにする。そしてその視点から現在の翻訳会社を振り返ることにする。

コーディネーターの未来 

第一に発注元と翻訳者を接続する「マッチング」の機能は翻訳会社が提供することになる。しかし、ただマッチングするだけならサービスでカバーできる部分も少なくない。たとえば“GMOスピード翻訳”8のような企業が現在提供している「オンライン翻訳」の機能を延長していけば、少なくとも単独の翻訳者でカバーできる業務は人手を介しないで済む。 

問題は単独の翻訳者で処理できない分量と納期の翻訳プロジェクトを処理する場合で、このときには複数の翻訳者でチームを編成して品質や納期を調整する「コーディネート」の機能が必要になる。翻訳管理システム(TMS)によってはコーディネートの機能の一部を実現するものもあるようだ。また、いわゆるクラウド翻訳は、従来コーディネーターが担当してきた翻訳者間の調整機能の一部が別のやり方で実現できることを示した。 

コーディネーターが行っている業務は、翻訳者のキャパシティ、経験、スキルなどを総合的に判断して組み合わせる作業を含む。その作業に限って言えば、翻訳者のキャパシティ・経験・スキルをデータとして処理できるように入力してやり、これらを調節するようなアルゴリズムを実装することで次世代のTMSでもある程度はコーディネート機能を実現できそうである。コーディネート業務を自動化できれば翻訳会社にとって人件費抑制の利点は非常に大きい。

しかし、現場のコーディネーターの仕事をすこし観察していれば、コーディネーターの担当している業務がシンプルなリソースの調整だけではないことがすぐにわかる。発注元の要求は翻訳対象文書も求める作業も一件ごとに少しずつ異なっており、それらの多様な組み合わせをその都度短時間で判断する複合的な処理はそう簡単に自動化できるとも思えない。

また、翻訳者をリソースとして割り当てるという工程理解はコーディネーターと翻訳者の人間関係を無視している。翻訳者はしばしばコーディネーターの人に付くと言われる。人間的な信頼感や親しみの部分でツールに置き換えられない価値を翻訳者から認められているコーディネーターの場合は、今後もおそらくコーディネーターとして作業に参加することを求められるだろう。

以上の検討を総合してみると、いまコーディネーターが担っているすべての役割をツールが置き換える可能性は当面の間ありそうもない。ただ、コーディネーターを支援する翻訳管理システムがコーディネーターの業務の一部を自動化する可能性はあるだろう。

翻訳支援ツールが品質管理を変える

次に品質管理であるが、この部分は翻訳支援ツールの問題とあわせて考える必要がある。使用する翻訳支援ツールによって品質管理の作業内容が変化するからである。現在品質管理の名目で行なわれている作業の中には、用語や表記の統一のようにツールでやれるはずの部分がまだ大きい。つまり、翻訳支援ツールの機能や性能が強化されていけば、品質管理の作業内容が変化する。このことは、品質管理の作業が本質的に翻訳と同じ作業であることを考えれば当然のことである。 

ここで問題は次世代の翻訳支援ツールを誰が設計するのかという点である。翻訳支援ツールの開発者と翻訳会社の間に距離がある場合は、いくら待っても次世代の翻訳会社の需要を満たせる次世代の翻訳支援ツールは開発されない。アウトバウンド翻訳で役立つような次世代の翻訳支援ツールを提供できる可能性があるのは、したがって翻訳支援ツールの開発者と翻訳会社が統合されている場合か密接な協力関係にある場合に限られるだろう。そのような企業は現在でも複数存在する。 

この項の視点に話を戻せば、これが次世代の〈翻訳会社〉に要請される第四の機能になるだろう。その機能とはつまり翻訳支援ツールの開発にあたって要求仕様を提示する機能である。当分の間、次世代TMSは開発に継ぐ開発が必要だから、この機能は継続的に必要とされる。 

言語資産活用のコンサルティング

翻訳支援ツールとならんで問題となるのは前述した言語資産の関連業務である。アウトバウンド翻訳で実効性が高いと思われるドメイン特化した言語資産はオーナーシップを得意先が持つとして、その手法は〈翻訳会社〉がアドバイスすることになるだろう。世界最大の言語資産を抱える企業の一つであると思われるGoogleが翻訳発注元に対して言語資産の蓄積方法・クリーンナップ方法・再利用方法を事細かにアドバイスするビジネスを自ら展開するとは考えられないから、ここは翻訳業界の仕事になる。もっとも、従来の翻訳会社には荷が重い。 

しかしそのようなコンサルティングを発注元が今後ますます求めてくる以上、その需要にうまく答えられる翻訳会社が営業的に成功するのは自然である。ビジネスの有効性が広く認識されるにつれて営業指向性の高い翻訳会社はどこもコンサルティングに力をいれざるを得なくなる。 

この機能、すなわち言語資産(翻訳メモリ、用語集)の蓄積・クリーンナップ・再利用のよりよい方法を発注元にアドバイスするとともに発注元を支援して実装システムを実現すること、それが今後の〈翻訳会社〉に必要な第五の機能になるだろう。

翻訳者が新しい作業環境に適応するのを支援する

以上に述べてきた未来の〈翻訳会社〉が担う5つの機能、マッチング、コーディネート、品質管理、翻訳支援ツール要求仕様策定、言語資産運用コンサルティング、のすべてに翻訳者が関係するのは当然である。翻訳者は次々に変化する作業環境に自力で対応していけるだろうか? 

ローカリゼーション翻訳の場合、翻訳者も対象分野であるITに詳しい人が多く、年齢的にも他分野の翻訳者と比べて環境変化への適応力の高い若い世代が多かったので、ある程度は自助努力に期待して翻訳支援ツールを導入することができた。Trados導入の実績がそれを示している。 

しかし、ローカリゼーション以外の分野の翻訳者では同じようにスムーズには新しいツールの導入が進まない可能性が高い。他分野では環境変化への適応性に低い翻訳者の比率が高いと予想される。そのセグメントの翻訳者に対して次世代の翻訳支援ツールの使い方を教育し対応可能翻訳者を増やすのは翻訳会社の仕事になる。 

翻訳者の教育といえば翻訳学校の仕事ともいえるが、翻訳学校は翻訳会社と兼業でない限り、現場の最前線で必要とされる特化したスキルについて何を教えればよいのか自分ではわからないので、その前段階の一般的なスキルについてしか教えられないことが多い。一昔前のTradosのように翻訳支援ツールとして定番が成立するような市場環境の場合はそれを教えておけばよいが、次世代翻訳支援ツールに対する要請も実装も流動的となり継続的発展が常態化し、翻訳支援ツールも多様化しているため、「Tradosを覚えればOK」とも言えなくなる。

そうなると、発注元の個別要請に応じてそれぞれの個別な翻訳支援ツールと言語資産利用にあわせたスキルを翻訳者に教育する人材育成もまた〈翻訳会社〉に期待される機能になる。つまりこれが〈翻訳会社〉の第六の機能になるだろう。人材育成は未来の〈翻訳会社〉にとって致命的に重要な機能になる可能性がある。なぜなら、教育能力が低い翻訳会社は新しい翻訳支援ツールに対応する翻訳者を育てられず、結果的に作業環境の変化に適応できる翻訳者が少ない翻訳会社となり、本業である翻訳において競合他社との競争で非常に不利になるからである。

以上に述べてきた6つの機能(マッチング、コーディネート、品質管理、翻訳支援ツール要求仕様策定、言語資産運用コンサルティング、人材育成)を担える翻訳会社は、資本規模がある程度以上(おそらく売上5億円以上)に限定されるだろう。統計上大多数を占めると思われる社員数名の翻訳会社は、これまでと同様に大手の翻訳会社の下請けとして居場所を見つけていくことになるだろう。 

翻訳者の未来 

次は翻訳者の視点に立場を変えてみる。アウトバウンド翻訳では確かに翻訳者の役割があり、現在それはポストエディットであることが多いが、すでに述べてきたようにポストエディットは過渡的に生じた工程にすぎず、不完全な「自動」翻訳の尻拭いを翻訳者に負担させている。

現在行なわれているポストエディットでは、機械翻訳で一括翻訳して後編集を翻訳者に外注しているが、この状況をかな漢字変換に例えると、全文を機械的に一括でかな漢字変換してから翻訳者にその変換結果を支給して手作業で修正させているのと同じである。 かな漢字変換では変換辞書の学習機能がユーザビリティ改善の上で決定的に重要であり、最初は誤変換が多くてもユーザーが教えていくうちに変換結果が目に見えて改善されるという希望が持てるからユーザーはかな漢字変換という作業に耐えられる。もし学習機能が禁止されたらユーザーはどう感じるだろうか?現状のポストエディットは学習機能を使用禁止にされた状態で全文を一括してヘタなかな漢字一括変換された結果の修正を翻訳者が押しつけられているのと同じことなので、これでは翻訳者のモチベーションが下がる一方である。優秀な翻訳者がポストエディットをやりたがる道理がない。 

現状のポストエディットがこのように不毛な作業になっていることの原因は機械翻訳と翻訳者の組み合わせ方を間違っていることにあるが、不毛な作業の原因が機械翻訳自体にあるように誤解されて、機械翻訳と翻訳者は共存できないという短絡的な誤った印象を持つ人が少なくない。

学習機能も分節単位での変換もできないかな漢字変換が使い物にならないという経験から、すべてのかな漢字変換は使い物にならないという結論を導くことが短絡的誤りであるのと同様に、現在のポストエディットが不毛な工程だから機械翻訳による翻訳支援がすべて不毛だと結論するのは短絡的誤りだろう。別の言い方をすれば、翻訳者がインタラクティブに機械翻訳の処理にアクセスでき、文単位または句単位での機械翻訳結果の出力と、翻訳者の修正結果を学習するインターフェイスを提供する翻訳支援ツールが登場すれば事態は変わるだろう。 

重要なのはプロセスを自分がコントロールできているという感触をユーザーに感じてもらえることだというのが現在の私の仮説である。それに成功すれば、かな漢字変換でも機械翻訳でも、ユーザーの支持を得られる可能性がでてくるだろう。かな漢字変換ではすでにその水準は実現されたが機械翻訳でもそれがこれから起きるだろう。機械翻訳の世界では前述したとおり自動翻訳だけが目標として設定されており、翻訳者を支援するシステムは無視されてきた。翻訳者にプロセスをコントロールできている感覚を与えるユーザビリティの提供はこれまで無視されてきた領域だけに、今後の開発余地がある。要素技術はすでに自動翻訳を目指す研究のなかで開発済みで、あとはそれらを翻訳者支援に転用するユーザーインターフェースの開発が必要な「だけ」なので、そういうツールは近い将来に登場する可能性がある(すでに登場しているかもしれない)。 

平均速度が二倍なら平均単価は半分に

翻訳支援ツールの技術革新が翻訳者のビジネスに及ぼす影響を考えるには、この点で先行しているローカリゼーション翻訳で何が起きたかを知ることが参考になる。ローカリゼーション翻訳では十年以上前にTradosが本格的に普及し、現在ではTradosを使わない翻訳者はほぼいない。 

翻訳支援ツールの導入にともなう翻訳生産性の改善効果は、前処理後の「正味の」翻訳対象ワード数に換算した作業量で生産性を計算している翻訳者の工程から判断するとわかりにくいかもしれないが、前処理前すなわちマッチ箇所を削減する前の「素材の」翻訳対象ワード数に換算した作業量で生産性を計算する翻訳会社の工程から判断すれば明らかである。翻訳支援ツールが進歩すればそれだけ翻訳の平均的生産性はあがっていくが、それと並行して翻訳の平均的単価は下がっていく。アダム・スミスは『国富論』において穀物の価格はそれぞれの地域での労働者の生活水準を維持できる労働の量に等しくなると述べている。翻訳者においても市場競争があるから、翻訳支援ツールの改善により全体的に改善された生産性は全体的な単価の低下により吸収される。わかりやすく一言で言えば平均速度が二倍になれば平均単価が半分になる。翻訳支援ツールの改良による全体的な生産性の改善によっては翻訳者の平均的所得が増えることはなく、経済的成果は翻訳を発注する発注元に回収される。すなわち、社会全体がより低い価格で翻訳を利用できるようになるので、社会はその需要に応じて、翻訳に対して出費していた経費を他の経費に割り当てるか、あるいはこれまで翻訳したくてもできなかった文書の翻訳を行うようになる。前者であれば翻訳市場全体の規模が縮小するし、後者であれば翻訳対象のバリエーションが増えていく。

競争相手はツールではなく他の翻訳者

同じ状況を翻訳者の立場から記述すれば、翻訳の平均単価が低下しても、翻訳支援ツールを活用し同業他者である競合翻訳者と比較して相対的に高い翻訳生産性を実現している翻訳者の所得は、平均単価でより多くの分量を翻訳することにより十年前と比較して一概に不利になっているとは言えない。それに加えて、翻訳者としての技能が優秀で同業他者である競合翻訳者と比較して相対的に高い品質で平均単価よりも高い単価で取引できる翻訳者の場合はさらに所得を増やすことができる。しかし、十年前と同じツールしか使えない翻訳者は翻訳速度を上げることができず、翻訳単価の低下がそのまま所得の低下に直結するので生活水準の維持が困難になる。つまり、新しい翻訳支援ツールを使いこなせるかどうかが職業人としての生活持続可能性を左右する。 

以上が過去十年間にローカリゼーション分野の翻訳者におきた事だが、これと同じことが次の十年間に他分野の翻訳者にも起きるだろう。新しい翻訳支援ツールが登場して最初の三年間は、「そんなもの使えない」と文句を言っていることもできる。しかし、四年目以降は文句を言わずに新しい作業環境に対応する新人翻訳者の台頭により仕事を奪われるリスクと直面することになる。新しい翻訳支援ツールに抵抗なく対応できる柔軟性を持てることが、翻訳者としての職業寿命を大きく左右する。翻訳者という職種では、すごく翻訳が上手であればツールを使わなくても仕事は自分に来る、と本人が考えるほどには当人の翻訳に稀少性がないことのほうが多い。よほど優れた翻訳者でない限り、自分の代わりは常にいると考えるほうが安全だと言える。「そんなもの使えない」と頑固親父みたいに意固地になるより、新しい作業環境に柔軟に対応する精神的柔軟性を今からでも開発するほうがよほど良いといえる。頑固親父でやっていける翻訳者はトップクラスの1%だけだと思っておいたほうがよい(翻訳会社も同じことだが)。 

何をやるにせよ、機械のほうが人間より上手くやれる仕事を漫然とやっていれば未来がない。そうでなく人間にしかやれない仕事に特化して、その分野で他人より優れた仕事をできれば未来がある。何が機械にでもやれる仕事で何がそうでないか、その違いを知るには機械を知る必要がある。


脚注:
1.「インバウンド、アウトバウンド」という区別は2011年2月23日に開催された「第5回『機械翻訳技術のイノベーション』シンポジウム」においてDFKI/ザール大学のHans Uszkoreit博士が使用した用語。
2.「ポストエディット」とは一般に機械翻訳の出力を人間の翻訳者が修正して要求された品質の翻訳を完成させる機械翻訳の後処理工程を指す。
3.「クリーンナップ」とは蓄積された翻訳メモリの品質を改善するために、翻訳メモリを調べて誤訳の修正や用語・表記の統一を行う保守的作業。
4.「XLIFF, TMX, UTX」はいずれも翻訳業界における技術標準。XLIFFはバイリンガルファイルの、TMXは翻訳メモリの、UTXは用語集のオープンスタンダード。
5.「MLV = Multi-Language Vendor」とは、複数の言語の組み合わせ翻訳をまんべんなく提供する翻訳会社のこと。小規模の翻訳会社でも多言語の翻訳を提供することは可能だが、MLVという用語を使うときは欧米とアジアに複数の支店を展開するような翻訳会社としては大規模な企業を限定的に指すことが多い。
6.「SLV = Single Language Vendor」とは、英日専門で翻訳する翻訳会社のように単独の言語の組み合わせに完全にまたはおおむね特化して翻訳を提供する翻訳会社のこと。
7.「TMS = Translation Management System」は翻訳対象文書、言語資源、翻訳者の管理を総合的に行うソフトウェアで、翻訳業務が発生したときに翻訳者を割り当てて受発注管理を行う機能を含む場合もある。Idiom World Server が代表的な製品であり、いわば翻訳会社の機能を可能なかぎりソフトウェアで実現しようとする試みの表れである。
8.オンラインで発注元を翻訳者と(コーディネーターを仲介せずに)直結させることにより短納期での翻訳を提供する翻訳会社。https://www.quicktranslate.com/