【機械翻訳】ニューラル機械翻訳利用の判断基準

私は、ニューラル機械翻訳(以下、NMT)を実務で利用するためには、以下の3つの検討が必要だと思っています。このことについては、現在毎月開催しているGreenT(私が開発しているツール)の無料説明会でも毎回お伝えしてGreenT導入の検討のヒントにしていただいています。

①(NMTが出力した訳文を使う)目的・用途
②(①を実現するために求められる)品質・スピード
③(②を実現するために求められる)コスト

誰かの声を鵜呑みにしない

現在、翻訳業界内外の様々な立場から「NMTは使える」、「NMTは使えない」、「NMTを使いたい」、「NMTを使いたくない」、「NMTを使って欲しくない」といろいろな声が聞こえてきます。

翻訳者だけでも様々な意見があります。

翻訳会社からも様々な意見を聞きます。

これらは、どういう立場の人が何のために言っているのか?(ポジショントーク)によってもその解釈が異なりますからけっこう複雑です。

さらに、意見の前提がはっきりしないまま、「使える」や「使えない」の言葉だけが聞こえてきており、それらの言葉を鵜呑みにしてはいけないと感じています。

特に翻訳エンジンにより出力結果が異なるのですから、どのエンジンをどの文書に対してどの言語方向で使っているのかも、NMTの利便性の評価においてかなり重要な前提条件になります。

自分で言うのもおかしいのですが、この記事を読まれているみなさんは、私が発信している情報も用心深く読んでいただきたいと思います。私はツール開発者・翻訳者として私が信じていること、私が面白いと思っていること、私が実務で経験したことをお伝えしていますが、これはあくまでも私が試した案件でのNMT(有料版・無料版の複数の翻訳エンジン)やGreenT(私が開発しているNMT支援ツール)の性能について語っているだけで、他の業界のことや他のすべてのツールのことをすべて知っているわけではないからです。

なので、GreenTの説明会では「ご自身で試してみて判断してください」とお伝えしてます。「ニューラル機械翻訳は翻訳者にとって使えるツールなのか?」でも書いたとおり、「使えるのかどうかは翻訳者本人が判断するものであり一般論はない」と思っているからです。

議論を整理するための手段

このような議論を整理するために、上記で上げた3点(①目的・用途、②品質・スピード、③コスト)を示すことが必要だと思うのです。この定義なしでは議論が噛み合わないと思います。私もいろいろな方からNMTの性能について問い合わせをいただいていますが、この3つをもとに回答をすると説明がしやすいし、質問された方から「腑に落ちた」と言ってもらえることが多いと感じています。

GreenTの説明会では、そのお話のあとで、「あ、GreenTは私には向いていない。使えないね。」と判断される方もいて、それも非常に重要なことだと思っています。私はNMTは万能だとぜんぜん思っていないし、フィットしない現場にむりやり押し込んでもGreenTの性能は出せないと思っています。むしろ、GreenTを無理して使った方が、「GreenTは使えないツールだ!」なんてがっかりされるのが一番残念ですから。なので、説明会では使える場合と使えない場合をはっきり説明して、どういう方に役に立ちそうなのかのヒントを差し上げるようにしています。

現状では、多くの場合、コストダウンやスピードアップのためにNMTの導入を検討する人が多いと思うのですが、NMTを導入することで本当にコストが下がるのか?スピードアップできるのか?という検討をしてみればいいと思います。GreenTのように試用版を使えるツールであれば、実務で使ってみて具体的な案件で評価してみることをおすすめしています。

以下、具体的に説明します。

①目的・用途

NMTを使う際に、その翻訳文をどのような目的で使用するのか特定します。この使用目的により、NMTが使えるのか使えないのか答えが変わります。

たとえば、多国籍企業における議事録(会議参加者向け内容確認用)、技術者(発明者)による競合他社の技術調査、特許出願明細書、IDS用の特許明細書、新医薬品の申請書類、海外企業とのアライアンス提携の契約書、マーケティング用の新商品説明資料などがあります。

この目的や用途を具体的にすればするほど、NMTを活用できるか否かの検討がしやすくなります。その翻訳文は誰が読むものなのか、お金を生み出すものなのか、関係者の情報共有用なのか、などの利用目的をできるかぎり明確にしてみます。翻訳文の利用目的をぼんやりしたままNMT導入の検討をすると、出てくる結論がぼんやりしたものになってしまいます。

②品質・スピード

上記の①で定めた目的・用途を達成するための翻訳の品質と納期(翻訳のスピード)を定義します。この品質とスピードには一般論がないはずなのに、NMTの利活用の議論においては、一般論でまとめられてしまうことが多いように思います。

翻訳に携わっている人であればクライアントから要求されている品質や納期は知っているはずです。依頼を受ける時点で決められていたり、事前に合意されていたりすると思います(機械翻訳の案件なのに、品質が定義されていない場合は納品後のトラブルに発展する可能性があって危険です)。さらに、分野により品質の意味が変わることもご存じの通りだと思います。

この点を整理してみると具体的に検討できることが多くなります。

品質とは?

品質の具体例が、日本翻訳連盟(JTF)の翻訳品質評価ガイドラインで紹介されています。このガイドラインには品質の項目が細かく定義されており、文書の分野別の品質カテゴリーの重みの違いも一覧表になっています(P.28)。

品質の話をするときに、自分が専門とする分野の「品質」を頭に思い浮かべがちなのですが、これが話相手の考える(求める)「品質」とは異なりうることにまず気をつける必要があります。

だからこそ、まずは「①目的・用途」をはっきりさせてから「②品質・スピード」を定義して検討する必要があると思うのです。

特許翻訳業界出身の私の場合、出願用の特許明細書翻訳において、用語の統一や数字や記号の正確さは非常に重要だと思っていますが、訳文の流暢さはそれほど重視されていないことを体験的に知っています。

文章として読みにくかったとしても、特許の権利範囲を広くとれる表現のほうが好まれます。さらに言うと、英訳の場合には日本人の発明者が確認しやすい英語表現が好まれることもあります。

こういうなんとなくわかっていたことが、このガイドラインでは数値化されているので興味深いです。また「翻訳品質」を具体的に言葉で示してあるので品質の全体像を見直すのに役立ちます。このガイドラインの定義を使うことで、機械翻訳と人間が翻訳する差も説明できるようになると思います。

ぜひ一読されることをお勧めします。

スピードとは?

上記で品質の話をしましたが、スピードについても同様です。「①目的・用途」により求められるスピードが異なると思います。数万ワードの特許文書を和訳する場合と数百ワードのニュース記事を和訳する場合では、翻訳手順も納期も異なります。そもそも調べものに割ける時間が変わると思います。

たとえば、多国籍プロジェクトの意思決定のために会議の議事録や関係者間のメールのやりとりを翻訳する場合には、おおざっぱに議論を確認することが目的になると思います。

このときには訳文の流暢さはあまり求められず、合意事項や商品名や期日や金額などがわかればそれだけでよいのかもしれません。訳文の流暢さよりもスピードが求められることがあると思います。

③コスト

上記のように求められる品質やスピードが定義できれば、そのためにかけられるコストも自ずと出てくると思います。

コストをかけずにNMTを利用するケース

「①目的・用途」によっては「正確さはさほど重要ではないけれど、すぐに訳文を読みたい」ということがあります。技術者や学者がドイツ語で発表された最新技術情報を確認するような場合です。

このとき、無料の「Google翻訳」を使うことは、現場で日常的に行われていることだと思います。その分野の専門家であれば出力された誤訳混じりの英語訳や日本語訳を内容を予測しながら読めるからです。

おおよその内容を把握するだけの場合、時間を圧縮できる無料の「Google翻訳」は間違いなく「使える」ツールだと思います。このような用途において「NMTは使える」「NMTを使いたい」だと思います。そしてこのときのコストは無料です。

無料でこのレベルの翻訳ができるのであれば使おう、という意見が出てくるわけです。

コストをかけてNMTを利用するケース

一方で、外国での権利化のために特許出願明細書をNMTで翻訳して使う場合を想定します。まず、無料の翻訳エンジンではデータが流出するため必ず有料の翻訳エンジンを使う必要があります。ここに「コスト」がかかります。

分野ごとに最適化された翻訳エンジンが販売されています。どの翻訳エンジンを選ぶかで出力される訳文の品質が変わるので、この検討も重要です。

そして、NMTの出力結果をそのまま使えないので修正します。用語統一ができるとする有料の翻訳エンジンを使った場合でも、用語の統一がなされないことが多いですし、そもそも誤訳もありうるからです。

そのため、NMTからの出力結果を求められる翻訳品質にするために「ポストエディット」が必要になるのです。この作業も「コスト」です。

翻訳分野や言語方向、翻訳エンジンによって翻訳の出力が変わりますから、それに応じて必要な「ポストエディット」の作業量が変わってきます。また、原文を上手に修正したら翻訳の出力が変わることが知られていますから、「プリエディット」も必要なのかも知れません。

そうすると、「プリエディット」と「ポストエディット」の作業のコストと「有料の翻訳エンジン」の利用料とのバランスで評価をすることになるのです。

このときの「コスト」に見合う対価が支払われる場合、この「有料の翻訳エンジン」を用いて「プリエディット」や「ポストエディット」をするというスキームが成り立つと思います。

翻訳者がNMTを利用するケース

普段は翻訳メモリを使って翻訳をしている翻訳者が、メモリがない部分をNMTを使う場合を想定します。すでにMemsourceやTradosなどのCATツールにはプラグインで有料の機械翻訳エンジンを使えるようになっています。

この場合も、翻訳メモリでヒットしない文章をNMTで出力をしてそれを編集する作業が割に合うのかどうかで判断するのだと思います。

翻訳メモリから出力された訳文と同等レベルにするための修正の手間(=コスト)が、自分で最初から訳文を作る場合の手間よりも少ないのであれば、この文章に対してはNMTを使う価値があるということでしょう。

この作業に伴う精神的な疲労感も翻訳作業の生産性に関わるので「コスト」と言えるかも知れません。

コストがかかるので工夫と努力が必要

ソースクライアントの中には、「このNMTの誤訳修正(ポストエディット)が簡単な作業なのでコストがかからない」と誤解をされている方もいるようですが、目的とする訳文品質が高い場合には修正にそれなりに手間(=コスト)がかかります。

海外のクライアントが特定の翻訳エンジンで機械翻訳した和文のチェック・修正を日本の翻訳会社に依頼するケースが増えているようです。これ、大変ですね。

原文のスタイルや質がNMTに向いていない場合には訳文が破綻することもあるので、この修正の手間もかかります。なので、どうしてもコストがかかってしまうのです。

いずれにしても、ソースクライアントも翻訳会社も何の努力もすることなく、翻訳者にNMTの駄文の修正を丸投げするようなやり方(業界ではときどきあるみたい)は間違っています。これでは翻訳者は疲弊するだけだし、その際に「ポストエディットだから」という理由だけで相応の対価が支払われない場合には担い手がいなくなってしまうと思います。

とは言っても、それぞれの立場で工夫や努力をした場合には、ソースクライアントも翻訳会社も翻訳者もハッピーになれるようなスキームが存在する可能性があると私は思っています。たとえば、私はツールの運用や業務フローの改善は必須だと思っており、うまく実行すればNMTを活用した翻訳で効率化ができると思っています。

前提条件を変えるとコストの評価も変わる

ときどき「NMTだけで翻訳をする」という前提でNMT利用の検討をしていることがあって、この前提が検討の柔軟性を欠く結果になっていると思います。「ニューラル機械翻訳は翻訳者にとって使えるツールなのか?」でも紹介したとおり、求める翻訳品質によってはNMTの出力が使える文章が文書の中の一部だけの場合もよくあります。

そのような場合には、手持ちの翻訳メモリのほうが使いやすいことになります。NMTだけを使って翻訳ができる案件もあれば、既存の翻訳支援ツールと連携したほうが翻訳が速いこともあるでしょう。そうすると「コスト」の評価には、NMTのツールの連携のしやすさ、という側面が加わります。

このように、何かを評価するときには前提条件を決めなければならないので白か黒かに偏りがちだと思うのですが、実務ではグレーゾーンが多くあって、そのグレーゾーンに様々な工夫の余地があると思います。

さらに、時間(評価期間)の視点も付け加えると、この「③コスト」の評価が変わってくると思います。現時点ではコストがかかっても、将来も同じようにコストがかかるとは限らないからです。

時間の経過と共に翻訳エンジンの品質が少なからず向上し、NMTを扱うツールの性能も今よりはよくなるでしょう。NMTをはじめとする機械翻訳への理解が深まり、ソースクライアント、翻訳会社、翻訳者の役割分担ももっと自然で柔軟なものになるでしょう。一部の翻訳者はNMTを扱うことに慣れていくでしょう。そうすると、現在よりも運用コストが下がる可能性があります。でも同時に、時間がいくら経過しても、分野や原文のスタイルによってはNMTがまったく機能しないこともあると思います。

あと、翻訳者が常にNMTを使わなければならないという前提も脳を萎縮させるようないやーな感じになるのでやめてもいいと思います。時間をかけて考え抜いて訳文を作る喜びはA案件でして、日銭を稼ぐためのNMTを使った翻訳はB案件でするという形もあり得ると思います。このA案件とB案件の比率は人それぞれだと思うのですが、それを選択できるような業界であればいいなと思います。

一緒に汗をかきましょう

みんながハッピーになるためのスキームは私自身も研究している最中です。NMTという技術を使って、お客様に求められる翻訳の品質を適正な価格(翻訳者が納得できる価格)で提供し続けられるようにみなさまと意見交換をしていきたいと思っています。

面白いアイディアがあれば紹介していきたいと思います。

関連記事

トップへ戻る