【機械翻訳】翻訳を評価する「視点」の違いについて

私がニューラル機械翻訳支援ツール「GreenT」を開発・販売している関係で、これまでとは違う様々な職種の方とお話をする機会が多くなってきました。

翻訳者の方々と機械翻訳について話をすることはもちろんのこと、翻訳学習者の方や仕事で英語を使う方（外資系企業の社員の方）、翻訳発注者（メーカーのマニュアル作成部門の方、翻訳会社の方、特許事務所の方など）、ツール開発会社の方、また機械翻訳エンジンの開発者の方など幅広くなりました。

その中で、訳文の品質について話をしているときにどうしても話がかみ合わないなと感じることがありまして、そのことについて書きたいと思います。

まとめ

翻訳をとらえる視点の違いにより目指す（期待する）翻訳の品質が異なります。この目指す品質の違いが、機械翻訳の出力の修正内容や作業量の違いにもつながります。その結果、機械翻訳ツールを利用した際の効率化の解釈も異なるのです。

実務においては、翻訳の購入者（クライアント）が想定する視点をとらえていない場合には、翻訳者が機械翻訳の出力を適切に修正できないという結果になってしまいます。

たとえば、機械翻訳の誤訳を発見ができないがゆえに、機械翻訳の品質を越えられない場合があります。

逆に、クライアントの要求レベルを超えてしまう過剰品質の翻訳になる場合もありえます。

機械翻訳のポストエディット業務では、機械翻訳の出力を「どの程度（どこまで）修正するのか？」で必ず迷います。このようなときに翻訳における視点をそろえることで、翻訳の購入者（クライアント）と供給者（翻訳会社、翻訳者）がコミュニケーションをしやくなるのではないかと思っています。

翻訳品質の考え方のギャップ＝視点の違い

以前、「【機械翻訳】ニューラル機械翻訳利用の判断基準」において、機械翻訳を実務で利用する場合の判断基準について書きました。

このときには、「機械翻訳ツールのユーザー自身が翻訳品質を自分で判断する」という前提で記事を書きました。

ところが、最近いろいろな立場の方とお話をしていて、「品質」の判断に用いる基準や考え方が私と異なることがありまして、現場で起きていることと自分の考えていたことの差に気付きました。

つまり、人によっては「そこまでやるの？」というレベルを期待しているし、「あ、その程度でいいのね。」というレベルの期待もありました。これは翻訳者であっても翻訳会社であっても、クライアントであっても同じです。

このギャップの原因の一つが、品質を考えるときの「視点」の違いだと思います。

すでに多くの場で語られている「翻訳の品質」なのですが、機械翻訳が実務用ツールの選択肢に加わりつつある今、これまでより具体的に品質について語る必要が出てきていると感じます。

機械翻訳でありがちな「訳抜け」、「情報の勝手な追加」、「文章の破綻」、「文法ミス」のようなわかりやすい誤訳以外にも、「品質」を語る際に考慮することがあります。このあたりを整理しておくと、機械翻訳と人手翻訳の違いを説明できるようになると思います。

どちらかというと「表現」の違いに関する品質だと思います。

視点とは？

翻訳を評価するにあたり「考慮する情報の範囲」を示す基準として「視点」という言葉を使います。

考慮する情報の幅広さを意味するために「視点」としてみましたが、「視座」としてもいいと思います。

この「視点」が違うと品質への考え方も変わります。すると、機械翻訳の訳文の品質を評価する際の基準が変わり、それゆえに訳文の修正の内容や手間も変わるということです。

視点の違いにより、同じ翻訳分野の翻訳者が機械翻訳の話をしていても以下のように異なる意見が出てくるのだと思います。

「機械翻訳の出力を少し修正するだけで使える訳文になる。機械翻訳を使えば翻訳が速くなる。」

「機械翻訳の出力の編集作業の手間が多くて時間がかかる。機械翻訳を使うよりも自分で書いたほうが断然速い。」

機械翻訳の出力のしっくりしない表現でもよしとするのか、そこに手を加えて読者目線（クライアントの好み）の表現に書き換えるのか、という差によるものだと思います。

機械翻訳の視点

以下、視点の違いについて具体的に説明します。

機械翻訳の場合、原文一文のみの情報から訳文を出力します。これが現在の機械翻訳の特徴です。現時点では、文脈を考慮した訳文を出力するエンジンは研究段階であり、実用化されていません。

文書の中には文脈を考慮せずに訳せる箇所もあります。このような場合、機械翻訳の出力をほとんど修正せずに使えることがあります。

人手翻訳の視点

人手による翻訳では翻訳者により様々なアプローチがあると感じます。わかりやすくするためにそれぞれのケースに分類して説明します。機械翻訳の出力した訳文を修正することをイメージして説明します。

ケース1：1つの文（セグメント）だけを見る

もし、翻訳者が原文の1文だけを読んで訳文を考えるのであれば、機械翻訳を超えられない場合があります。なぜなら、上記の通り機械翻訳は原文1文だけの情報で訳文を作成しているからです。

対象となる1文だけを何度も読み直して辞書や文法書を頼りに解釈をしようとしても意味を理解できない場合がありますよね。

たとえば、日英翻訳で日本語の原文に主語や目的語が書かれていない場合には、前後の文章を読んだり技術的観点から推測したりして翻訳者が主語を特定して訳文で補うということは通常行われていることです。

この工程を踏まないと、なにかごまかしたような（日本語で表現されていない主語が it と訳されるなど）わかりづらい訳文になります。

ケース2：段落の情報を取り入れる

段落レベルで情報を頭に入れると少し訳文が変わります。翻訳対象になっている文章の前後の情報も考慮することになりますので、少なくとも文章の結束性を考慮した訳文に仕上げられます。

段落の意味も考慮すると、機械翻訳の訳文を修正する際の視点が変わります。この段落が書類全体の要約部分なのか、イントロなのか、など段落の役割が見えると使う言葉も変わります。

この段落が書類の要約に該当するのならば、情報をかなり省略して書かれている可能性があり文章の意味を解釈しづらいかもしれません。

そのような時は書類全体を訳して内容を理解した後に、この要約箇所で使う言葉を選んだほうがいいかもしれません。

ケース3：書類全体の情報を考慮する

書類全体を見れば、この書類の種類を推測できます。翻訳者であれば翻訳を受注する際に、書類の種類は伝えられていると思います。この情報も訳文修正のうえで重要な手掛かりになります。

分野がわかりますから、専門用語も選びやすくなります。また、書類全体での用語や表現の統一という考え方も加わります。

書類の中の図表も大きなヒントになります。図を参照すると文章の意味を解釈しやすくなります。

機械翻訳では、当然のことながら書類内の図表の情報を考慮していません。

ケース4：書類の読者や用途を考慮する

さらに視点を上げて、書類の読者や用途を考慮してみます。書類の用途や読者が自明な場合がありますし、翻訳会社やクライアントが書類の用途や読者を教えてくれることもあります。

この情報の有無で訳文の作り方が変わりますから、わからない場合には、翻訳者がクライアント・翻訳会社に聞く必要があると思います。

たとえば、社内用文書の内容確認のために翻訳文を使う場合と、商品販売のマーケティングで使う場合、または特許申請のために使う場合とでは訳文の書き方が変わります。

相手を説得するための文書なのか情報共有の文書なのかでも使う表現が変わるでしょう。

ケース5：関連書類を考慮する

与えられた書類に書かれていな情報も考慮します。たとえば、議事録の翻訳では過去の議事録の内容を知っていれば、今回の議事録で使う言葉を選びやすくなります。

また、過去の経緯がわかればニュアンスがわかるのでよりわかりやすい表現を選べる可能性が高まりますし、議事録のあいまいな口語表現の解釈にも役立つでしょう。

特許翻訳であれば同じ発明者や同じ会社の過去の出願内容に、今回の発明を理解するヒントが書かれていることもよくあります。

過去の出願内容に訳語を合わせることもできます。

要は、翻訳対象となっている書類以外の情報が、今翻訳をしている1文の訳文に影響しうるということです。

機械翻訳はこのような情報を当然考慮していません。

ケース6：関係者（ステークホルダー）を考慮する

また別の視点で見ると、翻訳対象物（書類）を使うクライアントやそのクライアントの顧客、業界、競合他社などいろんな情報を考慮できます。

商習慣もあるし関連する法律もあります。専門分野が特定されると思うので、専門書で使われている言葉や表現も参考になるでしょう。

特許翻訳であれば、権利化のために審査基準を満たす訳語を選びます。私が勤めていた特許事務所では、技術分野ごとに特許審査官の審査の傾向を分析してそれに従って表現を選びました。また、判例に基づいて表現を選んでいました。

(2023-03-17に上図を追加）

小説であれば舞台になっている国の歴史や文化的な背景も訳語選びに影響します。出版社の意向も訳語に影響すると聞いたことがあります。

重要なのは視点のすりあわせ

私はこの記事の中で翻訳者は機械翻訳と違って文字に書かれていること以外の情報も考慮して訳文を作っているということを説明しました。その考慮する範囲には個人の経験や分野による違いがあります。

機械翻訳のポストエディットでは、クライアントが想定する視点の高さを理解して、それに応じた品質の訳文を相応の時間と価格で提供することが重要だと思います。

クライアントの視点の理解不足が迷いを生みます。この迷う時間がスピードの低下とコストになってしまいます。それゆえに、ポストエディットの訳文を提供するのには最初は十分な対話が個別案件で必要だと思います。

最近の翻訳のニーズに、これまでの「高品質」以外に「そこそこの品質＋すぐに！」というニーズが徐々に増えてきているようです。

書類の種類や業界によっては、この新たなニーズに意識的に取り組むことが大切になると思っています。機械翻訳というツールができてこのニーズへの対応が現実的になってきています。

すべての案件でこの「そこそこの品質＋すぐに！」が必要だとはぜんぜん思っていませんが、クライアントや外資系企業で働く友人と話をしていると、現場には多様なニーズがあり私が想定している翻訳品質（視点の高さ）を必要としないニーズが出てきていると感じています。

なので立場が違う人と話をする場合には、どの視点から翻訳の品質を語っているのかよくすりあわせる必要があります。

そのうえで、どのような翻訳のアプローチをするのか（機械翻訳をするのか、人手翻訳をするのか、翻訳メモリーも使うのかなど）を検討するのがいいと思います。

なんでもかんでも機械翻訳なんて思うと選択肢が狭まってしまいます。

まとめ