ニューラル機械翻訳(NMT)にありがちな誤訳に対して、用語を登録して対処する方法を紹介します。
GreenTでは用語を事前に準備して翻訳を開始することができますが、用語集なしで翻訳を開始し、必要なときに用語を登録できます。
語訳例
以下のGoogle翻訳で何が間違っているのかわかりますか?
原文 | 訳文 |
ドナルド・トランプ大統領(以下「トランプ」とする)は、第45代アメリカ合衆国大統領である。 | President Donald Trumph (hereinafter referred to as “cards”) is the 45th president of the United States of America. |
トランプ大統領のトランプはTrumpと書きます。上記ではTrumphとなっているので間違いです。ニューラル機械翻訳でよくみる間違いです。Trampとなった語訳例も見たことがあります。
また、「(以下「トランプ」とする)」のトランプをカードゲームのトランプと間違えて「cards」と翻訳しています。これも明かな誤訳ですが、なかなかいいセンスをしています(笑)。
修正方法
用語登録
ニューラル機械翻訳に訳語選定を任せた結果、このようなことになってしまいました。
なので、このような誤訳に出会うたびに正確な訳語を登録していくとよいでしょう。
「用語集の管理方法」でも説明したとおり、1つずつ登録します。
まずTrumphをTrumpに修正をしてから登録する用語「President Donald Trump」を選択します。そして、Ctrl + C を押して選択された文字列をクリップボードにいれいます。
次に、原文で原語にあたる「ドナルド・トランプ大統領」を選択して、[用語]ボタン(英語表示では[Glossary]ボタン)をクリックします。
すると、ダイアログが表示されています。登録内容が正しければ、[Add]ボタンをクリックします。
これで、用語が登録できました。
同様にして「cards」となってしまっていた箇所を「Trump」に修正し、この言葉も登録します。
訳文の出力
この状態で訳文を出力してみます。[GreenT]ボタンをクリックします。以下のように誤訳のない英文が出力されました。
原文 | 訳文 |
ドナルド・トランプ大統領(以下「トランプ」とする)は、第45代アメリカ合衆国大統領である。 | President Donald Trump (hereinafter “Trump”) is the 45th president of the United States of America. |
ダイアログには、用語が適用されていることを示す○印が表示されます。
上記の場合には用語集の訳語が適用されましたが、用語が適用されないこともあります。その場合には、用語リストに×が表示され用語リスト全体が黄色になりますのでショートカットキーの[Alt]+[B]を使って修正してください。
このようにその都度、必要な用語を登録していくといいでしょう。正しく訳出された用語も、それ以降の訳語を統一するために用語登録していくのもいいと思います。