【セミナー報告】2019/03/07(木)東京 日本翻訳連盟(JTF)翻訳セミナー

先日のJTF翻訳セミナーにお越しいただきましたみなさま、どうもありがとうございました。このセミナー後に出張や様々な納期が重なりまして、ブログのアップが遅れてしまいました。

セミナー後の懇親会でも翻訳会社や翻訳者、あと翻訳エンジン開発者の現場の声をうかがえて非常に有益でした。こういうセミナーは懇親会まで参加すると面白いですよね。

このセミナーでは日本知的財産翻訳協会(NIPTA)の「NIPTA特許機械翻訳研究会」の研究内容の報告をさせていただきました。

限られた時間の中でお伝えしたいことが多すぎて丁寧に説明できなかったことがありますので、ブログであらためて説明します。

ニューラル機械翻訳の出力のチェックと修正は必須

このJTFセミナーでは各分野の専門家がニューラル機械翻訳(NMT)の出力を評価しました。

特許明細書を出願するためにNMTで翻訳したとき、使える箇所と使えない箇所があります。その使えないというのがどのような場合なのか説明がありました。そして、使える場合にはどのような訳文が出力されるのか、という点についても例示されました。

いずれにしても、ニューラル機械翻訳の修正では、翻訳経験のある人(翻訳者)が出力内容を確認をして修正をしなければならないと提言されていた発表者が複数名いました。さらに、翻訳会社でポストエディット業務をされている方からは、ニューラル機械翻訳の誤訳のチェックのためには原文の理解が不可欠であるしニューラル機械翻訳特有の誤訳にも対処するためにそれ相応の能力が必要であることが具体例とともに説明されました。

ニューラル機械翻訳の活用方法

私は以下の図を使って、現状のNMTの活用方法の間違いを指摘しました。NMTにあまりにも大きな期待をして大きな役割を担わせていると思います。NMTができなかったことを後処理で作業者に修正させているという図です。

一般的にAIの活用方法では、目的に応じて人間の判断以外に他のテクノロジーとの組み合わせが必要とされています。なぜかNMTではNMTの出力がそのまま使われてしまったりして笑いの種になったりします。揶揄の対象はNMTの出力結果ではなく、NMTの出力結果をそのまま使った人の判断ミスでしょう。

現在、AI翻訳(NMT)が安価な技術として導入されています。この技術を使って欲しい結果を得るためには、目的に応じて別の既存の安価な技術と組み合わせるほうがよいのです。完全自動でできないところは半自動でもいいので何かしらの処理をするといいと思います。

私が考える技術の組み合わせは以下の通りです。NMTといってもそれぞれの分野に特化した翻訳エンジンがあるのでそれを活用すること、また用語集を適用できるエンジンを使うこと、これが必須だと思っています。(これは本研究会の結論ではなくツール開発者であり翻訳者である私の意見です)

この組み合わせについては、「翻訳手順」をご覧ください。

自動化できるところは徹底的に自動化すればいいと思っています。

翻訳者に支払われるべき対価

このように考えると特許翻訳の新規出願翻訳においては、ニューラル機械翻訳の出力を修正することが必須という前提になります。そして、それを修正するためのコストが生じています。

公開されている特許明細書をGoogle翻訳にかければ、このセミナーで指摘された以下のような誤訳がすぐに見つかります。用語の不統一、訳抜け、誤訳、表記ゆれ、数字とアルファベットの泣き別れなどなど、これらを翻訳者が修正するわけです。

翻訳の依頼者・発注者となる翻訳会社や企業の方々にはぜひ理解をしていただきたいのですが、この修正がけっこう大変なのです。ニューラル機械翻訳の誤訳を目視で発見するのは至難の業です。使える訳文もあるけど、そのすぐ次の訳文は修正が必要なのですから。

なので、この「隠れたコスト」をもう少し正確に見積もった上で、翻訳コストが本当に下がるのか、翻訳の品質を担保できるのかを検討したがいいと思います。実際にNMTの出力をポストエディットして提供をしている翻訳会社では、この「隠れたコスト」を下げるために工夫をしているようです。そのような努力なしに、機械翻訳の尻ぬぐいを翻訳者だけに頼るようなやり方では、ポストエディットによる翻訳提供のサービスは長続きしないと思います。翻訳者が誤訳を見逃すこともあるだろうし、面倒な作業で翻訳者が疲弊をしたりと、あまりよいことはありません。

このようなことを考えると、翻訳者の報酬についても今後検討する必要があると思っています。NMTのポストエディットにより提供する翻訳文が手翻訳と同じ品質になるのであれば、NMTを使用していても使用しない場合と同じ対価を得る権利が翻訳者にあると思います。手翻訳と同じ品質にするためにそれなりの手間をかけて知恵と経験を駆使してNMTの出力を修正しているからです。

翻訳者の役割・価値

誤訳があるとは言っても、複雑な係り受けのない表現はニューラル機械翻訳でいい感じに訳文が出力されることがあります。特許翻訳でも権利範囲に関係のある箇所以外は、出力された訳文に手を入れてきれいな自分好みの文章に修正する必要はないでしょう。

このように考えていくと、翻訳者の価値というのは、当たり前の簡単な文章を訳せるというレベルではなく、係り受けが難しい原文を技術的・文法的な理由をもとに読み解いて同じ意味の訳文を書けるということになります。さらに、特許法を理解して特許の使い手である特許事務所や企業の知財部で使いやすい訳文に仕上げるということも翻訳者ならではの価値提供だと思います。

また、セミナーで指摘されていたように、「原文の言い間違いをそのまま受け取って翻訳をする翻訳者もいる」ということも翻訳者として気をつけていきたいところです。これと同じようなことを、複数の翻訳会社や特許事務所の品質管理の方から聞いたことがあります。原文の意味を正しく解釈して訳すことも私たち翻訳者が価値を発揮できるところです。

このあたりのことは、翻訳を学ぶ上で今までもさんざん言われてきたことなので今さら話をする必要もないことです。しかし、翻訳者が提供できる価値を具体例とともにもう一度しっかりと定義をしておかないと、ニューラル機械翻訳と翻訳者の訳文の差をクライアントに説明しづらくなっているように感じます。

チューニングされた翻訳エンジンで何ができるのか

私が開発しているニューラル機械翻訳を翻訳者として利用するためのツール「GreenT」では、誤記の自動修正や用語の統一など様々な観点からNMTの出力を修正しているため、使いやすい文章が出力される可能性が高くなります。それでも、すべての文章を翻訳できるほど賢いわけではないので、他の翻訳支援ツールを併用したり、訳しにくい原文については翻訳者が手翻訳をする必要があると思っています。

セミナーでも紹介したいくつかの訳文の出力例を紹介します。

上記のようにGreenTでは「イチジク。」は発生しません。上記ではGoogle翻訳を例にしましたが、他社製の特許専用のニューラル機械翻訳エンジンでも「イチジク。」は発生しないようです。よって、「『イチジク。』があるからニューラル機械翻訳は使えない」というのはニューラル機械翻訳を否定する理由になりません。

GreenTでは「media device」を「メディア装置」として用語登録をしておけば、出力結果に反映されます。だから、「用語が統一されないからニューラル機械翻訳は使えない」とも言えないのです。

日英翻訳でも用語統一ができます。また、図番号を自動修正できます。このことについては、「自動処理の例(特許翻訳)」でも紹介したとおりです。

GreenTでは上記のように数字とアルファベットの泣き別れ(半角スペースの誤挿入)も解消されています。

現在のツールでここまでできるのです。今後、もっとできるようになります。ツール自体の性能がよくなるからですが、それと同時に翻訳エンジン自体も少しずつよくなっていくからです。

まとめ

JTFセミナーでは時間の関係であまり細かく話せなかったのですが、以下のスライドのように考えています。

NMTの出力をベースに何の工夫もなく修正をするのはおすすめしません。修正の労力がかかるからです。NMTを使うかどうかというのは、自分の分野でNMTを使ってみた人が判断をして使えばいいと思っています。

NMTを使った翻訳支援ツールは今後増えていき、使いやすくなっていくと思います。現時点では、翻訳メモリツールに組み合わせて使う「翻訳エンジン」としての提供が一般的ですが、GreenTのように原文の修正(プリエディット)を積極的にしたり出力文を自動修正をしたりして出力の品質を向上させるツールが他にも出てくると思います。また、GreenTのように複数の翻訳エンジンの結果を比較できるようなツールも現れるでしょう。

現に、去年の11月にGreenTの動画を公開して以来、いくつかのツールメーカーの開発者からの問い合わせがあり実際に会って話をしたりオンラインで打ち合わせをしたことがあります。それらのメーカーが何か新しいツールや機能を提供し始めてもおかしくないと思います。

翻訳者としてNMTを導入するときの判断材料については今後、別の記事で述べていきたいと思います。

関連記事

翻訳者のためのニューラル機械翻訳支援ツール「GreenT

ニューラル機械翻訳は翻訳者にとって使えるツールなのか?

トップへ戻る