Ver. 1.1から導入した「意味の区切りによる翻訳」の使い方を、英日特許翻訳の文例(すべてUS8259444B2からの引用)で紹介します。
一般的な機械翻訳の能力として無料のGoogle翻訳を使うことが多いと思うので、その出力結果との比較をしてみます。
この比較においては、GreenTが正しい訳文を出力できることを説明しているわけではありません。GreenTの説明記事では何度も書いていますが、ニューラル機械翻訳は誤訳を含みうるのでそう簡単に信用してはいけません。
GreenTには、誤訳を含みうる訳文の誤訳箇所をできるだけなくす機能(文末表現の統一、特許特有の表現の統一、用語の統一、数値や日付の正確な翻訳など)や、誤訳箇所を特定しやすくする機能(QAチェック)が組み込まれています。
この記事では、GreenTの機能により、「誤訳や不自然な表現があるけれども修正しやすい訳文」をどのように出力させるのかの例を紹介します。
例文1
原文
By way of example, the media device 200 including the housing and internal components may be assembled similarly to the invention disclosed in U.S. patent application Ser. No. 10/884,172, filed Jul. 2, 2004 and entitled “HANDHELD COMPUTING DEVICE,” which is herein incorporated by reference. |
Google翻訳
一例として、ハウジングおよび内部構成要素を含むメディアデバイス200は、米国特許出願第09 / 08,096号に開示された発明と同様に組み立てられ得る。 2004年7月2日に出願され、「ハンドヘルドコンピューティングデバイス」と題された米国特許出願第10 / 884,172号。 |
2文に分かれてしまっていること、また、最初の米国特許出願番号が間違っていることなど、わかりやすい誤訳のある訳文となっています。2文目は文末が消えています。
GreenT(その1)
設定:英数字記号の全角化、特許仕様、文末表現は常体
一例として、ハウジングおよび内部構成要素を含むメディアデバイス200は、米国特許出願第09/08,096号に開示された発明と同様に組み立てられ得る。 2004年7月2日に出願され、「ハンドヘルド計算装置」と題された米国特許出願第10/884,172号は、参照により本明細書に組み込まれる。 |
無料のGoogle翻訳と同様に間違った米国特許出願番号が記載されていますが、これはGreenTのQA機能で気がつけます。2文目は文章として成立しています。
GreenT(その2)
設定:英数字記号の全角化、特許仕様、文末表現は常体
「U.S. patent application Ser. No. 10/884,172」を意味の区切りと指定
例として、ハウジングおよび内部構成要素を含むメディアデバイス200は、2004年7月2日出願の「ハンドヘルドコンピューティングデバイス」という名称の米国特許出願番号番号10/884,172に開示された発明と同様に組み立てられてもよい。 |
GreenT(その1)では特許出願番号が誤訳になっているため、意味の区切りとして特許出願番号を指定しました。その結果、無事に1文として出力されました。
「which is herein incorporated by reference」が抜けているのでこれを補う必要がありますが、数字の誤訳はありません。
「米国特許出願番号番号」となっています。これは一義的に「米国特許出願番号」に変換してしまえばいい表現です。ポストエディットの自動変換機能で修正できるいい例です。
例文2
原文
Example of indicators of this type are disclosed in greater detail in U.S. patent application Ser. No. 10/773,897, filed Feb. 6, 2004 and entitled “ACTIVE ENCLOSURE FOR COMPUTING DEVICE,” which is herein incorporated by reference. |
Google翻訳
このタイプのインジケータの例は、米国特許出願第09 / 08,079号により詳細に開示されている。 2004年2月6日に出願され、「計算装置のための能動的エンクロージャ」と題された米国特許出願第10 / 773,897号は、参照により本明細書に組み込まれる。 |
例文1と同様に最初の米国特許出願番号が誤訳として出力され、2文になりました。
GreenT(その1)
設定:英数字記号の全角化、特許仕様、文末表現は常体
このタイプのインジケータの例は、米国特許出願第09/08,079号により詳細に開示されている。 2004年2月6日に出願され、「コンピューティングデバイスのための能動的エンクロージャ」というタイトルの米国特許出願第10/773,897号は、参照により本明細書に組み込まれる。 |
こちらも無料のGoogle翻訳と同様に米国特許出願番号が誤訳として出力され、2文になりました。後半の特許出願番号や日付は間違っていません。
GreenT(その2)
設定:英数字記号の全角化、特許仕様、文末表現は常体
「U.S. patent application Ser. No. 10/773,897」を意味の区切りと指定
このタイプのインジケータの例は、2004年2月6日に出願され、「コンピューティングデバイスのアクティブエンクロージャ」と題された米国特許出願番号番号10/773,897に詳細に開示されており、参照により本明細書に組み込まれる。 |
「which is herein incorporated by reference」の係り受けが間違っていますが、個々の情報は正確に出力されています。修正しやすい訳文の例だと思われます。こちらでも「米国特許出願番号番号」となっており、これはポストエディットの自動変換機能で修正する必要があります。
例文3
原文
That is, once the laptop computer 250 recognizes the media device 200 and determines that the media device 200 includes media functionality, the laptop computer 250 can be configured to automatically deliver all or a select few of the media files (e.g., audio tracks) stored in the laptop computer 250 to the memory of the media device 200. |
Google翻訳
すなわち、ラップトップコンピュータ250がメディアデバイス200を認識し、メディアデバイス200がメディア機能を含むと判断すると、ラップトップコンピュータ250は、保存されたメディアファイル(例えば、オーディオトラック)の全部または一部を自動的に配信するように構成できる。 ラップトップコンピュータ250からメディアデバイス200のメモリへ。 |
2文に分かれました。参照符号の数字に全角と半角が混在しています。
GreenT(その1)
設定:英数字記号の全角化、特許仕様、文末表現は常体
すなわち、ラップトップコンピュータ250がメディアデバイス200を認識し、メディアデバイス200がメディア機能を含むと判断すると、ラップトップコンピュータ250は、保存されたメディアファイル(例えば、オーディオトラック)の全部または一部を自動的に配信するように構成できる。ラップトップコンピュータ250からメディアデバイス200のメモリへ。 |
無料のGoogle翻訳とおおよそ同じです。「ラップトップコンピュータ」を使いたくない方は、用語集の適用機能を使って「ノートパソコン」など別の訳語にしてください。
GreenT(その2)
設定:英数字記号の全角化、特許仕様、文末表現は常体
「all or a select few of the media files (e.g., audio tracks) stored in the laptop computer 250」を意味の区切りと指定
すなわち、ラップトップコンピュータ250がメディアデバイス200を認識し、メディアデバイス200がメディア機能を含むと決定すると、ラップトップコンピュータ250は、メディアデバイス200のメモリにラップトップコンピュータ250に保存されているメディアファイル(オーディオトラックなど)のすべてまたは選択したいくつかを自動的に配信するように構成され得る。 |
GreenT(その1)では「deliver all or a select few of the media files (e.g., audio tracks) stored in the laptop computer 250 to the memory of the media device 200.」の箇所が誤訳になっていましたので、この部分で係り受けが正確に解釈されなかった上記太字箇所を「意味の区切り」として指定しました。その結果、係り受けが正確になり1文として出力されました。
例文4
原文
Although the platform 230 essentially floats within the cavity of the housing 202, when the user presses on the desired button zone over one side of the platform 230, the opposite side contacts the top wall (opposite the press) thus causing the platform 230 to pivot about the contact point. |
Google翻訳
プラットフォーム230は本質的にハウジング202の空洞内で浮いているが、ユーザーがプラットフォーム230の片側の所望のボタンゾーンを押すと、反対側が上壁(プレスの反対側)に接触し、プラットフォーム230を旋回させる接触点について。 |
文末が不完全な形で出力されました。わかりやすい誤訳です。また数字が半角になりました。
GreenT(その1)
設定:英数字記号の全角化、特許仕様、文末表現は常体
プラットフォーム230は本質的にハウジング202の空洞内で浮遊するが、ユーザーがプラットフォーム230の片側で所望のボタンゾーンを押すと、反対側が上壁(プレスの反対側)に接触し、プラットフォーム230を旋回させる接触点について。 |
表現が微妙に異なりますが、無料のGoogle翻訳とおおよそ同じような出力結果となりました。
GreenT(その2)
設定:英数字記号の全角化、特許仕様、文末表現は常体
「the opposite side contacts the top wall (opposite the press) thus causing the platform 230 to pivot about the contact point」を意味の区切りと指定
プラットフォーム230は本質的にハウジング202の空洞内で浮いているが、ユーザーがプラットフォーム230の片側の所望のボタンゾーンを押すと、反対側が上壁(プレスの反対側)に接触するため、プラットフォーム230が接触点を中心に旋回する。 |
GreenT(その1)では「the opposite side contacts the top wall (opposite the press) thus causing the platform 230 to pivot about the contact point」の箇所が誤訳になっていました。
最初は従属節の太字箇所のみを意味の区切りとしましたがいい訳文が出力されませんでした。そのため、この句全体を「意味の区切り」として指定しました。その結果、係り受けが正確になり従属節が正確に出力されました。
例文5
原文
Further, in some embodiments, the management module 806 also interacts with the host computer 802 to transfer data files (i.e., non-media asset files stored on the host computer 802, typically on the host computer’s hard drive) to and from media storage 808. |
Google翻訳
さらに、いくつかの実施形態において、管理モジュール806は、ホストコンピュータ802とも相互作用して、データファイル(すなわち、ホストコンピュータ802、典型的にはホストコンピュータのハードドライブに格納される非メディア資産ファイル)をメディアストレージ808とやり取りする。 。 |
末尾の句点2つが気になりますが、係り受けは正確に反映できています。
GreenT(その1)
さらに、いくつかの実施形態において、管理モジュール806は、ホストコンピュータ802とも相互作用して、データファイル(すなわち、ホストコンピュータ802、典型的にはホストコンピュータのハードドライブに格納された非メディア資産ファイル)をメディアとの間で転送する。ストレージ808。 |
末尾の「ストレージ808」。これだけで誤訳だと判定可能(笑)。無料のGoogle翻訳とも少し違います。
GreenT(その2)
設定:英数字記号の全角化、特許仕様、文末表現は常体
「data files (i.e., non-media asset files stored on the host computer 802, typically on the host computer’s hard drive)」を意味の区切りと指定
さらに、いくつかの実施形態では、管理モジュール806は、データファイル(つまり、ホストコンピューター802、通常はホストコンピューターのハードドライブに保存されている非メディア資産ファイル)をメディアストレージ808との間で転送するためにホストコンピュータ802とも対話する。 |
GreenT(その1)では「transfer data files (i.e., non-media asset files stored on the host computer 802, typically on the host computer’s hard drive) to and from media storage 808」の個所が誤訳になっていました。目的語が長すぎるのが原因だと思われます。
このような場合がこの意味の区切りがうまく作用する典型的な事例です。上記のように目的語を「意味の区切り」として指定すると「メディアストレージ808」が正確に訳出されます。