2017年12月17日日曜日

Adaptive Machine Translation (AMT:学習型機械翻訳)とは?

ニューラル機械翻訳(NMT)と、学習型機械翻訳(AMT)との違いについて書きます。

NMTでは、あるテキストに対して機械翻訳を実行した場合、単語の訳語を制御できません。以下のようになります。

英日の場合:

英語(ソース)
.......determine............................................................................................... .....................................determines................................................................................determination................................................................................. .....................................................................determined.....................

日本語(ターゲット)
.......判別する............................................................................................... .....................................判断する..................................................................判定する................................................................................. .....................................................................判別する....................

このようにターゲットの訳語に統一感がありません(統一感を持たせることができません)。

AMTでは、

.......determine............................................................................................... .....................................determines................................................................................determination................................................................................. .....................................................................determined.....................

日本語(ターゲット)
.......判別する............................................................................................... .....................................判別する..................................................................判別する................................................................................. .....................................................................判別する....................

最初の「determine」で「判別する」とタイピングして確定すると機械翻訳が学習します。それ以降はちゃんと「判別する」と表示してくれます。

作用の進め方として、AMTでは、テキスト全体に対して機械翻訳を実行するのではありません。各セグメントに対して各セグメントごとに機械翻訳を実行します。

ですので、NMTを使用する場合、「ポストエディット」と言われますが、AMTを使用する場合、れっきとした「翻訳」です(後者では、ポストエディットをするという概念はありません)。

*我々は、現在、AMTを検証中です。諸問題が解決できれば、2018年の前半にも、AMTを導入する予定です。
*「adaptive」=「適応性のある」という意味ですので、本来は、「適応性機械翻訳」が正しい訳だと思います。ただし、機能や内容を考えると「学習型機械翻訳」という名称は誤っていないと思います。

0 件のコメント:

コメントを投稿