2017年9月24日日曜日

機械翻訳エンジンはいくつ使う?

機械翻訳サミットから帰ってきました。メモを眺めているとポストエディットに関してこんなことが書かれていました(実際には、PCに入力しましたが)。
  1. 機械翻訳エンジンは、分野特定型(domain specific)の方が良い。
  2. コーパスさえ蓄積できれば自社で構築が可能。
  3. どのようなオペレーションにするかは営業秘密である。
1は、汎用型の機会翻訳エンジンを所有する意味はない。扱っている分野特定型の機械翻訳エンジンの方が精度が高い。

2は、英日/日英以外の言語ペアだと、コーパスが存在しないので自社で構築する必要がある。サーバーも自社で所有する。後者に関しては、サーバー代金も随分下がっているので我々のような中小企業でも自社サーバー所有は現実的だろう。それに日本のクライアントの場合、サーバーが国内にないと依頼できないというケースが多い(サーバーが海外にあると、データも海外にあることになる。会社のルールでそれが許されない)のでその方向で検討したい。

3だが、十分に検討したい。複数の機械翻訳エンジンを組み合わせてベストなものを使えばいいわけだ。CATツールの中には複数のAPIを構築できないものもあるのでこれに関しては課題である。サーバーが国内にあるのか海外にあるのかぐらいは公表すべきだろうが、どのこエンジンを組み合わせているかについて及びどのようなオペレーションで翻訳しているのかは営業秘密として扱っても良いと思う。

続く・・・。

0 件のコメント:

コメントを投稿