- 機械翻訳エンジンは、分野特定型(domain specific)の方が良い。
- コーパスさえ蓄積できれば自社で構築が可能。
- どのようなオペレーションにするかは営業秘密である。
2は、英日/日英以外の言語ペアだと、コーパスが存在しないので自社で構築する必要がある。サーバーも自社で所有する。後者に関しては、サーバー代金も随分下がっているので我々のような中小企業でも自社サーバー所有は現実的だろう。それに日本のクライアントの場合、サーバーが国内にないと依頼できないというケースが多い(サーバーが海外にあると、データも海外にあることになる。会社のルールでそれが許されない)のでその方向で検討したい。
3だが、十分に検討したい。複数の機械翻訳エンジンを組み合わせてベストなものを使えばいいわけだ。CATツールの中には複数のAPIを構築できないものもあるのでこれに関しては課題である。サーバーが国内にあるのか海外にあるのかぐらいは公表すべきだろうが、どのこエンジンを組み合わせているかについて及びどのようなオペレーションで翻訳しているのかは営業秘密として扱っても良いと思う。
続く・・・。
0 件のコメント:
コメントを投稿