2017年9月30日土曜日

第25回シンギュラリティサロン~「航空管制×シンギュラリティ」に参加しました。

本日は、グランフロント大阪で開催された第25回シンギュラリティサロンに参加しました。いつもは、ナレッジサロンで開催されますが、今回は、カンファレンスルームタワーBで開催されました。

講師の方は、伊藤恵理氏(国立研究開発法人 海上・港湾・航空技術研究所 電子航法研究所 航空交通管制領域 主幹研究員)でした。テーマは、「航空管制×シンギュラリティ」。

航空管制って始めて聞いた言葉だったかもしれません。

冒頭でお話がありましたが、「いま、この瞬間にも、世界の空には約6,000機を超える航空機が飛行しています。一機あたり150~200人が搭乗していると仮定すると、常時100万人を超える人が空を飛でいる試算になり、まさに天空の巨大都市。」。これはすごい!と思いました。

飛行機は、「後100年経過したいと物体は空を飛ばない」と言われた翌日、ライト兄弟が飛行機を飛ばしました。それ以降、これといった利用価値がなかったが、郵便という商用利用をきっかけに飛行機の認知度が高まったそうです。機械翻訳も人々の役に立つ商用利用が見つかれば、今以上に認知されるのではないかと思います。オリンピックのような大きなイベントで利用価値が高まれば素晴らしいと思います。

翻訳業界では、翻訳者が仕事を失うのではないか?と噂されていますが、本日のお話(航行管制の自動化)をお聞きしたところ、自律航行管制が実現すれば、航空業界では、パイロットよりも管制官の方が先に仕事を失ってしまうのではないかと思いました。翻訳業界で言うと、翻訳者よりもプロジェクトマネージャーが先に仕事を失ってしまいそうです。翻訳という作業よりも、プロジェクトマネジメントというタスクの方が自動化がし易いのではないか?というのが僕の印象です。

自律航行管制では、機械と人間とが異なる判断を下したとき、どちらを優先するかに関するルールは、各社異なるそうです。ある会社は、機械の判断を信じる。他の会社は、人間の判断を信じる。そういうルール作りも必要でしょうね。

Autonomous Project Management(自律プロジェクトマネジメント)の到来も遠くないと思われます。  
非常に面白い内容のお話でした。
伊藤氏のTED Kyotoでの講演
Air Traffic Management: Eri Itoh at TEDxKyoto 2012

2017年9月29日金曜日

PR:「機械翻訳及びポストエディット部門」設立のおしらせ

人間による翻訳を一切排除した
「機械翻訳及びポストエディット部門」設立のおしらせ


October 2, 2017 (Osaka, Japan)
- 特許翻訳専門会社である株式会社MK翻訳事務所は、この度、人間による翻訳を一切排除し、機械翻訳の後、ポストエディットを実施して、翻訳文を納品する作業に特化した「機械翻訳及びポストエディット部門」を設立致しました。機械翻訳システム以外にも様々なテクノロジーを活用し、機械と人間とがうまく共存する翻訳環境を構築して参ります。昨今の人工知能及び翻訳テクノロジーの発達を考えると、機械翻訳とポストエディットとの組み合わせに本格的に注力することにより業務効率が高まると判断いたしました。こうすることにより、お客様に対して、より良いサービスを提供できると考えております。
尚、人間による翻訳及び校正による翻訳文も従来通りお取り扱い致します。


【タイムスケジュール】
  • 2017年10月、機械翻訳及びポストエディット部門設立。
  • 同年同月、社内翻訳者の一部は、翻訳者からポストエディタに転身。
  • 2019年1月、機械翻訳及びポストエディットにより25%生産効率向上達成。
社内で行った調査では、ニューラル機械翻訳、クラウド翻訳システム、ポストエディタを活用した「Hybrid Translation」により、従来式の翻訳に比べて、20%以上生産効率が向上することが判明しています。現在のニューラル機械翻訳では、言語ペアによって精度の差が見られるものの、数年内にはこの問題は解決されると考えられています。
ポストエディタの育成も大きな問題でしたが、弊社では、独自のメソッドにより社内でポストエディタの育成にも成功致しました。2019年には、「ベテラン」のポストエディタがポストエディット業務に従事いたします。
現在の機械翻訳の精度では、まだまだ大量のポストエディットが必要ですが、業務全体をポストエディット業務に専念することにより、従来より、25%速く、お安く翻訳できることを見込んでおります。なお2017年、2018年中は、英語>日本語の言語ペアのポストエディット業務から開始いたします。それ以外の言語は、順次開始いたします。
Contact


株式会社MK翻訳事務所
代表 梶木正紀(カジキ マサノリ)
大阪市北区大深町3番1号
グランフロント大阪ナレッジキャピタル8階
Masa Kajiki (Mr)
Homepage: https://www.mktrans.info/


About MK Translation Firm

Founded in 2006. Since, the firm has translated numeral patent specifications in the field of electricity, chemistry, biotechnology, and pharmaceutical. In 2017, the firm started a so-called “Hybrid Translation” using a neural machine translation, a cloud translation system, and post-edit to boost the productivity. Firm’s founder CEO, Masa Kajiki, made public in a presentation titled “Neural Machine Translation and Patent Translation from LSP Perspective” (The 7th Workshop on Patent and Scientific Literature Translation (PSLT 2017), September 22, 2017, Nagoya, Japan) that the firm would become a post-edit only LSP in 2019, which is first of its kind in Japan.

機械翻訳導入に関するスケジュール

機械翻訳サミットの続きです。

僕のプレゼンテーションの最後に紹介いたしましたが、我々が機械翻訳導入に関するスケジュールは、以下のようになります。

これは、講演最後の方のスライドです。
このスケジュールによると、2018年をもって人間翻訳を廃止。2019年からは全案件に機械翻訳を下訳として導入(あくまでの下訳にしか使いません)。

そうなればもう「翻訳会社」とは呼べませんね。「ポストエディット会社」でしょうか?なんという名称が相応しいでしょうか?

英日/日英だけなら2018年から全案件に機械翻訳を導入することは不可能ではないですが、独日/日独に関しては、適当な機械翻訳エンジンが存在しないため、ゼロから構築しなければなりません。そう考えると2019年になってしまうでしょうね。

その前に、「機械翻訳及びポストエディタ部門」を設立しようと思っています。

機械翻訳エンジンだけではなく、サーバーも決めなくてはならないですし。オペレーションマニュアルも用意する必要があります。やることは山の様にありますね。じっくり取り組もうと思っています。

2017年9月28日木曜日

ポストエディットはこんなイメージです。

ポストエディットって何?という方向けに簡単な説明をします。以下のスライド図をご覧ください。
あるソーステキストがあると仮定します。

これが機械翻訳の結果だとします。

ポストエディタの頭には、こんな翻訳のイメージがありました。


ポストエディタは、赤の矢印のところを、ブルーの翻訳からはみ出ているところを削除したり、足りてないところを足したりします。これがポストエディットです。

ポストエディット作業は、簡単に言うとこんなイメージです。ポストエディタは、ゼロから翻訳できる能力が必要です。チェックや校正とも違う作業になります。下訳として機械翻訳が使われますので、チェックや校正と違って、訳抜け、記号及び数字の誤りは発生しない(場合がほとんど)。人間が翻訳すると文調は一定していますが、機械翻訳の場合、一定しません。突然とんでもない訳が現れる場合があります。長いテキストになればなるほど用語が統一されない場合があります(されている場合もあります)。

数字や記号は、ほぼ間違いなくコピーされますので機械翻訳はその点は安心ですね。

2017年9月27日水曜日

機械翻訳について地元の翻訳学校からインタビューを受けました。

1時間ほど持論を述べました。ポストエディタの育成は、急務なので、翻訳学校さんとも連携できればいいなと思っています。

ベテラン翻訳者さんは、機械翻訳に嫌悪感を抱いていらっしゃる。だからをポストエディタに転身させるのはかなり難しい。しかし翻訳学校に今通っている若い人は、頭が柔らかいので、機械翻訳にも理解を示してくれやすいと思う。

機械翻訳ではメールすら読めない?

機械翻訳サミットから帰ってきました。そのときのメモとか交わした会話の記憶を辿って記事を書いています。

講演をされた方々と日本料理のお店でランチをいただきました。そのとき、ある機械翻訳の上級研究員の方がおっしゃっていました。「君は機械翻訳の専門家だろ?なら日本語で書いてもメールは読めるよね?」と日本のクライアントから言われたそうです。しかし機械翻訳を使用しても全く意味は分からなかったそうです(この研究員の方は日本語は読めません)。

機械翻訳がいくら進んでもメール程度の内容でも機械翻訳を使ってもまだまだ理解できるようになるには時間が必要なようです。

非常に意外な気がしました。

2017年9月25日月曜日

ポストエディットを学ぶには?

機械翻訳サミットから帰ってきました。メモを眺めているとポストエディットに関してこんなことが書かれていました(実際には、PCに入力しましたが)。

  1. 各社ポストエディットの育成に力を注ぎ始めている(すでに注いでいる)。
  2. まず社内スタッフからポストエディットのトレーニングを開始している。

注目すべきなのは、「2番目の社内スタッフからトレーニングを開始している」だろう。つまり在宅翻訳者に対してオンラインでトレーニングすることが難しいため、まず社内スタッフからトレーニングして、それが落ち着いてから(マニュアルなんかが完成してから)在宅翻訳者に対してトレーニングなりを開始するというのが一般的な方法なのだろう。

このスケジュールでは、在宅翻訳者さんにトレーニングの機会が回ってくるのはまだ先のようだ。今後増々仕事が増える見込みのポストエディット職は、まず、社内スタッフが全て取ってしまうことになる。

もしポストエディットの仕事に興味があるなら、どこかの翻訳会社にでも就職しない限りトレーニングを受けることができないのではないか?

色々話してみましたが、「プロの(ベテランの)ポストエディターはまだ翻訳業界に存在しない」というのが業界のコンセンサスだと思いますので、やるなら今でしょ的なことが言えると思います。

続く・・・。

2017年9月24日日曜日

機械翻訳エンジンはいくつ使う?

機械翻訳サミットから帰ってきました。メモを眺めているとポストエディットに関してこんなことが書かれていました(実際には、PCに入力しましたが)。
  1. 機械翻訳エンジンは、分野特定型(domain specific)の方が良い。
  2. コーパスさえ蓄積できれば自社で構築が可能。
  3. どのようなオペレーションにするかは営業秘密である。
1は、汎用型の機会翻訳エンジンを所有する意味はない。扱っている分野特定型の機械翻訳エンジンの方が精度が高い。

2は、英日/日英以外の言語ペアだと、コーパスが存在しないので自社で構築する必要がある。サーバーも自社で所有する。後者に関しては、サーバー代金も随分下がっているので我々のような中小企業でも自社サーバー所有は現実的だろう。それに日本のクライアントの場合、サーバーが国内にないと依頼できないというケースが多い(サーバーが海外にあると、データも海外にあることになる。会社のルールでそれが許されない)のでその方向で検討したい。

3だが、十分に検討したい。複数の機械翻訳エンジンを組み合わせてベストなものを使えばいいわけだ。CATツールの中には複数のAPIを構築できないものもあるのでこれに関しては課題である。サーバーが国内にあるのか海外にあるのかぐらいは公表すべきだろうが、どのこエンジンを組み合わせているかについて及びどのようなオペレーションで翻訳しているのかは営業秘密として扱っても良いと思う。

続く・・・。

2017年9月23日土曜日

プレゼンテーション終了しました!The 7th Workshop on Patent and Scientific Literature Translation (PSLT 2017)

お陰様で無事プレゼンテーション終了しました!

ここで話しました。
そう言えば、大学の講堂でプレゼンテーションをさせていただくのは初めてだったかもしれません。

結構広いのです!
内容は、さておき、I will finish my presentation well before our lunch time. がちょっとだけウケたのが嬉しかったです(笑)。

僕のプレゼンテーションですが、終了後、ある参加者に"Bold move!"と言われました。まぁいいように取りましょう・・・。

ケータリングもありました。

朝食はここで食べることができる!
ちなみに朝食を会場でも取れることを知らなかった僕は、ホテルで食べてしまいました。

今回のサミットで学んでことは沢山ありますが、その中でも以下が勉強になりました。

独日/日独のニューラル機械翻訳では、ドイツ語>英語>日本語、又は、日本語>英語>ドイツ語の順に翻訳されている可能性がある。そのため、日独の場合、ターゲットのドイツ語に英語が混ざることがある。これはお話をお伺いした方のご意見でした。確証はありません。英語を一度経ている可能性があるとおっしゃっていました。

ドメインに合わせた機械翻訳(domain specific MT)が良いということも学びました。例えば、WIPOが開発しているMTでは、"I am a boy"というセンテンスは機械翻訳のコーパスんは含まれないのだそうです。特許明細書に現れないセンテンスだからです。ですので特許翻訳を行うなら特許専門のMTの方がよいみたいですね。ちなみに来週当たりにWIPOからお知らせがあるみたいです(担当者から直接聞いた話しなので間違いないですが、内容は公表まで書かないでおきます)。

9月22日の午後のセッションの休憩中に外に出ましたが、ケータリングも含めて全てがほぼ撤収されていました。ちょっと寂しい・・・。

その機械翻訳エンジンですが、「あそこのエンジンはいいぞ。でもあそこのエンジンは止めておいた方がいいぞ」とか「あそのエンジンは高いぞ(数千万)」とかのヒソヒソ話も聞いてきました。

1点残念だったことは、機械翻訳はこれから増々発展していくと思いますが、コンピュータサイエンスという分野がないので、機械翻訳ではノーベル賞の対象にはならないそうです。残念。

ここで学んだことを活かしたいと思います。機械翻訳の本格導入年である2019年までちょっとありますが、1つ1つ課題を解決していくつもりです。

今回、講演の機会を下さいました主催者の皆様、大変ありがとうございました。関係者の皆様、および名古屋大学のボランティア(アルバイト?)の学生(だと思う)の方々、お疲れ様でした。皆様のお陰で大変有意義な時間を過ごすことができました。今後ともどうぞ宜しくお願いします!

P.S. AAMTに加入しようかと思っています。

2017年9月21日木曜日

機械翻訳サミットに到着

名古屋大学で開催中の機械翻訳サミットにやっと到着しました。サミットは、19日から開催されていました。僕は、21日にやっと参加。大半のセミナーが終了していました。ちょっと残念です。


本日(21日)は、早朝に大阪を出発して、9時頃に名古屋大学に到着しました。受付で登録するときに、wifi を申し込みました。

受付でこれらのグッズがもらえる!名古屋大学バッグ!
ランチは、大学構内で食べました。定食です。


大学内をちょっと見学というか歩いてみました。さすがにノーベル賞受賞者を輩出している大学だけあった記念館がありました。入場無料だったので見学してみました。



会場では、存じ上げている方がいらっしゃったのでちょっと挨拶しました。翻訳会社関係者に加えて、やはり海外の研究者さんが多いようですね。当たり前ですが。僕のような立場の人は少数でしょう。

ちょっと残念ですが、Technology Showcase という出展が前日に終了していました。各メーカーさんの展示会には参加できませんでした。

紙のノートは持参せずです。すべてiphone経由でグーグルドックスに入力しました。wifi で接続できるキーボードを持ってきたのです。

これとiPhoneがあれば十分です。
今日のセッションが終わったらまっすぐホテルに帰りました。ホテルで明日の講演の練習をするためです。仕事も持ってきてるので仕事もちょっとしました。

うまく説明できませんが、ずっと事務所にいるより外に出た方が刺激になりますね。

明日は頑張るぞー!

2017年9月16日土曜日

NMT and Patent Translation from LSP perspective

名古屋大学で開催される第16回機械翻訳サミットの最終日の9月22日(金)に、The 7th Workshop on Patent and Scientific Literature Translation (PSLT 2017)が開催されますが、僕のプレゼンテーションはこれ。30分の予定です(しかし前後してもいいですと言われています!)。質疑応答もあるみたいですが、40分ぐらい話して、質疑応答は1問ぐらいにさせていたただくかもしれません。
1) Description of “Hybrid Translation” using NMT
2) Speed and amount of post editing needed for translations
3) Problems regarding implementation of NMT
4) Possibility of NMT dramatically changing the LSP
5) “End of human translation and rise of MT” campaign

なぜHybrid Translation に至ったかとか、NMTを使うとどれぐらい作業効率が上がったか(スタッフに試させたアンケート内容もお見せします)、今後の事務所が目指す方向とかをお話します。プレゼンシート15枚の大作(笑)です。

その後、ランチ会が開催されるみたいです(招待者のみ)。早く食べたいな。

P.S. 僕の発表の後にランチ会なので、僕はなんとしても定時に発表を終えなければなりません。ですので発表の最後に、In the interest of time, I would like to entertain only one question の代わりに、In the interest of our lunch, ... と言って笑いを取ろうと思っています。

2017年9月11日月曜日

事務所ミーティングは、30分以内に

今期から各ミーティングは、30分以内で終了するように義務付けた。

本日の事務所ミーティング(3名がオンライン参加)は、13:00に開始して、13:18分に終了した。

2017年9月7日木曜日

効率化:残業より早出

効率化のため、残業より早出残業を優先したい、とスタッフに提案した。完全一致を得ることはできなかったが、9月、10月はそうすることにした。

早出残業を優先する理由は、残業だと脳が疲れ切っている。その状態で1時間残業するなら早朝の脳が活性化している状態で1時間仕事をした方が効率的である。

もう1つは、誰だって残業は嫌である。残業が奨励されないと知るとスタッフは嫌でも時間内に仕事を終わらせようとする。

僕は、日本の文化の中で一番キライなのが「始まりは厳格に決まっているが、終了は果てしなく続く」である。

僕は、昔、サービス業で働いていたので上の文化が顕著だった(それに残業がつかないことがよくあった!)。

事務所の効率化について真剣に取り組みたいと思う。

2017年9月6日水曜日

9月22日から名古屋大学で機械翻訳サミットが開催されるが

9月18日(月)から名古屋大学で第16回機械翻訳サミットが開催されます。非常に楽しみにしているのですが、実は、僕は21日からの参加なのです。自分の講演は22日です。

本当は18日から参加したかったのですが、21日から来て下さいみたいな感じだったし・・・。

18日からは興味がありそうな講演とかセミナーがあるので本当は参加したいのですが。22日は、ワークショップの日みたいですが、最終日なので皆帰っちゃうんじゃないのかなと心配しています。初日から参加すると言っていた付き合いのある方も21日で帰りますと言ってたし。

名古屋大学には行ったことないので楽しみにはしてます。大学は大学の雰囲気があって結構好きな方です。23日の土曜日は名古屋見物でもしようかなと思っています。

ちなみに僕が講演するのは、機械翻訳サミットではなくて、The 7th Workshop on Patent and Scientific Literature Translation (PSLT 2017)の方です。

2017年9月4日月曜日

PSLT 2017のタイムスケジュール出ました!

皆さん、良かったらそのまま残って最終日もお越しください。

スケジュールはこちら

September 22, 2017

9:50-10:00
Opening

Session 1 (Chair: Katsuhito Sudoh)

10:00-10:45
[Invited Talk] Bruno Pouliquen (World Intellectual Property Organization)
WIPO Translate: Patent Neural machine translation in 10 languages publicly available

10:45-11:30
[Invited Talk] Masa Kajiki (MK Translation Firm)
Neural Machine Translation and Patent Translation from LSP Perspective


[Lunch 11:30-13:10]

Session 2 (Chair: Takehito Utsuro)

13:10-13:55
[Invited Talk] Andrew Finch (Apple Inc.)
Statistical and Neural Models for Transliteration

2017年9月1日金曜日

メールよりチャット

特許翻訳会社にとればセキュリティーは非常に重要な問題です。銀行員みたいに社内のメールから情報が漏れることを防止するため、チャットを使って通信することを考えた方が良いかもしれません。

社内的にはメールを使うことはほぼなくなりましたが、クライアントにはまだメールを使っています。メールは迷惑メールもあるし、ウイルスだって飛んでくるし・・・。

どこかのタイミングで、クライアントに対して、情報漏洩防止のためビジネスチャットのみでの通信に移行した方が良いかもしれません。

レギュラーのクライアントに対しては、ビジネスチャットの利用を今後お勧めしようかと思ってます。初めてのクライアントに対しては、メール通信でもしょうがないでしょうけどね。

ビジネスチャットを使えば、そのクライアントと我々との2者のみのチャットルームを作ることができます。

それでどれだけ効率化できるかは不透明ですが・・・。