以前からよく議論されていた話題がある。それは、MTの登場によって人間が職を奪われるかという話題だ。まさに審判の日だ。MTの出現により人間翻訳者が滅びてしまう。我々は、2017年12月31日(頃)が審判の日だと思っていた・・・。
本日、その日を迎えた。翻訳業界はどうなった?滅亡したか?
しなかった。間翻訳会社は生きの残っている。翻訳者も健全だ。なにも起こらなかったのだ。
カーナビのメーカーさんが大変苦戦されていた。カーナビが売れ行きが悪化したのである。スマートフォンがカーナビの代わりになるからである。しかもスマートフォンのカーナビの精度は非常に高い。それではカーナビのメーカーさんは全て倒産したかというと、今でもご顕在だ。今ではカーナビに代わる次の商品の開発に成功して大忙しである。その商品とは、車載カメラである。ドライブレコーダーと言った方が分かりやすいかもしれない。そう簡単にカーナビのメーカーさんは滅びない。
翻訳会社も同じだ。MTごときで滅びない。審判の日はやってこない。しかし、やってこなかっただけ、延期されただけかもしれない。その日がやってこないように次の手を打とうと思っています。
勿論、次の手は打ってあります。
2017年12月31日日曜日
2017年12月30日土曜日
【残酷な事実】MTPEを導入しても翻訳速度は早くはならないし、値段も下がらない。
2017年最後に大変残念な事実をお書きします。
MTPEを導入しても翻訳速度はそれほど早くはならないし、値段は下がらない。もう一度書きます。
MTPEを導入しても翻訳速度はそれほど早くはならないし、よって値段は下がらない。
2017年、1年間をかけて検証してみた結果です。我々は、この1件を使ってNMTを使ってなんとかして翻訳速度を上げること及び値下げに挑んできました。結果、MTPEは断念することになりました。
恐らく同業者さん(特許翻訳を専門にしている翻訳会社)も気づいていると思います。NMTが利用可能になったとき業界全体が湧き上がりました。各社様々な方法でNMTを活用するサービスを模索しました。が、特許翻訳業界では、それほどMTPEが商品として扱われていないことが全てを物語っていると思います(ですので翻訳者さんには朗報と言えるかもしれません。NMTのよって職を失うことがないことが判明したからです。)
NMTは、特許明細書のように複雑な構文を使っているテキストを翻訳できません。一応、翻訳はしてると言えるかもしれませんが、我々にとれば、「翻訳してる」というレベルではありません。全体に亘って修正を加える必要があるからです。
無論、エンジンによって違いはあると思いますが、NMTが出力する翻訳は、せいぜいTOIEC800点レベルです。このレベルの翻訳者が翻訳しても(少なくとも特許明細書に限って言えば)、翻訳とは呼べない翻訳結果しか返ってきません。TOIEC800点レベルの新人翻訳者が行った翻訳を想像してみて下さい。僕ならぞっとします。全面的に書き換えることを念頭に置くでしょう。
翻訳と呼べない最大の理由は、翻訳結果をコントロールできないことです。たとえTOIEC800点しか取れない新人翻訳者でも目の前で「determine」は、「判別する」で統一して下さいと指示をすると統一できます。NMTはこれができません(学習型機械翻訳(AMT)はこれができます)。
ですので、人がゼロから翻訳しても、NMTを使ってポストエディットしても、両者には、速度の上でそれほど違いはありません。社内で検証したところ、MTPEを利用した場合、20%程度は生産効率が上がることが確認されました。しかし、20%程度の生産性向上を目標とするなら既存の音声入力ソフト、トランスレーションメモリのようなソフト、及びオートサグゼッション機能を組み合わせれば実現できます。わざわざNMTを導入する意味がありません。
2018年からは、MTPEのサービスを一度廃止することを検討しています。なにか状況が大きく変わればまたそのときに考えようと思っています。
この1年、様々な取り組みを行い、NMTをサービスの1つとして取り組む努力を行いましたが。結論として我々は断念を選びました。2018年からは頭を切り替えて新サービス導入に向けて励むつもりです。
*上の記事は、特許明細書を翻訳する場合のみについて書き込んだものです。一般テキストを翻訳する場合は、NMTでもそれなりの効果があると思います。
*ポストエディットを前提にして原文の明細書を書くという条件下では、NMTを使う意味は大いにあると思います。よって出願人さんや特許事務所内で、明細書も書くし、翻訳もするという環境下の方が利用する意味が高いと思います。
MTPEを導入しても翻訳速度はそれほど早くはならないし、値段は下がらない。もう一度書きます。
MTPEを導入しても翻訳速度はそれほど早くはならないし、よって値段は下がらない。
2017年、1年間をかけて検証してみた結果です。我々は、この1件を使ってNMTを使ってなんとかして翻訳速度を上げること及び値下げに挑んできました。結果、MTPEは断念することになりました。
恐らく同業者さん(特許翻訳を専門にしている翻訳会社)も気づいていると思います。NMTが利用可能になったとき業界全体が湧き上がりました。各社様々な方法でNMTを活用するサービスを模索しました。が、特許翻訳業界では、それほどMTPEが商品として扱われていないことが全てを物語っていると思います(ですので翻訳者さんには朗報と言えるかもしれません。NMTのよって職を失うことがないことが判明したからです。)
NMTは、特許明細書のように複雑な構文を使っているテキストを翻訳できません。一応、翻訳はしてると言えるかもしれませんが、我々にとれば、「翻訳してる」というレベルではありません。全体に亘って修正を加える必要があるからです。
無論、エンジンによって違いはあると思いますが、NMTが出力する翻訳は、せいぜいTOIEC800点レベルです。このレベルの翻訳者が翻訳しても(少なくとも特許明細書に限って言えば)、翻訳とは呼べない翻訳結果しか返ってきません。TOIEC800点レベルの新人翻訳者が行った翻訳を想像してみて下さい。僕ならぞっとします。全面的に書き換えることを念頭に置くでしょう。
翻訳と呼べない最大の理由は、翻訳結果をコントロールできないことです。たとえTOIEC800点しか取れない新人翻訳者でも目の前で「determine」は、「判別する」で統一して下さいと指示をすると統一できます。NMTはこれができません(学習型機械翻訳(AMT)はこれができます)。
ですので、人がゼロから翻訳しても、NMTを使ってポストエディットしても、両者には、速度の上でそれほど違いはありません。社内で検証したところ、MTPEを利用した場合、20%程度は生産効率が上がることが確認されました。しかし、20%程度の生産性向上を目標とするなら既存の音声入力ソフト、トランスレーションメモリのようなソフト、及びオートサグゼッション機能を組み合わせれば実現できます。わざわざNMTを導入する意味がありません。
2018年からは、MTPEのサービスを一度廃止することを検討しています。なにか状況が大きく変わればまたそのときに考えようと思っています。
この1年、様々な取り組みを行い、NMTをサービスの1つとして取り組む努力を行いましたが。結論として我々は断念を選びました。2018年からは頭を切り替えて新サービス導入に向けて励むつもりです。
*上の記事は、特許明細書を翻訳する場合のみについて書き込んだものです。一般テキストを翻訳する場合は、NMTでもそれなりの効果があると思います。
*ポストエディットを前提にして原文の明細書を書くという条件下では、NMTを使う意味は大いにあると思います。よって出願人さんや特許事務所内で、明細書も書くし、翻訳もするという環境下の方が利用する意味が高いと思います。
2017年12月29日金曜日
生産性だけを上げるなら多言語翻訳という手もあるかも?
生産性だけを上げるなら多言語翻訳という手もあるかもしれません。英語以外の翻訳者は、複数言語の翻訳ができる場合が多いです。例えば、我々の独日翻訳者もドイツ語から以外に英語からも翻訳できます。日独翻訳者は、日本語に加えて、英語からもフランス語からもドイツ語に翻訳できます。1名の翻訳者が複数言語翻訳できれば生産性は一気に上がります。
英語しか翻訳されない方は、それ以外にも翻訳できる言語を増やすと生産性はアップするのではないかと思います。
2018年は、今年以上に多言語翻訳に力を注いで、生産性をアップさせたいと思います。
これが本年最後の書き込みになります。今年もお世話になりました。2018年もどうぞ宜しくお願いします。
では!
英語しか翻訳されない方は、それ以外にも翻訳できる言語を増やすと生産性はアップするのではないかと思います。
2018年は、今年以上に多言語翻訳に力を注いで、生産性をアップさせたいと思います。
これが本年最後の書き込みになります。今年もお世話になりました。2018年もどうぞ宜しくお願いします。
では!
2017年12月28日木曜日
Translated> Learning how to do post editing? 20170925
I'm back from the Machine Translation Summit. Looking back at my notes, I wrote down things like these on post editing (well, typed on PC actually).
- Each company is making their effort to train post editors (already started).
- They are starting post editor training with in-house translators first.
What is interesting is the second point: "starting post editor training with in-house translators". That is, it's difficult to train work-at-home translators online. Therefore, in-house staff is trained first and then work-at-home translators are trained after making manuals and such.
With this schedule, it seems like training opportunities for work-at-home translators will come much later. The post-editing jobs which is expected to increase in the future will be all done by in-house translators first.
If someone is interested in post-editing jobs, you probably cannot get the training unless being employed at some translation company.
I've mentioned many things here, but "There is no professional (experienced) post editors in the translation industry yet" is probably the industry consensus, so the phrase "now is the time" might be appropriate.
To be continued...
2017年12月27日水曜日
原稿は音声入力ソフトで
僕は、原稿を書くときこうしています。
音声入力ソフトは、iphone に備えられているソフトで十分です。こうすると結構早く原稿を書くことができます。
- フォルダから類似したテーマの原稿を探す。
- その原稿をコピーを作る。
- 各ヘッダーに新しい原稿用のヘッダーを追加する。
- 追加したヘッダーの下に音声入力ソフトを活用してテキストを書く。
- 修正を加える。
- スタッフが最後に確認する。
音声入力ソフトは、iphone に備えられているソフトで十分です。こうすると結構早く原稿を書くことができます。
Translated> In hopes of more people understanding benefits of machine translation 20170827
Some clients, especially manufacturers, are hesitant about machine translation.
They will turn away even the idea of it, right away.
In regards to pricing, some clients will be interested when being proposed of match-rate discounts. For questions like "Can you lower the rates more?", I usually propose: "How about Machine Translation?". In most cases, they will respond by saying "Hmmm".
In order to spread knowledge about Machine Translation, we need to take actions by doing various information campaigns such as making press release, seminars, publish articles on magazines.
I want to make more effort on activities like that from September.
They will turn away even the idea of it, right away.
In regards to pricing, some clients will be interested when being proposed of match-rate discounts. For questions like "Can you lower the rates more?", I usually propose: "How about Machine Translation?". In most cases, they will respond by saying "Hmmm".
In order to spread knowledge about Machine Translation, we need to take actions by doing various information campaigns such as making press release, seminars, publish articles on magazines.
I want to make more effort on activities like that from September.
2017年12月25日月曜日
学習型機械翻訳導入までの道ー001
本日は、事務所ミーティングにて学習型機械翻訳(AMT)導入を発表。まだ検証を開始していないスタッフのために実演しようとしました。しかしなぜか理由は分かりませんが、肝心のニューラル機械翻訳(NMT*)が動作せず・・・(現在は、復旧しました)。
これから検証している中で色々問題とか疑問とかが出てくると思います。色々試してみます。
*我々のNMTは、専用サーバー内で動作させています。
これから検証している中で色々問題とか疑問とかが出てくると思います。色々試してみます。
*我々のNMTは、専用サーバー内で動作させています。
2017年12月24日日曜日
Translated> How many machine translation engines should we use? 20170924
I'm back from the Machine Translation Summit. Looking back at my notes, I wrote down things like these on post editing (well, typed on PC actually).
- Domain specific machine translation engine is better.
- It's possible to construct our own engine as long as corpus can be accumulated.
- Specific operation details are trade secret.
In regards to 1, it's no use having machine translation aimed for general purpose. Accuracy will be higher with machine translation engine of specific field type.
Regarding 2, corpus does not exist for language pairs other than En/Ja and Ja/En, so we need to construct our own. For latter pair, the server fee is becoming lower, and it's possible for smaller companies like ourselves to possess in-house server. In addition, with Japanese clients, there are many cases that clients cannot request projects if the server is not within the country.
For 3, much consideration is needed. All we need to do is to combine multiple machine translation engines and use the best one. Some CAT tools don't allow multiple APIs to be constructed, so that is one problem to be considered. Whether the server is located domestically or internationally should be publicized, but the combination of engines and how the translation is operated may be considered trade secret.
To be continued...
2017年12月23日土曜日
Translated> Machine Translation can't even read e-mails? 20170927
I'm back from the Machine Translation Summit. I'm writing these blogs going through notes I took and conversations I had there.
I had lunch at a Japanese restaurant with people who presented at the event. At that time, one high-leveled machine translation researcher mentioned this. He was told by a Japanese client: "You're a machine translation expert, right? Then you should be able to read my e-mails if I write in Japanese". But he couldn't read the contents even with machine translation (this researcher cannot read Japanese).
It seems that however machine translation grows, it will take some time to even read contents of an e-mail even with machine translation.
I was not expecting this.
I had lunch at a Japanese restaurant with people who presented at the event. At that time, one high-leveled machine translation researcher mentioned this. He was told by a Japanese client: "You're a machine translation expert, right? Then you should be able to read my e-mails if I write in Japanese". But he couldn't read the contents even with machine translation (this researcher cannot read Japanese).
It seems that however machine translation grows, it will take some time to even read contents of an e-mail even with machine translation.
I was not expecting this.
2017年12月22日金曜日
Translated> Time schedule for PSLT 2017 is up! 20170904
(This article has been originally written on September 4th, 2017)
For those attending the event, please feel free to come visit until the end.
The schedule is on here.
September 22, 2017
9:50-10:00
Opening
Session 1 (Chair: Katsuhito Sudoh)
10:00-10:45
[Invited Talk] Bruno Pouliquen (World Intellectual Property Organization)
WIPO Translate: Patent Neural machine translation in 10 languages publicly available
10:45-11:30
[Invited Talk] Masa Kajiki (MK Translation Firm)
Neural Machine Translation and Patent Translation from LSP Perspective
[Lunch 11:30-13:10]
Session 2 (Chair: Takehito Utsuro)
13:10-13:55
[Invited Talk] Andrew Finch (Apple Inc.)
Statistical and Neural Models for Transliteration
For those attending the event, please feel free to come visit until the end.
The schedule is on here.
September 22, 2017
9:50-10:00
Opening
Session 1 (Chair: Katsuhito Sudoh)
10:00-10:45
[Invited Talk] Bruno Pouliquen (World Intellectual Property Organization)
WIPO Translate: Patent Neural machine translation in 10 languages publicly available
10:45-11:30
[Invited Talk] Masa Kajiki (MK Translation Firm)
Neural Machine Translation and Patent Translation from LSP Perspective
[Lunch 11:30-13:10]
Session 2 (Chair: Takehito Utsuro)
13:10-13:55
[Invited Talk] Andrew Finch (Apple Inc.)
Statistical and Neural Models for Transliteration
Translated> Arrived at the Machine Translation Summit 20170921
(This article has been originally written on September 21, 2017)
I've finally arrived at the Machine Translation Summit being held at Nagoya University. The summit has been going on since the 19th. I'm finally participating on the 21st. Majority of seminars have already finished. I was a bit sad.
Today (21st), I left Osaka early in the morning and arrived Nagoya University around 9'oclock. I signed up for wifi when I signed in at the reception desk.
I had lunch on campus. It was a lunch meal.
I went back to the hotel as soon as today's session was over. This is because I need to practice for tomorrow's presentation. I brought some work with me too, so I did some work.
I've finally arrived at the Machine Translation Summit being held at Nagoya University. The summit has been going on since the 19th. I'm finally participating on the 21st. Majority of seminars have already finished. I was a bit sad.
Today (21st), I left Osaka early in the morning and arrived Nagoya University around 9'oclock. I signed up for wifi when I signed in at the reception desk.
Received these items at the reception desk! Nagoya University bag! |
I went sightseeing, or rather walked around the campus. Truly, there was a memorial building since there were Nobel prize winner from the university. The entrance was free, so I checked it out.
At the event site, I saw one person I knew, so I chatted with him. In addition to translation company staff, there were many researchers from overseas. That's kind of obvious, though. People like me is probably a minority.
Unfortunately, a showcase called "Technology Showcase" has already finished the day before. I couldn't participate in the exhibition of each manufacturers.
I did not bring any paper notebooks. I input everything on google document via iphone. I brought a wifi-operating keyboard.
All I need is this and iphone. |
I can't explain well, but it's stimulating to be outside than being in the office.
I'll do my best tomorrow!
Translated> Finished presenting at The 7th Workshop on Patent and Scientific Literature Translation (PSLT 2017) 20170923
Thank you for those who participated!
Come to think of it, it was probably my first time doing a presentation in a university lecture hall.
Contents aside, I was happy that I was able to make some people laugh with the phrase "I will finish my presentation well before our lunch time" lol
About my presentation, afterwards, I was told "Bold move!" by one of the participants. I'll take it as a good thing...
There was catering.
Myself not knowing that you can have breakfast at the event site had my breakfast at the hotel.
This is where I made my talk. |
It's pretty big! |
About my presentation, afterwards, I was told "Bold move!" by one of the participants. I'll take it as a good thing...
There was catering.
I could have had my breakfast here! |
I learned many things at this summit, but below are the main things I learned.
In neural machine translation of De/Ja and Ja/De, the translation might be done in the order of: De>En>Ja or Ja>En>De. Therefore, for Ja/De translation, some English is mixed in the translated German. This is something I heard from one person, there is no verification. He mentioned that it is possible that the language is translated to English first.
I also learned that domain-specific machine translation (domain-specific MT) works well. For example, in the MT developed by WIPO, sentences like "I am a boy" is not included in the corpus of the machine translation. This is because no such sentence will appear in patents. Therefore, when doing patent translation, MT designated for patent might be better. It seems that there will be a notification from WIPO around next week (I didn't hear this from any representative, so I will not publicize any contents)
Translated> Machine Translation Summit will be held from September 22nd at Nagoya University
From September 18th (Mon), 16th Machine Translation Summit will be held at Nagoya University. I'm extremely looking forward to it, but I'm participating from the 21st. My talk is on the 22nd.
I actually wanted to participate from the 18th, but it seemed that they wanted me to participate from the 21st...
I wanted to participate from the 18th because there are some interesting lectures and seminars. 22nd seems to be a workshop day, but I'm afraid that many people will go home since it's the last day of the event. One of my acquaintance who is participating from the beginning said he is leaving after the 21st.
I've never been to Nagoya University, so I'm excited to go there. Each university has its own atmosphere and I enjoy experiencing it. I'm thinking of going sightseeing in Nagoya on Saturday the 23rd.
By the way, the event I'm talking at is not the machine translation summit. It's The 7th Workshop on Patent and Scientific Literature Translation (PSLT 2017).
I actually wanted to participate from the 18th, but it seemed that they wanted me to participate from the 21st...
I wanted to participate from the 18th because there are some interesting lectures and seminars. 22nd seems to be a workshop day, but I'm afraid that many people will go home since it's the last day of the event. One of my acquaintance who is participating from the beginning said he is leaving after the 21st.
I've never been to Nagoya University, so I'm excited to go there. Each university has its own atmosphere and I enjoy experiencing it. I'm thinking of going sightseeing in Nagoya on Saturday the 23rd.
By the way, the event I'm talking at is not the machine translation summit. It's The 7th Workshop on Patent and Scientific Literature Translation (PSLT 2017).
2017年12月21日木曜日
学習型機械(AMT)の検証が冬の宿題
2018年にサービス開始予定の学習型機械翻訳(AMT)の検証が冬の宿題です。検証担当のスタッフのスケジュールが年内は仕事が入っているし、今年も残すところ1週間ほどしかないので宿題は来年まで持ち越しかもしれません。
可能であれば2018年1月中には検証を終了させて、春からサービス提供と行きたいところです。
可能であれば2018年1月中には検証を終了させて、春からサービス提供と行きたいところです。
2017年12月20日水曜日
「良いパフォーマンス(効率化)」=「健康(食事、睡眠、運動)」
「生産性の向上」=「良いパフォーマンス」を成立させるために、我々は、以下の等式が成立すると考えています。
「良いパフォーマンス(効率化)」=「健康(食事、睡眠、運動)」
「良いパフォーマンス(効率化)」=「健康(食事、睡眠、運動)」
2017年12月19日火曜日
睡眠負債とは?
「睡眠負債」という言葉を今日初めて知った。
詳しくは、この記事をご覧下さい。
中小企業だからこそ考えるべき睡眠負債の問題 1 ~概論編~
詳しくは、この記事をご覧下さい。
中小企業だからこそ考えるべき睡眠負債の問題 1 ~概論編~
執筆者:柳内 茂樹氏(中小企業診断士)
要は、ちゃんと睡眠を取らないと仕事場で眠くなって生産性が下がりますよ、だからちゃんと睡眠は取りましょうね、ということのようです(もうちょっと複雑だと思います)。
やはり「良いパフォーマンス」=「睡眠」+「運動」+「食事」ですよね!
Translated> AI in schools 20170803
It seems that the teachers at school are attending seminars and studying sessions on the use of artificial intelligence (AI) to study how children should live in the future.
The research is proceeding to the extent where manufacturers are researching how they can utilize the AI.
In contrast, in the translation industry, there is no active opinion about the use of artificial intelligence (perhaps it’s just not out on the surface). In some cases, machine translation is even rejected…
I think it’s only a matter of time before AI and machine translation become industry standards. We need to prepare for the day when this happens.
2017年12月18日月曜日
#26シンギュラリティサロンに参加しました。
今回は、ゲームAIについてのお話でした。
講師は、三宅 陽一郎(株式会社スクウェア・エニックス テクノロジー推進部 リードAIリサーチャー)氏。
ちなみに僕はゲームを全くしないので、ゲームには関心はありませんでした。しかしAIには興味がありますので参加しました。ゲームを知らない人も非常に楽しめる興味深いお話が満載でした。
講師は、三宅 陽一郎(株式会社スクウェア・エニックス テクノロジー推進部 リードAIリサーチャー)氏。
ちなみに僕はゲームを全くしないので、ゲームには関心はありませんでした。しかしAIには興味がありますので参加しました。ゲームを知らない人も非常に楽しめる興味深いお話が満載でした。
ゲーム業界では、大学院等でゲーム理論を研究する>ゲーム会社に就職するという道があるそうです。翻訳業界も、同じような道が切り開けばいいなと思います。
一番印象に残っている発言は、「もはやゲームは人間単体では作れない(AIが必要)」でした。翻訳も同じことが言える日が来るのも近いと感じました。
一番印象に残っている発言は、「もはやゲームは人間単体では作れない(AIが必要)」でした。翻訳も同じことが言える日が来るのも近いと感じました。
2017年12月17日日曜日
Adaptive Machine Translation (AMT:学習型機械翻訳)とは?
ニューラル機械翻訳(NMT)と、学習型機械翻訳(AMT)との違いについて書きます。
NMTでは、あるテキストに対して機械翻訳を実行した場合、単語の訳語を制御できません。以下のようになります。
英日の場合:
英語(ソース)
.......determine............................................................................................... .....................................determines................................................................................determination................................................................................. .....................................................................determined.....................
日本語(ターゲット)
.......判別する............................................................................................... .....................................判断する..................................................................判定する................................................................................. .....................................................................判別する....................
このようにターゲットの訳語に統一感がありません(統一感を持たせることができません)。
AMTでは、
.......determine............................................................................................... .....................................determines................................................................................determination................................................................................. .....................................................................determined.....................
日本語(ターゲット)
.......判別する............................................................................................... .....................................判別する..................................................................判別する................................................................................. .....................................................................判別する....................
NMTでは、あるテキストに対して機械翻訳を実行した場合、単語の訳語を制御できません。以下のようになります。
英日の場合:
英語(ソース)
.......determine............................................................................................... .....................................determines................................................................................determination................................................................................. .....................................................................determined.....................
日本語(ターゲット)
.......判別する............................................................................................... .....................................判断する..................................................................判定する................................................................................. .....................................................................判別する....................
このようにターゲットの訳語に統一感がありません(統一感を持たせることができません)。
AMTでは、
.......determine............................................................................................... .....................................determines................................................................................determination................................................................................. .....................................................................determined.....................
日本語(ターゲット)
.......判別する............................................................................................... .....................................判別する..................................................................判別する................................................................................. .....................................................................判別する....................
最初の「determine」で「判別する」とタイピングして確定すると機械翻訳が学習します。それ以降はちゃんと「判別する」と表示してくれます。
作用の進め方として、AMTでは、テキスト全体に対して機械翻訳を実行するのではありません。各セグメントに対して各セグメントごとに機械翻訳を実行します。
ですので、NMTを使用する場合、「ポストエディット」と言われますが、AMTを使用する場合、れっきとした「翻訳」です(後者では、ポストエディットをするという概念はありません)。
*我々は、現在、AMTを検証中です。諸問題が解決できれば、2018年の前半にも、AMTを導入する予定です。
*「adaptive」=「適応性のある」という意味ですので、本来は、「適応性機械翻訳」が正しい訳だと思います。ただし、機能や内容を考えると「学習型機械翻訳」という名称は誤っていないと思います。
*我々は、現在、AMTを検証中です。諸問題が解決できれば、2018年の前半にも、AMTを導入する予定です。
*「adaptive」=「適応性のある」という意味ですので、本来は、「適応性機械翻訳」が正しい訳だと思います。ただし、機能や内容を考えると「学習型機械翻訳」という名称は誤っていないと思います。
2017年12月16日土曜日
米超大手特許翻訳会社もMTPE(機械翻訳+ポストエディット)を開始!
米超大手特許翻訳会社もMTPE(機械翻訳+ポストエディット)サービスを開始するという(すでに開始して時間が経っているかもしれないが)情報を得た。翻訳者が手にする料金は、自動的に、契約料金に対してXX%の割引が加えられた金額だ(これだったら簡単なビジネス翻訳の単価よりずっと良い)。トランスレーションメモリの一致率に合わせて割引が加えられることとなんあら変わらない。MTPEの場合は、テキスト全体に割引が加えられると考えれば良い。残念だが、クライアントへの売値がどう変化するかの情報は得ることができなかった。
日本でも状況は同じだと思うが、特許翻訳会社は出願人さんの意向で機械翻訳を禁止している会社が多い。しかし自社サーバーで機械翻訳を稼働させることは技術的に可能なので第三者へのデータの漏えいの問題はほぼ解決したのだと思う。
これだけの値下げが可能になるということは、そのまま何もしないとこの翻訳会社が市場を独占しかねない。市場原理から言うと、競合会社は追随するしかない。近い将来(来年とか)、MTPEが特許翻訳の業界標準になると言っても過言ではないと思う。
ただしこの翻訳会社さんも機械翻訳の精度にはバラツキがあるのでポストエディット程度では翻訳が完成しない場合もあることは承知のようだ。
ただしMTPEしかなくなるかどうかだが、ホテル業界を例とすると、高級ホテルとバジェットホテルとが共存している。このように、機械翻訳と人間翻訳とは共存すると思います。
日本でも状況は同じだと思うが、特許翻訳会社は出願人さんの意向で機械翻訳を禁止している会社が多い。しかし自社サーバーで機械翻訳を稼働させることは技術的に可能なので第三者へのデータの漏えいの問題はほぼ解決したのだと思う。
これだけの値下げが可能になるということは、そのまま何もしないとこの翻訳会社が市場を独占しかねない。市場原理から言うと、競合会社は追随するしかない。近い将来(来年とか)、MTPEが特許翻訳の業界標準になると言っても過言ではないと思う。
ただしこの翻訳会社さんも機械翻訳の精度にはバラツキがあるのでポストエディット程度では翻訳が完成しない場合もあることは承知のようだ。
ただしMTPEしかなくなるかどうかだが、ホテル業界を例とすると、高級ホテルとバジェットホテルとが共存している。このように、機械翻訳と人間翻訳とは共存すると思います。
2017年12月15日金曜日
忘年会、新年会、歓迎会等はランチタイムに
2017年12月14日木曜日
喫煙者の方が生産効率が高いと知ったら?
喫煙者に対する風当たりが強い。彼らは、会社が認めていないのに1時間に1回程度勝手に煙草休憩を取っている、というのだ。1回に10分休憩を取ったとしたら、1日当たり60分は余計に休憩を取っていることになる。けしからん!と非喫煙者は言う(僕もタバコは吸わない)。
しかし生産効率を考えた場合、実は、喫煙者の方が効率が高い場合もある。つまり喫煙者は、1時間に10分程度休憩を取っているので、休憩から返ってきたら頭がスッキリしているのだ。どの生産効率に関する本を読んでも1時間に10分ほど休憩するほうが生産性が上がると書いている。これぐらいの頻度で休憩した方が背骨の負担も軽くなるので姿勢が良くなっていいだろう。
非喫煙者の方で、勤務中は、ランチ休憩を覗いて休憩をしない人は、疲労が蓄積されすぎて、逆に生産性が悪くなる。
喫煙者には、積極的に会社から1時間に1回は煙草休憩を取れと指示した方が会社全体の生産性は上がるかもしれません。
しかし生産効率を考えた場合、実は、喫煙者の方が効率が高い場合もある。つまり喫煙者は、1時間に10分程度休憩を取っているので、休憩から返ってきたら頭がスッキリしているのだ。どの生産効率に関する本を読んでも1時間に10分ほど休憩するほうが生産性が上がると書いている。これぐらいの頻度で休憩した方が背骨の負担も軽くなるので姿勢が良くなっていいだろう。
非喫煙者の方で、勤務中は、ランチ休憩を覗いて休憩をしない人は、疲労が蓄積されすぎて、逆に生産性が悪くなる。
喫煙者には、積極的に会社から1時間に1回は煙草休憩を取れと指示した方が会社全体の生産性は上がるかもしれません。
2017年12月13日水曜日
2019年には、MT+PEが通常業務になるだろう。
我々は、2019年に機械翻訳を全件(英日/日英)に導入すると発表した。ちょうどいいタイミングでの発表だったと思う。今の手応えとすれば、2019年頃には機械翻訳が当たり前過ぎて全件に導入すると言っても誰も関心がなくなっているだろうと思うからだ。
最近は、PEの打診が急増している(問い合わせされるワード数の単位が多い!月間100万ワード単位とか)。一日でも速くポストエディタの育成をしなければならないと思っている。
もしPEが主流になったらどうする?という質問に対して、ある翻訳者さんは、「では、別の仕事を始めます」と答えた。料金を考えたらその方が良いだろう。果たして我々は、群雄割拠する機械翻訳業界で勝ち残れるだろうか。
最近は、PEの打診が急増している(問い合わせされるワード数の単位が多い!月間100万ワード単位とか)。一日でも速くポストエディタの育成をしなければならないと思っている。
もしPEが主流になったらどうする?という質問に対して、ある翻訳者さんは、「では、別の仕事を始めます」と答えた。料金を考えたらその方が良いだろう。果たして我々は、群雄割拠する機械翻訳業界で勝ち残れるだろうか。
2017年12月12日火曜日
変動ランチタイム性
我々は、ランチタイムは変動性である。好きなときに行っていいことになっている(一応、就業規則上、12:00~13:00だが、業務の都合上、その限りではないとしている)。
翻訳者の立場になればどうしても手が離せないタイミングもあるので、12時なれば自動的に休憩する必要はないということにしています。
ただし僕が見たところ、どの時間帯にランチに行くかはスタッフごとになんとなく決まっているみたいです。
ちなみに僕は、12時~13時にランチに行っています。
少し効率が上がるだろうか?
翻訳者の立場になればどうしても手が離せないタイミングもあるので、12時なれば自動的に休憩する必要はないということにしています。
ただし僕が見たところ、どの時間帯にランチに行くかはスタッフごとになんとなく決まっているみたいです。
ちなみに僕は、12時~13時にランチに行っています。
少し効率が上がるだろうか?
2017年12月11日月曜日
Finally submitted the abstract for The 7th Workshop on Patent and Scientific Literature Translation (PLST2017)!
Today, I finally submitted the abstract (created by staff and submitted by me).
The 7th Workshop on Patent and Scientific Literature Translation (PSLT2017) will be held on September 22 at Nagoya University (This article was originally written on August 10th). If you are around, please come join us!
Invited talks will be done by well known speakers from Apple and WIPO...
I'll most likely feel out of place, but I'll do my best nonetheless.
Here is what I'll be talking about:
The 7th Workshop on Patent and Scientific Literature Translation (PSLT2017) will be held on September 22 at Nagoya University (This article was originally written on August 10th). If you are around, please come join us!
Invited talks will be done by well known speakers from Apple and WIPO...
I'll most likely feel out of place, but I'll do my best nonetheless.
Here is what I'll be talking about:
Neural Machine Translation and Patent Translation from LSP Perspective
Masa Kajiki kajiki@mktranslaktionfirm.com
- Abstract
Five descriptions of Neural Machine Translation from a translation company (LSP) perspective in the following order:
1) Description of the service (Hybrid Translation) based on neural machine translation.
2) How much faster the translation has become and the amount of editing needed for translations.
3) Problems regarding implementation of neural machine translation.
4) Possibility of Neural Machine Translation dramatically changing the business of translation companies.
5) Description of the company’s direction to end human translation by 2018 and utilize machine translation for all projects starting from 2019.
- Introduction
According to some Internet news article, translation is an industry likely to disappear in the future. We will truly disappear if we continue translating in a conventional way. We cannot just stand and watch this happen. Just then, usage of Neural Machine Translation was permitted for commercial use for private translation companies. At this time, we decided to start a service utilizing the Neural Machine Translation. We have come up with a Hybrid Translation, which is a new service combining Neural Machine Translation, a cloud translation system and a post editor....
2017年12月10日日曜日
"5 hours a day and 4 days a week" "Revolutionizing work style"
The reason why we are making an effort to introduce machine translation is to achieve certain goal. The goal is to:
work "5 hours a day and 4 days a week".
If we can implement machine translation, work efficiency will improve and there will be no over time. If work efficiency improves, the amount of work it took in "7.5 hours x 5 days" will be complete in "5 hours x 4 days". If this comes true, the working hour becomes 5 hours and we will have 3 day weekends!
\(^o^)/\(^o^)/\(^o^)/\(^o^)/
For me, work is not everything in my life. Considering my lifestyle, I may be working most of my days but time outside of work is also important.
For example, coaches for the young baseball team are instructing with homemade lunch boxes. If these people can work 4 days a week, they can go to work and instruct the children. Plus, they will have one full day off. I belonged to a boys baseball team when I was younger, so directors and coaches at that time were probably exhausted (These people are probably living a hard life even today).
Presidents who are aiming to be listed in the stock market are working hard from 6 in the morning to 10 at night. This type of employers expect others to do the same. Some staff may not be into that (who cares how many hours the management side works). Anyway, my life doesn't revolve around work. A company that can only do work shows how small the company is.
Our company's policy is to work efficiently within fixed working hours (7.5hr). We use various technology to help achieve this. Machine translation is one of them.
I want to "revolutionize working style" by implementing machine translation. Whether or not machine translation is successful depends on whether the above standards are satisfied.
If we can achieve 5 hours a day and 4 days a week, I want to read books I like on Kindle, study Latin and
work "5 hours a day and 4 days a week".
If we can implement machine translation, work efficiency will improve and there will be no over time. If work efficiency improves, the amount of work it took in "7.5 hours x 5 days" will be complete in "5 hours x 4 days". If this comes true, the working hour becomes 5 hours and we will have 3 day weekends!
\(^o^)/\(^o^)/\(^o^)/\(^o^)/
For me, work is not everything in my life. Considering my lifestyle, I may be working most of my days but time outside of work is also important.
For example, coaches for the young baseball team are instructing with homemade lunch boxes. If these people can work 4 days a week, they can go to work and instruct the children. Plus, they will have one full day off. I belonged to a boys baseball team when I was younger, so directors and coaches at that time were probably exhausted (These people are probably living a hard life even today).
Presidents who are aiming to be listed in the stock market are working hard from 6 in the morning to 10 at night. This type of employers expect others to do the same. Some staff may not be into that (who cares how many hours the management side works). Anyway, my life doesn't revolve around work. A company that can only do work shows how small the company is.
Our company's policy is to work efficiently within fixed working hours (7.5hr). We use various technology to help achieve this. Machine translation is one of them.
I want to "revolutionize working style" by implementing machine translation. Whether or not machine translation is successful depends on whether the above standards are satisfied.
If we can achieve 5 hours a day and 4 days a week, I want to read books I like on Kindle, study Latin and
2017年12月9日土曜日
ISO/CD 18587 Translation Service--Post Editing after Machine Translation 20170813
Apparently, there is an ISO standard regarding "machine translation".
Well actually, it seems to be more about post editing rather than about machine translation.
●ISO/CD 18587 -- Translation services -- Post-editing of machine translation output-- Requirements
Translation service--Post editing after machine translation--Requirements
I'll do some research on this. Let's see how the industry goes and I might consider acquiring this.
Well actually, it seems to be more about post editing rather than about machine translation.
●ISO/CD 18587 -- Translation services -- Post-editing of machine translation output-- Requirements
Translation service--Post editing after machine translation--Requirements
I'll do some research on this. Let's see how the industry goes and I might consider acquiring this.
2017年12月8日金曜日
Networking with AI related people 20170731
The long road to January 2019 has begun.
Today, I went to a special table in the knowledge salon to see if they can “introduce me to people who are in the field of AI and machine translation”.
I was told: “Please give us some time and we will get back to you”.
Thank you!
Can AI be useful for translation, or useful in project management?
Today, I went to a special table in the knowledge salon to see if they can “introduce me to people who are in the field of AI and machine translation”.
I was told: “Please give us some time and we will get back to you”.
Thank you!
Can AI be useful for translation, or useful in project management?
Regarding machine translation, we’ll need to decide which machine translation to use and select internal server (not necessarily in-house server), write up a manual for post editing, and decide on the workflow…
Some people say that patent translation is suitable for machine translation because there are a lot of patterns and set phrases, while others say there are not many patterns or set phrases. I’m in the latter position. I think only about 3% in one specification is set phrases. Many clients will say that set phrases do not need to be translated anyway…
Machine translation will most likely be a standard technology in the industry in a few years. This may happen next year, or the year after next.
Some people say that patent translation is suitable for machine translation because there are a lot of patterns and set phrases, while others say there are not many patterns or set phrases. I’m in the latter position. I think only about 3% in one specification is set phrases. Many clients will say that set phrases do not need to be translated anyway…
Machine translation will most likely be a standard technology in the industry in a few years. This may happen next year, or the year after next.
2017年12月7日木曜日
This is what post editing looks like. 20170908
For those who are wondering what “post editing” is, here is a simple explanation.
Let’s look at the following images.
Let’s say there is a certain source text. |
and this is the result of machine translation. |
This is what the post-editor had in mind for the translation.
|
Post editors will remove red arrows and parts that are out of the blue translation or add to the places that are not enough. This is post editing.
|
In short, this is what post editing looks like. Post editors require an ability to translate from scratch. The job is also different from checking or proofreading. Machine translation is used as rough translation, so unlike checking or proofreading, there will be no (or close to none) missing translation as well as symbol and numerical errors. Sentence style is consistent for human translators, but it’s not always consistent for machine translation. There may be unexpected translations at times. The longer the text, the more chance of terms not being unified (sometimes it is unified).
On the contrary, the numbers and symbols are copied with no mistakes, so machine translation is safe in that respect.
2017年12月4日月曜日
特許機械翻訳の勉強会に参加した
特許機械翻訳勉強会みたいなのが始まったようです。ご招待いただきましたので参加させていただきました。機械翻訳が翻訳業界ではなく、特許業界ではどのように受け容れられるのかが分かったような気がします。弁理士の先生方も参加されておられるので、少なくとも参加されている先生方は、機械翻訳にご理解は示しておられるようでした。これから複数のエンジンを試して評価していく予定のようです。招待制のようなのでどなたが参加されているか等は書けませんが、今後も人数は増えるようです。なんとか毎回参加したいと思っています。
2017年12月2日土曜日
70%で良しとする
70%で良しとすれば仕事ははかどります。80%ではダメです。90%もだめです。70%で良いのです。こうすれば仕事はストレスなくスムーズに運びます。
僕は、例えば、ブログ記事なんて推敲に推敲を重ねるなんてしません。誤字脱字も多いと思いますが、気づけば(どなたかに指摘される場合もあります)修正すれば済みます。翻訳のお仕事はミスはできませんので100%を目指しますが、70%でいい仕事は沢山あります。
100%ミスできない仕事に集中して、70%で済む仕事は適当になれば良いと思います。集中すべき仕事だけに集中すれば、生産性も向上します。
僕は、例えば、ブログ記事なんて推敲に推敲を重ねるなんてしません。誤字脱字も多いと思いますが、気づけば(どなたかに指摘される場合もあります)修正すれば済みます。翻訳のお仕事はミスはできませんので100%を目指しますが、70%でいい仕事は沢山あります。
100%ミスできない仕事に集中して、70%で済む仕事は適当になれば良いと思います。集中すべき仕事だけに集中すれば、生産性も向上します。
2017年12月1日金曜日
食事から見る生産性向上
先日、あるイベントに参加しました。昼一番にセミナーを担当する方は観客が眠らないようにすることが大変です。でも数名は必ず寝てる(熟睡)人がいます。
これを会社に当てはめてみましょう。ランチ後の昼過ぎは眠くなります。睡魔と戦う必要もあります。大きな問題があります。眠くなると生産性が一気に落ちるのです。30分間眠くてうとうとしたとしましょう。8時間労働の場合、実際に仕事をしたのは7時間30分になってしまいます。もし1ヶ月22日出勤したとして、30分×22=11時間です。11時間の生産性のロスです。もしスタッフが10人いたとしたら、110時間のロスです。マネージメントとしては無視できません。
昼からも眠くならないようにするにはどうすればよいかをご提案する前に、人間はどうなれば眠く感じるかについてお聞きします。それは、血糖値の急上昇です。血糖値が急上昇すると人間は眠く感じます。
つまり眠くならないようにするためには、ランチは、血糖値が急上昇しないような食べ物を食べるべきです。丼ものは控えましょう。ラーメンもお勧めできません。糖質の高いものもやめましょう。まず野菜を食べて、血糖値の上昇を抑えてから肉類を食べましょう。こうすれば昼から眠くなりません(どうしても眠くなれば、うとうとするより思い切って15分ぐらい机に伏して寝れば眠気を吹っ飛ばすことは可能です)。
生産性向上を実現するには、様々なツールの使用がまず思い浮かびます。しかし食事の内容(順番)を変えるだけで生産性を向上することが可能です。
これを会社に当てはめてみましょう。ランチ後の昼過ぎは眠くなります。睡魔と戦う必要もあります。大きな問題があります。眠くなると生産性が一気に落ちるのです。30分間眠くてうとうとしたとしましょう。8時間労働の場合、実際に仕事をしたのは7時間30分になってしまいます。もし1ヶ月22日出勤したとして、30分×22=11時間です。11時間の生産性のロスです。もしスタッフが10人いたとしたら、110時間のロスです。マネージメントとしては無視できません。
昼からも眠くならないようにするにはどうすればよいかをご提案する前に、人間はどうなれば眠く感じるかについてお聞きします。それは、血糖値の急上昇です。血糖値が急上昇すると人間は眠く感じます。
つまり眠くならないようにするためには、ランチは、血糖値が急上昇しないような食べ物を食べるべきです。丼ものは控えましょう。ラーメンもお勧めできません。糖質の高いものもやめましょう。まず野菜を食べて、血糖値の上昇を抑えてから肉類を食べましょう。こうすれば昼から眠くなりません(どうしても眠くなれば、うとうとするより思い切って15分ぐらい机に伏して寝れば眠気を吹っ飛ばすことは可能です)。
生産性向上を実現するには、様々なツールの使用がまず思い浮かびます。しかし食事の内容(順番)を変えるだけで生産性を向上することが可能です。
登録:
投稿 (Atom)
-
下のような会話を耳にしたことがあります。 翻訳者:こんな料金で翻訳できるか! 翻訳会社:こんな翻訳にこんな料金払えるか! どっちが悪いんだろうね。
-
ファックスを完全に廃止します。 電話を完全に廃止します。 メールを完全に廃止します。
-
トライアル利用期間は2週間(又は一定の単語数)だったはず。APIも簡単に取得できたのでCATツールに搭載して試してみます。導入するか否かは、以下の通りです。 コストパフォーマンスに優れている。 比較の基準には、Google の機械翻訳を使用する。