2021年1月3日日曜日

恐らく機械翻訳を使用したと思われる訳文を考えてみる。

これは、大阪メトロの肥後橋駅の壁に貼り付けられている案内文の写真である。確証はありませんが、恐らく機械翻訳で訳したのでしょう。


機械翻訳が出力したと思しき英文は、

This area is crowded.
Please use the car in the middle of the platform.

である。

原文である日本語は、素晴らしいとは思わないが、日本語がネイティブであれば違和感はない日本語だと思う。日本語の特徴が良く出ている。曖昧であり抽象的だ。私は日本語が第一言語なのでこの英語を読んでも意味が分かる。日本語的な英語だからだ。

もう少し考えてみると、この案内文の伝えようとする内容は、

「この案内文が貼り付けられている周辺は、乗降者が多いので込み合います。それを避けるためには、もう少し前進して乗降者が比較的少ないプラットフォームの中央に停車する車両から乗り降りすことをお勧めします」

みたいなことだろう。それであれば、日本語を

「この乗車位置は、大勢の乗客のため混んでいます。プラットフォーム中央には、混まない乗車位置があります。」

に書き換えると、

This boarding position is crowded with a large number of passengers. In the center of the platform there is an uncrowded boarding position.

という機械翻訳の結果が出力されました(2021年1月3日、Google Translate)

この英語でもポストエディットは必要だとは思いますが、日本語が分からない人にも少しは良く分かるようになるのではないかと思います。

シンプルには、

To easily get on the train, avoid this crowded boarding location.

でも十分かもしれません。


2020年8月14日金曜日

【解説】10分で機械翻訳を理解する - Transformer

この動画を観て10分で機械翻訳を理解しましょう。


ただし行列など数学の知識がないと理解は難しいかもしれません。

URL: https://www.youtube.com/watch?v=BcNZRiO0_AE


2020年5月23日土曜日

通訳翻訳ジャーナル 機械翻訳2020 (English version)

I have written an article.




Magazine: 124 pages.
Published by: Icarus Publishing (2020/5/21)
Language: English
ASIN: B086PMZP4Z
Release date: May 21, 2020
Product Dimensions: 25.7 x 21 x 0.7 cm
Price: 1320 yen

I think you can find out more about the trends in machine translation in the year 2020 by reading this book.

Today's post was also post-edited using DeepL.

2020年5月21日木曜日

通訳翻訳ジャーナル 機械翻訳2020

記事を執筆いたしました。


  • 雑誌: 124ページ
  • 出版社: イカロス出版 (2020/5/21)
  • 言語: 日本語
  • ASIN: B086PMZP4Z
  • 発売日: 2020/5/21
  • 商品の寸法: 25.7 x 21 x 0.7 cm
  • 価格:1320円
2020年の機械翻訳のトレンドについては、この一冊を読めば分かるのではないでしょうか。

2020年5月20日水曜日

How does the evaluation of machine translation take place?

I will write about how specifically we are assessing the performance of machine translation. We're not developing MT, we're just users of MT. Therefore, our evaluation method is very different from the developer's evaluation method. I write about how to internally evaluate whether a particular MT can be used in practice by a translation company.

For example, when a translation company evaluates MT, the company evaluates the following

[MT evaluation items].

  1. omission/addition 
  2. incorrect translation 
  3. grammatical error 
  4. fluency
  5. inconsistency
  6. term appropriateness

You can rate other items, but we don't rate any more than that. It's too time consuming and too complicated. In fact, I think it's enough to narrow it down to the following three items

[Simple MT evaluation items].

  1. omission/addition 
  2. incorrect translation 
  3. grammatical error

The reason I narrowed it down to these three items is that I think it's wrong to expect the following three items from MT in the first place.

  1. fluency
  2. inconsistency
  3. term appropriateness

Therefore, there is no problem in excluding these three items when making an evaluation.

* Note that today's article was translated using DeepL.

機械翻訳の評価はどのように行われるか

具体的にどのように機械翻訳の性能を評価しているかについて書きます。我々は、MTを開発しているわけではない。MTのユーザに過ぎません。開発する場合の評価方法とは大きく異なります。あくまでも翻訳会社が実務で使用に耐えることができるかどうかを社内で評価するの方法について書きます。

例えば、翻訳会社は、MTを評価する際、以下のような項目を評価します。

【MT評価項目】
  1. omission/addition/訳抜け及び付け足し 
  2. incorrect translation/誤訳 
  3. grammatical error/文法の誤り(係り受けの誤りも含む) 
  4. fluency/流暢さ
  5. inconsistency/用語の不統一
  6. term appropriateness/適切な用語の選択
これ以上の項目についても評価できますが、弊社では、これ以上の項目は評価しません。時間がかかり過ぎるし、複雑すぎるからです。実際、3項目程度に絞れば十分だと思います。

【簡易版MT評価項目】
  1. omission/addition/訳抜け及び付け足し 
  2. incorrect translation/誤訳 
  3. grammatical error/文法の誤り(係り受けの誤りも含む)
なぜならそもそもMTに以下の項目を期待する方が誤っていると思います。
  1. fluency/流暢さ
  2. inconsistency/用語の不統一
  3. term appropriateness/適切な用語の選択
ですのでこの3項目は、評価をする場合、除外しても問題ないでしょう。