2021年4月13日火曜日

機械翻訳以前の問題として・・・。

昼ご飯に親子丼を食べました。その際、テーブルに置いてあった注意書きです。



日本語では、「~を使用しないで下さい」と書かれています。ところが英語では、「~のスイッチを切って下さい」と書かれています。両言語間で、意味が異なります。機械翻訳以前の問題だと思います。


「caused because ...」と書くべきところが「causedbecause ...」という風に1単語になっています。これも機械翻訳以前の問題でしょう。

最もこの程度の些細ことは気にしなくても良いと言えるかもしれませんが、職業上、気になるのです。

*なお上の英文が機械翻訳の結果出力されたかどうかは確認していません。

2021年1月3日日曜日

恐らく機械翻訳を使用したと思われる訳文を考えてみる。

これは、大阪メトロの肥後橋駅の壁に貼り付けられている案内文の写真である。確証はありませんが、恐らく機械翻訳で訳したのでしょう。


機械翻訳が出力したと思しき英文は、

This area is crowded.
Please use the car in the middle of the platform.

である。

原文である日本語は、素晴らしいとは思わないが、日本語がネイティブであれば違和感はない日本語だと思う。日本語の特徴が良く出ている。曖昧であり抽象的だ。私は日本語が第一言語なのでこの英語を読んでも意味が分かる。日本語的な英語だからだ。

もう少し考えてみると、この案内文の伝えようとする内容は、

「この案内文が貼り付けられている周辺は、乗降者が多いので込み合います。それを避けるためには、もう少し前進して乗降者が比較的少ないプラットフォームの中央に停車する車両から乗り降りすことをお勧めします」

みたいなことだろう。それであれば、日本語を

「この乗車位置は、大勢の乗客のため混んでいます。プラットフォーム中央には、混まない乗車位置があります。」

に書き換えると、

This boarding position is crowded with a large number of passengers. In the center of the platform there is an uncrowded boarding position.

という機械翻訳の結果が出力されました(2021年1月3日、Google Translate)

この英語でもポストエディットは必要だとは思いますが、日本語が分からない人にも少しは良く分かるようになるのではないかと思います。

シンプルには、

To easily get on the train, avoid this crowded boarding location.

でも十分かもしれません。


2020年8月14日金曜日

【解説】10分で機械翻訳を理解する - Transformer

この動画を観て10分で機械翻訳を理解しましょう。


ただし行列など数学の知識がないと理解は難しいかもしれません。

URL: https://www.youtube.com/watch?v=BcNZRiO0_AE


2020年5月23日土曜日

通訳翻訳ジャーナル 機械翻訳2020 (English version)

I have written an article.




Magazine: 124 pages.
Published by: Icarus Publishing (2020/5/21)
Language: English
ASIN: B086PMZP4Z
Release date: May 21, 2020
Product Dimensions: 25.7 x 21 x 0.7 cm
Price: 1320 yen

I think you can find out more about the trends in machine translation in the year 2020 by reading this book.

Today's post was also post-edited using DeepL.

2020年5月21日木曜日

通訳翻訳ジャーナル 機械翻訳2020

記事を執筆いたしました。


  • 雑誌: 124ページ
  • 出版社: イカロス出版 (2020/5/21)
  • 言語: 日本語
  • ASIN: B086PMZP4Z
  • 発売日: 2020/5/21
  • 商品の寸法: 25.7 x 21 x 0.7 cm
  • 価格:1320円
2020年の機械翻訳のトレンドについては、この一冊を読めば分かるのではないでしょうか。

2020年5月20日水曜日

How does the evaluation of machine translation take place?

I will write about how specifically we are assessing the performance of machine translation. We're not developing MT, we're just users of MT. Therefore, our evaluation method is very different from the developer's evaluation method. I write about how to internally evaluate whether a particular MT can be used in practice by a translation company.

For example, when a translation company evaluates MT, the company evaluates the following

[MT evaluation items].

  1. omission/addition 
  2. incorrect translation 
  3. grammatical error 
  4. fluency
  5. inconsistency
  6. term appropriateness

You can rate other items, but we don't rate any more than that. It's too time consuming and too complicated. In fact, I think it's enough to narrow it down to the following three items

[Simple MT evaluation items].

  1. omission/addition 
  2. incorrect translation 
  3. grammatical error

The reason I narrowed it down to these three items is that I think it's wrong to expect the following three items from MT in the first place.

  1. fluency
  2. inconsistency
  3. term appropriateness

Therefore, there is no problem in excluding these three items when making an evaluation.

* Note that today's article was translated using DeepL.