2019年12月25日水曜日

プリエディットとポストエディットと機械翻訳

機械翻訳もプリエディットとポストエディットとを加えれば実務に生かすことができます。下のテキストは、大阪市役所のホームページから借用しました。リンクは、こちらです。
========================================
新たな大都市制度の実現に向けて

副首都推進局では、副首都・大阪にふさわしい新たな大都市制度の実現に向けて、特別区制度(いわゆる「都構想」)の検討を進めています。

現在、特別区制度については、議会や「大都市制度(特別区設置)協議会」において、具体的な制度設計について議論しているところであり、住民の皆さんにご判断いただけるよう取りまとめていきます。

※総合区制度については、検討を終了しました。

<以下は、機械翻訳結果>

The Deputy Capital Promotion Bureau is studying a special ward system (so-called “Tokyo Plan”) to realize a new metropolitan system suitable for the deputy capital, Osaka.

Currently, the special ward system is currently being discussed in the parliament and the “Metropolis System (special ward establishment) Council”, and the specific system design is being discussed.

※ We finished examination about general ward system.

<原文をプリエディット>

副首都推進局は、副首都・大阪にふさわしい新たな大都市制度の実現に向かっています。副首都推進局は、特別区制度(いわゆる「都構想」)の検討を進めています。

現在、副首都推進局は、議会や「大都市制度(特別区設置)協議会」において、特別区制度についての具体的な制度設計を議論しています。副首都推進局は、市民の皆さんにご判断いただけるよう取りまとめていきます。

※総合区制度についての検討は、終了しおります。

<以下は、プリエディットされたテキストに対する機械翻訳結果>

The Deputy Capital Promotion Bureau is working toward the realization of a new metropolitan system appropriate for the deputy capital, Osaka. The Deputy Capital Promotion Bureau is examining the special ward system (so-called “Tokyo concept”).

Currently, the Deputy Capital Promotion Bureau is discussing the specific system design of the special ward system in the parliament and the “Metropolis System (special ward establishment) Council”. The Deputy Capital Promotion Bureau will arrange for citizens to make decisions.

* Examination of the comprehensive ward system has been completed.

<以下は、上の機械翻訳結果をポストエディット>

The Deputy Capital Promotion Bureau is working toward the realization of a new metropolitan system appropriate for the deputy capital, Osaka. We are examining the special ward system (so-called “Tokyo concept”).

Currently, we are discussing the specific system design of the special ward system in the parliament and the “Metropolis System (special ward establishment) Council”. We will make arrangements for citizens to make decisions.

* Examination of the comprehensive ward system has been completed.

2019年12月17日火曜日

趣味に興じる時間

機械翻訳とか自動化を導入したからと言ってすぐ勤務時間が短縮されるわけではないと思いますが、50歳を過ぎたら1日10時間ぐらい没頭できる趣味があるといいですね。僕は、没頭する時間がほしいので機械翻訳や自動化を進めています。

実際、10時間ぐらいあっという間に過ぎてしまいますよ。

2019年12月16日月曜日

某競技場の看板の日英訳がでたらめな件/ポストエディター、プリエディター

某競技場ができたらしいです。そこの看板の日英訳がでたらめらしいのです。

例えば、

月極駐車募集中

は、

The Moon Ultra Parking is being recruited

になっているとのことです。

ちなみに無料のGoogle Translate を使って訳してみました。すると、

Under recruitment of monthly parking

でした。どっちもどっちですね。

これは、原文を加工するともう少し良くなると思います。そこで原文を以下のように訂正しました。すると、

月極の駐車募集中
Under recruitment of monthly parking<変化なし

月払いの駐車募集中
Under recruitment of monthly payment parking

月極駐車スペース募集中
Under recruitment of monthly parking spaces

月払いの駐車スペース募集中
Under recruitment of monthly payment parking spaces

月払いの駐車スペースを募集しています
Looking for monthly payment parking space

月極駐車スペースあります
There is a monthly parking space

月払いの駐車スペース利用可能
Monthly payment parking space available

月極駐車スペース利用可能
Monthly parking space available

月極駐車場利用可能
Monthly parking lot available 

monthly だけで「月極」を正しく表現できているのか分かりませんが、「The Moon Ultra Parking is being recruited」よりは分かりやすくなっていると思います。

でも疲れた・・・。

ヒント:僕は、この原文の日本語を読むと、訳文のどこかに「available」が現れると想像しました。ですので、訳文に現れるであろうキーとなる単語が出てくるまで原文を加工しました。ただしルービックキューブではないですが、キーとなる単語が現れてもその単語以外を加工するとせっかくのキーとなる単語が消えてしまう場合があります。でもすごくおもしろい知的作業ですよ。

上の例をご覧いただくとお分かりになると思うが、ポストエディターの仕事は、ターゲット(訳文)を加工するだけではありません。ソース(原文)も適宜加工することが求められます。

ただしくは、pre/post-editor だと思います。

2019年12月13日金曜日

Googleアシスタントのリアルタイム通訳機能がiOSとAndroidでも利用可能に

IT Media New さんの12月13日の記事によると

「米Googleは12月12日(現地時間)、「Googleアシスタント」による音声通訳機能「通訳モード」をAndroidおよびiOSスマートフォンでも使えるようにしたと発表した。Googleアシスタントを搭載する端末であれば、44カ国語で通訳する。Pixelシリーズの「Google翻訳」上での通訳」だそうです。

グーグルさんというサーチエンジンの会社(機械翻訳エンジンの会社ではない)がこういう技術を無料で提供することがすごいと思います。イノベーションは、同業からは生まれないという実例でしょうね。

一度試してみようと思います。

2019年12月12日木曜日

機械翻訳コンサルティングを開始しました(仮称)

最近、機械翻訳コンサルタントを生意気にも名乗っている。機械翻訳の導入に関するコンサルティング的なことをさせていただいている。各社さんのお悩みとか問題とか課題とかを聞かせていただいて、それに対する提案をしている。

機械翻訳エンジンをお勧めしたり、操作方法をご指導するだけだと思っていたが、実は、社内の事情により導入できない(組織が大きいほど)場合があることが判明している。

やはり書くのが面倒なのでそのうち動画にします・・・。

2019年12月11日水曜日

2019年12月3日火曜日

機械翻訳の実力、人間の実力

以下は、トライアルの評価シートに記入された採点者によるコメントである。意図的に用意された評価ではない。正真正銘の評価シート内のコメントである(受験者を特定できないようにコメントは省略しています)。

  • 複数のandを「および」と「ならびに」で使い分けて表現している点はよいと思います。
  • すべて平仮名の「がん」にしているのは、「癌」が常用漢字ではないという理由であればかまわないと思います。
  • PDFで確認していないためか、原文誤記の指摘で足りない箇所があります。
  • 上付き添え字が消えているのはタイプミスなのか、意図的に無視したのか、それとも使っているフォントが原因なのか不明でした。
  • 置換基の列挙で、=S を「=硫黄」とするなど、化学で使わない表記になっています。
  • 「がん」と「癌」の区別ができている点から学術用語の理解ができていると思います。
  • 原文誤記の指摘は、最初と最後の2つを除いて適切です。間違った指摘の箇所は、テキスト変換時の文字化けなどが原因。
  • PDFで確認しているはずですが、添え字の上付きの処理ができていません。
  • 請求項1で、eitherが訳抜けのため、異なる2つの条件が同時に成立してしまう和訳です。
  • 複数のandについて「および」のみです。「ならびに」を使っていません。

受験者の語学力は、最低でも英検1級レベル、特許翻訳のご経験もそれなりにあった翻訳者さんばかりです。

これでは機械翻訳の出力結果の方が優れている。もし人がこの程度の翻訳しかできないのであれば、特に経営者は、機械翻訳を使う方を選ぶのではないだろうか(特に、機械翻訳は価格が安いし文句言わないし)。

よく機械翻訳がダメな例としておかしな訳を表示していかに機械翻訳がだめかを示そうとしているケースがありますが、人(プロ及びセミプロ)がやってもこれぐらいのエラーが発生することを知っておく方が公平な判断を下せると思います。

我々は、だから人の方がだめだという立場ではありません。機械の方が優れているとも思いません。我々は、機械と人とが協働してより良い翻訳を作り出すことを目標に日々努力しています。