« # 尾瀬の話 ~ 入山料でいけるじゃん | トップページ | # ミク曲、最近の(個人的)ヒット »

2011.05.18

# 日本語と機械翻訳

いろいろな形で機械翻訳との関わりは避けて通れないようですし、純粋にテクニカルな話としては個人的に興味もある分野なのですが、今朝ふと、日本語がそもそも機械翻訳には向いていないのかもなぁと思いました。

それは、

漢字
ひらがな
カタカナ

と 3 つも文字の種類があって、、それらが並んでできあがる文とか文章では、「見た目」という要素が意味に劣らず重要だからです。

漢字、ひらがな、カタカナの分量のバランスしだいで、読みやすさや文体(文章の硬度とかまで含めればなおのこと)はかなり変わってきますし、文字の並び方だけでもずいぶん様子は違ってきます。

これは別に文芸翻訳に限ったことではなく、産業翻訳だって当たり前の話です。

たとえば、

「実際にはもちろんそうではなく...」

と書くのと、

「もちろん実際にはそうではなく...」

と書くのでは、語順の問題を別にしても、「ひらがなの続き方のバランス」が違います。この前後での文字種の並び方によって、どちらが適切かは変わるかもしれません。

一方、機械翻訳というのは、あくまでも「意味を等価に保ちつつ他言語に置き換える」処理にすぎません。アルファベットしかない言語世界ではそれでもいいかもしれませんが、文字種の選び方や並び方が大きな要素となる日本語をターゲット言語にする場合、かりに意味を等価に保てても --- それすらもまだまだ前途多難ですが ---、いろんなものが切り捨てられてしまう可能性があります。

……なんてことは、機械翻訳の現場の人はとっくに承知なのかもしれません。切り捨てられる部分があっても、意味の置き換えが成立すればいいという分野や文種はたしかに存在します。だから、機械翻訳がもっともっと進歩して、そういう分野に浸透しきっちゃうほうが、実は翻訳者にとっては幸せなのかもしれません。

03:10 午後 翻訳・英語・ことば |

はてなブックマークに追加

« # 尾瀬の話 ~ 入山料でいけるじゃん | トップページ | # ミク曲、最近の(個人的)ヒット »

トラックバック


この記事へのトラックバック一覧です: # 日本語と機械翻訳:

コメント

産業翻訳ではあまり関係ない話かもしれませんが、文字種の他にも日本語の人称っていうのもなかなか厄介だなぁと思います。真面目に調べたことはありませんが、一・二・三を問わず、これだけ多彩な人称が存在する言語って他にはないんじゃないかと。

ごく一般的な「僕」という言葉でも、「ボク」、「ぼく」、「僕」でずいぶん印象が変わっちゃいますよね。そのへんが面白くもあり、難しくもあるんですが。

「我が輩は猫である」を「I am a cat」と訳せても、「I am a cat」から「我が輩」は普通は出てこないよなぁ、なんて思ったことがあります。

投稿: Ado | 2011/05/20 18:23:30

人称についてはもう、とにかく厄介の一言ですね。文芸翻訳の場合には、主人公の人称だけでそうとう悩むという話は定番です。

投稿: baldhatter | 2011/05/24 23:56:03

この記事へのコメントは終了しました。