« 2012年10月 | トップページ | 2012年12月 »

2012.11.21

# 『翻訳で失敗しないために』、公開されました

翻訳をめぐる数々の不幸は、そのほとんどが

発注クライアントの認識不足

に端を発しているといっても過言ではありません。そのことが最も分かりやすい形で現れたのが、先日の機械翻訳騒動でした。

# 機械翻訳のせいじゃない
# 今度はテレビ東京のサイト - 機械翻訳システムの害はかなり広いのかも

そんなクライアントに対する啓蒙のために、ITI(英国翻訳通訳協会)とATA(全米翻訳者協会)は、だいぶ前から

Translation: Getting It Right – A guide to buying translations

という冊子を公開しています。

その日本語版が完成し、JAT、JTF両団体の協賛を経て、正式に公開の運びとなりました。現在、JTFのトップページからダウンロードできるようになっています。

リンク: 「翻訳で失敗しないために」翻訳発注の手引き

※直接PDFが開きます。


翻訳を担当し、日本語版作成のプロジェクトを進めてきたのは、オランダ在住の杉本優さんです。「翻訳で失敗しないために」についても、彼女のブログに詳しいエントリがあがっています。ぜひ、併せてご覧ください。

リンク: 「翻訳で失敗しないために〜翻訳発注の手引き」完成! | ハーグ通信

自分で印刷する場合には、PDF版をダウンロードしたら、

・用紙の向き = 「横」(Landscape)

・用紙1枚あたりに2ページを印刷

という設定にすると、A5サイズの手頃な冊子ができあがります。


11/28(もう来週じゃん...)の翻訳祭には、きれいな印刷版を配布する予定です。

121121_2

発注の段階がもう少し合理的になれば、翻訳会社も、そして翻訳者も、今よりもう少しハッピーになれると思います。

クライアント企業の方はもちろん、翻訳会社の方、直取引のある翻訳者さんは、これを持って帰って、ぜひ「お客様の教育」に役立ててください。


08:26 午後 翻訳・英語・ことば | | コメント (2) | トラックバック (0)

はてなブックマークに追加

2012.11.18

# 翻訳者のための正規表現~基本その1の応用

1つ前のエントリで、

インタフェース、インターフェース、インタフェイス、インターフェイス

という4通りの表記をあげました。


では、このシリーズの前回までに説明した基本ルールを使って、この4通りすべてを検索できるパターンを書くことはできるでしょうか?


「続きを読む」に進む前に、まず自分で試してみましょう。

正規表現のパターンを考えるうえで大切なのは、

・出現するすべてのパターンを想定すること
・パターンの中で共通部分と差異部分を整理すること

だろうと思います。


今回のお題では、出現パターンはすでに示されているので、共通部分と差異を考えます。

インタフェース
インターフェース
インタフェイス
インターフェイス

・最初の「インタ」は共通
・途中の「フェ」も共通
・最後の「ス」も共通
・「インタ」の後は、長音あり/なし
・「フェ」の後は、長音か「イ」

こんなふうに整理できれば、それをルールに当てはめるだけ。つまり、「インタ●フェ▲ス」と書いてみて、●と▲に当たるルールを考えればいいわけです。

●のところは、長音が「あってもなくてもいい」ので、「0回か1回以上の出現」を表すクエスチョンマーク(?)を使うのが常套です。ここではアスタリスク(*)でもOKですが、プラス(+)ではダメ。理由は自分で考えてみてください。

▲のところは長音か「イ」のいずれか、なので、[ ]を使います。


ということで、正解のパターンは

インター?フェ[ーイ]ス

です。

インター?フェ[ーイ]?ス

とすれば、レアだと思いますが「インターフェス」の形にもマッチします。


11:08 午前 翻訳者のPCスキル | | コメント (2) | トラックバック (0)

はてなブックマークに追加

# ラウンチ、ローンチ...ロンチ?

定訳がない外国語をカタカナ表記するとき、その原語の発音が日本人にとってなじみのないものだと、カタカナ表記にある程度の揺れが生じるのはしかたがありません。

スタイルガイドについて話し合うときに必ず話題になる interface はその最たるもの。最初の in に第1アクセントがありますが、face にも第2アクセントがあるので曖昧にはならず、

発音のサンプル: Interface | Define Interface at Dictionary.com

という発音になります。ところが、これをカタカナで表記すると、

インタフェース、インターフェース、インタフェイス、インターフェイス

の4通りが出てきて(さすがに、終わりが「フェス」というのはほとんど見かけません)、IT系翻訳者を悩ませるわけです。

それでも、

launch、launcher

のカタカナ表記に比べればだいぶマシという気がします。


launchのほうは、製品とかサービス、サイトなどを新しくスタートする意味の動詞として最近よく使われますが、IT系だと、launcherという用語のほうが先に出てきたかもしれません。

システム上のあちこちにあるアプリケーションを1か所から起動できるように、そのショートカットを登録しておくソフトウェアをlauncherと言いますが、これのカタカナ表記は、かなり以前から

ランチャ
ランチャー
ローンチャ
ローンチャー
ロンチャー

などとばらけていました。原語の発音は

発音のサンプル: Launcher | Define Launcher at Dictionary.com

なので、「ローンチャー」がいちばん近そうですが、「ランチャー」でも意味は通じます。これより以前に「ミサイルランチャー」という言葉もありましたから。でも、

ラウンチャー

という表記を初めて見かけたときは、正直、絶句しました。どう考えても、発音をまったく知らずにローマ字読みしたとしか思えない、恥ずかしい表記という気がします。


こうなると、その動詞であるlaunchのほうもいろいろなカタカナ表記が出てくることは想像に難くないわけですが、

ロンチ

というのはずいぶん無理がある気がします。

リンク: Wii U北米ロンチまで18時間!みんなが作った「U」を紹介 | インサイド (任天堂、Wii Uのニュース)


そもそも、なんでこの動詞をカタカナで書かなきゃいけないのか、それが不明です。

10:41 午前 翻訳・英語・ことば | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2012.11.14

# 辞書検索ツール「かんざし」

先日参加した勉強会で、このツールを紹介してくださった方がいて、もちろん私もこのツールのことは知っているのですが、改めて使い始めました。

リンク: 複数辞書ソフトの一括検索ツール「かんざし」

Jammingなどの辞書ブラウザで複数の辞書を一気にひくことを、俗に「串刺し検索」と言いますが、ひとつの辞書ブラウザだけでなく、いくつもの辞書検索ツール(ときにはブラウザまで含めて)を一気にひくのも、「串刺し検索」と言います。

「かんざし」はそれを簡単に実現できるアプリケーションです。

インストールはダウンロードした knzs012.zip を解凍するだけ。

メインのインターフェースは、こんな入力ウィンドウだけ。見かけは実にシンプルです。

1211141


初めて起動したとき(またはオプションから選択すると)、こういうダイアログが開きます。

1211142

このダイアログの左上にある「★」を、検索したい辞書検索ツール(Jammingなど)の入力ウィンドウにドロップします。すると、その下のフィールドに辞書のウィンドウ名が取得されるので、[送信先に登録]をクリックして、その下にリストに追加します。これで辞書の登録は終わり。

後は、上にあげた本体の小さいインターフェースに検索語を入力すれば、すべての辞書検索ツールが検索されます。

要するに、各辞書検索ツールのウィンドウハンドルを取得して、そこに検索語を渡しているのですが、相手のアプリケーションによってはうまく機能しない場合があります。語句が渡されなかったり、渡されてもEnterキーに当たる操作が実行されなかったりする場合があります。私の手も環境では、

Jamming …… ○
Pasorama …… ○
LogoVista …… ○
Merriam Webster's Collegiate ……△(Search ボタンを押す必要がある)
COD …… ○
SOD …… ×
OED …… ×

でした。

メインのインターフェースがあまりにあっさりしているので、設定機能(たとえば辞書を後から追加する)はどこにあるのかわかりませんが、右クリックすれば出てきます。

さて、このアプリケーション、開発が始まったのは2000年より前のこと。そして2001年には開発が停止しています。

昨夜、翻訳フォーラムのメンバーと「かんざし」の話になって改めて気づいたのですが、このアプリケーションの開発が進んでいた2000年前後というのは、EPWing規格の辞書を何でもかんでもJammingに載せる、ということができなかった時代でした。

つまり、リーダーズでもランダムハウスでも、それぞれ別個のウィンドウがあって、いちいち検索語を入力(またはペースト)する必要があった。そんな不便を解消するために、この一気検索ツールが生まれたわけです。

でも、その後EPWing規格がかなり普及したり、Jammingもランダムハウスのデータを直接読み込めるようになったりしたので、「かんざし」の出番は少なくなりました。

ところが、ここ最近また状況が少し変わってきました。

まず、EPWing規格の旗色がちょっとよくありません。EPWing版が出ない辞書も増えているようです。

次に、LogoVistaデータはJammingで読み込めたのですが、最近のLogoVistaデータは後継のLogophileでないときれいに読み込めないようになっています。

電子辞書のPC用ブラウザ、PANORAMAのような独自規格も出てきました。

Oxford系辞書は、それぞれすべてスタンドアロンです。

こんな風に、どうしてもJammingだけでは済まない状況になりつつあり、そこで私も「かんざし」の素晴らしさを再発見したという次第です。


作者の内山さーん、見てますか~ :)

04:08 午後 翻訳・英語・ことば, パソコン・インターネット | | コメント (14) | トラックバック (0)

はてなブックマークに追加

2012.11.11

# 翻訳者のための正規表現~基本その1

それでは、改めて基本からはじめることにします。

第1回でまとめたように、"正規"表現というのは、

パターンを指定して、それに一致するものをすべて検索する

ことでした。

したがって、正規表現を使えるようになるというのは、このいろいろなパターンの指定方法を覚えるということになります。その基本を、何回かに分けて説明します。

なお、前回書いたように、このシリーズの正規表現は秀丸エディタで使えます。秀丸エディタ、あるいはエディタ全般を使ったことがない人は、いい機会ですからダウンロードして使ってみてください。

リンク: 秀まるおのホームページ(サイトー企画)-秀丸エディタ

シェアウェアですが、機能制限も期限もなしに試用できます(起動時にダイアログが表示される)。

それでは、基本ルールです。


任意の1文字
ピリオド(.)
機能:どんな1文字にも一致

伏せ字に使う×みたいなもんですね。複数並べれば、その文字数にマッチします。
※以下、例は背景色を変えていますが、ピリオドはゴミみたいで見落としそうなので、よーく見てくださいね。

例:

1.2
真ん中にどんな1文字があってもマッチします。102、112、1a2、1俺2 など

..省
「○○省」にマッチします。厚労省、文科省など。ただし、「数を省く」などにもマッチすることに注意。

例でもわかるように、マッチする文字のバイト数は関係ありません。でも、たぶんこれだけじゃ、あまり使い途はないですね。


0回以上の繰り返し
アスタリスク(*)
機能:直前のパターンを0回以上繰り返す

例:

レ*
「レレレのレ~」の中の「レレレ」と「レ」にヒットします。「ドレミ」の中の「レ」にもマッチします。

レレ*
「レ」を2つ書いてから * を指定するとどうなるでしょうか。「レレレ」にヒットするのはわかりますが、1文字の「レ」にもマッチしませんか?

実はこれが「0回以上」の秘密です。レ* という指定の意味は「レが0回以上」です。「レ」が0回でいいんなら、どんな文字にでもマッチしそうですが、さすがにそういう仕様にはなっていません。したがって レ* という指定は実質的には「1回以上」です。

ところが レレ* と書くと0回以上が意味を持ってきます。つまり1つ目の「レ」でまず1文字は「レ」がなきゃいけない。ところが2つ目は0回でもいいわけですから、1個で終わっても2個以上終わってもいい。つまり、これも実質的には「レが1回以上」になるのですね。

レレレ*
実質的に「レが2回以上」になりますね。よって、「レレレのレ~」の中の「レレレ」にだけマッチします。

Rerere


このピリオド(.)とアスタリスク(*)を組み合わせれば、「任意の文字を何文字でも」の意味になります。実際、この組み合わせを使う場面はよくあります。

例:

.*
これだけ指定すると、文字どおりすべての文字にマッチします。

To .*:
Toで始まってコロンで終わる箇所をさがすことができます。


1回以上の繰り返し
プラス(+)
機能:直前のパターンを1回以上繰り返す

上記のようにアスタリスクの「0回以上」はちょっと特殊なので、「1個以上ある」ことをはっきりさせたいときにはプラス記号(+)を使います。

例:

レ+
「レレレのレ~」の中の「レレレ」と「レ」と、「ドレミ」の中の「レ」にもマッチします。アスタリスクの場合と変わりません。

レレ+
レレ* の場合と違う結果になります。理由はもうわかりますね。


さて、アスタリスクもプラスも、「文字を繰り返す」ではなく「パターンを繰り返す」と説明されているところに注目してください。つまり、上の例にあげたような文字だけではなく、一定のパターンも指定できるということです。

今回より前にやった [ ] を思い出してください。[0-9]で数字10個を表しました。これを繰り返し記号と組み合わせ、次のようになります。

例:

[0-9]+
何桁でも、数字の連続にマッチします。ただしカンマ区切りがあるとそこで切れてしまいます。

[0-9,]+
こうすれば、カンマ区切りも含んだ数字にマッチします。

[a-zA-Z]+
アルファベットでできた単語にマッチします。

[ァ-ヶー]+・[ァ-ヶー]+
中黒で結ばれたカタカナ用語にマッチします。


0回か1回以上の出現
クエスチョンマーク(?)
機能:直前のパターンを0回または1回繰り返す

アスタリスクとプラスの中間みたいで半端そうですが、たとえばこんな風に使えます。

例:

インター?フェース
こうすると「インタフェース」と「インターフェース」のどちらも検索できます。インター*フェースと指定してもよさそうなのですが、そうすると「インターーフェース」のような誤字もヒットしてしまいます。そういう用途もありそうですが、正しい表記の「インタフェース」か「インターフェース」のいずれかを探したい、ときは ? の出番です。

チェック[ ・]?ボックス
カッコの中は、中黒の前に半角スペースがあることに注意。こうすると、「チェックボックス」も、「チェック・ボックス」も、「チェック ボックス」もマッチします。カタカナ複合語にゆれがあっても、このパターンでぜんぶチェックできることになります。

さて、だいぶ翻訳作業に使えそうになってきたと思いますが、いかがでしょうか。


なお、今回使ったピリオド、アスタリスク、プラスなどを、正規表現ではメタ文字(meta character)と呼んでいます。



【今回のまとめ】

●正規表現で特殊な意味をもつ文字をメタ文字という

●任意の1文字を表すメタ文字はピリオド(.)

●パターンを0回以上繰り返すメタ文字はアスタリスク(*)

●パターンを1回以上繰り返すメタ文字はプラス(+)

●パターンを0回または1回繰り返すメタ文字はクエスチョンマーク(?)



【サンプルテキスト】

秀丸エディタで今回の検索を試してみたい方は、以下の引用部分をコピペしていただくと、試しやすいかも。

レレレのレ~ ドレミの歌

2012年
1,980円

alphabetical order

インタフェース
インターフェース
インターーフェース
インターフェイス
インタフェイス

チェックボックス
チェック・ボックス
チェック ボックス

10:30 午前 翻訳者のPCスキル | | コメント (2) | トラックバック (0)

はてなブックマークに追加

2012.11.09

# 「日本翻訳ジャーナル」11/12月号

「日本翻訳ジャーナル」の11/12月号が発行されました。


リンク: JTF 日本翻訳ジャーナル 11/12月号


Ph_journal_new_1112

今号は、TC シンポジウム(8月)、第1回JTF 翻訳支援ツール説明会(9月)、TAUS and Localization World Seattle 2012(10月)など、翻訳業界のイベントレポートがてんこ盛り。

今月下旬に開催される「第22回JTF翻訳祭」の詳しい告知もあります。


私のコーナーには、映像・字幕翻訳者の仙野陽子さんをお呼びしました。元気の出る1本です。


全編無料でダウンロードできますので、ぜひお読みください。


【11/11追記】
翻訳業界のトップUstreamer、テリー齊藤さんが、ジャーナルを携帯端末などで手軽に見る方法を紹介なさっています。

リンク: 翻訳ジャーナルを便利に読もう | 翻訳横丁の裏路地

04:51 午後 翻訳・英語・ことば | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2012.11.08

# 翻訳者のための正規表現~方言の話、その他

正規表現でちょっと困るのは、環境によって表現ルールが違っていることです。

・UNIX経由の、由緒正しいルール
・POSIX規格
・Perl
・秀丸エディタ
・Wordのワイルドカード(この語の本来の意味については、いずれ)

などなど、共通部分もありますが、文法や自由度に差があります。


ちょっとずつ違いがあるのに「正規」なんて、ますますいかんですね、この訳語は。

今回は、少しずつ実用的なパターンを増やしながら、この違いについて簡単に触れておきます。そして、最終的にこのシリーズでは、

秀丸エディタで採用されている文法

を基本とし、必要があれば別のパターンを紹介する、ことにしたいと思います。理由は、私がいちばん慣れているからw

さて、前回使ったパターンは、

[0-9]

という形でした。

●文字の範囲を表すときは、ハイフンで結び、[ ]で囲む●

ルールとまとめておきましょう。

注意:今後このシリーズでは、明記しないかぎりパターンとして入力する文字はすべて半角です。漢字とかカタカナとか、検索対象の文字はもちろん全角もあります。

[0-9] と書けば、10個の数字いずれかにマッチします。

同じように、

[a-z] と書けばアルファベット26文字のいずれかにマッチします。大文字小文字の区別は設定やオプションによって違うのですが、

[a-zA-Z]と書けばその設定やオプションに関係なくアルファベット大小文字の52文字にマッチします。

この例でわかるように、複数の範囲を並べるとき、区切りとか必要ないんですね。


このルールの発展形として、「その範囲は除く」というパターンも簡単に指定できます。ところが、ここで問題になってくるのが、今回のテーマである方言なわけです。

[^0-9a-zA-Z]

これが秀丸エディタでの指定。[ ]の中で、範囲の前に ^ (カレット、キャレット)を付けます。ところが、同じような「除外」を指定する記号が、MS Wordだと感嘆符になり、

[!0-9a-zA-Z]

となります。

このように、方言は少しずつあるのですが、1つの文法体系を覚えてしまえば、別の体系でも十分類推がききます。私が秀丸エディタの文法をこのシリーズで標準とするのも、他の体系への類推が容易だからです(ルールがほぼPerl互換なので)。

ところで、カレットも感嘆符も、除外するのは別に範囲とは限りません。直後にある1文字でも、並べた複数文字でもいい。

[^個]
  …… 「個」の字のみ除外。そんな用途はあんまり考えられませんけど。

[^0-9何]通り
  …… 数字の後以外で「○通り」を見つけます。「以下の通り」をエラーとしたい場合。

ただし、除外の意味をもつのは[ ]の中でだけです。[ ]の外で使うと、別の意味を持ってしまいます。このように、同じ文字が場所によって違う意味をもつことがあるのも、正規表現で難しい点かもしれません。

また、[ ]の中で先頭に置かないと除外の意味になりません。


【今回までのまとめ】

●文字の範囲を表すときは、ハイフンで結び、[ ]で囲む

●除外するときは[ ]の中で最初に、 ^ または ! を付ける


【例】

[0-9a-zA-Z]
  意味: 数字、英字の大文字と小文字にマッチします。

[ァ-ヶーぁ-ん亜-熙]
  意味:日本語の文字種(漢字、かな、カナ)すべてにマッチします。

[ァ-ヶー] [ァ-ヶー]
  意味:カタカナ語の間に半角スペースがある箇所を見つけます。

行な[わいうえおっ]
  意味: 「行なう」という送りがな。動詞の活用形すべてにマッチします。

[個箇カヵヶ]所
  意味:「か所」が正しいという仕様のとき、それ以外の誤表記を見つけます。

[^に]従って
  意味: 接続詞として「従って」が使われている箇所を見つけます。

※範囲指定は、文字コードに依存するので、環境によって指定する文字はこれと違う場合があります。

【追記】
例に間違いがあるのをコメント欄でご指摘いただきましたので、いちぶ修正しました。

06:44 午後 翻訳者のPCスキル | | コメント (2) | トラックバック (0)

はてなブックマークに追加

2012.11.07

# 翻訳者のための正規表現~序章

正規表現のことを、ぽつりぽつりと不定期シリーズで書いてみようかと思い立ちました。


翻訳者にとって、正規表現はかなり強力な武器になるものなのですが、「それはわかっているけど、なかなか手をつけられない」という方が、私の周りにも少なからずいらっしゃいます。正規表現の入門的な内容はネット上にすでにたくさん出回っているのですが、ここでは、私の知っているそんな翻訳者さんたちの顔を思い浮かべながら、私なりの書き方をしてみようと思っています。


まず、「とっつきにくい」と思われている、その障壁をとっぱらう必要があります。その原因は、ひょっとすると「正規表現」という訳語にもあるんじゃないでしょうか。

英語では regular expression

この訳語がいったいいつ定着したのか知りませんが、「正規表現」って、そのはたらきから考えたら立派な誤訳でしょう、という話です。

たとえば研究社英和大で、regular は次のように定義されています。

regular
1 定時の, 定期的な (periodic).
3 規則的に組み立てられた[建てられた, 配列された], 規則的な
5a 法律[規則, 慣例など]に合った; 正規の, 正式の


いっぽう、「正規」を国語辞典でひいてみると……

正式にきめられていること。正式の規定。(広辞苑)
正式に決められた規則。また、規則にかなって正しいこと。(学研国語大)

ですよね。

だから、「正規表現」なんて言ったら、なにか「正式な表し方」みたいなイメージになっちゃって、検索とか置換という操作になかなかむすびつかないわけです。

regular expression の regular は、上の語義で言えば3です。CDOの語義を見ればもっとわかりやすいでしょうか。

arranged in a constant or definite pattern

そう、キーワードは「パターン」なんですよ。つまり regular expression というのは、特定の文字列を検索するのではなく、

パターンを指定して、それに一致するものをすべて検索する

ための表現方法ということなのです。

だから、同じような指定を「パターンマッチング」って言ったりもします。

ひとつだけ例を示して、「パターン検索」であることを実感してみましょう。

手元にある翻訳済みファイルを適当に開き、検索ウィンドウに

[0-9]

と入力し、必要なオプションを設定します。

角カッコは半角。数字とハイフンも半角です。翻訳のとき数字を全角で入力する人は、数字だけ全角にしてください。

たとえば、MS Word ならこうです。

1211071

秀丸エディタなら、こうなります。

1211072

検索を実行すると、[0-9]というパターンが、半角数字(または全角数字)のすべて、にマッチするはずです。


ということで、今さら用語を変えることもできないでしょうから、ここでも「正規表現」という言葉は使いますが、意味として「パターンを指定して、一致するものをすべて見つける」のだということを、まずおさえてください。

どうでしょう。少しはイメージできるようになったでしょうか?

09:13 午後 翻訳者のPCスキル | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2012.11.04

# お大事にしてください

撮りためてあったランチを見ながら「孤独のグルメ」を食べていたら、いや、あせるんじゃない。

遅く起きてブランチを食べながら、撮りためてあった「孤独のグルメ」の第2話を見ていたら、ゴローちゃんが水天宮で腹帯を買って、最後に巫女さんが

「お大事になさってください」

と言うシーンがありました。


ああ、さすがに言葉遣いはちゃんとしてるな、と思って(テレビ東京のスタッフがちゃんとしてたんでしょうね。実際の巫女さんならまちがってたかもしれない)、ついでだから前々から気になっていたことを書いておきます。


病院なんかでも、会計済ませると最後にかならず、同じ趣旨のことばが返ってきますが、最近はたぶん8割以上が、

お大事にしてください

じゃありませんか?


あれ、敬語として間違ってます。

Twitterの挨拶でもわりとよく見かけます。ご注意を。

人形町の水天宮は、ウチもお世話になりました。町並みも好きです。

12:57 午後 翻訳・英語・ことば | | コメント (4) | トラックバック (0)

はてなブックマークに追加