# 翻訳者のための正規表現~序章
正規表現のことを、ぽつりぽつりと不定期シリーズで書いてみようかと思い立ちました。
翻訳者にとって、正規表現はかなり強力な武器になるものなのですが、「それはわかっているけど、なかなか手をつけられない」という方が、私の周りにも少なからずいらっしゃいます。正規表現の入門的な内容はネット上にすでにたくさん出回っているのですが、ここでは、私の知っているそんな翻訳者さんたちの顔を思い浮かべながら、私なりの書き方をしてみようと思っています。
まず、「とっつきにくい」と思われている、その障壁をとっぱらう必要があります。その原因は、ひょっとすると「正規表現」という訳語にもあるんじゃないでしょうか。
英語では regular expression。
この訳語がいったいいつ定着したのか知りませんが、「正規表現」って、そのはたらきから考えたら立派な誤訳でしょう、という話です。
たとえば研究社英和大で、regular は次のように定義されています。
regular
1 定時の, 定期的な (periodic).
3 規則的に組み立てられた[建てられた, 配列された], 規則的な
5a 法律[規則, 慣例など]に合った; 正規の, 正式の
いっぽう、「正規」を国語辞典でひいてみると……
正式にきめられていること。正式の規定。(広辞苑)
正式に決められた規則。また、規則にかなって正しいこと。(学研国語大)
ですよね。
だから、「正規表現」なんて言ったら、なにか「正式な表し方」みたいなイメージになっちゃって、検索とか置換という操作になかなかむすびつかないわけです。
regular expression の regular は、上の語義で言えば3です。CDOの語義を見ればもっとわかりやすいでしょうか。
arranged in a constant or definite pattern
そう、キーワードは「パターン」なんですよ。つまり regular expression というのは、特定の文字列を検索するのではなく、
パターンを指定して、それに一致するものをすべて検索する
ための表現方法ということなのです。
だから、同じような指定を「パターンマッチング」って言ったりもします。
■
ひとつだけ例を示して、「パターン検索」であることを実感してみましょう。
手元にある翻訳済みファイルを適当に開き、検索ウィンドウに
[0-9]
と入力し、必要なオプションを設定します。
※
角カッコは半角。数字とハイフンも半角です。翻訳のとき数字を全角で入力する人は、数字だけ全角にしてください。
たとえば、MS Word ならこうです。
秀丸エディタなら、こうなります。
検索を実行すると、[0-9]というパターンが、半角数字(または全角数字)のすべて、にマッチするはずです。
ということで、今さら用語を変えることもできないでしょうから、ここでも「正規表現」という言葉は使いますが、意味として「パターンを指定して、一致するものをすべて見つける」のだということを、まずおさえてください。
■
どうでしょう。少しはイメージできるようになったでしょうか?
この記事へのコメントは終了しました。
コメント