# 翻訳者のための正規表現~基本その1の応用
1つ前のエントリで、
インタフェース、インターフェース、インタフェイス、インターフェイス
という4通りの表記をあげました。
では、このシリーズの前回までに説明した基本ルールを使って、この4通りすべてを検索できるパターンを書くことはできるでしょうか?
「続きを読む」に進む前に、まず自分で試してみましょう。
■
正規表現のパターンを考えるうえで大切なのは、
・出現するすべてのパターンを想定すること
・パターンの中で共通部分と差異部分を整理すること
だろうと思います。
今回のお題では、出現パターンはすでに示されているので、共通部分と差異を考えます。
インタフェース
インターフェース
インタフェイス
インターフェイス
・最初の「インタ」は共通
・途中の「フェ」も共通
・最後の「ス」も共通
・「インタ」の後は、長音あり/なし
・「フェ」の後は、長音か「イ」
こんなふうに整理できれば、それをルールに当てはめるだけ。つまり、「インタ●フェ▲ス」と書いてみて、●と▲に当たるルールを考えればいいわけです。
●のところは、長音が「あってもなくてもいい」ので、「0回か1回以上の出現」を表すクエスチョンマーク(?)を使うのが常套です。ここではアスタリスク(*)でもOKですが、プラス(+)ではダメ。理由は自分で考えてみてください。
▲のところは長音か「イ」のいずれか、なので、[ ]を使います。
ということで、正解のパターンは
インター?フェ[ーイ]ス
です。
インター?フェ[ーイ]?ス
とすれば、レアだと思いますが「インターフェス」の形にもマッチします。
この記事へのコメントは終了しました。
コメント
今回もありがたく拝読しました!「出現するすべてのパターンを想定することと、パターンの中で共通部分と差異部分を整理すること」を具体例を挙げて説明していただき、「ああ、これだあ^_^」と思いました。
正規表現をいくつか覚えても、上記を自力ではあまり実現できていなかったので、翻訳作業における活用度がいまいちだったのですが、これからは検索と見直しの効率があがりそうです^-^ ありがとうございました!
投稿: choco | 2012/11/24 20:10:39
ともかく、こういうのはすべて「必要だと思ったら使って覚える」という世界なので、なるべく、実践的な例を挙げながら進めていきたいと思っています。
投稿: baldhatter | 2012/11/25 17:37:56