« # ラウンチ、ローンチ...ロンチ? | トップページ | # 『翻訳で失敗しないために』、公開されました »

2012.11.18

# 翻訳者のための正規表現~基本その1の応用

1つ前のエントリで、

インタフェース、インターフェース、インタフェイス、インターフェイス

という4通りの表記をあげました。


では、このシリーズの前回までに説明した基本ルールを使って、この4通りすべてを検索できるパターンを書くことはできるでしょうか?


「続きを読む」に進む前に、まず自分で試してみましょう。

正規表現のパターンを考えるうえで大切なのは、

・出現するすべてのパターンを想定すること
・パターンの中で共通部分と差異部分を整理すること

だろうと思います。


今回のお題では、出現パターンはすでに示されているので、共通部分と差異を考えます。

インタフェース
インターフェース
インタフェイス
インターフェイス

・最初の「インタ」は共通
・途中の「フェ」も共通
・最後の「ス」も共通
・「インタ」の後は、長音あり/なし
・「フェ」の後は、長音か「イ」

こんなふうに整理できれば、それをルールに当てはめるだけ。つまり、「インタ●フェ▲ス」と書いてみて、●と▲に当たるルールを考えればいいわけです。

●のところは、長音が「あってもなくてもいい」ので、「0回か1回以上の出現」を表すクエスチョンマーク(?)を使うのが常套です。ここではアスタリスク(*)でもOKですが、プラス(+)ではダメ。理由は自分で考えてみてください。

▲のところは長音か「イ」のいずれか、なので、[ ]を使います。


ということで、正解のパターンは

インター?フェ[ーイ]ス

です。

インター?フェ[ーイ]?ス

とすれば、レアだと思いますが「インターフェス」の形にもマッチします。


11:08 午前 翻訳者のPCスキル |

はてなブックマークに追加

« # ラウンチ、ローンチ...ロンチ? | トップページ | # 『翻訳で失敗しないために』、公開されました »

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/13481/56137972

この記事へのトラックバック一覧です: # 翻訳者のための正規表現~基本その1の応用:

コメント

今回もありがたく拝読しました!「出現するすべてのパターンを想定することと、パターンの中で共通部分と差異部分を整理すること」を具体例を挙げて説明していただき、「ああ、これだあ^_^」と思いました。

正規表現をいくつか覚えても、上記を自力ではあまり実現できていなかったので、翻訳作業における活用度がいまいちだったのですが、これからは検索と見直しの効率があがりそうです^-^ ありがとうございました!

投稿: choco | 2012/11/24 20:10:39

ともかく、こういうのはすべて「必要だと思ったら使って覚える」という世界なので、なるべく、実践的な例を挙げながら進めていきたいと思っています。

投稿: baldhatter | 2012/11/25 17:37:56

コメントを書く

## コメントは承認制なので、公開されるまでに時間のかかることがあります。



(必須ではありません)