« Workbench の設定 - [設定]ダイアログ | トップページ | SDL Trados Studio 2009 - SP1 をインストール »

2009.10.18

Workbench の設定 - [設定]-[分節規則]

★★
前エントリで書いた[ファイル]→[設定]ダイアログのうち、[分節規則]タブについて説明します。

以前にも書きましたが、日本語文法用語の「文節」ではなく「分節」です。原語は Segmentation。

※余談ですが、Workbench は[表示]→[ユーザー インターフェイスの言語]機能を使えばアプリケーションの表示自体(ヘルプも含めて)を切り替えられるので、けっこう便利です。どのアプリケーションもこうなっていてほしいと思います(ただし、フリーランス版の場合はインストール時に指定する 5 言語に限定されます)。

【2009/10/28 加筆】

[設定]ダイアログ-[分節規則]タブ

Trados は、主に原文の punctuation 記号を手がかりにして翻訳単位(=分節)を区切っています。たとえば原文が欧文の場合、デフォルトでは次の記号や単位で分節として認識されます。
・ピリオド
・タブ
・コロン
・疑問符、感嘆符
・段落
ただ、これだけでは不十分で、たとえばピリオドは小数点の区切りにも使われるので、「ピリオドの後には空白文字が続いている」などの細かい条件も追加されています(したがって、原文でピリオドの後にスペースがないと複数文がつながって分節になります)。

ほとんどの場合はデフォルト設定で対応できるのですが、原文の状況によってはときどき、区切り方が不都合なことがあります。チャーリーさんからご質問があったように、文末が数字で終わっているときも、その文だけで分節とならず、次の文が続いてしまいます。

Tradoswbsegmentation_1

これは、「数字の後にピリオドが続く場合、そのピリオドでは分節として区切らない」という設定がデフォルトになっているためです。次のスクリーンショットのように、デフォルトでは[数字に続く]オプションがオフです。

Tradoswbsegmentation2


ではこれをオンにすればいいかというと、そうするとこの規則は「数字に続くときだけピリオドで区切る」という意味になってしまい、逆に本来区切られるべきセンテンスがつながってしまいます。なんというか、設定メカニズムとして非常に不親切です。

ところが、このオプションにはオン/オフのほかにグレーアウトされた状態というのがあって(オン状態から 2 回、またはオフ状態から 1 回チェックボックスをクリック)、

Tradoswbsegmentation3

こうすると、「ピリオドの前に数字が来るかどうかは考慮しない」状態になるのだそうです。試してみましたが、この状態にすれば、本来のセンテンスも区切られ、年号などの数字の後も区切られるようになりました(これ以外の場面で数字が出現したときの動作は未確認です)。

Tradoswbsegmentation4

チャーリーさん、いかがでしょうか。

【以下、2009/10/28 加筆】
その後、「U.S. のような略語で文が終わるとき、セグメントが区切られるようにしたい」というご要望をいただきました。

関係するのは、[略語と推定される文字に続く]オプションです。

Tradoswbsegmentation5

結論から言うと、これもオンやオフではなくグレー状態にしておくといいようです。

オフ(デフォルト)にすると、U.S. のようなピリオド付き略語で文が終わるとき、そこでセグメントになりません(ただし、U.S. の後にスペースが 2 つ以上あると区切られます。

オンにすると、ピリオド付き略語の後は区切られるようになりましたが、おもしろいことにスペースが 2 つ以上あると逆に区切られなくなりました。

グレー状態にすると、後ろのスペース数にかかわらず区切られます。

01:38 午後 Trados 機能 |

はてなブックマークに追加

トラックバック


この記事へのトラックバック一覧です: Workbench の設定 - [設定]-[分節規則]:

コメント

禿頭帽子屋さま(ここではこうお呼びするのですね!・・・どうも禿頭と書くことに抵抗が・・・)。

うまく行きました。ありがとうございました!

他にも分節が区切られないケースがあったので、それが実現した場合はまたご相談します。どうもありがとうございました。

チャーリー

投稿: チャーリー | 2009/10/18 15:13:31

チャーリーさん

お役に立てたようで何よりです。数字の出現パターンもいろいろですから、何かおもしろいケースがあればまたご一報ください。

投稿: baldhatter | 2009/10/19 20:22:55

baldhatter さん、おはようございます。

またまた基本的な質問ですみません。

・・・・U.S. The・・・

のように、米国のあとのピリオド兼用の.を文節の区切りと見てくれていないようです。どういうルールを適用すればよろしいのでしょうか?

お忙しいところ恐縮ですがよろしくお願いします。

チャーリー

投稿: チャーリー | 2009/10/27 6:25:01

チャーリーさんのご要望にお応えして、加筆してみました。

投稿: baldhatter | 2009/10/28 9:37:23

禿頭帽子屋さま、ご無沙汰しております。
便乗質問させてください。
コロンの前ではなく、後に数字(または大文字)が来るかどうかで文節を切ったり切らなかったりというのは設定できるのでしょうか?

切って欲しい例
Methods: This study included.....

切って欲しくない例
HR: 1.05, 95%CI: 0.79 - 1.34

コロンの「数字に続く」や「followed by lowercase」のオン、オフ、グレイをあれこれやってみたのですが、うまくいきませんでした。
お暇な折にでも、ちょっと検討していただけると大変ありがたいです。

投稿: ks | 2009/10/30 4:21:53

ks さん

私もいろいろやってみましたが、結論から言うとこの設定は無理なようです。

私が試してみたのは、[終了規則]の[Colon]オプションではなく[続行規則]のラジオボタンを選択してコロンの設定を追加してみるという方法でしたが、そうすると「切って欲しい例」の場合にも切れてしまいます。やはり「コロンの後ろに数字が続く」という設定項目がない以上、後ろに続く文字種で区別させることができないんでしょうね。

もし、どなたか方法をご存じでしたら、ぜひご一報ください。

投稿: baldhatter | 2009/10/30 19:28:22

なるほど、無理そうですか。ご検討いただきどうもありがとうございました。
ところで、草津の温泉、なかなかいいところのようですね。機会があればぜひ行ってみたいです。

投稿: ks | 2009/10/31 5:04:32

> 草津の温泉、なかなかいいところのようですね

ええ。
私も初めて行くまでは、俗な温泉街だとしか思っていなかったのですが、温泉治療の伝統と観光地としての歴史は伊達ではないと思いました。

温泉の質もさることながら、場所の「空気」が良いんだと思います。

投稿: baldhatter | 2009/11/01 19:48:29

コメントを書く

## コメントは承認制なので、公開されるまでに時間のかかることがあります。



(必須ではありません)