« QA Checker 3.0 はそれなりに使える | トップページ | Open Exchange のセミナー »

2011.07.23

QA Checkerプロファイルを解析してみました

★★★
解析、というほど大げさなものではありませんけど.....前エントリで書いたように、QA Checker 3.0 でもいちばん活躍すると予想される機能が[単語リスト]と[正規表現]なのですが、リストの読み込み/書き込み機能がないためルール定義をいちいち入力しなければならず、そこがいちばんのネックでした。

ただ、QA Checkerの設定ぜんぶを XML ファイルとして書き出す/読み込む機能はあって、その中に[単語リスト]と[正規表現]のルールも書かれているので、必要な部分だけ編集すれば何とかなるだろうと前から思っていました。

以下、QA Checker 3.0 での説明になります。2.0 以前の場合、XML ファイルの構造やタグは違うかもしれませんが、基本的な手順は同じです。

QA Checker 3.0 のルール設定(プロファイル)は、sdlqasettings という拡張子で保存される XML ファイルです。XML って、いろんな情報をテキストで操作できのは便利なのですが、構造を把握するのに苦労することがあります。特に困るのは、改行がまったくなくて、論理行の 1 行でだらだらーと続いちゃってる場合。*.sdlqasettings もそんな作りです。

1107221

そこで、XML ファイルを解析して、要素ごとにツリー構造で表示してくれる XML エディタで開いてみます(Internet Explorer などでも表示できますが、あまり見やすくありません)。

[単語リスト]の定義に当たる部分:
1107222

[正規表現]の定義に当たる部分:

1107223

[単語リスト]のほうは、

<Setting Id="WrongWordPairs">
  <ArrayOfWrongWordDef...>
    <WrongWordDef>

      (個々の定義)
    </WrongWordDef>
  </ArrayOfWrongWordDef>
</Setting>

という構造で、個々の定義が

<_CorrectWord>;ユーザー</_CorrectWord>
<_WrongWord>ユーザ</_WrongWord>

というペアです。

[正規表現]はもう少し複雑になっていて、

<Setting Id="RegExRules">
  <ArrayOfRegExRule...>
    <RegExRule.>

      (個々の定義)
    </RegExRule.>
  </ArrayOfRegExRule>
</Setting>

という構造で、個々の定義は、

<_Description>長音が必要なカタカナ</_Description>
<_IgnoreCase>false</_IgnoreCase>
<_RegExSource></_RegExSource>
<_RegExTarget>アクセサ\b</_RegExTarget>
<_RuleCondition>TargetOnly</_RuleCondition>
<_SourceRX xmlns:d3p1="..."true" />
<_TargetRX xmlns:d3p1="..."true" />

のように、もともとの定義フィールドが多い分、情報が多くなっています。<_RegExSource>< の行は定義が空ですが、これは原文に対する正規表現を指定していないから(訳文のみチェック)で、原文にもルールを指定する場合には、ここにも情報が入ります。

このような構造さえわかれば、後はこれに必要な定義を当てはめたリストを作り、XML 構造を壊さないように注意して貼り付ければオッケー。

たとえば、プリミティブですがわかりやすい方法はこれ。

1107224

このように Excel 表に元の構造を貼り付けて、定義の列(この場合は C 列と F 列)に必要なルールを貼り付け、タグの行を下方向にコピーするという方法です。後は、これをテキストに貼ってタブと改行を削除すれば出来上がり。

この秋には Studio 2011 がリリースされることが決まりましたが、QA Checker はどのくらい進化するのでしょうか。

09:45 午前 Trados 機能バージョン - Studio 2009 |

はてなブックマークに追加

トラックバック


この記事へのトラックバック一覧です: QA Checkerプロファイルを解析してみました:

コメント

この記事へのコメントは終了しました。