« 単語登録のコツ | トップページ | 翻訳後のチェック - Word の場合 - omiso.dot »

2010.06.27

Trados 使用時の辞書との連携

★★★
翻訳作業中の辞書検索をいかに省力化するかということも、効率化と品質向上、そして腱鞘炎予防に欠かせない大きなテーマです。おおまかに言うと 3 つの段階があって、

× …… 辞書(検索ソフト)の検索ウィンドウで綴りを手入力する
△ …… 原文の単語をコピーし、検索ウィンドウに貼り付けて検索する
○ …… 原文の単語を指定してキーを押すだけで検索できる

Workbench + Word を使っているときは、Word の VBA を使ってこの最終形を実現できます(翻訳フォーラムで Buckeye さんが紹介なさっています)。辞書検索だけでなく、Google 検索などにも応用できます。

ところが、Workbench + TagEditor という作業環境では、独自のマクロを組むことができませんし、API が公開されていないので独自のアドインを作成することもできず、このような連携ができません。

しかも、以前書いたように(禿頭帽子屋の独語妄言 side TRADOS: TagEditor と Word の違い - その2)、セグメント先頭の単語をコピーすると、非表示属性のセグメントタグ {0> まで取得されてしまうため、Jamming の検索ウィンドウに貼り付けると検索できない、という重大な問題点があります。

TagEditor と Jamming を併用している人って、きっと一定数いると思うんですが、みなさんこの不便を感じたことはないんでしょうか。Jamming の後継ツールである Logophile も、インストールはしてみましたが、辞書を移行できていない状況です。

しかたがないので、TagEditor → Jamming の間に秀丸エディタのマクロをかませてみることにしました。

翻訳作業中、私はほとんどの場合、テキスト形式の用語集ファイルを開いています。クライアントから支給される用語集は、たいてい Excel か MultiTerm 形式なのですが、すべてテキストファイルにし、かつ *.dic という任意の拡張子を付けています。特定の拡張子にしておくと、秀丸エディタ上でファイル形式別の設定(ウィンドウの背景色とか)を適用でき、また grep もしやすいからです。

で、翻訳時にはこの *.dic ファイルを grep するわけですが、grep ももちろん最小限の捜査で済むようにマクロ化してあります。そこで、この用語集ファイルを grep するとき、同時に Jamming にも検索語を渡して検索するようにしました(Buckeye さん作の秀丸マクロを借用し、語形変化に対応するルーチンをすべて削除)。

これで、{0> タグが邪魔になるのは、ひとまず回避できるようになりました。

01:27 午後 Trados Tips, 関連ツール |

はてなブックマークに追加

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/13481/48732825

この記事へのトラックバック一覧です: Trados 使用時の辞書との連携:

コメント

Trados2007を未だに使用しているのですが
ご存知でしたら教えて頂いてもよろしいでしょうか。

①翻訳メモリを一覧で表示することは可能でしょうか。
メモリがだいぶ溜まっているのですが、初期の頃のメモリを
チェックして必要なものは編集したいと考えています
(一覧表示さえ出来れば、後から編集はどうとでもなるので
 一覧表示の方法を知りたいです)

②翻訳メモリをPDICの辞書へ変換する方法はご存知ないでしょうか。
ちょっと調べたいときに毎回Tradosを起動するより
常時起動している(えいじろう辞書をインストールしてある)PDIC
1つで済めば、腱鞘炎もだいぶ軽減されるかと思いまして。。

お手数ですが、ご確認の程どうぞよろしくお願いします。

投稿: Teketeke | 2014/10/05 9:51:35

Teketekeさん、コメントありがとうございます。

> 翻訳メモリを一覧で表示することは可能でしょうか。

一覧というのはどういうイメージでしょうか。これまで使った複数のメモリーがあって、それをまとめて表示したいということでしょうか。もしそうであれば、Apsic Xbenchというツールがあります。

http://www.xbench.net/

最新版は有料ですが、少し前のバージョン2.9であれば無料でダウンロードでき、機能としてはこれで十分です。

http://www.xbench.net/index.php/download

↑このページの「ApSIC Xbench 2.9 - Build 474 (Non-Unicode, Freeware)」をダウンロードしてください。詳しく使い方はここでは説明できませんが、"Apsic Xbench"で日本語サイトを検索するといろいろヒットしますので参考になさってください。


> 翻訳メモリをPDICの辞書へ変換する方法はご存知ないでしょうか。

それ、おもしろいですね。私はやったことありませんが、できるはずですよ。メモリーをテキストファイルにエクスポートできるのはご存じですよね? ざっと言えば、こんな流れです。

1. Trados Workbenchからメモリーをテキストでエクスポートする

2. その中から原分と訳文だけのタブ区切りファイルを作る

3. PDic形式に変換して取り込む

これでできるはずです。

投稿: baldhatter | 2014/10/05 20:45:27

早速のご返答ありがとうございます!

> これまで使った複数のメモリーがあって、それをまとめて表示したいということでしょうか
はい、その通りです。Tradosにそういう機能は無いのですね。。
ご教示いただいたXbenchを試してみます!

> メモリーをテキストファイルにエクスポートできるのはご存じですよね?
うろ覚えですが、一度やった事があったので、おそらく分かります。

> 2. その中から原分と訳文だけのタブ区切りファイルを作る
ここが肝になりそうですね。秀丸のライセンスも購入しているので
そちらの正規表現での置換などでトライしてみようと・・・
あ、テキストで一度エクスポートしたことがあった際に
ファイルサイズが大きすぎて秀丸では開けなかったような気がするので
テキスト分割や他のエディタでもトライしてみます!

詳しくご回答いただき、ありがとうございました。
進展がありましたら、またコメントしたいと思います。

投稿: Teketeke | 2014/10/06 9:51:25

それから、もっと基本としては、新規のメモリーを1つ作成し、過去のメモリーをエクスポートして、すべて新規メモリーにインポートしてしまうという手もあります。ただ、あまり大きくなると扱いが難しくなりそうです。

> ファイルサイズが大きすぎて秀丸では開けなかったような気がする

秀丸エディタで開けるファイルサイズ(行数)は、設定で変更できるようになっています。デフォルトだと100万行くらいですが、最大1,000万行まで開けます(その規模のときどのくらい快適に動くかどうかは、マシンのメモリー次第です)。

前回のコメントをいただいてから、テキストメモリーをすべてタブ区切りの原文-訳文だけにする秀丸マクロも作ってみて、PDicにインポートしてみました。

TM内のフォント情報があると、それが邪魔で実用になりません。

それから、PDic上だとTM上のようにファジーな検索はできませんよね? PDicをメモリー検索ツールの代わりにするというのは有効なのかどうか、私自身は疑問です。

それであれば、上記Xbenchを使うか、もしくはエクスポートしたテキストメモリーをすべて1つのフォルダにまとめておいて、秀丸エディタのgrep機能を使うというのも現実的です。


投稿: baldhatter | 2014/10/06 12:54:10

実際にテキスト形式でメモリをエクスポートした所、秀丸で余裕で開けました。お騒がせしました><

またフォント情報についてはこちらのサイト内の以下ページの置換を参照したところ、上手く削除できました
  禿頭帽子屋の独語妄言 side TRADOS: 翻訳メモリーの中身の検索
  http://baldhatter.txt-nifty.com/trados/2012/03/post-9e92.html
  3. フォント情報の削除

>>テキストメモリーをすべてタブ区切りの原文-訳文だけにする秀丸マクロも作ってみて
素晴らしいですね。自分は原文-訳文以外の情報をひたすら置換で削除を試みたのですが、2時間くらいは使ってしまいました・・

上記で有る程度整形したテキスト(といってもまだ置換が足りていない所も散見される状態なのですが)をPDICの辞書として取り込んでPDICで使用してみたのですが
表示速度は速かったです。ので、簡単に調べたい時にはまぁ良いかな、程度です。
一応PDICでも曖昧検索は行える?のですが(インクリメンタルサーチ状態)、さすがにWorkBenchほど柔軟では有りませんでした。

ご教示いただいたXbenchはまだ試していないのですが、結局はテキスト形式などでWorkBench経由でメモリをエクスポートできたので
これだけでも1つ目の要望を満たせそうです。Xbenchはまた時間がある時に見てみようと考えています。

>> もっと基本としては、新規のメモリーを1つ作成し、過去のメモリーをエクスポートして、すべて新規メモリーにインポートしてしまうという手
すみません、こちらについて何を示してらっしゃったのか分かりませんでした。よろしければお聞かせ頂ければ幸いです。

投稿: Teketeke | 2014/10/08 0:01:40

Teketekeさん、すっから返信が遅くなりました。

>> もっと基本としては、新規のメモリーを1つ作成し、過去のメモリーをエクスポート

> こちらについて何を示してらっしゃったのか分かりませんでした。


たとえばメモリーA、B、Cの3つがあるとします。

まず、Aを開いてエクスポート、Bを開いてエクスポート、Cを開いてエクスポートというのプロセスを繰り返します。

次に、新規で空のメモリーを作成します。そこに、A、B、Cの3つをすべてインポートします。

もし、3つの間で重複するエントリがあったら、新規に追加する(99%の複数訳にる)か、後からのインポートで上書きするか、選ぶことができます。

こういう手順のことです。

投稿: | 2014/11/30 14:48:56

そういう事だったのですね。ご説明いただき、ありがとうございました。
PDIC用にメモリを綺麗に整形して辞書形式でインポートしたのですが
やはり仰ってたようにそこまで上手くHITしてくれませんでした。
ので、本当に参考程度に見る程度になってしまうので、それであれば
最初からWork Benchで検索したほうが良いのかな、と感じるこの頃です。
何にせよ、幾度もご回答くださり誠にありがとうございました!

投稿: Teketeke | 2014/12/16 22:54:26

Teketekeさん

ツールって、振り回されたりして苦労もしますが、四苦八苦して覚えていったほうが、きっと自分のスキルとして身につきますよね。そんな気がします。

投稿: baldhatter | 2014/12/17 17:43:28

コメントを書く

## コメントは承認制なので、公開されるまでに時間のかかることがあります。



(必須ではありません)