« 2010年10月 | トップページ | 2010年12月 »

2010.11.30

翻訳前後の処理 - その3「訳文の生成」


だいぶ間が空いてしまいましたが、SDL Trados 2007 入門編シリーズの続きです。

翻訳がひととおり終わった後、バイリンガル状態のファイルから訳文だけのファイルを生成する、[ツール]→[訳文を生成]処理、いわゆるクリーンアップ処理について説明します。

ついでですが、「Word 上で翻訳したら原文が消えてしまった」という質問を、今でもときどき見かけるので、その話もしておこうと思います。

念のために、以下の内容は引き続き Word 2003 までを想定していますので、あしからず(ってか、たぶん Trados 2007 と Office 2007 あるいは 2010 の組み合わせについて、ここで語る機会は、おそらくない)。

Word 上でのバイリンガル状態について

最初は原文だけだった Word ファイルで、セグメントを開く → 翻訳する → セグメントを閉じるという操作を行うと、原文の部分(とセグメント単位を示す Trados タグ)には、隠し文字属性が設定されます。

Cleanup1

上の図は、隠し文字も表示する設定になっているので原文と訳文の両方が見えていますが、Word の設定が違うと、セグメントを閉じた瞬間に、「原文はどこへ行ったの?」と、三千里ほど探す旅に出ることになります。

Cleanup2

デフォルトのツールバーにこんなボタンがあれば、

Cleanup3

これを押す。なければ、Word の[ツール]→[オプション]→[表示]タブで、

Cleanup4

この 2 つのオプションをオンにします。ちなみに、上に挙げたツールバーボタンも、ときどき機能しなくなりますから、そんなときはこのオプションダイアログを使うしかありません。

なお、TagEditor では、こういう心配はありません。


訳文の生成(クリーンアップ)

で、こんな風にバイリンガル形式で翻訳されたファイルを、訳文だけに仕上げるプロセスが「訳文の生成」、通称「クリーンアップ」処理です。

IT 翻訳の場合には、バイリンガル形式のまま納品するようお客さんに指定される場合も少なくないのですが(先方でメモリーを作るため)、それでも自分自身が訳文だけを見て推敲する必要はありますから、このプロセスは知っておかねばなりません。

訳文の生成でまず絶対に理解しておく必要があるのは、Word ファイルの場合と TagEditor ファイル(ttx)の場合で動作が異なるという点です。具体的にいうと、


- Word の場合、作業ファイルが直接変換される
- TagEditor の場合、ttx はそのままで、オリジナルファイルが生成される

ということ。したがって、対象が Word ファイルの場合には、バックアップファイルが生成されるようにオプションを設定しておかないと、

バイリンガルファイルがどこにもなくなってしまう

というスリル満点の展開になります。

バックアップファイル生成のオプションについては、「Workbench の設定- [オプション]-[翻訳メモリ オプション]」の回で、「[ツール]タブ」のところをご覧ください。デフォルトではオンになっているはず。訳文の生成を実行すると、

Cleanup5

こんな風にバイリンガルファイルは拡張子を BAK に変えて保存されます。拡張子 rtf のほうが訳文だけになったファイルです。BAK を元の拡張子に戻せばいいのですが、最初のうちは万全を期して、バイリンガルファイルを別ディレクトリにコピーし、そちらをクリーンアップしたほうがいいかもしれません。

一方、TagEditor であればそういう心配はなく、オリジナルファイル(XML、HTML など)が生成され、ttx ファイルは無傷です。ただし、同じフォルダに原典オリジナルファイルが存在している場合には、それが上書きされて訳文ファイルになるので、その点は注意してください。

[訳文を生成]の実際のダイアログはこうなっています。

Cleanup6

[変更された翻訳]のラジオボタンオプションは、訳文の生成だけを目的とするのなら[更新しない]にしておきます。

[TMを更新]にすると、訳文を生成しながらメモリーを更新します。つまり、新規の原文-訳文ペアがあれば登録し、既訳から修正されたペアがあれば書き換えるのですが、このときの動作は別のオプションによってちょっとややこしい話になります。[文書を更新]にすると、逆にメモリーの内容をイキにして、それと異なっている文書のほうを書き換えます。そんな用途もあるにはあるのですが、よほどのことがなければ使いません。


訳文の生成で何が起きるか

訳文の生成でもうひとつ覚えておきたいのは、ターゲット言語が日本語の場合、セグメント間のスペースも削除されるということです。英語などのヨーロッパ言語の場合、ピリオドの後に最低 1 つのスペースがあり、バイリンガル状態ではそれがセグメント間のスペースとして残っています。

それを放置しておくと、日本語になったとき、句点(。)の後にぜんぶスペースが入ってしまいます。訳文の生成を実行すると、このスペースが削除されるというわけです。


マクロによる訳文の生成

ごくまれに、訳文の生成が実行できないことがあります。理由はよく判りません。そんなとき、Word マクロに用意されているコマンドを使うと訳文を生成できることがあります。

[ツール]→[マクロ]で、tw4winClean.Main というやつを選びます。ただし、この場合には上述したセグメント間のスペースは削除されないので注意が必要です。

08:49 午後 | | コメント (2) | トラックバック (0)

はてなブックマークに追加

2010.11.24

秀丸エディタ - あいまい検索 - UI 辞書の検索に

何度か書いているように、私は Trados の MultiTerm をあまり使いません。

Trados 5.5 まではそれでも多少使っていましたが(特に会社にいた頃は)、インターフェースが大きく変わってからは、入力フォーカスを Tab キーで移動できなかったりして、とことん私の好みではないからですが、それでもあいまい検索(複数形や、余分な文字があってもヒットする)などの機能があるので、便利な面もあるかもしれません。

今、「余分な文字」と書きましたが、その最たるものがニーモニック文字(アクセラレータキーの指定に使われる特殊文字。通常は &)。

&Apply

みたいな形であれば Apply を検索してもヒットしますが、

A&pply

こんな風に単語中に割り込んでいると、普通の検索ではヒットしません。クライアントさんや翻訳会社の担当者さんが親切なら、こういう不要情報は削除してからデータを支給してくれるのですが、どうもそうではないケースも珍しくありません。

私は、支給される辞書データがどんな形式でも(xls、xml、mdb など)、テキストにして 検索/grep することにしていますが、こういう不要な文字をよけたいとき、秀丸エディタなら「あいまい検索」を使用します。

101124hide1

検索ダイアログで[あいまい検索]を選ぶと、デフォルトですでにいろいろな項目が設定されていますが、ここでは[特定文字を無視する]に文字を指定します。

101124hide2

[特定文字を無視する]フィールドに指定するだけではなく、あいまい検索の定義ファイルを作っておけば、その下にある[カスタム1]以下で指定できます。

UI 辞書を検索するときであれば、アンパサンド(&)のほか、半角スペースとか s なども指定しておけば、原典でブレている UI をだいたい拾うことができるので、この辺のセットを、あいまい検索定義として保存しておくといいかもしれません。

と書いておきながら、実はアンパサンド(&)については検索時にいちいちこのように指定するのではなく、支給された時点で一括削除してしまいます。秀丸エディタや Perl の正規表現ならこんな風に指定して一括置換します。

訳文中のニーモニック指定箇所は "\(&[A-Z]\)" → ""
英文中のニーモニック指定箇所は "&([A-Za-z])" → "\1"

04:27 午後 関連ツール | | コメント (0) | トラックバック (0)

はてなブックマークに追加

秀丸エディタ - カスタムの拡張子セット

(オリジナル投稿 2010/7/15)★

続いての Tip は、秀丸エディタで grep を多用する人向け。

と言っても、これはいろいろな拡張子のファイルを使う場合に有効な小技なので、翻訳者のなかでも IT 系くらいしか用がないかもしれません。むしろ、扱うファイルの種類が多いプログラマーさん向きでしょうか。

秀丸エディタの grep ダイアログはこうなっています。

100715_hide_01

grep するときは対象ファイルを拡張子で指定するので、[検索するファイル]というフィールドがあります。拡張子は、単独でも(*.txt など)複数でも(*.java;*.h)指定できるほか、フィールドの右にある右向き矢印を使えば、システム標準の拡張子(セット)から選択することもできます。

ところが、この拡張子フィールドで保持される履歴は多くて 5~6 個くらいなので、日常的に grep するファイルの種類が多いと、以前 grep 対象にしたファイルの拡張子が履歴からなくなり、また手入力で指定しなければなりません。

※つまり、逆に言えば、日常的に grep するファイルの種類が *.html と *.txt 程度という使い方であればこれでも困らないので、今回の Tip はたいして意味を持たなくなります。

私の場合、常用している翻訳関連ツールの都合があり、また個人的な便宜や必要性もあって(前エントリで書いた色分け表示など)、テキストファイルに付けるカスタムの拡張子がけっこうあります。

*.ttx …… Trados TagEditor のバイリンガル XML ファイル
*.dic …… 用語集ファイル(カスタム)
*.lst …… チェックスクリプト用の用語リスト(カスタム)、などなど......

そうすると、grep 履歴が消えてしまうのはけっこう煩わしい。そこで、[その他]→[動作環境]→[ファイル]で、カスタムの拡張子セットを作ってしまいます。

100715_hide_02

[ファイルの種類の編集]を押すとこんなダイアログが開くので、

100715_hide_03

[追加]をクリックして、頻繁に使う拡張子をセミコロン区切りで指定します。上のダイアログで[AT標準]というのが、私の作成したカスタム拡張子セット。grep ダイアログで、拡張子フィールドの右にある右向き矢印から選べるようになります。

03:48 午後 関連ツール | | コメント (0) | トラックバック (0)

はてなブックマークに追加

秀丸エディタ - 画面の色分け

(オリジナル投稿 2010/7/14)★

こちら、私がよく使う秀丸エディタ画面のサンプルです。

100713_hide_01

※実際にはタブ表示していますが、ここではわかりやすいように独立ウィンドウにして重ねてあります。

デフォルトのエディタ画面にはもちろん色など付いていませんが、[その他]→[ファイルタイプ別の設定]→[デザイン]の機能を使うと、このようにファイルのバックグラウンドに色を付けることができます。

100713_hide_02

このダイアログで、いちばん上の[~の設定]ドロップダウンリストから対象のファイルタイプを選択し、[背景の色]で任意の色を選択したうえで、[リセット/統一]→[文字色/背景色の統一]を選択します。

しかも、ダイアログの名前が示しているように、このデザイン設定はファイルタイプごとに指定できるので、上のサンプルのようにファイルの用途別に色を付けておくと、視認性がたいへん良くなります(と私は思っている)。

ちなみに上のサンプルは、私の作業環境に合わせて、以下のように色分けしてあります。

クリーム色
案件ごとの翻訳仕様(スタイルガイド)の抜粋。後半は、Perl チェックスクリプト用の用語リストになっています。
*.lst という独自の拡張子を付けたファイルです。

薄いグリーン
案件ごとの用語集。こちらも、*.dic という独自の拡張子を付けています。

薄いグレー
こちらは普通の *.txt ファイルですが、真っ白は味気ないので、この色がデフォルト。

このほかにも私の作業環境では、*.html や *.xml などのタグ付きファイル、grep 結果ファイルなどを色分けしてあります。

--------------------
[ファイルタイプ別の設定]ダイアログでは、このような単純なデザインだけでなく、フォントサイズ、強調表示などいろいろと設定ができるので、使いこなせば、それなりに作業の効率化につながります。

03:46 午後 関連ツール | | コメント (0) | トラックバック (0)

はてなブックマークに追加

秀丸 - 常駐とクリップボード履歴

(オリジナル投稿 10/03/20)★

いわゆるクリップボード拡張ツール、つまりクリップボード履歴をとっておいて、直前より前のコピー内容もペーストできるようにするツールを、今まで何種類か試してみましたが、実は秀丸エディタにも常駐させておけば同様の機能があります。

[その他]→[常駐機能]で[秀丸エディタの常駐]をオンにし、[クリップボードの履歴を取る]もオンにします。

秀丸エディタを使っているときはもちろんですが、他のアプリケーションを使っているときにも有効です。他の拡張ツールもたいていは常駐タイプなわけで、だったら秀丸を常駐させておいてもメモリー負担は大差ない、ということで最近はもっぱらこの機能を使っています。

ただし --- いちばん書きたいのはここ ---、私の環境では、クリップボード履歴から文字列を取り出すと、その直後に ATOK が「日本語入力OFF」の状態(つまり英数直接入力)になってしまうことがあります。

調べてみたのですが、同じような症状の報告はまだ見つかっていません。サイトーさんちに報告すべきかどうか、まだ迷っているところです(ATOK を最新版に切り替えた後で気づいたし)。

03:43 午後 関連ツール | | コメント (0) | トラックバック (0)

はてなブックマークに追加

秀丸エディタ - デスクトップ保存

(オリジナル投稿 2009/5/27)★★

今までその機能があるのは知っていたけど使っていなかった、というのはよくあることですが。

今回は、定番中の定番である秀丸エディタの「デスクトップ保存」がそれ([ウィンドウ]メニューにあります)。地味な機能ですが、どうしてなかなか便利なのでした。

翻訳作業にエディタはもちろん欠かせませんが、私の場合、翻訳自体には他のアプリケーションを使っていることが多いので、秀丸のウィンドウはもっぱら検索を目的として常時開いているというのが普通です。

- スタイルガイドの要点をまとめたファイル
- 用語集
- TM のエクスポートテキスト
- 原典 HTML ファイルのうちの 1 ファイル

たとえばこんな感じで複数のウィンドウ(タブ)を開いておき、検索または grep を行います。「デスクトップ保存」の機能を使うと、この状態を記憶してくれるので、PC を終了または再起動した後で作業を再開するとき便利です。

さらに、複数ウィンドウ(タブ)でなく 1 ファイルしか開いていない場合でも役に立つことに気づきました。

私はときどきやってしまうのですが、1つのファイルを開いて grep する → 確認した grep 結果ウィンドウを閉じる → 勢い余って元のファイルも閉じてしまう → 次に grep するにはまたファイルを開かねばならない、ということがあるのですね。これも、1ファイルだけ開いた状態で「デスクトップ保存」しておけば解決です。

ところで、秀丸の標準ではこの機能で 1 種類のデスクトップしか保存/復元できません。マクロで何とかなりそうかな、と思っていたら、同じことを考えた方がすでにいらっしゃいました。

リンク: 秀まるおのホームページ(サイトー企画)-複数デスクトップ保存マクロ hmpro Ver.1.1.0

前回書いたようなテキストファイル群を複数セットで保存/復元できるので、複数のジョブが並行したときなどは、これを使うとさらに便利です。

03:41 午後 関連ツール | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2010.11.21

TagEditor - 検索/置換機能 - その2

★★
昨年の 9 月に、TagEditor の検索機能が少し向上したと書きました(TagEditor と Word の違い、訂正)が、実際に使ってみたことは、ほとんどありませんでした。

なんでかというと、ttx ファイルはテキストエディタで開いて検索したほうが早いからなんですが、たまたま発見があったので、一応ざっと確認しておくことにしました。

たまたま気づいたこと、っていうのがこれ。

Tageditorsearch2

タグの中身を検索できるようになった、というのはけっこうな進歩だと思っていたのですが、[大文字と小文字を区別する]のオプションがグレイアウトされているところに注目。このオプションは、先にオフにしておいても必ずオンになってしまいます。つまり、タグの内容を検索するときは

大/小文字を厳密に指定

しなきゃいけないということ。なんでこんな半端な実装になってるのか、想像もつきません。

それからもうひとつ、検索機能の向上としては「ワイルドカード」を使えるようになったということもあったわけですが、

Tageditorsearch3

たとえばこう指定したら、

Tageditorsearch5

こんな風に怒られてしまいました。せっかくのワイルドカードなのに

* を先頭では使えない

という、これまた実に中途半端な仕様。いったい、設計・実装した人の頭ん中はどうなってるんでしょう。

それから、検索のヘルプを見て知ったのですが、「特殊フィールドの検索」という機能が増えてました。これは特にオプションボタンはなく、

Tageditorsearch4

このように ^ を付けて指定するだけ。検索できる内容はこのようになってますが、

Tageditorsearchhelp

どう考えてもあまり使い途はないんですよね。

12:43 午後 Trados 機能 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2010.11.14

SDL Trados Studio の次期バージョン


現行バージョンの Studio 2009 については SP 3 が出たばかりですが、先日 Twitter で見かけた情報によれば、次期バージョンと思われる Studio 2011 がしっかり準備されている模様。

12 月には、その発表を含めたセミナーがあります。ただしこれは対象が「一般企業または翻訳会社の方」と書かれているのですが、どういうわけか申込欄には「フリーランサー」という選択肢もあったので、とりあえず申し込んでみました。詳しいことが判りしだい、こちらでご紹介したいと思います。

仮にこちらに参加できなくても、おそらく近いうちに個人翻訳者も対象にした同趣旨のセミナーが開かれることでしょう。

03:14 午後 Trados 全般 | | コメント (4) | トラックバック (0)

はてなブックマークに追加

2010.11.06

SDL OpenExchange Beta - なるほど、そう来たか


毎度おなじみの割引キャンペーンではなく、なかなか目新しい内容のメールが届きました。

リンク: SDL OpenExchange

SDL Trados Studio 向けの SDK を公開して、パートナーやユーザーコミュニティを囲い込もうということですね。これはなかなか有効な手かもしれません。

Trados Workbench + Word というインターフェースが標準だった頃は、Word マクロの形で独自機能を追加するベンダーやユーザーがけっこういました。Studio 環境ではその資産がぜんぶ使えなくなったわけで、API の公開を求める声はきっと大きかったのでしょう。

私もヒマがあればこの SDK、見てみたいところですが、当面は公開されるアプリケーションだけつまみ食いしてみることにします。

それにしても ...... SDL さんの日本語ページの翻訳ってよくわかんないなぁ。その話は side A に書きます。

08:21 午前 Trados 全般 | | コメント (0) | トラックバック (0)

はてなブックマークに追加