« 2012年10月 | トップページ | 2013年1月 »

2012.12.29

Wordマクロで訳文の生成

★★
前エントリで書いたようにクリーンアップがうまくいかないときの対処法のひとつに、Wordのマクロを使うという方法があります。


その前に、念のためですが前提を確認しておきます。それは、

「訳文の生成」(クリーンアップ)には、2つの意味がある

ということです。つまり、

(ア)バイリンガルファイルを訳文のみのファイルにする

(イ)オリジナルファイルを生成する

の2つです。

前エントリと同じく作業内容の分類を考えると、

1-A. WordファイルをWord上で翻訳する場合
1-B. WordファイルをTagEditorで翻訳する場合
2-A. 他形式のファイルを変換してWord上で翻訳する場合
2-B. 他形式のファイルをTagEditorで翻訳する場合

があるわけですが、

1-A. の場合は、(ア)=(イ)ということになります。

※バックアップを生成するように設定しておかないと危険です。

1-B. の場合、イコールではありませんが、(ア)と同時に(イ)も実行されます。つまり、ttxファイル(バイリンガル)をクーンアップすると、ttxはそのままで、元のWordファイル形式で訳文のみのファイルが生成されます。

2-A. の場合は、(ア)で訳文のみのWordファイルが生成されるだけで、(イ)は得られません。中間処理が必要になります。

2-B. は1-B. と基本的に同じです。

Wordのマクロで対処できるのは、1-A. の場合と、せいぜい1-B. の場合だけです。

マクロの操作は、Word 2003までと、Word 2007以降で違います。

【Word 2003の場合】

[ツール]→[マクロ]→[マクロ]を選択して、[マクロ]ダイアログを開きます。

1212281

tw4winClean.Mainを実行します。


【Word 2007以降の場合】

[開発]リボンで[マクロ]ボタンを押して、[マクロ]ダイアログを開きます。

同じく、tw4winClean.Mainを実行します。

[開発]リボンが表示されていない場合(たぶんデフォルトでは表示されていません)は、

[ファイル]→[オプション]→[リボンのユーザー設定]を開いて、[開発]を有効にする必要があります。

1212282


マクロと言っても、要するに、隠し文字を全部削除しているだけのこと、です。やろうと思えば、手作業の置換でもできるでしょう。

ただし、この場合は

原文でセンテンス間にあったスペースが、訳文だけになったときにもそのまま残ってしまう

ので、句点(。)の後の半角スペースを削除する必要があります。ご注意ください。

09:49 午後 Trados 機能 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

訳文を生成できないとき

★★
Tradosを使って無事に翻訳が終わり、さあ、訳文を生成して納品だぁ。ところがこの「訳文の生成」、別名クリーンアップの段階が困りもの。うまく生成できなくてあたふたした経験が、虎使いのみなさんなら一度や二度、たいていはもっと頻繁にあることと思います。

特に、Trados指定案件であれば生成できない旨を先方にも説明できますが、Trados指定ではなくこっちの任意でTradosを使っている場合、最終形式のファイルを納品できないとかなり辛いことになります。


今回は、そんなケースを紹介しておきます。環境は、SDL Trados 2007です。

あらかじめお断りしておきますが、解決方法はない場合のほうが多いようです。


訳文生成の前に、Tradosで扱うファイルの形式と、翻訳環境について整理しておきます。

1. オリジナルがWordファイル(doc、docx、rtf)で、

  1-A. Word上で翻訳する場合
  1-B. TagEditorで翻訳する場合

2. オリジナルは他形式(HTML、XML、PPT、EXCEL...)で、

  2-A. ファイルを変換してWord上で翻訳する場合
  2-B. TagEditorで翻訳する場合


この4つのいずれかによって、訳文生成できないトラブルの大きさも違ってきます。ただし、2-A. は最近あまり見かけないフローかもしれませんし、残っているとしても翻訳会社を介している場合がほとんどで、たいていはバイリンガル形式納品だろうと思うので、今回はちょっと無視しておきます。


1-A. WordファイルをWord上で翻訳した場合

docとrtfの場合、クリーンアップできないケースはほとんどありません。厄介なのはdocxです。XML形式、しかもMicrosoft独自のXML形式であり、ユーザーからは見えないところに記録されているいろいろな情報が邪魔をしている気配があります(詳しくはわかりません)。

しかも、試してみたところ、ふつうはクリーンアップできなければエラーメッセージが出るのですが、docxをクリーンアップできない場合には、エラーさえ出ず、ログ上でも

Cleanup finished successfully without errors!

となっています。

あいにく、SDL Trados 2007はdocxファイルを正式にはサポートしていないので、クリーンアップできなくてもSDLさんに文句を言うわけにはいきません。

【対処法】

幸い、オリジナルがWordなので、この場合は確実な対処方法があります。それは、

Wordマクロでクリーンアップ

を実行する方法です。これについては、次のエントリで書くことにします。


1-B. WordファイルをTagEditorで翻訳した場合

1-A. より厄介です。

前述したようにdocxはSDL Trados 2007のサポート対象外なので、そもそもTagEditorで開けないってことならわかるのですが、どうも翻訳はできてしまうらしい。そして、docxに戻るかどうかは、

やってみないとわからない

模様です。これは困ります。

【対処法】

メモリーはできているはずなので、オリジナルのWordにバッチ翻訳をかけて、後は1-A.と同じくマクロで対処するというところでしょうか。

1-A.の場合も1-B.の場合も、SDL Studio環境(2009または2011)に移植してしまうという手があるかもしれません。つもり、メモリーをStudio環境に変換し、StudioでWordファイルに翻訳をかけてみてクリーンアップを試みる、ということです。これなら、docx対応の環境のはずですから、きちんと生成されるはず。


2-B. 他形式のファイルをTagEditorで翻訳した場合

この話は基本的に、「side TRADOS: pptxのもっと困ったこと」で書いた内容と重複します。

PPTやEXCELのオリジナルファイルから生成したTTXを作業対象として支給された場合は、まずクリーンアップできないと思って間違いありません。TTXを生成した環境と、こちらの環境が違うからです。

ただ、この場合も「TTXを作業対象として支給された」時点で、こちらの責任は回避されるので、「クリーンアップはできませんでした」と報告してバイリンガルファイルを納品すれば済みます。

でも、PPTなんかは特に、仕上がりを確認せずに納品するのは気持ち悪くてしかたないですよね。

【対処法】

オリジナルファイルから、自分の環境でTTXを生成し、それにバッチ翻訳をかける

ことになります。これなら生成は可能(なはず)です。

このように、やはり訳文の生成でトラブルになることが多いのは、docx、pptx、xlsxなど、つまりOffice 2007以降の***xファイルなんですね。これらのファイルについては、SDL Studio環境を使うのが正統なので、SDL Studio 2007環境で ***x ファイルを使う場合は自己責任、ということになります。

翻訳環境にインストールされているOfficeのバージョンにも注意が必要です。

Office 2003までしかインストールされていない環境で、Office 2007以降の***xファイルを開くことは、当然ですが、できません。

2003用の互換パック(Word/Excel/PowerPoint 用 Microsoft Office 互換機能パック - Microsoft Download Center - Download Details)を追加すれば、開くことはできますが、***x形式のファイルを新しく作成することはできません。

したがって、Office 2003までしかインストールされていない環境で、SDL Studio 2007を使ってdocxを翻訳することはできますが、訳文の生成もできない道理です。

09:15 午後 Trados 機能 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2012.12.11

PCスキル - 文字コードをちょっと意識する

★★
こんな経験はありませんか?

原文PDFの文字列をコピーして、作業用ファイルで検索(あるいはその逆)しても、あるはずの文字列がヒットしない。

作業用ファイルの語句をコピーして、用語集で検索(あるいはその逆)しても、ヒットしない......。

あるいは、の違い? がわからない。


そんなときは、疑惑の文字列をテキストエディタに貼って、

文字コード

を確認してみると、疑問が解決することがあります。深く追究しようとするとけっこう大変なことになりますが、翻訳者に限らず、PC上で文字を扱う方は、文字コードというものをちょっとだけ意識しておいたほうがいいと思います。

たとえば、

1212111_3

これは、原典PDFと作業用ファイル(このときはdocでした)から、同じ部分を抜き出して秀丸エディタ上に貼り付けたところです。わかりにくいかもしれませんが、単語間のスペース---赤丸を付けたところ---がちょっと違います。上のほうは何もなく、下のほうは点線の記号で表されています。

上のほうが普通のスペースで、下のほうが何か変な記号に化けている、のではなく、秀丸エディタの場合は点線の記号で表されるほうが普通のスペースです。このあたりはアプリケーションによって表示が違うので、たとえばMS Wordの場合は、

1212117

このように、上のほうは温度記号みたいな小さい○になり、下のほうは薄い中黒みたいな記号で表されています。

表示の差はあれ、何か

文字として別物

らしいことは想像できるかと思います。文字コードという概念が頭にあると、こんなふうに紛らわしい文字の識別も簡単です。

秀丸エディタでは、文字の左側にカーソルを置いて文字コードを調べることができます。ただし、コマンドが表のメニューにはなくて、[その他]→[コマンド一覧]を選択し、表示されるダイアログから[その他]→[文字コード表示]を選択してみてください(私は頻繁に使うのでショートカットを割り当ててあります)。

上のほうの何もないスペースは、文字コードがこう表示されます。

1212113_2

一方、点線記号で表示されたスペースはこうです。

1212114_2

このダイアログに見えているShift-JISとかUnicodeとか、見たことがあるかもしれません。テキストファイルを保存するときも、この文字コードの指定が影響する場合があります。たとえばShift-JISで保存するとき、上の「何もないスペース」は文字化けしてしまいます(Shift-JISの文字コードには、該当する文字がないため)。

別の例を見てみましょう。

1212112

これは見た目も違いますね。ハイフン/ダッシュ/マイナス記号のあたりは似たような文字がいろいろあるので要注意。これも文字コードを表示してみます。

1212115_2

1212116_2

ふつうにキーボードから入力できるハイフン(半角)は下のほうで、上のやつは全角分をとるダッシュです。

冒頭に書いた

も、1つ目はカタカナ、2つ目はひらがなですが、同じように文字コードを見てみれば違うことがわかります。

09:56 午後 翻訳者のPCスキル | | コメント (1) | トラックバック (0)

はてなブックマークに追加