« PCスキル - Wordの書式スタイルを引き継ぐ | トップページ | pptxのもっと困ったこと »

2012.10.13

pptxファイルをWord/TagEditorで処理するのは愚の骨頂


世の中の趨勢か、最近は原典ファイルがdoc、ppt(Office 2003までのファイル形式)ではなく、docx、pptx(Office 2007以降)で支給されることもだいぶ増えてきました。


このpptxファイルには、どうにも困らされます。単なる上書き翻訳で依頼されたのであれば、以前書いたようにSimplyTermsを使っていったん内容を抽出してからTrados処理すればいいのですが、最初からttxに変換された作業ファイルを渡されると、それを使うしかありません。

(SimplyTermsは、最近のバージョンでdocxやpptxにも対応するようになりました、念のため)


ところが、このファイルをTagEditorで開くと、あるいは私のように---もしかしたら私だけかもしれませんが---いったんWordに置き換えてから開くと、本文の随所がとんでもないことになります。


以下、なんの役にも立ちませんが、その話を書いてみました。

まず、PowerPointスライド上の状態を見てください。

1210131

なんでもないただのテキストボックス内の文字列です。この中で赤線を引いた "Set up for copy process" という1文を覚えておいてください。


このファイルをSimplyTermsでテキスト変換すると、こうなります。

1210136

670行目に、テキストボックスを示すタグがあり、672行目に問題の1文が見えています。


では、このファイルをTagEditorで開くとどうなるでしょうか。

1210134

なんだか、文中がタグだらけになっています。<cf>タグですから、フォント書式があちこちに出現したことになります。この画面はフォントが簡略表示モードなので、詳細表示モードに切り替えてみます。

1210135






萎えます

この状態で翻訳をしろと強制されたら、絶対断りますよね。そのための簡易表示モードなのですが、フォントがどう変わったかわからなくては困るので、簡易表示だけでは用が足りません。


これを、私流にWord上で開いているのが次の図です。

1210133

こんな状態ではとても翻訳できないので、以前書いたように(doc/docx ファイルを TagEidor で開くということ)、私はタグを一括削除してから翻訳にかかります。


それにしても、スライド上ではフォントが途中から変わっているようにはとても見えなかったのですが、いったい何が起きているのでしょうか。

以前のPowerPoint形式(ppt)ではここまでひどくなかったので、たぶんこれもpptxになったことが原因のようです。pptxの中身をみてみましょう。

※pptxは、拡張子を .zipに変えて解凍すれば、構成しているXMLファイルを見ることができます。docxも同様です。

12101310

いったいどんな仕様にするとこんなことになるのか、そこは皆目見当もつきませんが、問題の1文がタグによってバラバラになっているのがわかります。

元がこんなだから、ttx(これもXML形式です)に展開すると、上に見たようなグチャグチャな状態になるわけですね。

TagEditorというツールは、前にも書いたように最初っからとんでもなく出来の悪いソフトウェアでした。バージョンを重ねて少しずつマシになりましたが、PowerPointとかExcelにも対応しようとして、いろいろと無理を重ねてきたような気がします。

そこで、ものは試し、同じpptxをStudioアーキテクチャで開いてみました。使ったのは、最新版のStudio 2011 SP2です。

1210132

あらまあ、なんとスッキリ。


ってことは、やはりdocxとかpptx、つまりOffice 207以降のファイル形式は、SDLさんが推奨しているようにStudioで開いたほうがいいということなんでしょうね。

はからずも、Studioアーキテクチャの長所をひとつ発見する結果になりました。かと言って、横並びインターフェースで私が仕事をする気になるかどうかというと、それはまた別問題なわけですが......

04:11 午前 Trados 雑記 |

はてなブックマークに追加

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/13481/55877403

この記事へのトラックバック一覧です: pptxファイルをWord/TagEditorで処理するのは愚の骨頂:

コメント

ああ、PPTXの翻訳用のファイルがタグだらけになってること、SDLXでもよくあります。
しょうがないので、訳文もタグだらけにして返してます orz

投稿: nazma@五拾音 | 2012/10/13 12:15:20

ただ、よく考えたらこれは支援ツールの側が悪いというより、こんなバカバカしいタグが並ぶようなファイルを生成するOfficeの側が悪いんですよね。

たまに、Wordから生成されたHTMLファイルが来ることもありますが、その汚さには吐き気がします。

投稿: baldhatter | 2012/10/13 19:24:55

10回ぐらい首を縦に振ってしまいました!
1文がタグで細切れになっているのを見ると、すっかりやる気が無くなります。

最近は、可能な限りSimply Termsを活用させていただき、
可能な限りTagEditorは使わないようにしています。

この場で恐縮ですが、Studioのライセンストラブルでは、
本当にありがとうございました。結局、その後、SDLからは音沙汰ありません。サポートに入らないとだめなんでしょうね。

投稿: mako | 2012/10/18 11:48:21

makoさん、そうですよねー。

私も翻訳会社の人と話す機会があると、SimplyTermsを推すのですが、どうもイマイチわかっていただけませんね。

投稿: baldhatter | 2012/10/18 18:35:30

コメントを書く

## コメントは承認制なので、公開されるまでに時間のかかることがあります。



(必須ではありません)