« 2010年9月 | トップページ | 2010年11月 »

2010.10.28

Workbench の設定- [オプション]-[翻訳メモリ オプション]


SDL Trados 2007 の基本的な設定機能については、1年くらい前にいくつかエントリを書いたまま時間が経ってしまいました。今回は、ふだんの Trados 操作でいちばんよく使うオプション設定画面について説明します。

[オプション]-[翻訳メモリ オプション]

です。

ところで、SDL 社はもう Studio 2009 にかかりっきりですから、2007 がアップデートされることももうないと思うのですが、このオプション設定はグローバル、つまり開いているメモリーにかかわらず Workbench 共通で適用されてしまいます。機能から考えて、これはメモリーごとに適用すべきでした。

[翻訳メモリ オプション]ダイアログ

[全般]タブ

Tradoswbmemoption1

[一致精度最小値]
このオプションで指定したマッチ率以上の既訳が Workbench に表示されます。つまり、メモリーにある既訳のうち、どの程度を再利用したいかという設定。デフォルトは 70% ですが、実用的には 50% くらいまで下げておくと再利用できる範囲が広がります(もちろんゴミの表示も増えます)。最小は 30% で、実際にはこのくらいでも再利用できる場合がある一方、70% を超えていてもあまり使えないケースがあったりします。その辺のことは、たぶんユーザーならよくご存じでしょう。

それから、あまり知られていないことですが、[一致精度最小値]はワードカウントのログにも影響します。

Tradoswbmemoption2
これがデフォルトの 70% のとき。

Tradoswbmemoption3_2
これが最小の 30% まで下げたとき。

このサンプルではたった 3 ワードの差ですが、「不一致」と「50% - 74%」に差が出ています。つまり、[一致精度最小値]が 70% のときはこの 3 ワードが「一致なし」とカウントされたが、[一致精度最小値]を 30% に下げると、同じ 3 ワードについて「50% - 74%」レンジの既訳が見つかったとカウントされたわけです。Trados 翻訳の場合、マッチ率ごとのワードカウントが料金に直結することは多いはずなので、このことはもっと知られているべきでしょう。

[一致精度最小値]以外はだいたいデフォルトのままで大丈夫。[タグの後ろに空白を挿入]はデフォルトでオン/オフどちらだったか忘れましたが、オフにすべきです。


[ペナルティ]タブ

Tradoswbmemoption4

上の図がデフォルトのペナルティ設定ですが、実際の運用現場では、たとえば上から 0、0、2、0、0、1 程度に設定することも多いようです。

[原文のタグが異なるときはペナルティを課す]はデフォルトでオフですが、実際にはオンにするのが常識です。なぜなら、Trados には既訳と異なるタグを自動的に置換する機能があるのですが、多くの場合これが

まったくアテにならない

からです。このオプションをオフにして、つまり Trados によるタグの自動置換に任せておいたら、目も当てられないことになります(TagEditor 上で警告が出るので大丈夫、と SDL では考えているのでしょうけど)。

さて、このオプションの適用がグローバルなのは重要な欠陥だったと私は考えています。ペナルティの使い方はメモリーによって(機械翻訳を含むか、Win Align の結果を含むか、など)、あるいは翻訳会社の運用方法によって違っていることが多いからです。メモリーごとに設定できるようになっていないので、プロジェクトが変わるごとに設定を確認/変更しなければなりません。


[地域に関する情報]タブ

Tradoswbmemoption5

通常はデフォルトのまま、つまりすべてオンにしておきます。数字や単位が自動置換されます。ただし、この置換機能も完璧ではないのでオフにするよう指定する会社もあるようです。


[訳語検索]タブ

Tradoswbmemoption6

今までにも何度か書いている、あまり使いものにならないことも多い「訳語検索」(Concordance 検索)機能に関するオプションです。ここにも[一致精度最小値]という指定がありますが、計算方法はメモリーのときと同じではないようです。どんな計算になるのか、実はよく判っていません(言及してる資料も見たことがありません)。

[参照 ( 読み取り専用) 翻訳メモリ]
というのは、まだ複数のメモリーを同時に開くことができない 2007 までのメモリーアーキテクチャ上では苦肉の策とも言える機能です。訳語検索のとき、開いているメモリーのほかにひとつだけ、別のメモリーも検索することができます。

この設定もグローバルなので、一度設定すると変更するまで有効なままです。別のプロジェクトに移ったとき、以前のプロジェクトで検索していた別メモリーを引き続き検索してしまうので注意が必要。


[ツール]タブ

Tradoswbmemoption7

基本的にデフォルトのままで大丈夫ですが、[バックアップ コピーを保存]だけは必ずオンになっていることを確認してください。

Trados のバッチ処理、つまり[ツール]→[翻訳]で訳文を埋め込んだり、[ツール]→[訳文を生成]でターゲット言語だけのファイルを生成するとき、Word ファイルの場合にはオリジナルが上書き更新されます。つまり、[バックアップ コピーを保存]オプションをオンにしておかないと、バイリンガルファイルがなくなってしまうということです。[バックアップ コピーを保存]オプションをオンにしておけば、オリジナルが *.BAK というファイルで確保されます。

[ツール]タブではもうひとつ、[タグ設定ファイル]という重要な機能もあるのですが、こちらはややこしいので、別の機会に説明します。


[自動翻訳(Beta)]タブ
このタブについては、少し前のエントリ(自動翻訳(Beta)- SDL Trados 2007のオプション機能)を参照してください。

12:45 午後 Trados 機能 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2010.10.27

Studio 2009 - 自動翻訳の実力


少し前に、Studio 2009 で自動翻訳が使えるように設定してみました(Studio 2009 の自動翻訳 - これでいいのかな)。

そこで、Trados で使える翻訳エンジンの現時点の実力を見てみることにしました。

以下の各スクリーンショットは、Studio 2009 の翻訳メモリー参照ウィンドウ。ツールバーのすぐ下が原文、左右ならびの左側も同じ原文(注)、右側が訳文です。また、

1番として提示されているのが Language Weaver の訳文
2番として提示されているのが Google の訳文

となっており、残念ながら自前であるはずの SDL.com の翻訳結果は、アクセスエラーとなってしまって表示されません。警告マーク付きで「翻訳注に問題が発生しました」と表示されているのはそのためです(この状態が、ここ最近ずっと発生しているようです)。

注:今回は、ツールバー直下と左側の原文が同じですが、機械翻訳ではなく通常のメモリーを参照する場合には、ツールバー直下が翻訳対象の原文、左側がメモリーで見つかった既存ペアの原文になります。

Tra2009_at00
(クリックで拡大、以下同)

"global database"を「世界的な~」ではなく「グローバル~」と処理できているところが、Google で採用されている「統計ベース」の実力という気がします。受動態を含む単文ですが、Language Weaver の出力はだいぶ見劣りします。

※統計ベースの機械翻訳については、たとえばこちらをどうぞ。
リンク: 統計ベースの機械翻訳: Buckeye the Translator
(偶々ですが、"統計ベース"でググったらトップでヒットしました)


Tra2009_at01

if 節の入った複文。Language Weaver と Google でさらに差がつきました。これなら、ポストエディット(機械翻訳された訳文を人間が編集する作業)の手間も最小限 --- 「あなたの」を削除、Advanced Installation を UI として処理する --- で済むレベルでしょう。


Tra2009_at02

単文ですが、to 不定詞以下に当たる句が 4 つ並列になっています。一見するとどちらも日本語になっていませんが、よく見ると Google のほうはその並列関係が正しく理解されています。この精度はかなりのものと言えます。


Tra2009_at03

これもいいサンプルでした。動名詞が主語になり、関係代名詞も登場しています。主述の関係はさすがに乱れていますが、やはり関係代名詞の処理で Google が勝っています。


Tra2009_at04

かなり単純な文。Google はほぼ完璧です。


Tra2009_at05

今回のサンプリングの中では珍しく、Language Weaver が勝っていた例です。after 節はこの後でもう1つ出てきます。


Tra2009_at06

今回比較した中で、Google 翻訳の驚くべき水準が最もよく表われている例かもしれません。only までの句の処理も優秀ですし、specify の目的語が正しく並列として処理されていて、実はこれはスゴイことなのです。


Tra2009_at08

前の例と似た句が含まれていますが、permissions の後の前置詞 on を修正する程度で実用レベルになるでしょう。


Tra2009_at09

いわゆる無生物主語の構文です。人間による翻訳であれば、prevent をこのように訳してしまったらたいてい失格ということになりますが、機械翻訳の場合、この程度なら許容される方向に

要求水準自体が変わってくる

可能性が高いようです。機械翻訳の技術的な進歩より、このような翻訳体系の変質のほうがはるかにコワいと私は思っています。


Tra2009_at10

やはり、Google くんはどうも after 節の処理が苦手なようです。が、これが正しく処理されるようになるのも、統計ベースの進化を考えれば時間の問題でしょう。


Tra2009_at12

これは、統計ベースが裏目に出てしまったのかもしれません。なにしろ、こういう主語を「~では」って訳すのって、IT 翻訳ではおなじみですよね(私は悪癖だと思っています)。


Tra2009_at13

最後は、おそらくたいていのローカライズ翻訳でこのまんま通用するだろうというサンプルです。「代名詞 they を訳さない」というレベルがちゃんとクリアされています。

以上、使った例文は、昨年の翻訳フォーラムで使ったドキュメントのままなのですが、偶然ながらけっこう典型的なサンプルが集まったように思います。

機械翻訳のレベルは、今やここまできています。

Trados とは別の機械翻訳システムでポストエディットにも触れた経験のある私自身、正直言って今回のこの結果にはかなり驚いています。

純粋なマニュアルやヘルプの翻訳マーケットは --- 難易度にもよりますが、おそらくは中程度くらいまで含めて --- 数年前の予想よりはるかに急激に縮小してしまうかもしれません。

このような現状を考えると、今年の JTF 翻訳祭、特に「支援ツール分科会」は、特に IT 翻訳者にとって必見かもしれません(手前味噌ですけど)。

統計ベースの機械翻訳については、D-3 セッションで聴くことができます。

機械翻訳を実地に利用したい場合には、D-4 セッション

ポストエディットに興味のある方には D-5 セッションがありますし、こうした現状で翻訳者が生きる道を模索するなら、C-5 セッションがお奨めです。

02:44 午前 Trados 機能, バージョン - Studio 2009 | | コメント (4) | トラックバック (0)

はてなブックマークに追加

2010.10.21

JTF翻訳祭2010のバナーを貼りました

先週ご案内したように、日本翻訳連盟の翻訳祭が 12/13(月)に開催されます。

拙ブログの右カラムにも、案内ページへのリンクを貼っておきました。よろしければ、ぜひご覧になってください。

08:11 午後 その他 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

Lionbridge - Translation Workspace - インストール時のメモ


MLV の大手 Lionbridge(ライオンブリッジ)には、今までも Logoport という独自の翻訳支援ツールがありました。ただし、これは一般公開されず、同社のお仕事を(間接的にでも)請け負っている翻訳者が使用するという、いわば内輪のツールでした(この手の、社内ツールを非公開で運用しているところはけっこう多い)。

この Logoport を、SaaS の形で一般公開したのが Translation Workspace です。

リンク: 翻訳メモリ管理 | Lionbridge の Translation Workspace™

1か月間は試用できますが、その後は個人使用のミニマムでも「5,000wds 当たり 10 ドル/月」の課金になります。クラウドコンピューティングベースなので、Web 上に確保される専用の「ワークスペース」にメモリーを保持して利用します。もちろん、1つのワークスペースやメモリーを複数の作業者が共有できます。

実際の翻訳作業には、Word アドインと、XLIFF エディタという 2 つのクライアントを使います。

101021_tw_1
こちらが Word アドインのツールバー。

101021_tw_2
こちらが XLIFF エディタ。嬉しいことに原文-訳文が縦並びです。

Web 上のメモリーにアクセスするという点を除けば、クライアント上での操作体系は Trados に似ています。

ところが、これをインストールするとき dll ファイルに関するトラブルがあり、その情報がどこにも見当たらなかったので、こちらにメモを残しておこうと思います。日本語の情報としてはたぶん一番乗り :)


手順としては、Lionbridge の GeoWorks サイト(https://www.geoworkz.com/)にアクセスし、ユーザー登録してからクライアントをダウンロードすることになります。ダウンロードするインストーラは

TranslationWorkspace.exe
TranslationWorkspaceXliffEditor.exe

の 2 つですが、インストールでトラブルが発生したのは前者、つまり Word アドインのほうです。

インストール自体は正常に終わりますが、デフォルトのインストール先が、なぜかヘルプの記述とは異なります。

101021_tw_3

ヘルプでは、このように Prgram Files 以下にインストールされることになっていますが、実際のインストーラでは、

101021_tw_4

このようにユーザープロファイルの Documents and Settings 以下にインストールされてしまいます。今回のトラブルに直接の関係はありませんでしたが、気持ち悪いので、いちおうヘルプのように Program Files 以下に変更しておきます。インストール後、システムの再起動は要求されませんでした。

で、Word を起動してみると、こんな VBA エラーが出ます。logoport.dll がない、って。

101021_tw_5

探してみると、こいつのことのようです。インストールディレクトリにあります。

101021_tw_6_2

あまり深く考えずに、この logoport.dll を Windows\system32 フォルダにコピーしてみると、ちゃんと動作するようになりました。

でも実は、インストール後にシステムの再起動は要求されませんが、どうもちゃんと再起動すれば、この DLL がインストールディレクトリにあるままでも正しく認識されるみたいです。

02:48 午後 関連ツール | | コメント (2) | トラックバック (0)

はてなブックマークに追加

2010.10.19

Word で翻訳単位が壊れたときの対処法


以前のエントリ(Word についてほとんど書かれないこと)でも、Microsoft Word を翻訳エディタとして使用するとき、その動作は

マクロで組まれている

と書きました。

最近は、ようやく少しずつ Studio 2009 案件も動き始めたようであり、2007 で Word ファイルを扱う場合でも TagEditor で開くことが増えてきましたから、Word + Workbench という作業スタイルは減ってくると思われますが、まだまだ Word 上で Trados 翻訳という機会はなくならないので、やはり

Word 上で翻訳中に、セグメントが壊れたらどうするか

ということは書いておいたほうがよさそうです。

ちなみに、[編集]メニューで[元に戻す]と[やり直し]を見てみると、Trados 操作に伴う処理の履歴を探ってみることができます。セグメントを開閉するだけでも、「ブックマークの編集」のほか、複数のVBA処理によって文字列のコピーや貼り付けが実行されています。

「セグメントが壊れる」というのは、このステップにどこかで狂いが生じ、その時点からマクロを正しく実行できなくなってしまう状態です。そうなると、[登録]はもちろん、セグメントを[閉じる]ことさえできなくなり、Trados 初級の方などが途方に暮れてしまいます。

1. [文書の修正]コマンド

いちばんオーソドックスなのは、Word のメニューバーから[Trados]→[文書の修正]コマンドを選択する方法です。運がよい、つまり破損が軽症の場合には、これで正常に戻ります。閉じなくなった後で、慌てていろいろなコマンドを試してしまうと、さらに別のマクロが実行され、[文書の修正]が成功する可能性が低くなるようです。異常が起きたら、すぐこのコマンドを使うほうが早道かもしれません。

★ここで重要な注意がひとつあります。★

セグメント、つまり原文-訳文のペアが出来上がったとき、原文には隠し文字属性が設定されています。[文書の修正]コマンドを実行すると、

原文の隠し文字属性が外れてしまう

ということです。したがって、[文書の修正]を実行したときは、必ずそのセグメントを「もう一度開いて閉じる」必要があります。


2. [元に戻す](Undo)コマンド

Ctrl+Z で、正しい状態まで自力で戻ります。とは言っても、この「正しい状態」を見きわめるのがかなり困難。たとえば、

101019_trados_corrupt1

あるいは

101019_trados_corrupt2

こんな風に編集記号が見えていればもちろん NG ですが、見かけだけでは判断できません。

いちばんわかりやすいのは、自分が訳文を入力していた途中の段階まで戻ることでしょう。文字列の入力途中であれば、セグメント処理のうえでは正常な状態、と言えるので、そこからなら復帰は容易だろうと思います。


3. Trados セグメントタグが壊れたとき

セグメントの開始と終了、マッチ率を表すタグ {0> <}100{> <0} というタグは、通常プロテクトされていますが、これもあっさり壊れたりします(参照:タグプロテクションの落とし穴)。

この場合、壊した操作に覚えがあるなら、Ctrl+Z でうまくいくかもしれません。

そうでない場合には、付近にある正常なセグメントからセグメントタグを手作業でコピペするしかありません。きわめて原始的ですが、有効ではあります。このときは当然、[タグプロテクションの切り替え]で、プロテクトを一時的に解除する必要があります。

なんでこんなエントリを書いたかと言うと、自分の環境で、最近ときどき予期しないセグメント破損が起きているからです。

[後続の完全一致を翻訳]コマンド --- かつての社内では「グルグル」ボタンと呼んでいました --- で既訳を取り込んでいくと、ときどき上のスクリーンショットのように、編集記号が残った半端な状態になります。比較的最近になって発生するようになった症状ですが、もちろん原因は不明です。

この症状の場合、Ctrl+Z を 1 回使うだけで正常に戻ります。


10:02 午後 Trados 機能 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2010.10.17

ATOKの使いこなし - 単語登録など


続いて、単語登録と、それに関連するお話です。

単語登録 - [Ctrl]+[F7]

単語登録するときは、登録したい語句を反転選択した状態で[Ctrl]+[F7]のショートカットが使える、というのは、まあ常識ですね。登録のとき、「名詞サ変」とか「名詞形動」とかの[品詞]設定はけっこう重要です。


[辞書メンテナンス]→[辞書ユーティリティ]

[辞書ユーティリティ]を開いてみると判りますが、実は ATOK では、ユーザーが明示的に単語登録しなくても、「学習」の機能によって驚くほどたくさんの語句が登録されていて、これが「自動登録単語」としてリストされます。

別のマシンにユーザー辞書を移動/コピーするときなどは、この[辞書ユーティリティ]で[ツール]→[単語・用例の一覧出力]機能を使いますが、

101017_atok6

デフォルトのままでは、この「自動登録単語」まで含めて出力されてしまいます。「自動登録単語」のほとんどはあまり有用ではないと思うので、ユーザー辞書をエクスポートするときは、このチェックを外しましょう。


[Ctrl]+[Delete]

で、学習機能によって自動登録された単語が、変換のたびに候補に出てきて邪魔なこともあります。そんなときは、変換キーを押してその不要な候補が表示された時点で[Ctrl]+[Delete] を押してみてください。

101017_atok7_2

こんな風に削除することができます。

08:55 午後 関連ツール | | コメント (0) | トラックバック (0)

はてなブックマークに追加

ATOKの使いこなし - 辞書/辞典の追加


【10/22加筆修正しました】

10/5 に、side A で ATOK の話を少し書きました(side A: # ATOK と英字入力)。あちらはただの雑談でしたので、もう少し実用的な話をこちらにまとめてみます。

まずは、辞書や電子辞典の追加に関するお話......なのですが、ATOK で使われる辞書/辞典やそれに類するデータには 4 種類もあるので、以下の話に使う用語を整理しておきます。


- 漢字変換辞書
漢字変換に使われる、単なる「読み-単語」の対応データです。用法上の注意などが表示されることもありますが、語義や用例は含まれません。これを増やすと、たとえば「こばやしたきじ」→「小林多喜二」と一発で変換できるようになります。後続の 1. で説明します。


-連想変換辞書
「連想変換」とは、類義語や言い換え表現などを変換候補として表示するという、いわば通常の漢字変換の拡張機能です。たとえば、「うてん」と入力して連想変換のキーを押すと、「降雨」とか「お湿り」のような類語を一覧できます。データとしては、類語の説明が載っている場合もあるので、次に上げる「電子辞典」の性質も帯びてきます。後続の 2. で説明します。


- 電子辞典
いわゆる電子辞書、つまり『広辞苑』とか『ロングマン』のような辞書の電子版を ATOK に組み込んで使うという形態。当然ながら、語義や解説などが表示されます。たとえば「さかもとりょうま」と入力すると、漢字変換とは別に、電子辞典の解説が変換候補ウィンドウの横に表示されます。後続の 3. で説明します。


- 省入力データ
何文字か入力すると後に続く候補が表示されるという「省入力」機能のためのデータです。「辞書」のカテゴリとはちょっと違うのですが、ATOK で漢字変換に利用されるので、ここにまとめます。たとえば、「こうきょうし」まで入力して[Tab]キーを押すと、「公共職業安定所」とか「交響詩篇エウレカセブン」が出てきます。後続の 4. で説明します。

1. [プロパティ(環境設定)]→[辞書・学習]タブ

Buckeye さんがご紹介なさっていた「共同通信社 記者ハンドブック辞書」を私も入れてみました(今まで書籍しか持ってなかったし)。

ATOK でオプションの辞書を追加するときは、追加する辞書セットを指定できます。私は「記者ハンドブック辞書」を[標準辞書セット]に追加しましたが、こうすると通常の変換操作(スペースバー)で、追加した辞書も参照されます。

101017_atok_1

通常の変換操作でハンドブックの候補や注意書きがいつも表示されてしまうのが煩わしい、という場合には、辞書を追加する「辞書セット」を変更すれば、[F2]など別のキーで呼び出すようにできます。

たとえば、私の環境には以下のような辞書セットが入っています。

101017_atok_2
[F2]で変換する、人名関係の辞書セット。「トレンド辞書」というのは ATOK で公開されている無料(登録ユーザーであれば)のオプション辞書ですが、私の知らない芸能関係の名前とかぽんぽん出てきます。

101017_atok_3
こちらは[オプション辞書セット]。「はてなキーワード変換辞書」は、予想以上に役に立ちます(こちら無料のオプション辞書)。


2. [プロパティ(環境設定)]→[入力・変換]タブ →[連想変換]

「連想変換」に使う辞書はここで設定します。

101017_atok_4

上のスクリーンショットに並んでいる「連想変換辞書」のうち、下の 4 つはたぶん ATOK 標準ですが、いちばん上の「角川類語新辞典」だけは有料オプションで追加したものです。
リンク: 角川類語新辞典 for ATOK

別途、類語辞典ももちろん使っていますが、訳語に困るときなどにはこの機能もけっこう重宝しています。


3. [プロパティ(環境設定)]→[電子辞典検索]タブ

ジャストシステムからは、『明鏡国語辞典』とか、『ジーニアス英和/和英』、『広辞苑』とか、それなりのラインアップがオプションとして販売されているのですが、私は ATOK 上で辞書をひくことはほとんどありません。

101017_atok_5

よって、標準以外に追加されているのは、「はてなキーワード電子辞典」だけ。これも、「はてなキーワード変換辞書」と同様、けっこう役に立ちます。


4. [プロパティ(環境設定)]→[入力・変換]タブ →[省入力データ]

101017_atok8

私の場合、IT 文脈に出てくる単語はほとんど自前で単語登録していますが、それ以外は、この機能をうまく使うと文字通りキーボード入力の省力化を図ることができます。「コンピューター・インターネット用語データ」、「経済・ビジネス用語データ」、「はてなキーワード省入力データ」など、実用から趣味までけっこうな量のデータがジャストシステムで公開されていて、製品登録したユーザーは無料で使えます。

08:10 午後 関連ツール | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2010.10.16

Studio 2009 の自動翻訳 - これでいいのかな

★★
前々エントリ、前エントリと立て続けにアップしてから、もう一度 Studio 2009 の自動翻訳について調べてみました。

SDL のサイトにこんなページがあって、不出来なヘルプより、こちらのほうが役に立つようです。
リンク: ビデオチュートリアル - SDL Trados Studio 2009

前々エントリで、こう書いたばかりです。

さて、自動翻訳を実際に使ってみるには、[ファイル]→[サーバー]で機械翻訳のサーバーに接続しなければならないのですが、

だって、ヘルプにこう書いてあったんだもん。

自動翻訳を使用するには、自動翻訳サーバーを追加してから、そのサーバーに接続する必要があります。

でも、これはウソでした。日本語版ヘルプを信じた私が間違っていました。

自動翻訳のサーバーを追加するには、[プロジェクトの設定]→[翻訳メモリと自動翻訳]を使います。つまり、ローカルのメモリーやサーバー上の共有メモリーを追加するときと同じように、SDL/Google/Language Weaverのサーバーを指定できるのでした。

Tra2009101016autotransdlg4

そこで、現在選択できる 3 つの機械翻訳エンジンをさっそく試してみることにしました。

まずは、いちばん見てみたかった Language Weaver のサーバー(ただし、ダイアログのオプションから察すると正式版ではなく、SDL Trados Studio ユーザー用に用意された先行お試し版のようです)。

Tra2009101016autotransdlg5lw

ダイアログに2つの訳文候補が表示されています。マッチ率が「91%」になっているのがローカルのメモリーでヒットした既訳、「AT」となっているのが、Language Weaver のエンジンから取得された訳文です。

次は、Google 翻訳。

Tra2009101016autotransdlg5ggl

まあ、五十歩百歩といったところですね。

で、自前の SDL サーバーなんですが、こちらを指定するとプロトコルエラーとなって結果が返ってきません。原因は不明です。

【2010/11/14 追記】
その後、SDL の方にこの件を確認する機会がありました。[SDL 自動翻訳]のオプションは、日本語に対応していないそうです。そのため、私がやったこのサンプルのように「英語-日本語」を指定していると、エラーになってしまうと。

09:21 午後 Trados 機能, バージョン - Studio 2009 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

自動翻訳(Beta)- SDL Trados 2007のオプション機能

★★
Studio 2009 では自動翻訳(機械翻訳)を試すことができない、と前エントリで書きましたが、SDL Trados 2007 であれば試してみることができます。

[オプション]→[翻訳メモリ オプション]→[自動翻訳(Beta)]タブを開いて、

Tra2007101016autotrans2

[翻訳メモリに一致しなければ、SDL 自動翻訳を使用する]をチェックし、[既定の接続設定を使用する]を選択すれば、デフォルトのサーバー(mt.services.sdl.com)に接続できるはずです。この状態でセグメントを開くと、

Tra2007101016autotrans1

このように、機械翻訳の訳文が翻訳サーバーから取得されます(マッチ率=1% )。このときサーバーからのレスポンスを待つディレイはほとんど感じられません(この例のような1行だけでなく、4~5行分の長さでも)。その点はたいしたものだと思いますが、精度については、まあ上のサンプルからだいたいご推察ください。

ところで、1つ目のスクリーンショットには、"Your license for this feature will expire in 168 days."と書かれています。これが何かというと、SDL Trados 2007 における自動翻訳の機能はあくまでもベータ版であり、ライセンスには1年間という期限が付いているのでした。

ライセンスマネージャを開いてみると、そのことが判ります。

Tra2007101016autotrans3

つまり、2007 で提供される自動翻訳の機能はあくまでもオマケであり、1年経過した後も使いたいときは Studio 2009 上で使ってね、ということのようです(この制限に関する記述を、以前はどこかで見かけたような気がするのですが、今探しても見つかりませんでした)。

私の環境でも実は、2009+2007 をいち早くインストールしたマシンではもうこのライセンスが切れています。

であれば、Studio 2009 でこの機能を使うための情報がきちんと欲しいわけですが......

08:19 午後 Trados 機能 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

Studio 2009 SP3 を見てますけど……


1週間ほど前に書いたように、Studio 2009 の SP3 が公開されました。

Service Pack に関する情報ページ(SDL Trados Studio 2009 Service Pack)などを見ていると、とにかくもうどんどん生産性が上がっちゃうみたいな謳い文句ばかりが並んでいて、実際、もっと使いこなしていれば気づいていたバグなども SP3 ではフィックスされているんでしょうけど、やはり、翻訳者視点でのメリットは感じられません。

その一方で、今までにも何度か書いているように、ユーザーとして

必要な情報を見つけにくい

という状況はますますヒドくなっている気がします。

AutoSuggest

まず、Studio 2009 のリリース当初から全面的にアピールされている AutoSuggest 機能ですが、SP3 に至っても未だに

日本語に対応していない

というのはいただけません。

Tra2009101016autosuggest_2

ローカライズソリューションの開発が、どうしてもヨーロッパ言語主体になってしまうのは判りますが、マーケット規模としてけっして小さくないはずの日本語に対して、ここまで放置プレイが続いたら、ふつうはそっぽを向かれます。

自動翻訳

最近いろいろな事情で、自動翻訳の現状を見てみたいと思っているのですが、実は何をどう設定すればいいのか、必要な情報がなかなか見つからず、Studio 2009 上で試すに至っていません。

リンク: 自動翻訳

このページの説明によれば、

SDL Trados Studio 2009では、インターネット接続で使用できる3種類の機械翻訳エンジン、SDL Enterprise Translation Server、Language Weaver、Google翻訳をサポートしています。

ということになっていて、特に最近 SDL が買収した Language Weaver の実力なども気になります。

ところが、そもそもまずヘルプで必要な情報が得られない、というか日本語ヘルプが追いついていません。

Tra2009101016autotranshelpen_2
(実際のオンラインヘルプ: Overview: Automated Translation

このように、英語版ヘルプには 3 種類のエンジンが紹介されていますが、これに該当する日本語版ヘルプは、どうやら更新されていないようです。

Tra2009101016autotranshelpja_2
(実際のオンラインヘルプ: 概要: 自動翻訳

そもそも、日本語版ヘルプでは "Language Weaver" を検索しても何も出てきませんし......

さて、自動翻訳を実際に使ってみるには、[ファイル]→[サーバー]で機械翻訳のサーバーに接続しなければならないのですが、

Tra2009101016autotransdlg1

ここで[ヘルプ]ボタンを押しても、表示される説明がほとんど噛み合っていないのは、なぜなんでしょうか。

Tra2009101016autotransdlg2
(実際のオンラインヘルプ: サーバー

サーバーを追加しようとしたときのダイアログでも、ヘルプはまったく役に立ちません。

Tra2009101016autotransdlg3

接続先サーバーのアドレス、ユーザー名/パスワードについての情報はどこにも見つからないので、結局この機能は試すことができません。トホホです。

03:03 午後 バージョン - Studio 2009 | | コメント (5) | トラックバック (0)

はてなブックマークに追加

2010.10.14

JTF翻訳祭2010 - 20周年

日本翻訳連盟のサイトでも公式に発表されたとおり、12/13(月)に、JTF翻訳祭が開催されます。

リンク: 【 JTF 翻訳祭 】翻訳祭プログラム詳細

「20周年記念」を謳う今年の翻訳祭は、例年と違ってマルチセッション形式になっていす。基調講演の後は、メイン会場(2セッション)のほかに、4つの会場で計19のセッションが予定されています。

実は私もパネル形式のセッションのモデレーターということで末席を汚していたりしますが、それを除けば、実にそうそうたる顔ぶれです。師走の忙しい時期ではありますが、翻訳業界と翻訳支援ツールについて最新の情報に触れることのできる絶好の機会だと思います。

ちなみに、夕方からは交流会もありますが、こちらに参加して「人とのつながり」を築くことも、昼間のセッションと同じくらい意義があると個人的には思っています。

11:36 午後 その他 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2010.10.07

Studio 2009 SP3 公開


SDL Trados Studio 2009 の SP3 が公開されましたので、こちらでも告知。

リンク: SDL Trados Studio 2009 Service Pack

何がどうなったのか、とりあえずダウンロードしてインストールしているところですが、特筆すべき点があればまたエントリをアップします。

08:14 午後 バージョン - Studio 2009 | | コメント (0) | トラックバック (0)

はてなブックマークに追加

2010.10.01

タグを一括削除する Word マクロ

★★
Trados 翻訳する文書には、タグがつきものです。

タグの数が妥当であればそのまま作業できますが、ファイルによっては邪魔あるいは無意味なタグがやたらと多くて、原文を読むのさえ不自由なことがあります(FrameMaker ベースの RTF ファイルとか、Word から出力した HTML ファイルとか)。たとえば、こんな感じ。

Tra101001

そんなときは、原文をすべて訳文フィールドにコピーし、タグをぜんぶ削除してから作業すると楽なのですが、Trados の標準コマンドに、「タグを一括削除」というコマンドはありません(Idiom Workbench にはあります)。

そこで、簡単な Word マクロで実現しています(Word 2003)。

Tra1010012

こんな風に訳文をコピーしてから、訳文の範囲をすべて選択して「タグの一括削除」マクロを実行します。マクロはこんな感じです。

Sub Trados_DeleteAllTags()
  With Selection.Find
   .Text = "\<*\>"
   .Replacement.Text = ""
   .Forward = True
    .Wrap = wdFindStop
    .Format = False
    .MatchCase = False
    .MatchWholeWord = False
    .MatchByte = False
    .MatchAllWordForms = False
    .MatchSoundsLike = False
    .MatchFuzzy = False
    .MatchWildcards = True
  End With
  Selection.Find.Execute Replace:=wdReplaceAll
End Sub

False になっている検索条件のところは、なくてもいいものがあるのですが、削除すると True ということになり、True の条件が衝突する場合があるみたいなので、面倒なのですべて明示的に指定してあるだけです。重要なのは、以下のポイント。

- \<*\> というワイルドカード指定文字列(タグを表す)
- .MatchWildcards = True(ワイルドカードを使う)
- .Wrap = wdFindStop(置換を選択範囲だけで終わらせる)

なんてエラそうに書いていますが、実際にはマクロをゼロから書いたわけではなく、操作を記録してから若干編集しただけ。

ちなみに、上のスクリーンショットでは、原文をコピーした部分(黄色の範囲)が元のフォントと違っています。これも、フォントを引きずらないようにコピーする、というマクロを使っているため。

11:10 午前 Trados 機能, 関連ツール | | コメント (2) | トラックバック (0)

はてなブックマークに追加