Microsoft用語集(tbx)をMultiTerm化
★
side TRADOSをお読みくださっている方から、質問メールをいただきました。
趣旨としては、
「マイクロソフトランゲージポータルでダウンロードできる用語集が、MultiTerm Convertでうまく変換できない」
ということです。さっそく試してみましたので、レポートしておきます。
「マイクロソフトランゲージポータル」の解説はside Aに書きましたので、必要であれば先にそちらもご覧ください。
リンク:side A: # マイクロソフト ランゲージ ポータル - 更新版
今回MultiTerm化したいのは、このサイトで「マイクロソフト用語集」として公開されている、一般の用語集です。
ランゲージポータルのトップページで、「用語集」というオレンジ色のボックスをクリックすると、言語を選択してダウンロードできます。
ダウンロードされるのは、
MicrosoftTermCollection.tbx
というやく12MBのXMLファイル。これはいちおう標準の用語集形式なので、Trados MultiTermにもインポートできるはずです。
MultiTerm Convertを使って用語集を作る方法は、過去のエントリを参照してください。
リンク:MultiTerm - 用語集の作成 - MultiTerm 5.5 から
※このエントリはStudio 2009時代の内容ですが、2011、2014でも基本は変わりません。
今回違う点は、Convertウィザードの[変換オプション(3/7)]ステップで、[用語ベース交換形式]を選ぶことです。
(以前のエントリ、つまりStudio 2009のときは「Term Base exchange形式」というオプションでした)
次のステップで[入力ファイル]にMicrosoftTermCollection.tbxを指定し、[次へ]をクリックすると……
ご質問くださった方が困っていたのが、ここです。ウィザードがここから先に進まず
「応答なし」
になってしまう、と。
でも、[次へ]を1回だけ押したら、じっと待っていてください。ちゃんと処理は進むはずです。私の最新環境で1分くらいでした。
ここでこんなに時間がかかるのは、読み込んでいるMicrosoftTermCollection.tbxファイルが、
すべて1行の論理行で書かれているXML
だからです、たぶん。1行で書かれたXMLファイルは、いろんな場面で処理に時間がかかります。
このステップさえ通り抜ければ、後は上記の過去エントリのとおりの作業でMultiTerm化できるはずです。
[フィールド タイプの指定]ステップは、このままでOK。その次の
[エントリ構造のカスタマイズ]は、このまんまでもたいした違いはありませんが、
・左ペインで[Japanese]→[Term]ノードを選択した状態で、右ペインの[Definition]を選択して[Add]をクリック。
・同じく、左ペインで[Japanese]→[Term]ノードを選択した状態で、右ペインの[Part of Speech]を選択して[Add]をクリック。
しておくとよいかと思います。
できあがるファイルで、エントリ数は21,929でした。MultiTerm本体でインポートするときは、さすがに時間がかかります。
03:11 午前 バージョン - Studio共通バージョン - Studio 2014 | URL
この記事へのコメントは終了しました。
コメント
こんにちは。
以前中国から書き込みさせていただいた、中国で翻訳にかかわっている者です。
中国からだと開くのに時間がかかり、
その後はあまりこちらにお邪魔することができませんでした。
今、中国のゴールデンウィークで帰国していることと、
ブログ内容の一括ダウンロードが下記のようなツールでできるようなので、
今週中にダウンロードして、中国でゆっくり読ませていただきたいと思います。
(今はWindows7でできる、わかりやすそうなソフトウェアを調べ中です。)
http://q.hatena.ne.jp/1202150644
この操作がブログ運営の方にどのような影響を与えるかはわからないのですが、
近日、突然全ページに変なアクセス記録が残ったらこの件かもしれません。
スパムなどではないので安心していただければと思います。
よろしくお願いします。
投稿: Y | 2014/10/01 23:05:30
Yさん、コメントありがとうございます。
こちら、特に影響などはないようです。
そうそう、中国はこの間お休みなんですよね。実は一昨日ヤフオクである商品を落札したら、出品者が中国の方だったらしく「明日から5日間休みになるので休み明けに発送します」って言ってました。
投稿: baldhatter | 2014/10/04 22:17:28