« Trados Studioの解析に大きな疑問 | トップページ | QA Checker - 「単語リスト」でも正規表現 »

2014.11.15

Studio 2014ヘルプのその後


今年5月2日のエントリに対する9月19日時点の追記として

オンラインヘルプの日本語版、いつの間にか、日本語の検索が機能するようになっていました。

と書きましたが、実はいまだに十分には機能していないようです。いまだに、というか、おそらくこのまま変わらないんじゃないかと思います。


ためしに、たとえば「単語リスト」と入力して検索してみてください。

一致する結果は見つかりませんでした。

と言われてしまいます。

今度は、

「単語」だけ、または「リスト」だけ、あるいは「単語 リスト」(スペースを空ける)と入力してみます。

1411161

こうすると、いちおうちゃんと目的の言葉を探すことができます。

同じように、「レポートの生成」---左カラムの目次に見えている項目です---と入れてもダメで、「レポート 生成」と入力すると必要な情報がヒットします。


お気づきかと思いますが、漢字、ひらがな、カタカナという3つの

文字種が混在して連続

していると、機能しないようです。

ということで、十分に機能しないとは言っても実用にはなるレベルなのですが、何とも惜しい。

これ、ローカライゼーションの現場にいた人ならわかると思いますが、要するにヘルプのインデックスの作りが問題なんですね。

ヘルプのインデックス(索引)は、すべて手作業で作られる場合もあります。つまり、ヘルプの内容に応じて、検索されそうな索引項目、たとえば「単語」とか「単語リスト」とか「レポート」とか「レポートの生成」とかを別ファイルとして用意しておく。これなら、指定した言葉がそのまま索引として機能するので、文字種が混在していても大丈夫。

しかし、ご想像のとおり、この作業はかなり大変です。

そこで、インデックスの自動生成機能を持つヘルプ作成ツールというのも出てきました。ヘルプの内容から、キーワードになりそうな単語を適当に抽出してきてインデックスファイルを自動的に生成するわけです。


ところがこの単語抽出というのも、アルファベット圏ならスムーズにいきますが、例によって日本語では一筋縄ではいかない。「単語」という単位を正しく識別するには、助詞や助動詞を切れ目にするために言語解析が必要になって、システムがかなり大がかりになります。

それで、その手間を省いて単語を抽出しようとするとどうなるかというと

単語

リスト

レポート

生成

のように、同じ文字種だけが続く文字列を単語とみなしちゃう。これならかなり簡単。秀丸マクロでだってささっとできちゃうレベルです。

たぶんそのレベルでしか日本語を抽出できないシステムを使っている。「おそらくこのまま変わらないんじゃないか」と書いたのは、そのせいです。


SDLさんは言語を扱う会社なんですから、インデックス生成くらいもう少しちゃんとやってもいいのではないかと思います。それができていないのは、ひょっとすると

日本語がけっこう冷遇されている

からかもしれません。

12:10 午後 バージョン - Studio 2014 |

はてなブックマークに追加

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/13481/60661653

この記事へのトラックバック一覧です: Studio 2014ヘルプのその後:

コメント

コメントを書く

## コメントは承認制なので、公開されるまでに時間のかかることがあります。



(必須ではありません)