« # テリーさんの「翻訳チェック」、関東ではこれが最後! | トップページ | # COBUILDの凡例はこちら »

2017.06.17

# なぜ、「Weblio類語辞典」は「辞書」とはいえない、のか

毎日新聞・校閲グループさんが、ブログにこんな記事をアップなさっています。

リンク:ネットの類語辞典は辞書といえるか | 毎日ことば

既に5月のブログでその可能性には言及していましたが、もっと強調しなければなりますまい。「Weblio類語辞典」は「辞書」とはいえないと。
「Weblio類語辞典」は提供元がWeblioとなっています。市販の類語辞典から提供されたものではなく、独自に作っているのです。その中には、プログラムにより自動的に生成されたものもあるようです。


毎日新聞さんの投稿としては、ここまでで十分でしょう。ここから先は、帽子屋が引き受けようと思います。なぜ

「Weblio類語辞典」は「辞書」とはいえない

のでしょうか。

ちなみに、このブログでは過去にも何度かWeblioは取り上げています。

side A: # Weblio のご紹介

最初の記事がこれ。10年以上前です。私としてはただ、「変な用語集へのリンクが集まっているおもしろサイト」だと思っていました。

side A: # Weblio のこと・続

その少しあとには、運営者あてにスペルミスを報告したりしており、好感のもてるサイトでした。

side A: # ググるなとまでは言わないけれど

それから3年後、WeblioだけでなくGoogle全体の信頼度がだいぶ怪しくなってきた頃の記事がこちら。

side A: # Weblioを使うときの注意

さらにその3年後、いまから5年前ですが、この頃には収録データの

出典に注意する

よう、呼びかけています。この注意点には、あちこちのセミナーなどでも、繰り返し触れるようにしてきました。

では、Weblioで「そもそも」を引いてみましょう。

ただし、トップページ

1706171

から検索したときに出てくるのは、三省堂大辞林です。

1706172_2

出典情報として、ちゃんと「三省堂 大辞林」と書いてある点、覚えておいてください。もちろん、語義・語釈のなかに「基本的」などという類語は載っていません。


Weblioのなかで「類語・対義語辞典」というセクションに移動して---

1706173

---あらためて「そもそも」を検索します。

1706174

ありました、「基本的に」。

ここで注意するのが、さっきの「三省堂 大辞林」と同じ位置にある出典情報です。ここに

Weblio類語辞典

と書いてあるわけです。ここをクリックしてみましょう。

1706175

提供 Weblio
URL http://thesaurus.weblio.jp/

ということなので、このURLに移動してみます…… って、あれ、これは、さっき「そもそも」を検索した「類語・対義語辞典」セクションのトップですよね。戻ってきちゃいました。ここに、ちゃんと、この辞典の説明があったんでした。

1706176_2

Weblio類語辞典は、以下の辞書を利用しています。
「Weblio類語辞書」
Weblioシソーラス(自動抽出機能)

ん? んん?

「Weblio類語辞典は、以下の辞書を利用しています」として挙がっているのが、「Weblio類語辞書」?

これだけでもう、

辞書の出典情報としてはアウト

のはずですが、さらにその下に注目してください。「自動抽出機能」とあります。これについては、もっと下まで進まないと説明が見つかりません。

1706177

一部不適切なキーワードが含まれていることもあります

だそうです。


なんだか、どこかで見た気がしませんか。そう、機械翻訳の出力でもよく目にする免責の文言です。


機械翻訳は、この文言を入れておくことによって免責としているわけですが、それは同時に

これはちゃんとした翻訳じゃありませんからね

と宣言しているに等しい。


それと同じように、「Weblio類語辞典」も、

これはちゃんとした類語辞典じゃありませんからね

と宣言しているわけでした。

なんのことはない、「辞典として使っちゃダメですよ」って、Weblioさん自身がちゃんと書いてくれてたわけです。

使う側が気をつけなくちゃいけない……でも、ですよ。免責事項をこんな深いところに書いてたら、ふつうのユーザーはなかなか気づかないんじゃないかなぁ。そういう点では、サービスとして非常に問題だとは思います。

どんな辞書だって、無謬ということはありえません。誤植も含めて、どこかに必ず間違いはあるでしょう。でも、だからといって

一部不適切な語義・語釈が含まれていることもあります

と免責している辞典なんて、一冊も見たことありません。なぜか。それが、辞書編纂者の矜持だからです。


内容に間違いはあるかもしれない。だが、間違いがないよう、全力で編纂した辞典を作ったつもりだ。


どんな辞書も、そう言えるだけの過程を経て作られています。その努力は、小説・映画・アニメ『舟を編む』の終盤、「ちしお」のたった1語が抜けているために、『大渡海』の編集部がどれだけの苦労をしたかという、あの場面を見ても分かります。

誤解のないように書いておきますが、人が苦労をして作ったものだから良い、機械的にデータを集めただけのものだから悪い、と言ってるのではありません。

要は名乗り方と、使い方です。

「機械翻訳です」と断っている翻訳が、本来の「翻訳」を名乗ってはいけないのと同じように、「自動抽出データを使っている」と宣言しているデータ集が「辞典」を名乗るべきではない、そういうことです。

使う側も、そのつもりで使いましょう、ということ。

以下は余談。

「どんな辞書も、無謬ということはない。が、編集者は間違いがないよう全力を尽くしている。だから、免責の文言を書いたりしない」

これって、翻訳も同じですね。

「どんな翻訳も、誤訳がないということはない。が、翻訳者は間違いがないよう全力を尽くしている。だから、免責の文言を書いたりしない」


だから、免責の必要な機械翻訳に、人間の翻訳が負けるはずはないのです。

05:08 午後 翻訳・英語・ことば 辞典・事典 |

はてなブックマークに追加

« # テリーさんの「翻訳チェック」、関東ではこれが最後! | トップページ | # COBUILDの凡例はこちら »

コメント

この記事へのコメントは終了しました。