« # 最近読んだ/買った国語関係の本 | トップページ | # 3、4、5月の翻訳関連イベント »

2017.02.26

# 無料で使える文章チェックツール

先日、WildLightのサンプルを紹介しました。

参照リンク:side A: # こそあど、~という、~こと、~ている - WildLightの活用例


私自身がふだんからやりがちなポイントを定義ファイルに書き、WildLightで実行してマーカーを付けるという(←ほら、すぐ「~という」を使っちゃう)基本的な使い方でした。定義の内容は、(前回からすこし修正し)

・こそあど言葉のうち、「これ」系と「それ」系

・形式名詞の「もの」と「こと

・文末の「~ている、strong>ていた、strong>ています」

・文末、文節末の「~ており

・文節末の「~が、

です。

このうち、「~てい」と「~ており」だけは、前に来る動詞が音便---「騒いでいる、読んでいる」のような形のこと---を起こしているときのために、ワイルドカードを使って

[てで]い
[てで]おり

としています。


さて、WildLightも無料で公開されていますが、ほかにも無料で公開されている文章チェックツールがあるので、ご紹介しておきます。

リンク:小説推敲補助ソフト「Novel Supporter」 - クロノス・クラウン -

リンク:Tomarigi | PaWeL:日本語表現法開発プロジェクト-青山学院大学-



まず、サンプルとしてWilidLightを実行したファイルを貼っておきます。使ったのは、昨日2/25の当ブログの記事です。予想どおり、「~という」とか「~が、」がけっこうありますね。恥ずかしいですが、サンプルなのでこのままにしておきましょう。
「225.docx」をダウンロード

さて、ご紹介する1つ目は、クロノス・クラウン(柳井政和さん)で最近公開されたツールです。以前---Windowsであまりにメモリー管理がずさんだったころ---からフリーウェア「めもりーくりーなー」で有名だったサイトですね。
(余談ですが、ついに小説家としてもデビューしたようです。しかもイラストは『スティーブズ』の、うめ!)

「小説推敲補助」という名のとおり、そのまま翻訳に適しているとは限りません。

現時点で実装されているチェック機能は、以下のとおり。

・単語近傍探索(同じ単語の連続)
・こそあど確認(こそあど言葉)
・文末重複確認(同じ文末(現在形や過去形の連続))
・段落先頭重複確認(段落の先頭が同じでうるさく見えないか)
・文章警告(表現上注意すべき点や凡ミスを)
・画数ヒートマップ(文字の画数を元に文字の背景色を変え、読みやすさを視覚化)
・文長ヒートマップ(1文の長さに応じて文字の背景色を変え、長すぎる文を可視化)
・ルビ追加(様々な形式でルビを追加)
・文字種表示(文字種で文字の背景色を変更。漢字とかなの混じり具合や比率を確認)
・指定文字数改行(指定した文字数で改行)

使い方は簡単。起動したら、ファイルを開き(完成したファイルでなく、一時的なチェックなら、左ペインに貼り付けるだけでもOK)チェック項目を選んで「全て実行」をクリックするだけです。「ブロック実行」なども可。ほぼ一瞬で、右ペインに結果が表示されます。

1702261
同じく2/25の当ブログ記事で「単語近傍探索」を実行してみたところです。

実際にどの機能が有用かどうかは、各自お試しください。たとえば日英翻訳なら、原文の日本語に対して「単語近傍探索」を実行すれば、キーワードの確認に使えるかもしれません(英文には使えないので、英日翻訳では使えない)。私は、「画数ヒートマップ」がけっこう気に入っています。

また、設定を変えるにはJSONファイルを直接編集しなければならないので、ちょっと上級向けです。起動ファイルが、ふつうにexeファイルではなくbatファイルというところも、発想が技術屋さんです。

2つ目の「Tomarigi」は、青山学院大学で、言語研究プロジェクトの一環として開発されたツールです。

形態素解析の機能まで備えており、使いこなせばけっこういいツールになりそうです。翻訳者(や志望者)なら、うまく使えばかなり役に立つと思われます。

Tomarigi 本体のほかに、
・形態素解析ツール Mecab v0.996以上
・係り受け解析ツール Cabocha v0.68以上
が必要ですが、サイトの指示に従ってインストールすれば、特に難しくはありません。

文字数にはある程度の制限があるようですが(実際の制限と速度は、おそらくPCのリソースしだい)、機能はかなり抱負で、指摘の結果もいろいろと参考になります。


こちらも使い方は簡単。ファイルを開くか、ウィンドウに直接貼り付けて「実行」ボタンをクリックするだけ。

1702262

上の例では、敬体の文末(です、ます)が緑色で指摘されているほか、

「接続表現を中心とした著作の多い石黒先生」

という箇所もピンク色になりました。右ペインでそこをクリックすると、右下に詳細な指摘内容が表示されます。

1702263

二段構えの修飾節が存在する長文です.

と指摘されています。これが、JustRightなどにもない注目の機能です。具体的にどんなことなのかは、「図表」ボタンをクリックしてみるとわかるでしょう。

1702264

・「接続表現を中心とした」が、<連体修飾節>として「著作」を修飾しており

・その修飾節を含む「接続表現を中心とした著作の多い」が、次の<連体修飾節>として「石黒先生」を修飾している

という二段構えの修飾構造になっている。そう指摘されているわけですね。もちろん、これを修正するかどうかは、また別の問題。


さらに、「修正」の隣にあるボタンを押すと、

1702265
こういう係り受けの図も表示できます。学校やトライアルの答案でも、係り受けの変な訳文をかなりの頻度で見かけます。係り受けに自信がない人は、この図で自分の訳文を分析すれば参考になるのではないでしょうか。


別の指摘例も挙げておきます。

1702266
こちらは、MS Wordの校正機能でも指摘される「連用形中止法の多用」です。4か所と指摘されていますが、実際に連用形中止法になっているのは、

~読んで
~強くなり

です。たしかに、しまりがない感じ。

また、ここで指摘されているセンテンスの最後にはグレーの四角とピンクの丸もあります。グレーの四角をクリックすると同音語が注意され、
1702267

ピンクの丸をクリックすると、長文だと注意されます。
1702268

ただし、上の例で「読ん/詠ん」と書かれているのを見てもわかるとおり、同音語のチェックはちょっとうるさすぎるようです。


チェック項目は、かなり細かくカスタマイズできます。

1702269_2
これは、敬体/常体によって文末の指摘を選べる設定。

17022610
これは助詞の連続。「の」だけ、または「それ以外」も含めてチェックでき、連続回数も指定できます。

17022611
かな/漢字の使い分けは、デフォルトでも設定されていますが、任意で追加できます。


以下、チェックできる項目だけ挙げておきます。

・ひらがな書きすべき副詞のチェック(カスタマイズ可能)
・漢字書きすべき副詞のチェック(カスタマイズ可能)
・英数字の全角/半角(設定の切り替え可能)
・漢数字のチェック(オン/オフのみ)
・読点のチェック(オン/オフのみ)
・常用漢字のチェック(常用漢字のほか、学年別指定にも対応)
・ひらがな書きすべき接続詞のチェック(カスタマイズ可能)
・連用中止形のチェック(オン/オフのみ)
・助詞の連続(カスタマイズ可能)
・ひらがな書きすべき形式名詞のチェック(カスタマイズ可能)
・同音語/同訓語のチェック(同音、同訓ごとにオン/オフ)
・不適切な表現(若者ことば)のチェック(オン/オフのみ)
・指示語の多用(しきい値のオプションあり)
・体言止めのチェック(オン/オフのみ)
・送りがなのチェック(カスタマイズ可能)
・句読点の統一(設定の切り替え可能)
・長文の指摘(オン/オフとしきい値を設定可能)
・敬体/常体のチェック(設定の切り替え可能)
・文末の冗長表現(カスタマイズ可能)
・ひらがな書きすべき補助動詞のチェック(カスタマイズ可能)
・当て字のチェック(カスタマイズ可能)


以上のオプションを見ただけでも、かなりの高機能です。ものによっては、JustRightでは拾えない項目もたくさんあります。

それから、あちこちに再生ボタン(右向き三角)もありますね。なんと、音声読み上げもしてくれます(音声エンジンは、環境によって異なる)。

これが無料というのは素晴らしいことです。ただ、あくまでも大学の研究室のプロジェクトですから、いきなりなくなってしまう可能性もあります。

JustRight!は、個人で買っても40,000円(税別)します。値段に見合う機能はあります。表記のゆれや、誤字・脱字の指摘はやはり強力(それでも、十分ではない)。

WildLightは、自分で定義ファイルを作ってサクっとチェックするには便利ですし、単なるチェック以外の機能も豊富です。

Tomarigiは、自分の書いた日本語をじっくり分析するのによさそうです。

ひとつ注意したいのは、チェックした結果からどこをどう直すかは、あくまでも自分の力量しだいだということです。単純なミスなら修正すれば済みますが、たとえば連用形中止法を自分でよしとするか修正するかは、最終的に自分の判断です。

とはいえ、翻訳をしていて大切なのは、自分の訳文をどこまで客観的に眺められるかいうこと。そのためには、こういうツールの導入は有効でしょう。

02:52 午後 パソコン・インターネット 翻訳・英語・ことば |

はてなブックマークに追加

« # 最近読んだ/買った国語関係の本 | トップページ | # 3、4、5月の翻訳関連イベント »

コメント

この記事へのコメントは終了しました。