« # 転んでもただでは起きない - その1:エルゴノミクスキーボード | トップページ | # AmiVoiceについて少し補足 »

2017.08.27

# 転んでもただでは起きない - その2:音声入力

前エントリーで書いたように、左肘の骨折に伴ってエルゴノミクスキーボードを導入しましたが、それでも通常の入力速度にはとうてい及びません。

ちょうどいい機会なので、音声入力を本気で導入してみることにしました。


実は、何年か前にも、DragonSpeechが付属するパッケージ版のATOKが出たときに、音声入力は試してみたことがあります。このときとは、インストール直後のトレーニング操作がやや分りにくく、あっさり投げ出しました。

人間、本当に必要に迫られないと新しいことはなかなかできないということでしょう。


今回、試用版から使ってみることにしたのは、AmiVoice。実際に使っている同業者がいらっしゃって、そこからのお勧めでした。


公式サイトから、体験版をダウンロードできます。

リンク:音声認識ソフト AmiVoice SP2


総合評価 ★★★★☆

試用期間は2週間で、なかなか具合がよかったので製品版に移行しました。

※Amazonのこのページでは、評価の平均点がやたらと低くなっています。見てみると、会議の音声メモから文字を起こそうとして購入した方のようです。製品サイトの紹介ページに、議事録作成にも使えるようなことが書いてあるせいかもしれません。


インストール直後から、ほぼ直感的に使えました。ヘッドセットかマイクを接続し、AmiVoiceを起動したら、

1708271

左端の録音ボタンを押して発声を始めるだけです。

マイクの性能や環境によって、マイク音量と感度は設定したほうがいいようです。

1708272

たしか、デフォルトで最大だったと思います。いろいろ変えてみて、私の環境では結局、最大で落ち着いています。


最初は、家にあった適当なヘッドセットを使ってみましたが、認識精度が芳しくありませんでした。同業者のアドバイスによると、ノイズキャンセリング機能の付いた有線のマイクを使うとまったく違うということ。

そこで、さっそくこれも購入しました。


アドバイスどおり、効果は抜群でした。

ふだんの仕事で入力するくらいの文章は、かなりの精度で入力できます。この記事も、最初からからずっと、音声入力で書いています。


好みと作業環境に応じて、入力モードも選択できます。

1708273

デフォルトは、エディターモードです。入力したいアプリケーションと別に、

1708274

このような入力専用エディターが開きます。ある程度まとまったところまで入力したら、「転送」コマンドを使うと、アプリケーションに文字列が確定入力されます。

漢字変換が間違っている場合には、そこにカーソルを持っていけば、変換候補を選び直せるようになっています。

1708275

しばらくはこのモードを使っていましたが、今はほぼ直接入力にしています。直接入力モードでは、入力したいアプリケーションのウィンドウ上に確定(転送)前の文字が暫定的に表示されます。仕事には、このほうが向いている気がします。

エディターモードと直接入力モードで大きく違うのは、転送のタイミングです。

直接入力モードでは、ひとまとまりで発声した文字列だけがバッファに保持され、次のまとまりを発声し始めると、前のまとまりは確定されてしまいます。漢字変換が間違っていた場合に別の候補を選び直せるのも、このまとまりで暫定表示されている間だけです。

一方、エディターモードでは、「転送」コマンドを使うまで、入力した文章をためておくことができ、その間はどの部分も自由に変換候補を選び直せます。ちょっと難しい文章で、変換違いが多そうな場合は、こちらのモードのほうが向いているかもしれません。


使ってみて感心したのは、文脈認識性能の高さです。短い単語やフレーズほど誤認識が多く、

長くまとまった文になるほど精度が高く

なります。

したがって、これを翻訳に使うと、訳文を作るときの頭のはたらき方がかなり変わってきます。

ふつうにキーボードを打つときは、英文を読みながら、いきなり文字を打ち始めることもあります。しかし音声入力では、一定以上の長さでまとまって入力しようと思うと、頭の中である程度の長さの訳文を作ってから、一気に発声することになる。訳文の性質も変わるでしょう。いい方向に変わるように、しばらくは模索が続きそうです。


入力が終わった文章の見直しポイントも、ふだんのキー入力のときとは勝手が違ってきます。

この文章を打ち終わってから見直したときも、こんな誤入力が見つかりました。

キーボート → ○キーボード

議事録作成にも使えるようなことは書いてある → ○~ことが書いてある

ふだんの仕事で入力するくらいの文書 → ○~文章


「キーボード」の濁点が落ちて「キーボート」。ふだんの入力ならこんな誤字はまず起こりません。単語登録してあるからです。

「が」→「は」の助詞の違いは、私が間違ったわけではなく、音声認識のミスです。「を」などの助詞が落ちる場合もあります。

「文章」→「文書」は、発音があまりよくなかったのかもしれません。

おおむね満足なのですが、録音ボタンのキー割り当てはオプションが少なすぎます。

1708276

オプションが単独のキーだけで、どれも他の機能に使うものばかりです。なぜコンビネーションキーの選択肢がないのか不思議です。この点だけはぜひ、今後のバージョンアップで改善されてほしいものです。


ケガが治ってからも音声入力を使い続けるかどうかは、まだ何とも言えません。

07:43 午前 翻訳・英語・ことば, パソコン・インターネット |

はてなブックマークに追加

« # 転んでもただでは起きない - その1:エルゴノミクスキーボード | トップページ | # AmiVoiceについて少し補足 »

コメント

コメントを書く

## コメントは承認制なので、公開されるまでに時間のかかることがあります。



(必須ではありません)