« pptxのもっと困ったこと | トップページ | 訳文を生成できないとき »

2012.12.11

PCスキル - 文字コードをちょっと意識する

★★
こんな経験はありませんか?

原文PDFの文字列をコピーして、作業用ファイルで検索(あるいはその逆)しても、あるはずの文字列がヒットしない。

作業用ファイルの語句をコピーして、用語集で検索(あるいはその逆)しても、ヒットしない......。

あるいは、の違い? がわからない。


そんなときは、疑惑の文字列をテキストエディタに貼って、

文字コード

を確認してみると、疑問が解決することがあります。深く追究しようとするとけっこう大変なことになりますが、翻訳者に限らず、PC上で文字を扱う方は、文字コードというものをちょっとだけ意識しておいたほうがいいと思います。

たとえば、

1212111_3

これは、原典PDFと作業用ファイル(このときはdocでした)から、同じ部分を抜き出して秀丸エディタ上に貼り付けたところです。わかりにくいかもしれませんが、単語間のスペース---赤丸を付けたところ---がちょっと違います。上のほうは何もなく、下のほうは点線の記号で表されています。

上のほうが普通のスペースで、下のほうが何か変な記号に化けている、のではなく、秀丸エディタの場合は点線の記号で表されるほうが普通のスペースです。このあたりはアプリケーションによって表示が違うので、たとえばMS Wordの場合は、

1212117

このように、上のほうは温度記号みたいな小さい○になり、下のほうは薄い中黒みたいな記号で表されています。

表示の差はあれ、何か

文字として別物

らしいことは想像できるかと思います。文字コードという概念が頭にあると、こんなふうに紛らわしい文字の識別も簡単です。

秀丸エディタでは、文字の左側にカーソルを置いて文字コードを調べることができます。ただし、コマンドが表のメニューにはなくて、[その他]→[コマンド一覧]を選択し、表示されるダイアログから[その他]→[文字コード表示]を選択してみてください(私は頻繁に使うのでショートカットを割り当ててあります)。

上のほうの何もないスペースは、文字コードがこう表示されます。

1212113_2

一方、点線記号で表示されたスペースはこうです。

1212114_2

このダイアログに見えているShift-JISとかUnicodeとか、見たことがあるかもしれません。テキストファイルを保存するときも、この文字コードの指定が影響する場合があります。たとえばShift-JISで保存するとき、上の「何もないスペース」は文字化けしてしまいます(Shift-JISの文字コードには、該当する文字がないため)。

別の例を見てみましょう。

1212112

これは見た目も違いますね。ハイフン/ダッシュ/マイナス記号のあたりは似たような文字がいろいろあるので要注意。これも文字コードを表示してみます。

1212115_2

1212116_2

ふつうにキーボードから入力できるハイフン(半角)は下のほうで、上のやつは全角分をとるダッシュです。

冒頭に書いた

も、1つ目はカタカナ、2つ目はひらがなですが、同じように文字コードを見てみれば違うことがわかります。

09:56 午後 翻訳者のPCスキル |

はてなブックマークに追加

トラックバック

この記事のトラックバックURL:
http://app.cocolog-nifty.com/t/trackback/13481/56300907

この記事へのトラックバック一覧です: PCスキル - 文字コードをちょっと意識する:

コメント

baldhatterさん
有用な情報を有難う御座います。このような実質的なお話を発信してくださるサイトがあることに感謝します。

投稿: 柳絮 | 2012/12/11 22:04:09

コメントを書く

## コメントは承認制なので、公開されるまでに時間のかかることがあります。



(必須ではありません)