« 2014年5月 | トップページ | 2014年7月 »

2014.06.27

# これからのイベントなど

IJET-25も終わりましたが、一息ついたところで、またいろいろとあるので、例によって公私混同でご紹介しておきます。


6/29(日)
ほんま会 in TOKYO

翻訳者のためのマクロ勉強会(通称"ほんま会")の東京編、今回は午後、私が担当することになりました。

……って、もう今週末です。すいません、定員に達したそうです。m(__)m


7/12(土)
TAC月例セミナー「翻訳における物質性」

川端康成、高橋源一郎、よしもとばなな、松浦理英子、川上弘美、古川日出男などの英訳を手がけているイケル・エメリック氏の講演です。ふだん以上に格調高いセミナーになりそうで、ちょっとドキドキしています。


7/20(日)
第9回関西通翻勉強会「SKIT」

SKITの活動、積極的に続いていますよねー。今回は、東京からテリー斉藤さん、井口耕二さんが参加して、それぞれコマを担当するようです。これは、こちらから出張ってでも行きたいところですけどねぇ......


8/2(土)
ほんまかい特別会

6月の東京版を受けて、なんと、ほんま会の本拠地にもお邪魔することになりました。京阪のみなさん、今年もお世話になります。

しかも、この日の午前中は、最近話題のAutoHotkeyの話です!


8/9(土)~全4回
~翻訳の専門校~フェロー・アカデミー 【双方向Web授業】

今年の2~3月に、フェローとして初めて開催したWeb上の授業。暑いさなかですが、また開催されます。


9/27(土)
サン・フレア アカデミー「オープンスクール」

詳細は未定ですが、久しぶりに私もお邪魔することになるらしいです。

12:36 午前 翻訳・英語・ことば | | コメント (0)

はてなブックマークに追加

2014.06.26

# プログラミングの基本 - 短期講座第8回(了) -

前回コピーした、または手入力したシンプルなマクロの内容を説明します。

秀丸マクロも、当たり前ですがプログラムの一種です。これから説明する内容は、いろいろなプログラミングに応用できる基本中の基本。ここから学習を発展させていけば、プログラミングを覚えるのはそんなに難しくない...かも。

この説明で、今回の短期集中講座はひとまずおしまいにしたいと思います。


最近、実は秀丸エディタにもマクロ入門みたいなヘルプが付くようになっています。このエントリの後は、そちらを読むといいかもしれません。[ヘルプ]→[マクロヘルプ]を選んで、[マクロを初めて作成する方はこちらへ]のリンクをクリックしてください。


//一発検索マクロ ver1.0
//作成: 2014/06/26 最終更新: 2014/06/26
//コピーした文字列を一発で検索するマクロ

gofiletop;

beginclipboardread;
$sr = getclipboard;

hilightfound 1;
searchdown $sr;


■コメント文

どんなプログラミング言語でも、プログラミングに直接関係ない(=プログラムとしては実行されない)内容を書いておきたいものです。これをコメント文と言います。

大規模なプログラミングなら、他のプログラマーが見てもわかるようにという配慮の場合もありますが、個人で作る場合、たいていは自分のためのメモ書きです。内容が複雑になると、いったいどんな処理をしているのか、後から見て自分でもわからなくなったりする。そんなときのためです。

秀丸エディタの場合、コメント文は冒頭にスラッシュを2つ付けます。行頭に//を付ければ1行全体がコメントになり、行の途中に//を書くと、それ以降の行末までがコメントになります。

今回の例では、

1行目……マクロ名とバージョン番号
2行目……作成日と最終更新日
3行目……マクロの簡単な説明

を書いてあります。最低限これくらい書いておくと、マクロの更新管理に便利だからです。


■マクロの書き方

一部を除き、秀丸マクロの各行は半角セミコロン(;)で終わります。言い方を変えると、秀丸はセミコロンまでを命令と見なして実行しようとします。

マクロのコマンド(文)は、頭から順番に実行されます。順序を変えるコマンドがある場合は、それに従います。


■コマンド(文)

コメントが終わって最初に出てくるのは、

gofiletop;

というコマンド。名前から想像できるとおり、「ファイルの先頭に移動してや」という

命令

です。

※秀丸のヘルプでは、コマンドを「文」とも読んでいます。

続く

beginclipboardread;

もコマンドで、「クリップボードからの読み取りを開始せいや」という命令。これがないと、次の行の getclipboard が動いてくれません。

getclipboard;

というコマンドで、実際にクリップボードの内容を読み取ります。

ただし、ここで重要なのは、

getclipboard は読み取るだけ

ということです。どういうことかというと、マクロの中で、この命令は確かに実行された。でも、クリップボードの内容はあくまでも内部的に読み取られただけで、それを

使える形で取り出す

という作業が必要です。


■変数と代入文

そこで、getclipboard の内容を プログラムで使える形にする必要があります。そのために使うのが、「変数」「代入文」です。

$sr というのが変数ですが、頭にドル記号「$」が付いているので、これは文字列変数です。

$sr = getclipboard;

この式は「変数 $sr に getclipboard の内容を格納する」という意味になります。イコールを使ってはいますが、等式とは微妙に違います。


変数には、例外を除いて任意の英数字とアンダースコアを使えますが、あまり短いと自分でもわかりにくくなります。この例では、検索(Search)したい文字列を代入するので、Searchのうち最初の2文字を変数名にしました。


秀丸マクロの場合、変数の内容によって「文字列型変数」「数値型変数」があります。

文字列型変数は、先頭にドル記号「$」を付けます。代入できるのは、「abc」とか「禿頭帽子屋」とか、そういう文字のまとまり。

数値型変数は、先頭にナンバー記号「#」を付けます。

ナンバー記号「#」とは、キーボードで「3」の上にあるやつです。「いげた」とか、英語だとpound signとも呼びます。シャープ記号「♯」とは違います。どのみち、プログラミングで使うのはいつも半角文字です。


「文字列型変数」と「数値型変数」を正しく使わないと、プログラムは動きません。この区別は、秀丸マクロに限らず、とても重要な考え方なので、ぜひ覚えておいてください。


■コマンド(文)、パラメータ付き

hilightfound 1;

もコマンドですが、「1」というパラメータが付いてます。これは強調表示をオンにするということ。パラメータを「0」にすると強調表示がオフになります。

このように、コマンドのなかにも gofiletop のように一律の動作を実行するものと、パラメータ指定によって異なる動作を実行するものがあります。

searchdown $sr;

これが最後のコマンド。パラメータは、さっき文字列を代入した文字列変数 $sr です。

つまり、このコマンドの意味は「文字列変数 $sr の内容を下方向に検索せいや」ということになります。

$sr には、getclipboard が代入されています。つまり、$sr の中身はこれ以前にコピーされている内容ということ。


これで、ごくシンプルながら、秀丸マクロをひとつ作り、その動きも1行ずつ理解できました。


後は、関数制御文を使えるようになれば、かなりのことができるようになります。

「できるようになります」というのは、あくまでもスキル上の話です。プログラミングで大切なのは、プログラミングに至る発想とその実現の段階。

今回作ったマクロの例で言うと、こんな流れだったことになります。


検索って、翻訳中に何度も何度もやるから、少しでも楽をしたいなぁ。

検索したい文字列って、入力することもあるけど、コピーすることも多いな。

コピーした内容は、クリップボードに入ってるはず。

クリップボードの内容を取り出して、それを検索すればいいんじゃね?

ってことは、

1. クリップボードの内容を変数に入れて、
2. その変数をパラメータにして、
3. 検索コマンドを実行

すればいいんじゃないかな。


こういう発想に立って秀丸マクロを書いたことになります。ここで、大切なのは、赤字で書いた部分。こういう発想さえできれば、後はそれを実行できるコマンドを探していけばプログラムは書けます。


今回のように、ひとつでもマクロを書いてみて、その動きを1行ずつ納得できれば、最初の一歩はばっちりのはずです。

11:45 午後 翻訳者のPCスキル | | コメント (0)

はてなブックマークに追加

2014.06.25

# 最初のマクロ - 短期講座第7回 -

いよいよ、実際にマクロを作ります。

作ったマクロは「マクロ登録」し、「キー割り当て」まで設定します。つまり、前回の復習を兼ねた実習ということです。

ここまでやっておくと、今週末6/29(日)の「ほんま会」で、だいぶ話がわかりやすいのではないかと思います。

1. かんたんなマクロを作る

まず、秀丸エディタで新規ファイルを開き、以下の内容をコピーしてください。内容については、次回詳しく説明します。


<ここから>

//一発検索マクロ ver1.0
//作成: 2014/06/26 最終更新: 2014/06/26
//コピーした文字列を一発で検索するマクロ

gofiletop;

beginclipboardread;
$sr = getclipboard;

hilightfound 1;
searchdown $sr;

<ここまで>


※コピーせず、これを見ながら手で入力してもかまいません。そのほうが勉強になります。

1406262


このファイルを、たとえば

QuickSearch.mac

とか、そんな名前で保存します。保存先は、前回作ったマクロ用のフォルダです。ここで大切なのは拡張子。秀丸マクロの拡張子は

*.mac

です。


2. マクロを登録する

[マクロ]メニューから[マクロ登録...]を選択します。

最初はどのフィールドも空っぽだと思うので、[マクロ 1:]に登録しましょうか。

ダイアログの上のほうに[グループ]というフィールドがありますが、最初はグレーアウトされていると思います。ダイアログ左側にある[対象]で[11~20]以降を選択すると、[グループ]フィールドが使えるようになります。これは、たとえば機能別などでマクロを10個ずつまとめるための機能です。当面は使わないからしれませんが、マクロをがんがん使うようになると、グループ分けしたくなるかもしれません。[対象]の[1~10]は特にグループ内がないので、グループ分けするまでもない基本マクロとか、多用するマクロとか、そんなのを登録します。

[タイトル]に任意の名前、たとえば今回は「クイック検索」と入力します(さっきコピーしたのは、つまりそういう機能のマクロなわけでした)。

[ファイル名]にマクロを指定します。▼を押してドロップダウンリストを開くと、さっき登録したマクロ(QuickSearch.mac)が出てくるはずです。あるいは、[...]をクリックすると、マクロ用のフォルダが参照されるはずです。

【重要】
もし、ここで▼を押しても「QuickSearch.mac」が出てこない、あるいは[...]をクリックしてもマクロ用フォルダが開かない場合には、前回やった「1. マクロ用のフォルダを作って、指定する」の手順がうまくいっていない可能性があります。確認してみてください(このダイアログの下のほう、[マクロファイル用のフォルダ]というラベルの右にマクロ用フォルダが表示されます)。

1406263

登録ができたら、[OK]を押してください。


3. マクロをキーに割り当てる

ファンクションキー(F1~F12)には、デフォルトでいくつかの機能が割り当てられています。デフォルトの割り当てを使っているなら残しますが、そうでなければ、どんどん上書き設定しちゃってかまいません。

F1~F12までほとんどデフォルトの割り当てがありますが、[Ctrl]とか[Shift]などの修飾キーを押すとほとんど空欄です。今回はおとなしく、最初から空いている[F2]キーを使うことにします。

たぶんこの辺は、秀丸エディタをどのくらい使いこんでいるか、あるいは全般的にキーボード多用派かマウス多用派か、といった好みによっても違うと思います。


[その他]→[キー割り当て]を選択します。

ダイアログ左側の[キー]で[F2]を選択します。右側の[コマンド]は、[ファイル系]-[なし]になっていると思います。これが何も選択されていない状態です。

[コマンド]のすぐ下の▼を押すとドロップダウンリストに機能グループが表示されます(ファイル系、カーソル移動系、クリップボード系……)。下のほうに[メニュー/マクロ]があるので、これを選択します。

さっき登録した「マクロ1:クイック検索」というのが出てくるはずなので、それを選択して[OK]を押します。

1406264

これで、今回作ったマクロが[F2]キーに登録されました。


4. マクロを使ってみる

さっそく、「クイック検索」を使ってみます。


何でもいいので、テキストファイルを秀丸エディタで開きます。ここでは、第2回でリンクした

寺田 寅彦『科学者とあたま』より抜粋

を開いてみます。

開いたら、今この記事を読んでいるブラウザに戻って、すぐ上にある 「科学」という文字をコピーしてください。


コピーしたら、秀丸ファイルに戻って[F2]を押してみると......

1406261

こんな風に、該当する箇所がすべてハイライト表示される ...... はずですが、ハイライト表示のされ方は人によってたぶん違います。

このマクロ、機能はいたってシンプルで、

「コピーしてある文字列をファイルの先頭から検索する」

というだけです。

私自身が秀丸エディタを使い始めた最も初期に作ったマクロのひとつであり、今でも多用しているマクロです(ただし、私が実際に使っているバージョンは、もっと機能が増えています)。

検索ダイアログを開く → 検索したい文字列を貼り付ける → [下検索]をクリックする

という3ステップだった動作を

[F2]キーを押す

という1ステップに縮めたことになります。

たいした省力化には思えないかもしれませんが、こういう「些細な省力化」の積み重ねが実は大きな効率化の基礎になっているというのは、新田さんがよくいう「2秒×1000回=30分のなぞ」と同じことです。

今回のマクロを、コピペせずに手で入力した場合、実行するとエラーになったかもしれません。

1406265

たとえばこのエラーは、

beginclipboardread

と打つべきところを、

begincliboardread

とミスタイプしてしまったことが原因です。


このようなミスタイプによるエラーは、プログラミングにつきものです。というより、プログラミングとはこんなエラーとの戦いの繰り返しとも言えます。エラーが出たら、その原因を探って修正する。その過程こそが、実はいちばん勉強になるとすら言えるかもしれせん。


次回は、今回作ったマクロの内容を説明します。

11:38 午後 翻訳者のPCスキル | | コメント (0)

はてなブックマークに追加

2014.06.18

# 秀丸マクロを使う準備 - 短期講座第6回 -

では、そろそろ秀丸マクロの本題に入ることにしましょう。


秀丸マクロを使うための準備は、大きく言うと、次の3ステップです。

・マクロ用のフォルダを作って、指定する

・「マクロ登録」を覚える

・「キー割り当て」を覚える

1. マクロ用のフォルダを作って、指定する

[その他]→[動作環境]→[環境]を選択すると、[パス]というセクションに、[マクロファイル用のフォルダ]というフィールドがあります。

ここが空欄の場合は、秀丸エディタの本体(Hidemaru.exe)と同じディレクトリ、つまり

<プログラムディレクトリ>\Hidemaru\

にマクロファイルがあるものと判断されます。逆に言えば、このフィールドを空欄にして、秀丸エディタ本体と同じディレクトリにマクロを置いていってもいいのですが、ここにはほかにもいろいろなファイルが入っているので、マクロが増えてくるとごちゃごちゃになります。このフィールドで、明示的にマクロファイルの場所を設定することをおすすめします。

マクロの中で別のマクロを呼び出したりする場合など、このフィールドの設定が意味をもつ場合もあります。書き換えが必要になることもあるかもしれません。


ぜんっぜん違う場所を指定してもいいのですが、私は

1406181

このようにHidemaruディレクトリの直下にフォルダを作って、マクロはすべてここに置いています。(このフォルダの頭の3文字は気にしないように)。このフォルダを指定するには、[マクロファイル用のフォルダ]が次の図のようになります。

1406185


2. 「マクロ登録」を覚える

上の手順で所定の場所に置いたマクロは、

[マクロ]→[マクロ実行]

を選択して

1406182

このダイアログから選んでも実行できますが、こんな手間をかけていたのではマクロを使う意味(=省力化)が半減します。

[マクロ]→[マクロ登録]

を選択して[マクロ登録]ダイアログを開き、名前を付けて登録すれば、[マクロ]メニューの直下に表示され、簡単に実行できるようになります。

1406184_2


3. 「キー割り当て」を覚える

マクロの便利さを十分に活かしたければ、「マクロ登録」だけでなく、「キー割り当て」までぜひ覚えましょう。

[その他]→[キー割り当て]

を選択すると、ファンクションキー(F1、F2、...)や[Shift]、[Ctrl]などの修飾キーに、マクロだけでなく、秀丸のほぼすべての機能を割り当てられることがわかります。

1406186

[キー]を適当に選んだり、[Shift]や[Ctrl]、[Alt]のチェックボックスをオン/オフしてみると、[コマンド]のほうが動いて、現在割り当てられている機能を確認できます。たとえば、[Ctrl]チェックボックスをオンにして[Ctrl+N]のキーを見てみると、[ファイル系]の[新規作成]が割り当てられています。

既存の割り当てがあっても、割り当てを変えれば簡単に上書きできます。キー設定をいろいろ変更してしまっても、[読込み]というボタンを使えばデフォルト設定はいつでも呼び出せます。


今回は以上の説明までにして、次回、実際に簡単なマクロを作り、それを「マクロ登録」して「キー割り当て」までやってみることにします。

02:23 午後 翻訳者のPCスキル | | コメント (0)

はてなブックマークに追加

2014.06.16

# 文字コード - 短期講座第5回 -

前回ダウンロードしたテキストファイルを使って、文字コードの話に進みます。

文字コードについては、しばらく前にside TRADOSにも記事を書きました。

リンク:禿頭帽子屋の独語妄言 side TRADOS: PCスキル - 文字コードをちょっと意識する

リンク:禿頭帽子屋の独語妄言 side TRADOS: PCスキル - 文字コードをもうちょっと意識する


今回の記事を読んでから、こちらもお読みいただくとよいかもしれません(内容は一部重複します)。


「文字コード」という用語は、前回やった「エンコード」とほぼ同義に使われることもあります。

ここでは一応、

ある文字セット(エンコード)で、各文字に割り当てられているコード

のことを「文字コード」と呼ぶことにしますが、例によってこの辺の用語はユルユルで進めます。


前回ダウンロードしたファイル ASCII.txt を秀丸で開いてください。

なお、前回の記事についてFacebookでコメントをいただきました。「ダウンロードしたファイルはUTF-8」と書きましたが、環境によってはShift-JISファイルとしてダウンロードされることがあるようです。テキストファイルをShift-JISでアップロードすると、ダウンロードしたとき文字化けすることがあるので、わざわざUTF-8に設定してアップロードしたのですが、ダウンロードの時点でエンコードが変わってしまうこともある。この辺が、エンコードのややこしいところでもあります。


カーソルがファイルの先頭にある状態で、[その他]→[コマンド一覧]を選択すると、[ファイル]メニューの近くにこのようなメニューが出現します。

1406161_2

もしかすると、この機能自体ほとんど知られていないかもしれません。表のメニューからは見えない機能が、実はいろいろあるのです。この"裏メニュー"から、さらに

[その他]→[文字コード表示]

を選択すると、カーソル直後にある文字の文字コードを調べることができます。

1406162_2

これが、感嘆符(!)の文字コード。

Shift-JISでは0x21
UTF-8でも0x21

ということがわかります。

同じようにアルファベット大文字のAとZの文字コードを見てみると---

1406163_2

これが、A。

1406164_2

これが、Zです。

0x21、0x41、0x5A...

この表し方についても説明が必要ですね。

21、41、5A

というのは、単なる英数字の並びでもふつうの数字でもなく、16進数です。16進数のことが分からない人は、こちらなどを参照してください。

そして、冒頭にいちいち0xと付いているのは、これが16進数であることの目印です。

今回の短期講座では扱いませんが、PCを知りたいなら、やはり2進数と16進数のことは理解しておいたほうがよさそうです。それがわかると、「1024って、キリがいい数字だね」などというわけのわからない発言の意味もわかるようになります。


前回も書いたように、このファイルにある文字は基本中の基本なので、Shift-JISでもUTF-8でも(そして、上の図で赤線を引いていない他のエンコードでも)、文字コードは同じです。


ファイル:日本語の文字

次に、このファイルをダウンロードして、秀丸で開いてみてください。日本語で使うひらがな、かたかな、常用漢字です。さっきと同じ手順で、「あ」、「ア」、「亜」の文字コードをそれぞれ調べてみてください。

文字コードを調べるとき、いちいちさっきの手順で裏メニューからコマンドを探すのはけっこう面倒くさいですね。そう思ったときこそ、PCスキル向上のチャンスです。秀丸エディタには「キー割り当て」という機能があります。これも近いうちに説明する予定です。

1406165_3

「あ」の文字コード。Shift-JISでは82A0、UTF-8ではE38182

1406166_3

「ア」の文字コード。Shift-JISでは8341、UTF-8ではE382A2

1406167_2

「亜」の文字コード。Shift-JISでは889F、UTF-8ではE4BA9C


最初に見たように、ASCII 文字の文字コードは2桁です。1バイトだから。一方、Shift-JISの文字コードは4桁、つまり2バイトです。さらにUTF-8になると6桁、つまり3バイトということになります。

それから、ASCII 文字とは違い、エンコードごとに文字コードも違うことがわかります。したがって、エンコードをUTF-8からShift-JISに変更してファイルを保存したとき、たとえばカタカナの「ア」は

E38182 → 8341

という風にPC内部では変換されているわけです。この変換がうまくいかないとき、いわゆる文字化けが起きることになります。


最後に、このファイル

ファイル:Shift-JISにない文字

も秀丸エディタで開いて、文字コードを調べてみます。

1406168_2

丸シー、著作権記号は、UTF-8でE292B8ですが、Shift-JISの文字コードは......ありません。

Shift-JISに文字コードが存在しないということは、さっき「ア」でやったような内部処理が通用しないということになります。前回、警告ダイアログが出て、「?」に置き換えられたのは、実はこれが原因だったわけです。


ファイルを保存したりダウンロードしたりしたとき、文字表記がなーんか変だ、というときは、まず文字コードのことを考えてみてください。

06:37 午前 翻訳者のPCスキル | | コメント (0)

はてなブックマークに追加

2014.06.15

# エンコードの基本 - 短期講座第4回 -

前回(改行の話)、最後のほうで下図のようなオプションを設定しました。

1406129

この設定をしてから、第2回でリンクを貼った寺田寅彦の引用のファイル(こちら)を開くと、

14061210

こう見えたんでした。このタイトルバーに見えている[CR + LF]が改行の種類でしたが、今日はその左に見えている[UTF-8]というやつについて説明します。

いわゆる「エンコード」のお話です。

テキストファイルというのは、

文字のデータだけでできているファイル

だと説明しました。アルファベット文化圏であれば、数字やよく使う記号まで含めても、「文字」の種類はたかが知れています。8ビットで表すことのできる128種類のデータだけでも十分でした。

(注:8ビットなら本当は256種類ですが、ASCII は実際には7ビットなので、種類が半分になります)

ファイル:主なASCII 文字一覧

※クリックではなく、右クリックで保存してください。

このように、一定の範囲で使える文字体系のことを、広義には文字セット、狭義にはエンコードと呼びます。上のリンクに挙げたASCIIというのは、もっともプリミティブな文字セットです。

文字セット、エンコード(エンコーディング)、文字コードという用語は、厳密に使おうとするとかなりややこしいようです。ここはIT専門家のためではなく、翻訳者のための話なので、そういう用語についてはユル~く考えておきましょう。


さて、上のリンクからダウンロードした ASCII.txt を秀丸エディタで開くと、タイトルバーには

[UTF-8][CR + LF]

と書かれているはずです。

これを別名保存してみましょう。[ファイル]→[名前を付けて保存]です。

1406151

ファイル名は適当でかまいませんが、[エンコードの種類]を、上の図のように

[日本語(Shift-JIS)]

に変えてください。

別名保存しても、このファイルにある94文字(英数字と記号)は基本なので、どんなエンコードにしても文字化けが起きたりすることはありません。

Shift-JIS というのは、日本語の文字を表すための文字セットですが、当然、ASCII に当たる欧文文字も含まれています。

ファイル:非ASCII 文字のファイル

※クリックではなく、右クリックで保存してください。

では次に、このファイルをダウンロードして、同じように[日本語(Shift-JIS)]で別名保存してみてください。

1406152

こーゆーダイアログが出て怒られてしまいます。

デフォルトでは[保存せずに変換できない文字へジャンプする]というオプションになっているので、そのまま[OK]してみてください。カーソルが

©

の文字の前にあると思います。この「©」も、後に続く ® も、欧文の特殊文字も、Shift-JIS には定義されていません。

上の警告ダイアログで[変換できなし文字を"?"などに置き換えて保存する]を選択して[OK]を押すと、

© → ?

® → ?

となってしまいました。こういう、エンコードの違いが、いわゆる文字化けの原因です。


テキストファイルを扱うときは、このエンコードをいろんな場面で意識する必要があります。

ASCII 文字セットで使われている英数字と記号が、いわゆる1バイト文字、シングルバイト文字です。

だから、

abc

の3文字だけ打って保存したテキストファイルのサイズは3バイトになります(ちゃんと自分で試すこと)。

ファイルのサイズを確認するには、エクスプローラでファイルを右クリックして[プロパティ]を選択します。

では、

あいう

と3文字打って、[Shift-JIS]で保存したら、ファイルは何バイトになるでしょうか。

そして、同じ「あいう」だけのファイルを[UTF-8]で別名保存したら、何バイトになるでしょう。それぞれ試してみましょう。


1406153

これがアルファベット3文字のテキストファイル。ファイルサイズ=文字数です。


1406154

ひらがな「あいう」を Shift_JIS で保存したファイルです。サイズはちょうど2倍の6バイトになりました。1文字あたりが2バイトずつだからです。


1406155

これは、同じ「あいう」の3文字ですが、UTF-8 で保存したファイルです。UTF-8 では、1文字が3バイトずつで表現されます。


翻訳の終わったWordファイルなどを、いろいろな処理のためにテキスト保存することはよくあると思いますが、そのたびに上のような警告ダイアログが出たり、いつの間にか「?」に置き換わっていることがある。こういうときは、この「エンコード」の話を思い出してください。

Wordファイルをテキスト形式で保存しようとすると、こんなダイアログをよく見かけると思います。

1406156

これも、趣旨は上の秀丸での警告ダイアログと同だったわけです。

09:32 午後 翻訳者のPCスキル | | コメント (0)

はてなブックマークに追加

2014.06.12

# 改行と論理行について - 短期講座第3回 -

前回のカスタマイズで、行番号の付き方が大きく変わりました。


これは[ファイル別の設定]→[体裁]→[詳細]→[行番号の計算方法]を、

[ワープロ的]

から

[エディタ的]

に変更したためです。

この設定変更に、実は「改行」というものの大切な考え方のヒントがあります。テキストファイルを扱うときは、改行のことをしっかり意識する必要があります。

もう一度、改行番号のオプションダイアログを見てみます。

1406124_2

[ワープロ的]の注として「折り返しも1行とする」、[エディタ的]の注として「改行だけを数える」と書いてあります。


この注の前提として「折り返し」と「改行」は違うということを、まず理解する必要があります。

改行などの記号も表示されるように設定を変えたはずなので、「改行」記号も見えていますね。↓ です。

  私に親しい ~ 聞かせた。↓

  「科学者になるには ~ 少数である。↓

  この一件相反する ~ もちろんである。↓

こんな風に「改行」が入っていて、その「改行」の数に対応して行番号が付いています。このように(明示的に)「改行」した1行のことを「論理行」と呼ぶこともあります。


一方、初期設定の「ワープロ的」というのは、(改行がなくても)右端で「折り返し」たら新しい行としてカウントします。ということは、1行の長さが変われば行番号もどんどん変わっていくということになります。1ページに何行印刷できるかしら... みたいなことを見るにはいいかもしれませんが、ふつうにテキストファイルを扱う場合、このような行の数え方は、ほとんど何の意味もありません。


それで、まず最初のカスタマイズで[エディタ的]に設定を変えたわけです。これからも、秀丸エディタで「改行」と言えばすなわち論理改行のことだと考えてください。

side TRADOSに先日アップしたこの記事、

side TRADOS: Microsoft用語集(tbx)をMultiTerm化

のなかでも「論理行」という言葉を使っています。

さて、「改行」には実は2種類があり、PCの環境によって使われ方が違うということも、テキストを扱うときは知っておいてください。

CR = Carriage Return(キャリッジリターン、復帰)

LF = Line Feed(ラインフィード、行送り)


そして、PC世界では、どういうわけか伝統的に

UNIX、Linux 系 …… LF

Mac OS …… CR

Windows …… CR + LF

ということになっています。


そのため、ファイルの出所によっては、同じようにWindows上で開いても、そして見かけではまったく変わらなくても、改行の種類が違っていることがあります。


秀丸エディタでテキストファイルを開いたとき、改行の種類をすぐに判別できる方法があります。

[その他]→[動作環境]を開いたら、まず[上級者向け設定]のチェックボックスをオンにします。

1406128

次に、[設定の対象]→[ウィンドウ]→[高度なウィンドウ]を選択し、[エンコードの種類]を下の図のようなオプションに設定します。

1406129

こうすると、タイトルバーでファイル名の隣にファイルの文字コードと改行の種類が表示されるようになります。

14061210

以下は余談。

"Carriage Return"と"Line Feed"っていうのは、タイプライターを知ってる世代だとピンとくる用語ですよねー。

タイプライターの動きをまったく知らない人は、YouTubeでタイプライターの動きを見てみてください。


キャリッジというのは、タイプライターを打つと左のほうへ移動していくシリンダー状のパーツです。このキャリッジに紙を巻き付けてあるので、印字位置が左端から右端まで進んでいきます。行末まで進んだ時点で、このキャリッジはいちばん左まで移動しています。次の行に進むときは、したがって、このキャリッジを初期位置に戻す必要があります。

これが、「キャリッジ」の「リターン」(復帰)です。

ところが、キャリッジがリターンしただけでは、厳密にいうと水平移動するだけで、行は進みません。そこで登場するのが「ライン」を「フィード」すること、すなわち「行送り」という垂直方向の移動です。


つまり、タイプライター上の機構を考えると、まず

「キャリッジをリターン」= CR

してから

「ラインをフィード」= LF

するという2段階の動作が「改行」だったということになります。その伝統を、いわば律儀に守っているのがWindowsプラットフォームという感じでしょうか。


「ばかじゃん? キャリッジリターン(CR)したら、同じ行に重ねて打つわけないんだから行送り(LF)だって自動的にやるに決まってるだろ」という発想でCRだけにしたのがMac OS。

「行送り(LF)したら、そのままに位置じゃ右端なんだから左端にリターンする(CR)の当たり前だわい」という発想でLFだけにしたのがUNIX系。

……というわけではないのかもしれませんが、まあそんな感じです。

12:39 午後 翻訳者のPCスキル | | コメント (2)

はてなブックマークに追加

# 秀丸エディタの使い始め - 短期講座第2回 -

これ以降は、基本的に秀丸エディタがお手元にあるという前提で話を進めます。

お持ちでない方は、本家のサイトからダウンロードして、インストールしてみてください。

リンク:秀まるおのホームページ(サイトー企画)-秀丸エディタ

シェアウェアですが、試用段階でも機能制限なく使えます(起動時に余分なダイアログが表示されるだけ)。そのまま使い続けてもかまいませんが、一定以上使いこなせるようになったら、4,320円は安い、と思えるはずです。

今回は、秀丸エディタをインストールしたら、これだけはしておくといいかも、という設定について説明します。


なお、マクロによっては、こういう導入部分の設定までぜんぶやってくれる親切機能も含まれていたりします。ここでは、あくまでも手動で設定します。

インストールしたら、たとえば、次のファイルを秀丸エディタで開いてみます。

ファイル:寺田 寅彦『科学者とあたま』より抜粋

ダブルクリックするとブラウザ上で表示されてしまうかもしれません。右クリックして terada.txt をローカルに保存してから、秀丸エディタで開いてください。

ついでに、開く前に、ダウンロードしたファイルのアイコンも念のために確認。今までのテキストファイルのアイコンではなく、秀丸エディタに関連付けられたアイコンになっているはずです。


あ、そうだ。大切なことを言い忘れました。今回のようなアプリケーション導入でも、マクロやプログラミングの学習でも、いちばん大事なのは必ず

自分でもやってみる

ことです。この記事や書籍を

読んだだけでは身につかない

と心得ましょう。

さて、デフォルトだと、こんな風に見えると思います。

1406121

このデフォルト設定を、自分で使いやすいようにある程度カスタマイズしましょう(どんなアプリケーションでも、使いこなすにはまず設定関係を確認すること。これもスキル向上のコツだと思っています)。


※以下、スクリーンショットはクリックで拡大できます。


秀丸エディタのカスタマイズは、2系統あります。

[その他]メニュー→[動作環境...]……アプリケーション全体の設定

[その他]メニュー→[ファイルタイプ別の設定...]……ファイルタイプごとの設定


[ファイルタイプ別の設定...]の使い方は、ちょっと慣れが必要ですが、ひとまず以下のダイアログのとおりに設定してみてください。

1406122

terada.txtファイルを開いたままであれば、左上のラベルは[.TXTの設定]になっているはずです。ここは、今開いているファイルの拡張子が反映されます。

[共通]と見えているドロップダウンは、開いてみるといろいろなファイルタイプがあります。これを選択すると、ファイルタイプ別に(つまり拡張子ごとに)設定を変えられます。だから、ここは[ファイルタイプ別の設定...]なわけです。ここでは、どのファイルにも共通で設定を変えようとしているので、[共通]のままでOK。

[設定の対象]が[フォント]ツリーであることを確認して、フォントの[サイズ]を適当に選んでください。デフォルトはたしか9ポイントで小さすぎます。


1406123_2

次は、[設定の対象]を[体裁]に移動したところです。上の図のように、[禁則処理]をオンにしてください。和文のいわゆる禁則処理だけでなく、英文のワードラップもこれをオンにしないと機能せず、英文がたいそう見にくくなります。


1406124

[設定の対象]→[体裁]の下の[詳細]に移動しました。[行番号の計算方法]を[ワープロ的]から[エディタ的]に変更します。黄色い枠で囲ったオプションは任意ですが、少し行間を広げたほうが読みやすくなります。


1406125


1406126

上の2つは、どちらも[設定対象]→[デザイン]のオプションです。[改行文字]とか[全角空白]、[半角空白]などは表示しておいたほうがいいので、それぞれオンにします(上図)。

同じオプション欄を下までスクロールしたのが下図です。特に[ホームページURL][ファイル名と思わしく場所]はオンにしておいたほうがいろいろ便利。


最後に、このダイアログ全体の[OK]を押してください。[保存しないで更新]を押すと一時的な設定変更になり、次の*.txtファイルを開いたらデフォルトにもどってしまいます。


以上の設定を変更すると、このように変わると思います。

1406127

何がどう変わったか確認してください。

特に、行番号の付き方が変わったことに注目です。この話が次回に続きます。


アプリケーション全体の[動作環境]は、ひとまずデフォルトのままにしておきましょう。

11:41 午前 翻訳者のPCスキル | | コメント (0)

はてなブックマークに追加

2014.06.11

# テキストファイルについて - 短期講座第1回 -

6/28(日)のほんま会に向け、秀丸エディタと秀丸マクロについての簡単な予習になりそうな内容を、

翻訳者のPCスキル・短期集中講座

として連載してみようと思います。


第1回は、テキストファイルのお話です。

テキストファイルというものがちゃんとわかると、PCスキルが一段階向上すると思います。


Wikipediaにも項目はありますが(テキストファイル - ikipedia)、私なりにまとめておきます。


ざっくり言うと、テキストファイルというのは、

文字のデータだけでできているファイル

です(ここでいう「文字」は、数字、記号なども含んでいます)。文字データだけなので、原則的には≪ファイルサイズ = 文字のバイト数≫ということになります。


このテキストファイルを、"そのまま"開けるのが「テキストエディタ」と呼ばれるアプリケーションです。商用アプリケーション、フリーウェア、シェアウェアともいろいろ出ていますが、Windows界では秀丸エディタが老舗です。

Windowsにも標準で付属しています。それが、有名な「メモ帳」(英語名はNotepad、ファイルとしてはnotepad.exe)。Windows 1.0の頃(1985年)からあるそうなので、そうとう「枯れた」ソフトウェアということになります。

[すべてのプログラム]→ [アクセサリ]→[メモ帳]

で開きます。


メモ帳に文字を入力して保存するとどうなるか、これはside TRADOSの過去エントリにありますから、そちらも併せてご覧ください。

参照リンク:side TRADOS: PCスキル - 文字コードをもうちょっと意識する

さて、テキストファイルは通常、*.txtという拡張子です。つまり、*.txt ファイルをダブルクリックすれば、標準ならメモ帳が開くし、秀丸エディタをインストールしていれば、たぶん秀丸で開きます。


が、テキストファイルは *.txt だけではありません。ここからが"テキストファイル"の肝です。

自分のPCに、

*.html

*.xml

*.log

のような拡張子のファイルがあったら、片っ端からエディタで開いてみましょう。

と言っても、ダブルクリックではダメです。*.log はたぶんメモ帳で開きますが、上の2つはブラウザで開いてしまいます。エディタの[ファイル]メニューから開くか、エディタのアイコン(ショートカット等)上にドラッグアンドドロップしてください。

*.html というのは、ブラウザで表示するためのいろいろな情報(タグなど)が入ったファイルですが、中身はちゃんとエディタで読めるはずです。*.xml も *.log も同様。

1406111

↑これは、秀丸マクロのひとつ(*.mac)をメモ帳で開いたところです。


では、今度は

*.docx
*.xlsx
*.pdf
*.jpg

など、何でもいいのですが、ふだんそれぞれ専用アプリケーションで開いているはずのファイルをエディタで開いてみてください。ダブルクリックではダメですね。上に書いた方法で。

1406112

これが、*.docxを開いた画面です。部分的には読めますが、基本的にはまったくアウト。


このように、テキストエディタで開いて読めるファイルを「テキストファイル」と言います。

かたや、テキストファイルで開いても意味不明なファイルは「バイナリファイル」です。

バイナリファイルは、専用アプリケーションがないと編集できません。テキストエディタで開いて適当に編集してしまうと、本来のアプリケーションで正しく開かなくなります。

一方、テキストファイルは基本的にテキストエディタで操作が可能です。

PCの扱いに慣れてくるほど、テキストファイルとテキストエディタを頻繁に使うようになる、その理由がまさにここにあります。


具体例を、翻訳者になじみの深い例で説明します。

SDL Trados 2007 まででTagEditorを使ったことのある方は、*.ttxをテキストエディタでひらけることをご存じだったでしょうか。

TagEditorの検索・置換機能はけっして使いやすいものではありません。テキストファイルとしてエディタで開けば、いろいろな操作が可能です(正規表現による細かい検索など。ただし、タグを壊したりすると*.ttx として正しく機能しなくなるので要注意)。


虎使いじゃない方は、たとえばJammingをお使いであれば、Jammingのインストールディレクトリで

初期設定\dicpath

というファイルをさがし、エディタで開いてみてください。登録してある辞書のパスが書いてあります。マシン環境のお引っ越しで、もしJamming辞書データの置き場所が変わっても、ここを編集すれば簡単に移行できます。


つまり、テキストファイルを開ければ、

アプリケーション自体では不可能/不自由な部分をカバーできる

ことが多いわけです。

そして、秀丸マクロというのは、こういう「テキストファイル上のいろいろな操作を限りなく便利にするツール」です。

何でもできるとは言いませんが、

できることの範囲が想像以上に広い

ことは、間違いありません。

その範囲がちゃんと見えてくると、秀丸エディタのシェアウェア料金4,320円というのはまったく高くない、と思えるはずです。

12:05 午後 翻訳者のPCスキル | | コメント (0)

はてなブックマークに追加

2014.06.10

# We call him "ゴジラ"!

昨日『X-MEN: フューチャー&パスト』を観にいったら、この新しい予告編が流れてました。

われらのケンさん、

We call him "ゴジラ"

って言うんですよ(0:55くらい)。US版だけど、

Godzilla

じゃない、"ゴジラ"!

ウチの家内でも気づいたくらいなので、みんなわかってくれてるはず。


ご本家であるはずの日本で、

公開がこんなに遅いのはなぜ

だぁ~、と叫びつつ、あと40日ほど待つことにします。

06:18 午後 映画・テレビ | | コメント (7)

はてなブックマークに追加

2014.06.09

# ほんま会にお邪魔します - 6/29

「翻訳者のためのマクロ勉強会」、通称

ほんま会

をご存じでしょうか。

リンク:HOME - 翻訳者のためのマクロ勉強会

当勉強会は翻訳環境向上のために、秀丸エディタと秀丸マクロ、Word VBA、AutoHotKey等の研究を行う会です。

という趣旨で、大阪の特許翻訳者、糸目慈樹さんが立ち上げた勉強会です。通翻クラスタでは、

Wordマクロなら東の新田さん!

秀丸マクロなら西の糸目さん!

というのが、今ではすっかり定番になりました。


私自身は、今までなかなか都合がつかずに一度も出席できずにいましたが、そうこうしているうちに、次の東京勉強会には私もお邪魔して、手持ちの秀丸マクロを紹介することになりました。

リンク:東京勉強会詳細 - 翻訳者のためのマクロ勉強会


Facebookのイベントページはこちら:
https://www.facebook.com/events/1455012111412652/?ref=2&ref_dashboard_filter=upcoming&source=1


6/29(日)

午前の部・・・ 9:30~12:30
午後の部・・・13:30~16:30
懇親会もあり!


IJET-25の興奮もさめやらぬ、1週間後の日曜日です。


私は午後の部を担当(もちろん午前中から参加していますが)し、

Tradosその他のツールと秀丸マクロの連動

というテーマで、ふだん使っている秀丸マクロをご紹介します。

Trados(Studioを含む)を使う作業をちょっとだけ支援したり、Tradosだけだとなかなかうまく処理できない部分を秀丸マクロで補ったり、まあそんな内容です。

・検索を少しでも楽にしたい

・検索結果を効率的に使いたい

・TradosのConcordance検索がもの足りない

・各種の関連ファイルを見やすくしたい

・タグをぜんぶ消したい

……等々

単にマクロを紹介するだけではなく、どんな経緯でそれを作ったか、どんなロジックで動作するのかなど、これからマクロを自分で作ってみたい人のヒントにもなるようにお話しする予定です。


すでに7割ほどのお席が埋まっているということです。

04:48 午後 翻訳者のPCスキル, パソコン・インターネット | | コメント (3)

はてなブックマークに追加

2014.06.07

# マイクロソフト ランゲージ ポータル - 更新版

Microsoftさんが、自分のところで使っている用語やUI 訳を公開している「ランゲージポータル」。このサイトについては、公開が始まった頃に一度、記事を書いたことがありました。

リンク:# マイクロソフト ランゲージ ポータル

あれからもう6年も経ち、いろいろと状況も変わったので、更新版をアップすることにしました。


まず、以前の記事で書いていたこの件、

> ちょっとレスポンス遅いですが

今は当てはまりせん。ストレスなく検索できる十分な速さです。


それから、

> 結果が Terminology と Software Strings に分かれて表示されます

6年前はそんな表示でしたっけ? 今はもっとわかりやすくなっています。


リンク:マイクロソフト | ランゲージ ポータル


トップページに行くと、「用語検索」フィールドだけではなく、下のほうに


「スタイル ガイド」(青色)

「用語集」(オレンジ色)

「UI 訳語データ」(緑色)


という3つのボックスが並んでいます。このうち「用語集」というのが、かつて"Terminology"だった内容、「UI 訳語データ」というのが"Software Strings"です。「UI 訳語」のダウンロードは、MSDNかTechNetに登録していないとできませんが、検索は誰でもOK。

検索フィールドに何か入力して実行すると、検索結果も

「マイクロソフト用語集」

「製品別用語」

という2つのセクションに分かれて表示されます(細かいことですが、文字の色も上のボックス色に対応しています)。「製品別用語」のほうは、エントリが多すぎるようなら、検索フィールドのすぐ下にある「製品」というドロップダウンフィールドを使って絞り込んでみてください。

たとえば "run"を検索すると、「マイクロソフト用語集」には単に「実行」と出てきますが、「製品」を「Windows」に限定すると、「ファイル名を指定して実行」も見つかります。


Microsoftさんは"interface"をどう表記するんだっけ? という場合は「マイクロソフト用語集」の結果を、製品別にUI 訳を確認したいときは「製品別用語」の結果を見てください。

ダウンロードした「用語集」をTradosでMultiTerm化したい、という人は、side TRADOSの記事をご覧ください。

02:26 午前 TRADOS, パソコン・インターネット | | コメント (0)

はてなブックマークに追加

2014.06.03

# 今月の水木さん(水木しげる漫画大全集 2014/6)

(注:書いたのは6/15ですが、6/3付に変えました)

1月の第8回配本でシリーズをスタートしましたが、ちっとも続行できていませんでした。

ぼちぼちと...

第13回(2014/6/3)配本

『沖田総司 他 付四コマ漫画』


『神秘家列伝(下)』



表題作である『沖田総司』。

黒鉄ヒロシの『新撰組』には残念ながらはるかに及びませんが、いつもながら不思議な迫力は満点。

新撰組ものとしては珍しく下ネタが頻出するところも水木さんならではで、その下ネタも含めて、全編が

"ギクシャクした"喜劇性

にあふれています。原田左之助と沖田が餅を食うくだりなんか、たまりません。

そもそも新撰組という物語は、時代が生んだペーソスでありながら、どこかドタバタ喜劇の要素がありますよね。その感じが本作には実によく出ています。

巻末の解説は、いしいひさいち。これも見事にはまっています。


『神秘家列伝(下)』は、同名シリーズの最終巻。

今回の1本目を飾る「仙台四郎」、これ、水木しげるの数ある作品の中でも屈指の1本です。水木リリシズムが遺憾なく発揮されていて、他のどんな作家にもない至福の読後感を味わうことができます。

ちなみに、「神秘家列伝」は季刊誌「怪」に連載されていたシリーズで、この辺が今回の監修である京極夏彦との接点でもあったわけです。

巻末の解説は、玄侑宗久。

08:08 午後 アニメ・コミック・サブカル | | コメント (0)

はてなブックマークに追加