6.半角と全角の違い
全角・半角はもともと印刷用の活字について言われた言葉。全角は、縦横の比が同じ、つまり正方形の活字のこと。日本の文字は、正方形のマス目に、おさまりが良い。一方、ローマ字や英数字は、正方形では横に間延びがした感じがする。そこで、横を半分にすると、ちょうど良い感じになる。そんなわけで、ローマ字や英数字には、横が半分の活字、つまり半角がよく使われるわけ。
こうすると、全角・半角の区別は、簡単明瞭なのですが、今のパソコンの世界では、実はこうスッキリとはいきません。少し、印刷の歴史を見てみましょう。
日本の文字は、正方形のマスに収まりが良い、と言いましたが、アルファベットは、そうはいきません。横幅の広い W と、その半分の V 、さらに狭い I 、これらを、同じ間隔で並べていくと、どうも間延びのした感じになります。そんなわけで、欧米では、印刷に際し、文字によって横幅の違う活字を、昔から好んで使って来ました。
横幅の同じ活字も、使ってはいました。それが、コンピュータの初期には、重宝(ちょうほう)されました。サイズが一定の文字の方が、コントロールが楽なのです。四角なタイルを並べていくことを考えてみてください。サイズが同じタイルを使っていれば、どれだけのタイルを使えばよいか、簡単に予測できますが、サイズが違うと大変です。人間は、何事も「感でやる」ということができますが、コンピュータはそれができなくて、何もかも、律儀(りちぎ)に計算しないと収まりません。そこで、コンピュータに負担をかけないように(!)という配慮で、横幅が一定の文字を使っていました。
「より美しく印刷したい」という欲は、いつでもありました。それが、パソコンが発達すると、つまり、パソコンが計算にどんどん強くなっていくと、幅の違う文字を使うことが可能になったのです。そこで、パソコンの文字には、横幅の一定な固定幅(fixed pitch / mono space)のものと、幅の違うプロポーショナル・フォント(proportional font)の両方が使われるようになったのです。
※「MS P明朝」の P は、proportional(プロポーショナル)の P で、固定幅の「MS明朝」と区別されます。
このように、日本語フォントの多くは、 P のありなしで、プロポーショナルと固定幅を区別しています。
※ある種類の1組の文字のセットを、フォント(font)と言います。フォントは、チーズ・フォンデュのフォンデュの親戚の言葉。フランス語の動詞にfondreというのがありますが、これは、「溶かす」という意味。チーズ・フォンデュは、チーズを溶かしたものをソースとして食べる料理。文字のフォントは、活字の作り方から来ています。活字を作る時は、文字の型に金属を溶かし入れて作るのです(=鋳造:ちゅうぞう)。溶かして作ったもの(=鋳物:いもの)だから、「溶かすfondre」の過去分詞fontを使って、それを表現するようになったわけ。
日本にコンピュータが紹介された初期は、日本の文字を使うことはできませんでした。それが、「文字をbitで」の中で説明したように、工夫してカタカナを使えるようになりました。このカタカナは、アルファベットと同じサイズでした。やがて、日本でも技術の進歩と、ユーザーの熱望により、漢字やひらがなが使えるようになったのです。
この時に、文字を表現するのに2バイトを使うことを、始めました。2バイトで表現できる文字は最大65,536種類。また、もともとの英数字の幅では、漢字を表現することが難しかったので、1バイト文字の2倍の幅で、この2バイト文字を作ることになりました。もともと、日本の活字で区別していた「全角:半角」というのを、そのまま、持ち込んだのです。バイト数が2倍になったのだから、文字幅が2倍になるのは、論理的でもあります。
日本では、原稿用紙のマス目に1文字ずつ、お行儀よく収める文化が定着していたので、プロポーショナル・フォントへの要求は、最初、余りありませんでした。そのため、フォントの横幅は2種類、全角と半角とに、きちんとわかれていました。半角は、先にも説明したように、1byte=256文字の範囲にある文字で、アルファベットと英数字、欧文の時の記号、それに、カタカナがあります。
しかし、原稿用紙を使うときも、話したことの最後の。」など、「句点+カッコは1マスに収める」という規則があります。それで、全角文字にも、プロポーショナル・フォントが出て来ました。これは、漢字、カナの幅はすべて同じだけど、英数字と記号の幅が調整してあるのです。そのため、現在では、「見た目で全角と半角を区別する」ということが、とても難しくなっています。文字を作るコードの世界で、1byte=256文字の範囲に収まれば半角、そうでなければ全角、ということが一番確実なように見えます。
半角と全角の使い分けについては、次の「半角と全角を使い分ける[1]」から、説明を始めます。
☆今では、1byte <-> 2bytesの違いで区別するということが難しくなっています。これは、ユニコード(Unicode)という2bytesの文字を、世界的に使うようになってきたからです。このユニコードについては、別の機会に説明します。
※日本語の文字は、横幅は一定ですが、縦の長さは、必ずしも一定ではありませんでした。中国では漢字だけなので、縦横きちんと並べるときれいに見えるのですが、日本にはひらがながあります。ひらがなは、特に崩し書きにした時など、文字の姿に応じで縦長になったり、短くなったりします。また、繰返しを表す記号には、縦2文字分のものもあります。そんなわけで、「日本語は、原稿用紙のマス目にきれいに収める」というのは、「神話」に属するものかも知れません。和紙に筆で書いた、昔の和歌や仮名交じりの手紙などは、実に自由に書かれています。あるいは文学館などにある文豪の直筆原稿にも、たまに、そんなものがあります。