エンジニア、クリエイターのための派遣求人情報ラボラトリー
キャリア・ラボ IT TOP > IT Columns > 文字コードで世界に出る~さらば!文字化け~ > 第12回
IT Columns 【文字コードで世界に出る~さらば!文字化け~】
Windowsの外字を理解する
12  前回、Windowsでは「シフトJISコード」という文字コードが使われている旨、説明しました。
  この「シフトJISコード」はその名が示す通り、「JIS漢字」で規定されている文字のコード領域をごっそり別の場所にシフトさせてあるという特長のほかに、「JIS漢字」にはない記号や漢字が「外字」として追加されているという特長を備えています。「外字」というと、昔はユーザが独自にデザインした文字を指すのが一般的でしたが、最近はこのようにOSが独自に追加した文字も「システム外字」と呼び、外字の一種とみなすようになっています。
  今回から数度に渡って、Windowsが収録している「システム外字」について説明しましょう。

Windowsは3種類の「システム外字」を収録

 Windowsの外字の内、比較的よく使われているのは、①・Ⅲ・㈱・№・㍼といった記号の数々です。
 MS-IMEやATOKなどのIMEでも、「いち」→「①」、「かぶしきがいしゃ」→「㈱」、「なんばー」→「№」、「しょうわ」→「㍼」というように、ふつうに読みから変換できてしまいますので、最近ではこれらの記号が外字であることを知らない人も増えているようですが、いずれも「JIS漢字」には含まれていない歴とした外字です。

 これらの記号は、Windows以前にパソコン市場で圧倒的なシェアを持っていたNECのPC-9801シリーズが漢字ROMの中に収録していた外字を、Windows開発時にそっくりそのまま踏襲したことから「NEC特殊文字」と呼ばれています。
 「NEC特殊文字」には、①・②…⑳といった丸付き数字、Ⅰ・Ⅱ…Ⅹといったローマ数字(大文字だけ)、㍉・㌻といった組み文字、㎝・㎡といった単位、㍾…㍻の年号、№・㏍・℡・㈱・㈲といった略語、㊤・㊧といった丸付き文字のほかに、≒・√・∵・¬といった数字記号が含まれています(図1)。

「NEC特殊文字」に含まれている文字 「NEC特殊文字」に含まれている文字
【図1】
「NEC特殊文字」に含まれている文字
 「NEC特殊文字」と並んで、よく使われているのが「IBM拡張文字」と呼ばれるシステム外字です。「NEC特殊文字」がNECのPC-9801シリーズの外字を踏襲したものであるのに対して、こちらは日本IBMのPS/55シリーズの外字を踏襲したものです。

 「IBM拡張文字」には、Ⅰ・Ⅱ…Ⅹ、ⅰ・ⅱ…ⅹといったローマ数字(大文字と小文字の双方)、№・℡・㈱といった略語、∵・¬・"といった記号のほかに、纊・褜・鍈・銈・蓜……鵰・鵫・鶴・鸙・黑といった「JIS漢字」にない漢字が360字も含まれています(図2)。

「IBM拡張文字」に含まれている文字(漢字は一部のみ) 「IBM拡張文字」に含まれている文字(漢字は一部のみ)
【図2】
「IBM拡張文字」に含まれている文字(漢字は一部のみ)
 「IBM拡張文字」の漢字はもっぱら人名に使われている漢字から採用されたようで、彅・﨑・塚・弴・福・靖・緖・羽・鄧・閒・髙など、著名人などの名前でよく見かける漢字が多く含まれています。

 ちなみに、「彅」字はSMAPの草彅君の「彅」ですが、もちろん、彼の名前によって採用されたものではありません。以前、「なぜ、IBM拡張文字に[彅]字が含まれているのだろうか」と疑問を持ち、図書館にある人名録や歴史人名辞典の類を軒並み、調べてみたことがありますが、残念ながら、この字を含んだ有名人を見つけることができませんでした。彼以外で、「彅」字が付く著名人をご存知の方がいましたら、ぜひ、ご教示ください。

 閑話休題。
 「NEC特殊文字」と「IBM拡張文字」は割と有名ですので、その存在を知っている方も少なくないと思いますが、実はWindowsにはもう1種類、「NEC選定IBM拡張文字」と呼ばれるシステム外字が収録されています(図3)。
 この名称は、NECが「JIS漢字」を拡張する外字として「IBM拡張文字」をPC-9801シリーズに採用しようとした際に、
  ・パソコンの設計上の違いから同じコード領域に割り当てることができなかったため、別のコード領域に収録
  ・Ⅰ~Ⅹ・№・℡・㈱・∵の14字は既に「NEC特殊文字」に含まれていたため、除外
したことに由来しています。

「NEC選定IBM拡張文字」に含まれている文字(漢字は一部のみ) 「NEC選定IBM拡張文字」に含まれている文字(漢字は一部のみ)
【図3】
「NEC選定IBM拡張文字」に含まれている文字(漢字は一部のみ)

3種類の「システム外字」の関係は?

 さて、Windowsに収録されている3種類のシステム外字を紹介しましたが、それぞれに含まれている文字をじっくりと眺めると、
  -Ⅰ・Ⅱ…Ⅹなどのローマ数字(大文字)と№・℡・㈱・∵の4つの記号が「NEC特殊文字」と
    「IBM拡張文字」の両方に含まれている
  -ⅰ・ⅱ…ⅹなどのローマ数字(小文字)、¬・¦・'・"の4つの記号、纊・褜・鍈…鶴・鸙・
    黑といった漢字が「IBM拡張文字」と「NEC選定IBM拡張文字」の両方に含まれている
ことがわかります。
 これをまとめると、図4のようになります。
Windowsの3種類の外字の関係 Windowsの3種類の外字の関係
【図4】
Windowsの3種類の外字の関係
 前述した通り、「NEC特殊文字」と「IBM拡張文字」はそれぞれWindows以前にNECと日本IBMのパソコンが搭載していた外字によるものです。Ⅰ・Ⅱ…Ⅹなどのローマ数字(大文字)と№・℡・㈱・∵の4つの記号はどちらにも含まれていたため、マイクロソフト社がWindowsのシステム外字としてこの両方の外字セットを採用した時点で、双方の外字領域に重複して収録されてしまったものです。
 また、「NEC選定IBM拡張文字」は「IBM拡張文字」をNECが別のコード領域に割り当てたものであるため、これもWindowsの「システム外字」として重複して収録されてしまったものです。

 今となっては、いかにも無駄なことをしたように見えてしまいますが、MS-DOSからWindowsへと移行する段階では、「それまでに作成されたデータ資産をいかに無駄にすることなく、引き継ぐか」が重要な課題となっていましたので、PC-9801シリーズやPS/55シリーズの外字をそのまま継承することも必然的に求められていたのです。

 では、実際にこれらの3種類のシステム外字はどうやって利用することができ、また、利用するうえでの注意点があるのでしょうか? 次回は、そこら辺を追究していきたいと思います。

ページトップ
フジスタッフホールディングスグループのサイト
オフィス系人材サービスキャリア・ラボ 人材派遣 | 転職 | ITエンジニア | CAD派遣 | 新卒・第二新卒 | ワーキングマザー
ファクトリー系人材サービスジョブデパ 求人情報 | エンジニア
その他人材サービス:人材紹介 | 旅行 求人 | メンタルヘルス | キャリアサポート | 障害者支援
その他サービス:ネットショッピング | タイムレコーダー販売 | 広告デザイン | ITソリューション | 大型ビジョン放送 | 保険相談