NDL 書誌情報ニュースレター2015 年4 号(通号35 号)
した。
[8] たとえば、“title or form of title chosen to identify the work”という英文中の“chosen”は、フラ
ンス語では性・数の一致により“choisi”“choisie”“choisi(e)”“choisis”の4 通りの翻訳が可能。
[9] JSC は、2015 年11 月、RDA 運営委員会(RDA Steering Committee:RSC)に名称が変更されました。
RDA Governance Review Takes First Step in Implementation (RSC, 2015/11/7),
http://www.rda-rsc.org/RDAgovernancefirststep, (参照 2015-11-20).
[10] 下記のURL に、2013 年5 月以降の変更箇所のリストが掲載されています。
http://www.rdatoolkit.org/translation/french, (参照 2015-11-02).
[11] LAC のRDA 導入時期は、本誌前号「連載「世界のRDA の取組みのいま」が始まります」によります。
http://dl.ndl.go.jp/view/download/digidepo_9496832_po_2015_3.pdf?contentNo=1#page=5, (参照 2015-11-
30).
BAnQ のRDA 採用時期は、下記の記事によります。
Pat Riva. The French translation of RDA is published!. SCATNews. June 2013, Number 39, p. 15,
http://www.ifla.org/files/assets/cataloguing/scatn/scat-news-39.pdf, (参照 2015-11-30).
[12] ABES, BnF. “Historique des travaux français sur RDA”. Transition bibliographique.
http://transition-bibliographique.fr/enjeux/historique-travaux-francais-rda/, (参照 2015-11-30).
[13] “De RDA en France à la Transition bibliographique”(Novembre 2014).
http://www.bnf.fr/documents/1411_transition_bibliographique.pdf, (参照 2015-10-20).
「書誌移行」計画についてはBnF のホームページで紹介されています。
http://www.bnf.fr/fr/professionnels/normes_catalogage_francaises/a.rda_fr.html, (参照 2015-10-20).
専用のサイト“Transition bibliographique”も公開されています。
http://transition-bibliographique.fr/, (参照 2015-10-20). [14] 和中幹夫・古川肇・永田治樹訳. 書誌レコードの機能要件: IFLA 書誌レコード機能要件研究グループ最終 報告 (IFLA 目録部会常任委員会承認). 日本図書館協会, 2004, 121p, http://www.ifla.org/files/assets/cataloguing/frbr/frbr-ja.pdf, (参照 2015-11-05). [15] http://www.bivi.fonctions-documentaires.afnor.org/livres-blancs/rda-fr-transposition-francaise- de-rda, (参照 2015-10-20).
-17-
NDL書誌情報ニュースレター2015年 4号(通号 35号)
世界の RDA の取組みのいま(5)―フィリピン
【はじめに】
フィリピンでは従来、英米目録規則第2版(Anglo-American Cataloguing Rules, second edition: AACR2)を
使用して目録を作成していましたが、 2012 年 12 月、フィリピン図書館専門職調整委員会 (Philippine
Professional Regulatory Board for Librarians: PRBFL)が国内の図書館に、2015 年までに目録規則として
RDA(Resource Description and Access)を採用するように指示しました。本稿では、2013年5月から7月にかけ
てアナベル・パレーデス・アセデラ氏が実施したアンケート調査の結果に基づき、ミンダナオ島の図書館におけ
る RDA に対する意識やその準備状況(2013 年 7 月時点)をご紹介します[1]。なおアセデラ氏は、アンケート実施
当時、北ミンダナオ地方の教育の中心、カガヤンデオロ市にあるルーデス大学に所属していました。また、あわ
せて、2015年9 月現在のフィリピン全体のRDAの対応状況についてもご紹介します。
【背景】
フィリピンの図書館員にとって、RDAはまだあまり馴染みがありません。その基本概念となる「書誌レコードの
機能要件」(Functional Requirements for Bibliographic Records: FRBR)[2]がフィリピンの図書館員に初めて
紹介されたのは、2006年11月の第1回フィリピン目録作成専門家会議(First Meeting of Philippine Experts
on Cataloging)でのことでした。 当時の参加者たちの反応は、 「私たちをさらに混乱させるだけだ。 」 「著作(work)、
表現形(expression)、体現形(manifestation)、個別資料(item)など目録作成に何の意味もない。 」といった否定
的なものでした。そして、会議の後、FRBRは忘れ去られたかのようでした。
2008年 11月には、米国のRDA開発合同運営委員会(Joint Steering Committee for Development of RDA:JSC)
が RDAの草案を公開しましたが、国内での対応は緩慢なものでした。講義や研修が開催されたものの、RDAの概要
や簡単な紹介に留まるものがほとんどだったのです。
しかし、その後、2012年7月に、フィリピン国立図書館がRDA適用スケジュールの策定などを目的に、国内の
図書館員の RDA 移行準備に関する会合を開催しました。同年12 月、PRBFL は、AACR2 の代わりにRDA を採用する
ことを発表しました。
一方、アセデラ氏が、RDAについて、ミンダナオ北部の中心都市カガヤンデオロ市の図書館員を対象に、非公式
なヒアリング調査を実施したところ、楽観、悲観、無関心などのさまざまな反応がありました。さらには、RDAに
ついて全く知らない図書館員さえいることがわかりました。そこで、カタロガーの研修の検討の参考に、ミンダ
ナオ島の図書館員のRDAに対する意識と各図書館における準備状況をより詳しく調査することにしました。
【調査方法と調査対象】
アンケートは、2013年5月から7月にかけて、ミンダナオ島の28の図書館の司書資格を持つ図書館員51名を
対象に行われました。RDAは、すべての図書館業務に影響するため、アンケートの対象者を目録担当者に限定しま
せんでした。その結果、回答者の内訳は、全体の45%が「ワンパーソン・ライブラリーの図書館員」で、43%が目
録以外の業務(収集、レファレンス、貸出、医療分野、総務等)担当者でした。目録担当者は全体の12%でした。
アンケートは質問事項 10 問からなり、海外の二つの図書館関係団体(米国の SWON 図書館コンソーシアム(SWON
Libraries Consortium)およびカナダ図書館協会(Canadian Library Association )の専門サービスに関するグル
-18-
NDL書誌情報ニュースレター2015年 4号(通号 35号)
ープ(Technical Services Interest Group)[3] )がそれぞれ行ったRDAに関する調査をもとにアセデラ氏が作成 しました。
【調査結果と考察】
PRBFLによるRDAの採用に関する決定については、78%が認識していましたが、各館における適用のための準備
状況については、未対応という回答が相当数に及びました。具体的な適用時期については、41%が適用未定と回答
した一方、すでに適用している(16%)、2013 年または 2014 年中に適用する予定である(29%)という回答もあり
ました。また、適用する予定がないとする回答は4%でした(図1)。
図1 RDAの適用時期[4]
つぎに、前述のとおり RDA はフィリピンの図書館界にとって馴染みのないものであり、十分な研修が必要であ るため、RDAの講義や研修の受講経験の有無について質問しました。その結果、ほとんどの図書館員がすでに受講 したことがあると回答しました。さらに、その講義や研修が実際にRDA を適用するために十分なものだったかど うかについては、反応が真っ二つに分かれ、47%が研修は十分と感じているのに対し、53%はそうではないという 回答になりました。 RDA について充分理解できたと思われる分野は何かという質問には、RDA の適用方法と用例(25%)、RDA の規則 の基本(24%)、AACR2との違い(19%)と続きました(図2)。
まだRDAをど のように使う か決めていな い, 41% 2013年中に使 う予定, 27% すでにRDAを 使用している, 16% 状況が落ち着 いてから, 10% 使う予定は まったくない, 4% 2014年中に使 う予定, 2% -19-
NDL 書誌情報ニュースレター2015 年4 号(通号35 号)
図2 RDA について充分理解できたと思われる分野[5]
RDA を実際に仕事でストレスなく使えるかどうか尋ねたところ、ストレスがない(18%)、あまりストレスがない (36%)、ややストレスを感じる(16%)、ストレスを感じる(29%)という結果でした(図3)。
図3 RDA を実際に仕事でストレスなく使えるか[6]
25% 24% 19% 11% 9% 7% 6% 0% 5% 10% 15% 20% 25% 30% RDAの適用方法と用例 RDAの規則の基本 AACR2との違い FRBR 特殊な媒体へのRDAの応用 RDAへの移行 RDAの規則の詳細 ストレスがない, 18% あまりストレスがな い, 36% ややストレスを感じ る, 16% ストレスを感じる, 29% -20-
NDL書誌情報ニュースレター2015年 4号(通号 35号)
さらに、研修を受講した回数と RDA の使用におけるストレスの相関関係を調べました。その結果、受講した回 数が多いほど、RDAをストレスなく使えると感じていることがわかりました。しかし、十分に研修を受けたと感じ ている図書館員の場合でも、RDAの概要は理解しているものの、 非図書資料に適用するためにはより進んだ知識を 必要としていました。また、当然のことですが、研修が十分でない図書館員ほどRDA の使用にストレスを感じて いました。 RDAは、冊子体以外に、RDA Toolkitとしてオンラインでも有料で提供されています。RDA Toolkitは、年に数 回改訂されるRDAの規則そのもののほか、MARC21フォーマットとのマッピングや、米国議会図書館(LC)の指針類 も見ることができ、RDAを使って目録を作成する図書館員にとって必要不可欠なツールです。ところが、アンケー トに応じた図書館員が所属している28の図書館のうち89%はRDA Toolkitはもちろん冊子体も持っておらず、六 つの図書館では RDA Toolkit が何かさえ知りませんでした。RDA に関する研修の配布資料だけを頼りにしている 図書館も少なくありませんでした。そのおもな理由は、図書館員にRDA Toolkit の目的や使用に関する知識がな いことと、年間予算10万ドル以下の小さな図書館では、RDA Toolkit等を揃えるより図書館資料を購入したいと 考えているからでした。 このアンケート調査の結果から、今後研修を計画する上で重要な点がいくつか明らかになりました。まず、す でに RDA の適用準備が十分にできたと感じている図書館員にとっては、さらに応用知識が必要であること。つぎ に、RDAの適用準備が不十分、 または適用に不安がある図書館員にとっては、RDAの広範な研修が必要であること。 そして最後に、多くの図書館でRDA toolkit や冊子体の購入費がまかなえないため、図書館員はRDAにアクセス できないことです。 上記のアンケート結果と考察をふまえ、 “Maxwell’s Handbook for AACR2”[7]のような、基礎から応用まで含 み、段階や対象別に分かれたRDA の研修マニュアルの必要性が訴えられています。これはAACR2 から RDA への移 行の不安に応えるためのガイドラインであってほしいとも述べています。また、ミンダナオ学術図書館情報ネッ トワーク(Academic Libraries Information Network in Mindanao:ALINET)のような、この地域の図書館に専門 的な支援を行っている機関が研修マニュアルの作成主体となり、RDA Toolkit にアクセスできない図書館に配布 することを期待して論文を結んでいます。
【おわりに】
2013年に実施したアンケート調査から2年経った現在のフィリピン全体の状況はどうなっているでしょうか?
筆者がアセデラ氏にメールで問い合わせたところ、次のような回答をいただきました[8]。
(1)フィリピン学術研究図書館協会(Philippine Association of Academic/Research Libraries:PAARL)は、過 去 2 年の間にフィリピン全土でワークショップを開催し、参加したすべての図書館員にRDA ハンドブックを 配布してきました。また、フィリピン国内のその他の図書館協会もRDA に関するセミナーを支援してきまし た。 (2)2015 年から司書資格試験の範囲に RDA が含まれるとの発表が試験委員会からありました。また、大学の図 書館情報学のカリキュラムではすでにAACR2からRDA に置き換わっています。
いただいた回答には、RDA Toolkit や冊子体の普及状況に関する言及はありませんでした。この2 年間で質量 ともに充実した研修が行われたことがうかがえ、RDA はより一層フィリピン全体の図書館員の間に浸透してきた -21-
NDL 書誌情報ニュースレター2015 年4 号(通号35 号)
と言えるでしょう。また、大学のカリキュラムや司書資格試験にもRDA が含まれるようになり、今後、RDA に習熟 した図書館員が増えていくことが期待されます。
上田 友明
(うえだ ともあき 外国資料課)
[1] Annabelle Paredes Acedera. Are Philippine Librarians Ready for Resource Description and Access (RDA)? The Mindanao Experience. Cataloging & Classification Quarterly. 2014, 52(6/7), p. 600-607, doi:10.1080/01639374.2014.891164, (参照 2015-11-05). 下記のURL に要旨が掲載されています。 http://catalogingandclassificationquarterly.com/ccq52nr6-7.html, (参照 2015-11-05). [2] 和中幹夫. 動向レビュー: AACR2 改訂とFRBR をめぐって-目録法の最新動向-. カレントアウェアネス. 2002, (274), p. 11-14,http://current.ndl.go.jp/ca1480, (参照 2015-11-05). 和中幹夫・古川肇・永田治樹訳. 書誌レコードの機能要件: IFLA 書誌レコード機能要件研究グループ最終報告 (IFLA 目録部会常任委員会承認). 日本図書館協会, 2004, 121p, http://www.ifla.org/files/assets/cataloguing/frbr/frbr-ja.pdf, (参照 2015-11-05). [3] TSIG RDA Training Needs Assessment Working Group of the Canadian Library Association, “Survey,” http://rdaincanada.wikispaces.com/Survey,(参照 2015-11-05). [4] [1]をもとに筆者作成。なおパーセンテージは「図書館の数」ではなく「図書館員の数」の割合。 [5] [1] FIGURE3 (p. 603)を筆者が翻訳し作成。 [6] [1]をもとに筆者作成。 [7] Robert L, Maxwell. Maxwell’s Handbook for AACR2: Explaining and Illustrating the Anglo- American Cataloguing Rules through the 2003 Update. Chicago, American Library Association, 2004, 519p. [8] 2015 年9 月9 日付けアセデラ氏からのメールによる回答を筆者が翻訳。
-22-
NDL書誌情報ニュースレター2015年 4号(通号 35号)
文字コード講座 第 1 回 ― 文字コードの歴史(Unicode 前史)
【はじめに】
人類初のコンピュータは1946年に米国で開発されたENIAC(Electronic Numerical Integrator and Computer)
であると言われています。当時は回路に真空管が用いられていました。その後、1947年にトランジスタ、1958年
に集積回路が発明され、コンピュータの小型化が進みました。1977年にはApple社がPC(Personal Computer)
「Apple Ⅱ」を発表し、1981年にはIBMが「IBM PC」を発表しました。これらの開発は、米国を中心に進められ
ました。
一方、コンピュータ・ネットワークは、1969年に米国の国防総省の高等研究計画局(現 国防高等研究計画局)が
国内の四つのコンピュータ関連の大学や研究所をネットワーク回線で結んだのが端緒と言われています。これを
ARPANET(Advanced Research Projects Agency Network)と呼びます。ARPANETは、1983年に学術研究用のネット
ワークとして米国内の他のネットワークにつながれ、ネットワークとネットワークをつなぐインターネットの原
型ができました。さらに、その後、米国以外の研究機関や商用利用への開放などにより、世界中に広がりました。
日本では、1984年に研究用コンピュータ・ネットワークであるJUNET(Japan University NETwork)が誕生しまし
た。
1991年には、ティム・バーナーズ・リー(Tim Berners-Lee)がWorld Wide Webを開発し、インターネットが世
界中に広まりました。
文字コードはコンピュータ上で文字を扱うためのものです。その歴史は同様に米国を中心として始まり、コン
ピュータの性能の向上やネットワークの発達とともに広く進展してきました。
文字コードの歴史について、今号から 3 回にわたって連載します。今回は、アルファベットや日本の文字コー ドを中心に、Unicode が普及する前の状況を中心に概説します。次回は、Unicode の出現とその内容について、3 回目は、文字コードを扱う上での留意点や当館が採用してきた文字コード等についてご紹介する予定です。
【文字が表示される仕組み】
そもそも、コンピュータに文字がどのような仕組みで表示されるか、ご存じでしょうか。文字コードの歴史を
振り返る前に、まずはその仕組みを簡単にご説明します。
コンピュータ内部では、文字は、文字コード規格に基づくコード番号として記録されており、コンピュータ間
でも基本的にこのデータを交換します。これを文字の形で表示・印刷するためには、該当する字形(文字のデザイ
ン)に変換して表現する必要があり、この変換に関する情報の集合をフォントと呼びます。
たとえばJIS文字コードの場合、 「3B7A」というコード番号として記録されている文字は「字」ですが、JIS X
0213(詳しくは後述)に対応しているフォントによって「字」を表すさまざまな字形に変換されて画面に表示され
ます(図 1)。そのため、異なるフォントを使用すると、同じ文字でも字形が変わります。
-23-
NDL 書誌情報ニュースレター2015 年4 号(通号35 号)
図1 文字コードとコンピュータ
なお、一つのフォントがすべての言語や文字コードに対応しているということは通常ありません。たとえば、 Microsoft Windows の日本語版に標準で搭載されている「MS 明朝」というフォントは、おもに英数字と日本語 に対応しており、韓国語やアラビア語などは表示できないこともあります。
【アルファベット―ASCII とISO/IEC 646】
ASCII(American Standard Code for Information Interchange)は、米国の標準化組織であるASA(American
Standards Association = 米国規格協会、現ANSI)が1963 年に制定した128 文字で構成される文字コード規格で
す[1]。
英語で用いられる文字は、英数字と記号を合わせて100 種類程度です。これに空白(スペース)や改行文字、タ
ブ文字、コンピュータを制御するための制御文字などを加えても、128 文字あれば十分でした。
その後、ASCII を基に各国版の文字コードが作成されました。
ヨーロッパの言語の中には英語にはないダイアクリティカル・マーク付き文字(ä、ö、ü、â、ô、û、ç、ş、èな
ど)があります。また、ASCII にはドル記号($)が含まれていますが、各国にとっては、自国の通貨記号が含まれて
いないと不便です。
そこで、ASCII の一部の文字や記号のコード番号に各国独自の文字を割り当てて各国版文字コードを作成する
ことにしました。この各国版作成のための枠組みは、ISO 646(現ISO/IEC 646)という規格で定められています。
この規格に基づき、各国の通貨記号のほか、フランスではグレーブアクセント付き文字などが、ドイツではウ
ムラウト付き文字などが割り当てられました。日本では、ASCII のバックスラッシュ「\」が円記号「\」に、チル
ダ「~」がオーバーライン「‾」に割り当てられており、英語環境と日本語環境では別の文字が表示される可能性
があります(表1)[2]。
表1 ISO 646(現ISO/IEC 646)に基づいた各国の文字割り当ての例
コード番号 0x23 0x24 0x40 0x5B 0x5C 0x5D 0x5E 0x60 0x7B 0x7C 0x7D 0x7E ASCII
$ @ [ \ ] ^ ` { | } ~ 日本
$
@
[
¥
]
^
{ | } ‾ イギリス £ $ @ [ \ ] ^
{
|
}
~
ドイツ
$ § Ä Ö Ü ^ ` ä ö ü ß フランス £ $ à ° ç § ^ µ é ù è ¨ -24-
NDL 書誌情報ニュースレター2015 年4 号(通号35 号)
<文字コードに関連する用語> 「文字コード」という用語には、文字集合(符号化文字集合)、符号位置(符号点、コードポイント)、 エンコーディング(符号化)という三つの概念が含まれています。 ・文字集合:どのような文字が含まれるかということ ・符号位置:文字集合内の各文字の位置(付与されている番号をコード値やコード番号という) ・エンコーディング:文字集合をコンピュータで扱えるデータに変換する方法(エンコード法、 符号化方式) 文字コードに関する文書を読む際には、どの概念に関して述べられているのかを理解する必要が あります。 たとえば、「「A」という文字はASCII の文字コードの範囲にある」とか「ASCII の「A」の文字コ ードは0x41 だ」というように、文字集合にも符号位置にも文字コードという用語を用いるのが一般 的です。特に、符号位置という用語は一般には用いられず、単に文字コードと呼ぶ場合が多いので、 注意が必要です。
【日本の文字コード(1)片仮名―JIS X 0201】
日本でも、英数字等を表現するためには、ISO 646(現ISO/IEC 646)の文字集合を用います。しかし、日本語を
表現するには、片仮名、平仮名、漢字などを含む文字コードを定める必要があります。
日本語用の文字コードとして最初に制定されたJIS 文字コードには片仮名が含まれました。片仮名と日本語固
有の句読点を合わせると約60 文字[3]になります。これをISO 646(現 ISO/IEC 646)の英数字128 文字と同時に
用いるためには、約190 文字の文字集合が必要となり、256 文字を表現できる8 ビットが必要となります。
そのため、日本では、1969 年にISO 646(現ISO/IEC 646)を8 ビットに拡張し、片仮名や句読点を加えたJIS X
0201(当初はJIS C 6220-1969)という独自の規格を定めました[4]。この規格は一般的にANK(Alphabet Numeric
and Kana)と呼ばれています。
<ビット(bit)> コンピュータで扱うデータの最小単位であるビットは、binary digit (2 進数の数字)の略で、2 進 数の1 桁を意味します。2 進数は0 と1 で数を表現する方法で、0 と1 のみから構成される7 桁の数 字で128 通り(2 の7 乗=128)を表現できます。 ASCII およびISO/IEC 646 で定められている128 文字の場合、7 ビットあれば各文字に一意の数字 を割り当てることで識別可能となり、JIS X 0201 で定められている190 文字の場合は、2 の8 乗、つ まり、256 文字を表現できる8 ビットが必要となります。 <文字コード符号位置の表現> 符号位置は16 進数で表すのが一般的です。たとえば、「A」のASCII コードは1000001 ですが、 1000001 の16 進数は41 で、16 進数を表す0x を先頭に付けて0x41 と表します。 -25-
NDL書誌情報ニュースレター2015年 4号(通号 35号)
【日本の文字コード(2)漢字―JIS X 0208(JIS 基本漢字)】
つぎに、漢字を表現できる文字集合として、JIS X 0208(当初はJIS 6226-1978)という規格が定められました。
この規格には、片仮名、平仮名、漢字、ギリシア文字、キリル文字、郵便記号や罫線素片などの日本独自の記号な
ど 6,879字が含まれています。
文字は、コンピュータの性能に応じて扱う範囲を選択できるように、使用頻度によって第1 水準と第 2 水準に
分けられました。第 1 水準には、記号、当用漢字、人名用漢字などのより一般的に用いられる文字が含まれてい
ます。
なお、この文字集合には、JIS X 0201 で定められている英数字、片仮名、記号なども含まれています。JIS X
0201と JIS X 0208 を区別するため、前者の文字を後者の文字の半分の幅で表示することが多く、一般的にこれ
を半角文字と呼びます。
JIS X 0208は、日本語を表現するための文字集合の基礎となっている規格で、「JIS 基本漢字」と呼ばれること
があり、1978年に最初の規格が制定された後も、1983年(第2 次規格)、1990年(第3次規格)、1997年(第4次規
格)、2012年(第 5次規格)に改定されています。
改定時には、字体の変更、入替、追加等が行われました。拡張新字体という、従来の漢和辞典には存在しなか
った字体が作成されたこともあり、規格間で整合性がとれなくなるという問題が発生しました。
【日本の文字コード(3)JIS X 0212(JIS 補助漢字)】
1990年には、JIS X 0208:1983 (第2次規格)に含まれない使用頻度の低い6,067字で構成された規格として、
JIS X 0212 が制定されました。この規格は、「JIS補助漢字」と呼ばれることがあります。JIS X 0208 と組み合
わせて利用することを想定して作成されましたが、後述のとおり、現在では、ほとんど使われることがありませ
ん。すべての文字が次回紹介するUnicodeに含まれているため、Unicodeを用いれば表現可能です。
【日本の文字コード(4) JIS X 0213(JIS 拡張漢字)】
2000年には、JIS X 0213 という新たな規格が制定されました。JIS X 0208 の6,879字に加え、第3水準の漢
字 1,259 字(うち、10 字は 2004 年の改定時に追加)、第 4 水準の漢字 2,436 字、非漢字 659 字が収録されていま
す。つまり、JIS X 0213は、JIS X 0208の文字に4,354字を追加した規格で、「JIS 拡張漢字」とも呼ばれます。
2004年(第2 次規格)、2012年に改定されています。
JIS X 0212 とは異なる基準で選定されていますが、約2,900字が重複しています。この規格が普及したため、
JIS X 0212はほとんど使われることはなくなりました。
ここで一度、JIS文字集合の関係を整理してみます(図2参照)。 JIS X 0221(UCS/Unicode)は他のすべてのJIS文字コードを包含します。 JIS X 0213は JIS X 0208を包含します。 JIS X 0213と JIS X 0212は一部の文字が重複します。
-26-
NDL 書誌情報ニュースレター2015 年4 号(通号35 号)
図2 JIS 文字集合の関係概念図
<区点と面区点> JIS X 0208 やJIS X 0212 では、1〜94 の区と、同じく1〜94 の点の組み合わせにより文字の符号 位置を表わしていました。この方法を区点と呼びます。たとえば、「亜」という文字は16 区1 点の 位置にあり、16-01 などと表されます。 さらに、JIS X 0213 では、元々JIS X 0208 で定義されていた領域と、新たに文字を追加した領域 の二つの領域を持つようになったため、それぞれの領域を1 面、2 面と呼ぶようになりました。この 方法を面区点と呼びます。たとえば、「亜」という文字は、JIS X 0213 では1 面16 区1 点の位置に あり、1-16-01 などと表します。 もちろん、前述のように16 進数(3021)でも表現可能です。
【JIS 漢字(ISO 2022-JP)】
これまで見てきたとおり、日本国内だけでも複数の文字コード規格が策定されました。文字コード規格が異な
れば、同じコード番号に異なる文字が割り当てられている可能性があります。そのため、多種多様なコンピュー
タが正しく情報交換を行うためには、文字集合が変わるたびに、どの文字集合なのかを明示する必要がありま
す。ISO/IEC 2022(JIS X 0202)はこの方法を定めた規格で、Unicode の登場前は、インターネットではISO/IEC
2022 に従って文字を送信する必要がありました。
ISO/IEC 2022 の日本語の文字集合をISO 2022-JPと呼びます。当初は、ASCII、JIS X 0201 のローマ字部分、
JIS X 0208(JIS X 0208:1978 およびJIS X 0208:1983)から構成されており、一般に「JIS 漢字」や「JIS コード」
と呼ばれていました。後にJIS X 0212、JIS X 0213 が追加されました。
ISO 2022-JP では、それぞれの文字コードが始まる部分にエスケープ・シーケンスと呼ばれる特殊な符合を付与
して、文字集合を切り替えます(表2)。
-27-
NDL 書誌情報ニュースレター2015 年4 号(通号35 号)
表2 ISO 2022-JP のエスケープ・シーケンス 文字コード エスケープ・シーケンス ASCII(ISO/IEC 646 IRV) ESC ( B JIS X 0201:1976(ローマ字部分) ESC ( J JIS X 0208:1978(JIS C 6226-1978) ESC $ @ JIS X 0208:1983 ESC $ B
【Shift JIS】
ISO 2022-JP では、漢字とASCII や半角カナ文字等を混在させるためにエスケープ・シーケンスを用いますが、
この方法では文字の処理に時間がかかるという欠点がありました。一方で、これらの文字を、エスケープ・シー
ケンス等による文字の切り替えを行わずに混在させる方法として、マイクロソフト社などが考え出した文字コー
ド体系を「Shift JIS」(S-JIS と略されることがある)と呼びます。
具体的には、JIS X 0201 で使用されていない領域(0x80~0x9F までと、0xE0~0xFF まで)が先頭バイト(第1 バ
イト)になるように(図3)、JIS コードを移動(シフト)させています。たとえば、「右」の符号位置は、JIS X 0208
では0x3126、Shift JIS では0x8945 で、その次の「宇」の符号位置はJIS X 0208 では0x3127 で、Shift JIS で
は0x8946 です。
図3 JIS X 0201 の未使用領域
一方、Windows の機種依存文字を含む文字集合であるCP932(Code Page 932 = Windows-31J)もJIS X 0208:1990 と同じ文字集合を含むことから、JIS X 0208:1990 にWindows の機種依存文字を追加したものをShift JIS と呼 -28-
NDL書誌情報ニュースレター2015年 4号(通号 35号)
ぶことがあります。 <機種依存文字> 機種依存文字は、機種によって異なる文字が表示・印刷される文字コードのことです。 日本語の文字コードの場合、JIS の文字集合に含まれない文字や記号を各 PC メーカーが導入した ため、 一部の文字が、WindowsとMacintoshのPCでは異なる文字として表示されるなどの状況が発生 しました。たとえば、Windowsで「①」と入力した文字は、Macintoshでは「㈰」と表示されました。 そのため、Unicodeが登場するまでは、これらの文字コードは、メールなどの情報交換には使わな いのが原則でした。 機種依存文字の例
【おわりに】
これまで見てきたように、コンピュータの性能が高まるにつれて、より大きな文字集合を扱うことができるよ
うになりました。英数字と記号のみだった文字コードに、ヨーロッパ諸国ではダイアクリティカル・マーク付き
文字などが、日本では片仮名、平仮名、漢字などが追加されていき、世界中で多種多様な文字コードが制定され
ました。
英数字と記号のみの ASCII は 1963 年、ヨーロッパ諸国の独自文字を収録したISO R 646( 現 ISO/IEC 646)は
1967年、片仮名を収録したJIS(JIS X 0201)は 1969年、漢字などを収録したJIS(JIS X 0208)は 1978年に登場
しました。当初、一台のコンピュータで複数の文字コードを同時に扱うことは基本的にできませんでした。その
ため、異なる文字コードを用いているコンピュータ間で通信を行う時には、特殊な処理を行っていました。
しかし、ネットワークが発達し、世界中のコンピュータが接続されるようになる1980年代から、世界中の言語
の文字を一つのコード体系に収めた文字集合を作ろうという動きが出てきます。次回は、そのために考案された
Unicodeについてご紹介します。
上綱 秀治
(かみつな しゅうじ 電子情報部 電子情報企画課)
※お詫びと訂正 本記事の一部に誤りがあり、訂正いたしました。 【はじめに】 JIS X 0213は 2000年制定、Unicodeは1993年制定でしたので、下記のように訂正いたしました。 -29-
NDL 書誌情報ニュースレター2015 年4 号(通号35 号)
(訂正前)Unicode が出現する前の状況を概説します。 (訂正後)Unicode が普及する前の状況を中心に概説します。 【Shift JIS】 (訂正前)それを改良するため、マイクロソフト社などが考え出した文字コード体系を (訂正後)一方で、これらの文字を、エスケープ・シーケンス等による文字の切り替えを行わずに混在させる 方法として、マイクロソフト社などが考え出した文字コード体系を
誤りがありましたことお詫び申し上げます。 さらに、脚注[4]を追加いたしました。
[1] ASA X3.4-1963。現在の規格番号は、ANSI INCITS 4-1986。 [2] 円記号とチルダについては、第3 回で解説する予定です。 [3] 「ガ」や「パ」などの、片仮名と濁音・半濁音記号の合成文字は含みません。 [4] JIS X 0201 には、英数字と片仮名の二つの7 ビット符号化文字集合を用意し、制御文字(SHIFT-OUT と SHIFT-IN)によって切り替える方式も規定されています。
参考文献
加藤弘一. 図解雑学文字コード. ナツメ社, 2002, 237p.
小林龍生ほか編. インターネット時代の文字コード. 共立出版, 2002, 285p.
芝野耕司編著. JIS 漢字字典. 増補改訂. 日本規格協会, 2002, 527p.
トニー・グラハム. Unicode 標準入門. 乾和志, 海老塚徹訳, 関口正裕監修. 翔泳社, 2001, 455p.
三上喜貴. 文字符号の歴史 アジア編. 共立出版, 2002, 377p.
安岡孝一, 安岡素子. 文字符号の歴史 欧米と日本編. 共立出版, 2002, 286p.
矢野啓介. プログラマのための文字コード技術入門. 技術評論社, 2010, 383p.
Ken Lunde. CJKV 日中韓越情報処理. 小松章, 逆井克己訳. オライリー・ジャパン, オーム社 (発売), 2002,
1128p.
-30-