オンライン講座「漢字の歴史と文字コード」

講師:藤本 隆(ふじもと たかし)氏  プランディット 編集事業部 編集長

【講師略歴】
ベネッセグループの編集専門会社にて編集業務に長年携わる。学習教材をはじめ、情報誌、フリーペーパー、教育系タブロイド、資格系教材、広告チラシ、フライヤーなど、広範な印刷媒体の企画・制作経験を持ち、原稿、記事の執筆、イラストレーション、DTPデザインもこなす。ベネッセグループ各社向けの育成研修講師を務める。著書に『印刷発注の基本がわかる本』(日本能率協会マネジメントセンター)。

 編集講座のBコースで、藤本さんの3回目の講座です。今回は、当初のテーマは「漢字の歴史と文字コードとフォント」でしたが、時間の都合で、フォントについては次回になりました。その代わり、漢字の歴史と文字コードにつきましては丁寧に説明していただきました。この場合の漢字と文字コードというのは、あくまでも日本語の漢字であり、日本語としての漢字の文字コードの話です。最終的には、現在Unicodeに統一されています。

 今回の講座は、編集の仕事の中のDTP組版に関係した話になります。文字の扱いについては、正しい知識を持つことによって、トラブルを解決し、先手を打った制作ができるようになると話されていました。詳しい内容につきましては、AJECのHPで紹介される講義内容などで確認してもらうことにして、今回も藤本さんの講座の流れをスライド順に簡単に紹介しておきます。

講義内容

  • 漢字の歴史
    かなの誕生と漢字かな交じり表記
    • やまとことばの音に漢字をあてる→「万葉仮名」
    • 万葉仮名の崩し書きから「ひらがな」、略字から「カタカナ」が生まれる。
    • 漢字は表意語として残り、「漢字かな交じり」となる。
    漢字文化への批判
    • 蘭学者を中心とした漢字排斥論
    • 明治維新と漢字廃止論
      ──公用語を英語にすべし、表記はすべてローマ字にすべし、漢字は順次減らし、最小限とすべしなど。
    明治政府の対応
    • 従来の漢字かな交じりを正式な国字とする。
    • 漢字は「康熙字典」を採用する。
    漢字文化への批判
    • GHQ方針……かな漢字を廃止し、ローマ字表記に。
      ──識字率調査を受けて、頓挫。
    • 漢字制限論の方向へ
      ──使う漢字を絞り込む、難しい漢字を使わない。
      ──現代仮名遣い……言文一致を図る。
    • 当用漢字……当面の日常生活で用いる漢字約2千字。
    • 教育漢字……うち、学校教育で学習する漢字約千字。
    • 新字の導入……字体の変更(戦前までの字体は「旧字体」と呼ばれる)
      ※当用漢字への制限で、1956年、同音異義語の書き換え例示がある。編輯→編集、障碍→障害など
    当用漢字・教育漢字・人名漢字から、常用漢字・学習漢字・人名・地名漢字へ
    • 2010年に2,136字に(新常用漢字)。
    • 2020年に、都道府県名に使う漢字を追加して、1,026字になった学習漢字。
    • 同年に、常用漢字のほかに、人名・地名漢字として863字が認められた。
      ※戦後の漢字施策は、省によって管轄が異なって、混乱がある。
      • 文部省(文科省)→常用漢字、学習漢字
      • 法務省→人名漢字
      • 通産省(経産省)→コンピュータ等で扱う漢字の制定
      ※現在は、実用的には、コンピュータで使える漢字が使える漢字と言える。(Unicode)
  • 文字コード
    • 文字の符号化と伝送
      モールス信号
      • 無音/単音(トン)/長音(ツー)の組み合わせで符号化。
      • 符号化してデータを送信し、受け手が復号する。
      コンピュータの登場
      • データとプログラム(命令)をメモリに置いて、複雑な情報を高速処理する。
      • 電圧のON/OFFというごく単純な2値の組み合わせに置き換え演算する(デジタル回路)。
      • リレー装置→真空管→トランジスタの高速化。
    • 文字規格の策定
      ASCII(American Standard Code for Information Interchange)の登場
      • 1963年に誕生の7ビットの文字コード。
      • アルファベットの大文字/小文字、数字、欧文やプログラムの記述に必要な記号類、文字の入力や制限に必要なコードなどを定義。
      JIS X0201-1669(Japan Industrial Standard)の誕生
      • 1969年に誕生。日本最初の日本語文字コード。
      • ASCIIに準拠して日本語のコード化を試みる。
      • カタカナのみをコード化。
      • 濁点「゛」半濁点「゜」を分離して、コード化=半角コード。
    • 符号化文字集合の進化
      ISO-2022-jp(JISコード)の誕生
      • 1978年に誕生。ASCII互換のかな漢字コード。
      • 約8,000字の符号化スペースを持つ符号化方式。
      • 2バイトコードによるかな漢字の符号化=2バイト文字・全角文字。
      • エスケーブシーケンス起因の文字化けリスクあり。
      Shift_JISコードの誕生
      • 1982年に誕生。ASCII互換のかな漢字コード。
      • 7ビットと決別し、8ビット2面で符号化。
      • 2バイトコードによるかな漢字の符号化。
      • エスケーブシーケンスが不要となり、文字化けが激減。
      Unicodeの時代へ
      • コンピュータの能力向上とグローバル化の流れから、各国の言語を一律に扱える規格が求められる。
      • 符号化文字集合と文字符号化方式を同時に策定。
      • ゼロックスが提唱し、MS・Apple・IBMなどが参加。
      • Uni(統合)+code(文字コード)
      Unicodeの進化
      • 16ビット単面(約65,000字)では納まらず、紆余曲折を経て、部分的な2面化(サロゲートペア)を導入して、コード領域を約111万字に拡張。
      • ASCIIとの互換性や拡張性を考慮し、文字符号化方式もUTF8・UTF16・UTF32などへ。
      • 2020年現在、Unicodeはv13.0で、143,859字が定義されている。

感想

 今回の漢字の話と文字コードの話を聞きながら、なんだかとても懐かしい気持ちになりました。というのは、我々の世代(団塊の世代)は、漢字は当用漢字の時代だったし、文字コードについては、MS-DOSの時代でShift_JISができたばかりでした。もちろん、そのころ、例えば銀行の口座名のコンピュータ処理の場合は、半角コードが主で、決められた書式にカタカナで書き、濁点や半濁点は1字分を取って書いていました。そして、少しパソコンでプログラムなどをいじるときは、すべてASCIIコードで処理していました。そんなわけで、藤本さんの戦後の漢字施策やコンピュータで扱う文字の符号化の話は、私たちの体験そのものでした。出版社に勤め始めたのは半世紀前でしたが、そのころは写植の文字盤と付き合っていました。

 講座は、前半が日本語の中の漢字の表記の歴史で、その中でも戦後の国字政策について詳しく触れられていました。当用漢字の時代は漢字を制限する方向でしたが、常用漢字の時代になると、それが緩められ、またコンピュータの進化等でたくさんの漢字を使えるようになって、少しずつ増加していく様子が詳しく話されていました。特に、文科省と法務省および通産省という3つの省の綱引きのなかで、漢字が少しずつ増え、また字形が多様化して混乱が生じたことなどを丁寧に説明されていて、思わず過去の失敗などを思い出しました。この辺の混乱が現在も残っているものもあります。

 また、漢字を制限しようということで、制限外の漢字を別漢字で書き換えの例示を国が示すことによって、もとの意味が誤解されるような例を紹介がありました。特に、「編輯」が「編集」になることによる意味の変化は面白かったです(編輯の「輯」には、材料を集めると言う意味があったが、「集」はただ集めるという意味である)。さらに「障害」は「障碍」の書き換えで、現在「障害者」という言葉は使わず、「障がい者」と表記することが多くなった話など、興味深い例示がありました。

 講座の後半は、その漢字をコンピュータでどう表していくかという、文字規格の策定についての話でした。どんな文字を収めるのかがコンピュータの性能との関係で増加していく様子や、どんな方式で収めるのかという符号化の方式がUnicodeによって拡張されていく流れが、分かりやすく説明されていました。旧JISと新JISとの字形の変更と再変更の話では、「葛󠄀飾区」の「葛󠄀」や「葛󠄀城市」の「葛󠄀」の例示が興味深かったです。

 講座の内容紹介では、漢字の歴史と文字コードの進化の羅列になっていますが、藤本さんは、ところどころ丁寧にかつ興味深い実例をあげて説明されていて、あっという間に1時間半が過ぎてしまったような印象でした。

 私たちが使っている漢字はどのように標準化されていったのかという漢字の歴史と、コンピュータで漢字を使うとき、なぜUnicodeのようなものができているのかがよく分かる講座でした。こういうことを知っておくことは、編集作業がデジタル化され、常にコンピュータ上の文字表現に依存している現状では、編集者の必要な基本的な教養だと思いました。

参考文献
安岡孝一著『新しい常用漢字と人名用漢字 漢字制限の歴史』(三省堂2011/3/25)
矢野啓介著『プログラマのための文字コード技術入門 』(技術評論社2018/12/28)

(文責:東京オフィス 塚本鈴夫)