XEmacs UTF-2000 Version 0.19 (郡山)

守岡 知彦 / MORIOKA Tomohiko tomo @ kanji.zinbun.kyoto-u.ac.jp
2002年 8月 21日 (水) 18:33:24 JST


XEmacs 21.2.46 (Urania) UTF-2000 Version 0.19 (郡山) を

http://www.kanji.zinbun.kyoto-u.ac.jp/projects/chise/dist/XEmacs/xemacs-utf-2000-0.19.tar.gz

に置きました。


[主な変更点]

・文字属性を外部文字データベースから要求時に遅延読み込みする機能を実装
  した。現在の実装は XEmacs の `database' 機能に基づいており、Berkeley
  DB Version 3 での動作を確認している。これにより IA32 アーキテクチャ
  で実行形式の大きさが従来約 30 MB (文字定義数約7万字) だったのが約
  16 MB (文字定義数約10万字) となる。

・これに伴い

	関数 mount-char-attribute-table
	関数 save-char-attribute-table
	関数 load-char-attribute-table
	関数 reset-char-attribute-table
	関数 close-char-attribute-table

  を追加した。

・coded-charset `chinese-big5-eten', `chinese-big5-cdp',
  `chinese-big5-pua', `chinese-big5-eten-a', `chinese-big5-eten-b' を
  追加した

・coded-charset `japanese-jisx0213-1' で `japanese-jisx0208-1990' を継
  承するようにした

・次の UTF-8 系 coding-system を追加した:

    utf-8-mcs: 独自の写像を採用し、Unicode に含まれない文字を Unicode
	       外の UCS 外字領域に割り当てる(従来の utf-8 と同等)
    utf-8-mcs-er: 独自の写像を採用し、Unicode に含まれない文字を実体参
		  照形式で表現する
    utf-8-gb: GB に基づく mapping を採用し、Unicode に含まれない文字を
	      Unicode 外の UCS 外字領域に割り当てる
    utf-8-gb-er: GB に基づく mapping を採用し、Unicode に含まれない文
		 字を実体参照形式で表現する
    utf-8-cns: CNS に基づく mapping を採用し、Unicode に含まれない文字
	       を Unicode 外の UCS 外字領域に割り当てる
    utf-8-cns-er: CNS に基づく mapping を採用し、Unicode に含まれない
		  文字を実体参照形式で表現する
    utf-8-big5: Big5 に基づく mapping を採用し、Unicode に含まれない文
		字を Unicode 外の UCS 外字領域に割り当てる
    utf-8-big5-er: Big5 に基づく mapping を採用し、Unicode に含まれな
		   い文字を実体参照形式で表現する
    utf-8-jis: JIS に基づく mapping を採用し、Unicode に含まれない文字
	       を Unicode 外の UCS 外字領域に割り当てる
    utf-8-jis-er: JIS に基づく mapping を採用し、Unicode に含まれない
		  文字を実体参照形式で表現する
    utf-8-ks: KS に基づく mapping を採用し、Unicode に含まれない文字を
	      Unicode 外の UCS 外字領域に割り当てる
    utf-8-ks-er: KS に基づく mapping を採用し、Unicode に含まれない文
		 字を実体参照形式で表現する

   また、utf-8 を alias とし、既定値では utf-8-mcs を指すものとした
   (将来的には language-environment に応じて既定値を変えることを考慮
   している)

   また、aliast `utf-8-er' を新設し、既定値では utf-8-mcs-er を指す。

・次の Big5 系 coding-system を追加した:

    big5-er: Big5 にない文字を実体参照形式で表現する
    big5-eten: Big5-ETEN
    big5-eten-er: Big5-ETEN にない文字を実体参照形式で表現する

  また、big5 は ETEN 拡張を含まないものであることを明確化した。

・実体参照形式の表現や優先度を指定する変数
  coded-charset-entity-reference-alist を追加

・関数 ideographic-structure-to-ids を追加

・文字属性データベースの追加・修正など


Happy Hacking!
-- 
守岡 知彦 (MORIOKA Tomohiko) <tomo @ kanji.zinbun.kyoto-u.ac.jp>




More information about the CHISE-ja mailing list