名前問題

NIIBE Yutaka gniibe @ m17n.org
2002年 12月 10日 (火) 10:46:27 JST


江渡さん wrote:
 > ・UTF-2000という名称はobosoleteとする。(新名称は作らない)
 > 
 > ・対外的にはCHISE projectで一本化する。(tomoyoという読みは内部使用のみ)
 > 
 > ・いままで作ってきたコード+文字データベースをあわせて、libchiseとする。
 > 
 > ・つまり、
 > XEmacs UTF-2000 → XEmacs + libchise = XEmacs/CHISE

「XEmacs を libchise に載せるのは難しいかも? 」 という声があったと思い
ます。XEmacs/CHISE は libchise の API は持つが, 現在の実装を(しばらく
は)そのままというのも妥当だろうと。

 > Ruby/UTF-2000 → Ruby/CHISE
 > Gauche/UTF-2000 → Gauche/CHISE
 > とかそういう感じ? ちょっとこの辺は自信無いのでフォローお願いします。

それから, 思い出しつつ, WiLiKi に書いていこう(それで固まったら 
cvs.m17n.org へ)と思いますが, Tomoyo は別のプロジェクトだったと記憶し
ています。

UTF-2000 は最初, 以下のような話から始まったと思います。

	o 符号化文字集合の寄せ集めとしての Mule ってどうでしょうか?
	o 符号化文字集合の寄せ集めとしての Unicode ってどうでしょうか?
	o 文字の集合は文字の集合として, 文字は文字のオブジェクトとして, 
	  エンコーディングはエンコーディグとして扱いたいものだ。

===> 文字オブジェクトを扱うこととし, 内部エンコーディングはそれとは独
     立に UTF-8 のマルチバイト表現を用いる。符号化された整数値と文字オ
     ブジェクトとの間の対応関係を別に管理する。
	.... GNU Emacs UTF-2000 試験実装 (1998) 

それで, そこから XEmacs UTF-2000 の実装へと進み, 文字オブジェクトとし
てあつかう属性のデータ整備が始まりました。

CHISE モデルの文字オブジェクト(弁別可能な属性の集合)に必要とされるもの
は, おそらく現在の XEmacs UTF-2000 の枠組みより広いと思います。

XEmacs UTF-2000 では, CHISE の枠組みから見れば, まだ, 文字オブジェクト
の扱いに関して, 十分な設計がされ, 実装されているというわけではありませ
ん。

XEmacs UTF-2000 では, 文字オブジェクト中心なので, 文字オブジェクトは固
定のものです。あるコンテクストでは, 別の弁別可能な属性が浮かび上がって
くるというようなのは扱えません。文章の中で文として単語として使われてく
るなかで, 初めてその弁別可能な属性が見えてくるというようなのが扱えませ
ん。これを扱いたいものだということで, 文字オブジェクトの(動的な)多義性
を扱う仕組みを与えるもの tomoyo だったような気がします。ちがったっけ?
-- 




More information about the CHISE-ja mailing list