CHISE specs (Re: UTF-2000 char-db)

守岡知彦 / MORIOKA Tomohiko tomo @ kanji.zinbun.kyoto-u.ac.jp
2003年 1月 27日 (月) 19:06:10 JST


>>>>> In [utf-2000 : No.00349] 
>>>>>	"江渡さん" = Kouichirou Eto <2003 @ eto.com> wrote:

江渡さん> > という風に文書を機械可読にしてそこからプログラミング言語に
江渡さん> > バインドするという方法とは逆に、DOC-string(Lisp における
江渡さん> > オンラインヘルプの元)などから文書を自動合成する方が良いん
江渡さん> > じゃないかと思っています(文芸的プログラミング万歳)。

江渡さん> 私は逆に、文芸的プログラミングがだめなのですが…。

;; 実は私もそうだったりして。(^_^;

江渡さん> 文芸的プログラミングではなく、文学的プログラミングを提唱して
江渡さん> いる今日この頃です。

それってどんなのですか?


江渡さん> > そこで、文字属性名に対して DOC-string や型情報、フォーマッ
江渡さん> > ト情報などのメタ情報(文字属性のクラス定義)を付けてはどう
江渡さん> > かと思っています。そして、その情報は各文字属性値と同様に
江渡さん> > 外部文字データベースに格納します。

江渡さん> 外部データベースに格納するという部分はいいと思います。
江渡さん> 文字データベースとどう同居させるのか、まだイメージがつかめま
江渡さん> せん。

今は key として文字(例:“?a”)しか使ってません(文字属性の場合; 
decoding-table (CCS → 文字 の場合、整数を使ってます)。

そこで、key として symbol(例:“type”)を用いた場合、クラスとしての
文字属性の属性として解釈することにするという方法を考えています。


江渡さん> define-char形式ならぬ、define-attribute形式というのはどうで
江渡さん> しょうか。これなら私でもわかります。

attribute というのは一般的すぎなので、関数 define-char-attribute(ある
いは、define-chattr とか)でしょうか。私もこういうのを導入することを考
えています。CCS 属性に関しては、既に、make-charset(や define-charset)
がありますが、この新関数はこれを一般化したものと位置付けられます。また、
既存の charset-property は char-attribute の property の一種と見倣され
るべきでしょう。

-- 
守岡 知彦 (MORIOKA Tomohiko) <tomo @ kanji.zinbun.kyoto-u.ac.jp>




More information about the CHISE-ja mailing list