文字素性の集合による文字の交換 (Re: 属性か素性か)

守岡知彦 / MORIOKA Tomohiko tomo @ kanji.zinbun.kyoto-u.ac.jp
2003年 2月 17日 (月) 20:44:35 JST


>>>>> In [chise-ja : No.00160] 
>>>>>	"江渡さん" = Kouichirou Eto <2003 @ eto.com> wrote:

江渡さん> 属性か素性かはともかくとして、私はいまだに属性によって文字を
江渡さん> 定義するということがどういうことか理解できてません。

江渡さん> 例えば、私がこの場で定義した文字をどのように交換すればいいの
江渡さん> か、などがよくわかりません。

文字を交換するには、文字素性の集合を交換する必要があります。例えば、
XEmacs CHISE の Emacs Lisp の世界なら define-char 形式で記述した文字定
義をやりとりするのはこれに相当します。

文字列交換の局面において同様のことをするには、CES レベルないしは文書形
式レベルで文字素性の集合を表現することによって実現可能であると考えられ
ます。ただ、これを既存の環境・標準と整合的にやるには CES レベルでは多
分無理で、現状では文書形式レベルでやらざるを得ないでしょう。

例えば、char-spec 形式(define-char 形式)の XML 版(TEI の WSD?)や 
LaTeX 版を作るということです。また、現状の実体参照のように十分に簡略的
な(XML としての処理をしなくても解釈できるような)XML に基づく形式を定
義すれば、XML 以外でも有用かも知れません。

また、CHISE に閉じて良いなら、CES レベルでのなんらかの表現法をえいやっ
と決めてしまうというのはありかも知れません。前に冗談でいってたように、
UCS のタグ文字で char-spec を書くとか。

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======




More information about the CHISE-ja mailing list