素性について

守岡知彦 / MORIOKA Tomohiko tomo @ m17n.org
2004年 1月 20日 (火) 17:49:39 JST


守岡です。

;; 浦島フォローでごめんなさい。

>>>>> In [chise-ja : No.00305] 
>>>>>	"師さん" = Shigeki Moro <s-moro @ hanazono.ac.jp> wrote:

師さん> > また、属性と訳される property と attribute のうち、前者が帰
師さん> > 属的・所有的なのに対し、後者は外形的・象徴的なニュアンスを持っ
師さん> > ていると思います。

師さん> これ、ちょっとイメージがわかないのですが、補足していただけませ
師さん> んでしょうか?

install してる英語の辞書数種 + Emacs などでの用例から想像したものです
が、オブジェクト(インスタンス)が内部に保持している値のようなものは 
property, 文字列に face を設定するなど利用者が操作対象に設定するような
ものは attribute と考えています。モデリングする場合とかでのクラスの性
質も property よりは attribute かなと思います(プラトニックに考えない
とすれば)。

;; 如来蔵は property かな?識は attribute っぽい?

研究社 新英和・和英中辞典によれば、property の語源は

	ラテン語「自分自身のもの」の意 (PROPER+-TY2)

		proprius?

だそうで、attribute の語源は

	ラテン語「…に帰する」の意 (AT-+tribuere 「与える」)

	;; tribute は貢ぎ物とか年貢で tribe は類語だそうです。

だそうです。


師さん> 素性に関しては一度、つっこんで考えてみたいところです(今度の
師さん> 論文でいろいろ論じたかったのですが、まだ積み残しがいっぱいあっ
師さん> て断念しました)。Chaonモデルは、これはこれで現実的な落としど
師さん> ころとしていい線いってると思うのですが、理論面ではまだつっこみ
師さん> どころが多いんじゃないかと思っています。

御意。

文字素性は、当初、『文字の性質』としてた訳ですが、「じゃあ、『文字の性
質』って何なのよ?」という疑問を棚上げにして実装に走った訳です。

実際に XEmacs CHISE で Chaon 的プログラミングをしたり、文字データベー
スを作ると判るんですが、結局、文字素性とは文字に対するインターフェース
なんですね。slot value というよりは method とか message とか関数の方が
しっくりきます。文字(概念)を分節したり(あるいは、統合したり)するよ
うに、文字素性もまた分節したり(あるいは、統合したり)したくなると思い
ます。つまり、文字素性を出典によって分けたり、同じ情報を異なるインター
フェースで提供したり、異なる出典の情報を同じインターフェースで扱ったり
という、オブジェクト指向システムでの API 的な話が出て来ると思います。

define-char 形式での記述も、文字本来の性質 (property) を書いたものでは
なくて、良く使われる文字に対する切り口が簡単に取り出せ、なるべく多用途
をカバーでき、それでいて簡潔に記述できるようにしたものといえます。1つ
の define-char に1つの Charon(文字状況オブジェクト)が対応するのでは
なくて、無数の Charon が対応するといえますし、文字素性に関しても同様に
無数の文字素性を考えることが出来ます。

現実には無数の define-char や無数の文字素性を書くのは無理なので、
define-char 形式での記述はそれを圧縮・近似したものといえ、それを再加工
して展開する仕組が必要だといえます。しかし、現状ではこの辺りを CHISE 
の枠組で十分に支援してないといえます。XEmacs CHISE の場合、Emacs Lisp 
の力を借りて書くことが出来ますが。師さんがやってらっしゃるような集合的
操作もその一例といえると思います。しかし、いずれも CHISE 環境で共有で
きていません。

この辺りを支援するために、

・文字素性間の関係の定義(とりあえず、継承と文字素性属性の記述)

・文字定義の継承

・domain

を導入したいと考えています。

domain というのは同じインターフェースだけど出典が違うものを扱うのに用
います。ある文字定義で出典の差を書くのにも使えますし、別の文字データベー
スを mount する時に矛盾する値を扱うのにも使えます。また、親文字から子
文字の素性を参照する時にも使えます(子文字は親文字の用例と見倣されます)。
default の domain の優先順位を指定することで、policy の制御にも使える
と思います。

また、文字素性に対するフィルターの集合を domain と同様に操作できるよう
にすると、特定用途での処理を支援できるかも知れません。

ところで、師さんがおっしゃってた理論面での話というのは、多分、こういう
プログラミング的な話ではないと思いますが、当然、そういう話も詰めていか
ないとまずいですね。そこでは、多分、書体・組版ワークショップで John
Plaice 氏らがおっしゃってたテキストにおける文脈の話とも絡めて議論でき
ると良いなあと思います。

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======




More information about the CHISE-ja mailing list