素性メタデータ

守岡知彦 / MORIOKA Tomohiko tomo @ kanji.zinbun.kyoto-u.ac.jp
2003年 10月 6日 (月) 16:18:29 JST


>>>>> In [chise-ja : No.00238] 
>>>>>	"江渡さん" = Kouichirou Eto <2003 @ eto.com> wrote:

江渡さん> > (define-char-feature 'ideographic-structure
江渡さん> >   :description "Structural information of Han Ideographs."
江渡さん> >   :type '(or (list ids2-char-ref char-ref char-ref)
江渡さん> > 	     (list ids3-char-ref char-ref char-ref char-ref)))
江渡さん> > (define-char-feature '=ucs
江渡さん> >   :description "ISO/IEC 10646 UCS-4."
江渡さん> >   :type 'ccs
江渡さん> >   :ccs-dimension 4
江渡さん> >   :ccs-chars 256
江渡さん> >   :ccs-iso-ir 177)

江渡さん> これでいきましょう。

了解です。


江渡さん> > 御意。ただ、@DOMAIN と *SOURCES は名前解決機構に組み込んで、
江渡さん> > 定義しなくても決まるようにするのが良いかなと思っています
江渡さん> > (ファイル名の相対パスみたいな感じに扱うというか)。
江渡さん> > つまり、=ucs @ jis が =ucs を継承することは自明とする訳です。

江渡さん> これはOKです。

ここで、*SOURCES は *METADATA に修正します。すなわち、
ideographic-radical*sources とある場合、未定義時に判ることは、素性 
ideographic-radical の `source' という名前のメタデータであるということ
にしようと思います。すなわち、*source がなんなのかは別途定義が必要とい
う訳です。そして、これをどう定義するのが良いかなんですが、今の所、

	(define-char-feature '*source
	  :type '(repeat symbol))

のように文字素性の一種として扱うのが良いかなと思っています。


江渡さん> > 一方、digit-value が numeric-value の特殊形であるというよ
江渡さん> > うなことは文字素性定義で明示するという訳です。

江渡さん> そうですね。jis-x0208とか。

はい。

ところで、工業標準とか本とかを対象とする時に、@DOMAIN とは別に、
version とか edition とか日付とかがあると良いかも知れないという気もし
てます。もっとも、これも @DOMAIN として扱って、@DOMAIN のメタデータで
表現する方が良いかなという気もしてて悩み中です。

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======




More information about the CHISE-ja mailing list