素性メタデータ
守岡知彦 / MORIOKA Tomohiko
tomo @ kanji.zinbun.kyoto-u.ac.jp
2003年 10月 6日 (月) 16:18:29 JST
>>>>> In [chise-ja : No.00238]
>>>>> "江渡さん" = Kouichirou Eto <2003 @ eto.com> wrote:
江渡さん> > (define-char-feature 'ideographic-structure
江渡さん> > :description "Structural information of Han Ideographs."
江渡さん> > :type '(or (list ids2-char-ref char-ref char-ref)
江渡さん> > (list ids3-char-ref char-ref char-ref char-ref)))
江渡さん> > (define-char-feature '=ucs
江渡さん> > :description "ISO/IEC 10646 UCS-4."
江渡さん> > :type 'ccs
江渡さん> > :ccs-dimension 4
江渡さん> > :ccs-chars 256
江渡さん> > :ccs-iso-ir 177)
江渡さん> これでいきましょう。
了解です。
江渡さん> > 御意。ただ、@DOMAIN と *SOURCES は名前解決機構に組み込んで、
江渡さん> > 定義しなくても決まるようにするのが良いかなと思っています
江渡さん> > (ファイル名の相対パスみたいな感じに扱うというか)。
江渡さん> > つまり、=ucs @ jis が =ucs を継承することは自明とする訳です。
江渡さん> これはOKです。
ここで、*SOURCES は *METADATA に修正します。すなわち、
ideographic-radical*sources とある場合、未定義時に判ることは、素性
ideographic-radical の `source' という名前のメタデータであるということ
にしようと思います。すなわち、*source がなんなのかは別途定義が必要とい
う訳です。そして、これをどう定義するのが良いかなんですが、今の所、
(define-char-feature '*source
:type '(repeat symbol))
のように文字素性の一種として扱うのが良いかなと思っています。
江渡さん> > 一方、digit-value が numeric-value の特殊形であるというよ
江渡さん> > うなことは文字素性定義で明示するという訳です。
江渡さん> そうですね。jis-x0208とか。
はい。
ところで、工業標準とか本とかを対象とする時に、@DOMAIN とは別に、
version とか edition とか日付とかがあると良いかも知れないという気もし
てます。もっとも、これも @DOMAIN として扱って、@DOMAIN のメタデータで
表現する方が良いかなという気もしてて悩み中です。
--
===『幾千億の分子に分かれても ========================================
決して忘れない。
この宇宙が終るまで』 守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======
More information about the CHISE-ja
mailing list