Priority of GT and GTK
守岡知彦 / MORIOKA Tomohiko
tomo @ m17n.org
2005年 6月 7日 (火) 00:36:46 JST
>>>>> In [chise-ja : No.00419]
>>>>> Koichi KAMICHI <kamichi @ fonts.jp> wrote:
> 上地です。オブジェクトの親子関係について、specsでは
(略)
> > この一族の定義は現在
> >
> > U+5F50
> > |
> > +-- <CJK RADICAL SNOUT TWO> = GT-K00266
> > | |
> > | +-- BC-897C
> > |
> > +-- JSP-3C77 = GT-12503 = GT-K00268
> > |
> > +-- G0-6566
> > |
> > +-- BC-8BAB = GT-67403
> > |
> > +-- GT-K00267
>
> とありますが、この場合に、どうして親(U+5F50)子(4人)の関係に分か
> れるのかがわかりません。U+hogeが5欄表記だから、その5欄に相当するも
> のが子供、と考えていいのでしょうか?平等ではなくて親子になる部分が不
> 明です。
形状によって(独断と偏見で(^_^;)分類してます。5欄表記はあんまり関係
ないです。
U+5F50 の場合の親子関係:
(a) <CJK RADICAL SNOUT TWO> の系列
(b) BC-8BAB の系列
は便宜的に文字オブジェクトを分離するためのもので、おっしゃるように意味
不明な面があります。
(a) は微妙に形状が違うかな(BC-897C は真中の線が突き出しているように見
える)という気がしたので <CJK RADICAL SNOUT TWO> と unify しなかったよ
うな気がします。もし、本当に区別するなら
<CJK RADICAL SNOUT TWO> ; 横線の長さは気にしない
|
+-- GT-K00266 ; 横線が同じ長さ
|
+-- BC-897C ; 真中の線が長い
みたいにするのが良いかなと思います。
(b) は GT-67403 と GT-K00267 が同じ物理フォントを利用していない(GT 的
に違うものとして分離されている)ので便宜的に分離されているだけです。ま
た、GT を GT-K よりも優先したようです。
;; GT は文字、GT-K は部品と解釈するならば、BC-8BAB と unify するのは、
;; GT-67403 よりも GT-K00267 の方がふさわしかったかもしれません。ただ、
;; GT-K00267 が GT-67403 よりも汚かったのでなんとなく避けてしまったの
;; かも。(何て、以前の mail で書いたことと矛盾したこと言ってるし。で
;; も、文字定義をいじった時期によって揺れてる部分があるもんで(^_^;;;)
なお、いっそ GT-67403 と GT-K00267 を unify しちゃうのはありだと思いま
す。
> 逆に、子と子の関係(JSP-3C77とG0-6566)は、specsでいうと、どれになる
> のでしょうか?(もしくは、U+5F50をまたがないと表現できないのでしょう
> か)
今の所、ありがちな木構造と同様に、親子関係しか表現されていません。自分
の兄弟を得るには
(let ((self (decode-char '=jis-x0212 #x3C77))
dest)
(dolist (parent (union (get-char-attribute self '<-subsumptive)
(get-char-attribute self '<-denotational)))
(dolist (child (union (get-char-attribute parent '->subsumptive)
(get-char-attribute parent '->denotational)))
(unless (eq child self)
(setq dest (cons child dest)))))
dest)
みたいな処理が必要です。
--
===『幾千億の分子に分かれても ========================================
決して忘れない。
この宇宙が終るまで』 守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======
More information about the CHISE-ja
mailing list