difference of subsumptive and denotational
守岡知彦 / MORIOKA Tomohiko
tomo @ kanji.zinbun.kyoto-u.ac.jp
2005年 8月 31日 (水) 19:28:49 JST
>>>>> In [chise-ja : No.00470]
>>>>> "上地さん" = Koichi Kamichi <kamichi @ fonts.jp> wrote:
上地さん> subsumptive と denotational の違いについて、<chise-ja: 00349>では、
守岡>>> そういう訳で、毎度おなじみ現実逃避なんですが、今回は懸案のひと
守岡>>> つの文字定義の継承をやってみようということで、以下の提案をしま
守岡>>> す。
守岡>>> (1) ->unified
守岡>>> 派生する文字を表す文字素性として ->unified を新設する。値の型
守岡>>> はchar-ref の list とする。
上地さん> (snip)
守岡>>> (3) ->inherited, <-inherited
守岡>>> ->unified, <-unified と同じセマンティクスとする。
守岡>>> 但し、<-inherited を持つ文字に対して define-char 形式での独立し
守岡>>> たエントリーを設けることとする。
守岡>> ->denotational, <-denotational として XEmacs CHISE に実装しました。(*1)
上地さん> ということで、後者はdefine-charで独立したエントリがある、と
上地さん> いう違いのようですが、実質的に何が違うのでしょうか?同じメー
上地さん> ルにはsubsumptiveが
上地さん>
上地さん> > ;; 実は、今の所、Unicode の unification の表現にしか使って
上地さん> > ;; ないので、->unified の方が良かったかもという気もしない
上地さん> > ;; ではないですが。
上地さん> とあるので、Unicodeのunificationがsubsumptiveで、それ以外が
上地さん> denotationalかと思ったのですが、「呉」の場合でもU+5449の子は
上地さん> denotationalなので当てはまりません。
今の所、ad hoc ではあるのですが、微小な差異は ->subsumptive, 比較的大
きな差異は ->denotational としています。もっとも、その規準は明確にでき
ていないのですが。指針としては、
・部品レベルで別字(別字源)の場合は ->denotational
・IDS 構文木が異なる場合は ->denotational
・新字⇔旧字関係や簡体字⇔繁体字関係と規定されている場合は
->denotational
・UCS や大漢和などで分離されているような差異(どれかの文字で分離された
ら、同様の規準を分離されてないケースにも再帰的に適用する)は
->denotational. 但し、重複と認められるものは除く。
・上記以外で、トポロジカルに同じであるような微小な差異は ->subsumptive
・重複符号化、同形異音など形以外の要素で分離されるものは ->subsumptive
という感じでしょうか。
--
===『幾千億の分子に分かれても ========================================
決して忘れない。
この宇宙が終るまで』 守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======
More information about the CHISE-ja
mailing list