difference of subsumptive and denotational

守岡知彦 / MORIOKA Tomohiko tomo @ kanji.zinbun.kyoto-u.ac.jp
2005年 8月 31日 (水) 19:28:49 JST


>>>>> In [chise-ja : No.00470] 
>>>>>	"上地さん" = Koichi Kamichi <kamichi @ fonts.jp> wrote:

上地さん> subsumptive と denotational の違いについて、<chise-ja: 00349>では、

守岡>>> そういう訳で、毎度おなじみ現実逃避なんですが、今回は懸案のひと
守岡>>> つの文字定義の継承をやってみようということで、以下の提案をしま
守岡>>> す。

守岡>>> (1) ->unified

守岡>>> 派生する文字を表す文字素性として ->unified を新設する。値の型
守岡>>> はchar-ref の list とする。
上地さん> (snip)
守岡>>> (3) ->inherited, <-inherited

守岡>>> ->unified, <-unified と同じセマンティクスとする。

守岡>>> 但し、<-inherited を持つ文字に対して define-char 形式での独立し
守岡>>> たエントリーを設けることとする。

守岡>> ->denotational, <-denotational として XEmacs CHISE に実装しました。(*1)

上地さん> ということで、後者はdefine-charで独立したエントリがある、と
上地さん> いう違いのようですが、実質的に何が違うのでしょうか?同じメー
上地さん> ルにはsubsumptiveが
上地さん> 
上地さん> > ;; 実は、今の所、Unicode の unification の表現にしか使って
上地さん> > ;; ないので、->unified の方が良かったかもという気もしない
上地さん> > ;; ではないですが。

上地さん> とあるので、Unicodeのunificationがsubsumptiveで、それ以外が
上地さん> denotationalかと思ったのですが、「呉」の場合でもU+5449の子は
上地さん> denotationalなので当てはまりません。

今の所、ad hoc ではあるのですが、微小な差異は ->subsumptive, 比較的大
きな差異は ->denotational としています。もっとも、その規準は明確にでき
ていないのですが。指針としては、

・部品レベルで別字(別字源)の場合は ->denotational
・IDS 構文木が異なる場合は ->denotational
・新字⇔旧字関係や簡体字⇔繁体字関係と規定されている場合は
  ->denotational
・UCS や大漢和などで分離されているような差異(どれかの文字で分離された
  ら、同様の規準を分離されてないケースにも再帰的に適用する)は
  ->denotational.  但し、重複と認められるものは除く。
・上記以外で、トポロジカルに同じであるような微小な差異は ->subsumptive
・重複符号化、同形異音など形以外の要素で分離されるものは ->subsumptive

という感じでしょうか。

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======





More information about the CHISE-ja mailing list