「恋、蛮、変」の漢字構造

守岡知彦 / MORIOKA Tomohiko tomo @ kanji.zinbun.kyoto-u.ac.jp
2008年 12月 18日 (木) 20:32:54 JST


>>>>> In [chise-ja : No.00572] 
>>>>>	"Jeroen Hoek" <mail @ jeroenhoek.nl> wrote:

> 漢字構造データベースでは、次の三つの漢字の構造を解明して下さいません
> か?
> 
> 恋 ⿱ ⿱ 亠 &CDP-89BB; 心
> 蛮 ⿳ 亠 &CDP-89BB; 虫
> 変 ⿱ 亦 夂
> 
> この字の下の部首が異なっているが、上の部分は同じではありませんか?
> 旧字体としても、その部分はこの三つの漢字の場合では、同じく「糸言糸」
> なので、この違いはどこから生じましたか?

入力の揺れの問題と、(例示字形における)デザイン差の問題があるようです。

JIS 例示字形 (=ucs @ jis) や日本風字体 (=ucs @ JP) の場合に関しては、「変」
のように「⿱ 亦 x」に統一しようと思います。

;; まだコミットしてませんが、IDS-JIS-X0208-1990.txt に関しては修正しま
;; した。

また、GB 例示字形 (=ucs @ gb) 風のデザインの場合、上述の「恋」の例のよう
に、「⿱ ⿱ 亠 &CDP-89BB; x」に統一したいと思います(将来的には、「⿱亠&CDP-89BB;」を
表す文字オブジェクトを定義して、それを使うのが良いと思います)。

なお、将来的には、IDS を抽象 IDS と具象 IDS に分けて、例えば、「恋」の
場合、

	<恋>: ⿱ <亦> <心>
	<恋@JP>: ⿱ <亦@JP> <心>
	<恋@GB>: ⿱ <⿱<亠@GB><&CDP-89BB;>> <心>
	<恋@CNS>: ⿱ <亦@CNS> <心>

	但し、ここで、<x> は x の抽象文字、<x @ domain> は x の domain 
	における例示字形・字体

としようと思っています。現行の IDS-UCS-*.txt は Unicode や ISO での例
示字形を示すことになっているのですが、これも抽象 IDS と具象 IDS でファ
イルを分けたいと思っています。

;; ファイル名の付け方の案、募集中!


;; 漢字構造情報 (ideographic-structure 素性) の正規化プログラムもしな
;; くちゃと思いつつ、幾年月。(^_^;;;

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======





More information about the CHISE-ja mailing list