「恋、蛮、変」の漢字構造
守岡知彦 / MORIOKA Tomohiko
tomo @ kanji.zinbun.kyoto-u.ac.jp
2008年 12月 18日 (木) 20:32:54 JST
>>>>> In [chise-ja : No.00572]
>>>>> "Jeroen Hoek" <mail @ jeroenhoek.nl> wrote:
> 漢字構造データベースでは、次の三つの漢字の構造を解明して下さいません
> か?
>
> 恋 ⿱ ⿱ 亠 &CDP-89BB; 心
> 蛮 ⿳ 亠 &CDP-89BB; 虫
> 変 ⿱ 亦 夂
>
> この字の下の部首が異なっているが、上の部分は同じではありませんか?
> 旧字体としても、その部分はこの三つの漢字の場合では、同じく「糸言糸」
> なので、この違いはどこから生じましたか?
入力の揺れの問題と、(例示字形における)デザイン差の問題があるようです。
JIS 例示字形 (=ucs @ jis) や日本風字体 (=ucs @ JP) の場合に関しては、「変」
のように「⿱ 亦 x」に統一しようと思います。
;; まだコミットしてませんが、IDS-JIS-X0208-1990.txt に関しては修正しま
;; した。
また、GB 例示字形 (=ucs @ gb) 風のデザインの場合、上述の「恋」の例のよう
に、「⿱ ⿱ 亠 &CDP-89BB; x」に統一したいと思います(将来的には、「⿱亠&CDP-89BB;」を
表す文字オブジェクトを定義して、それを使うのが良いと思います)。
なお、将来的には、IDS を抽象 IDS と具象 IDS に分けて、例えば、「恋」の
場合、
<恋>: ⿱ <亦> <心>
<恋@JP>: ⿱ <亦@JP> <心>
<恋@GB>: ⿱ <⿱<亠@GB><&CDP-89BB;>> <心>
<恋@CNS>: ⿱ <亦@CNS> <心>
但し、ここで、<x> は x の抽象文字、<x @ domain> は x の domain
における例示字形・字体
としようと思っています。現行の IDS-UCS-*.txt は Unicode や ISO での例
示字形を示すことになっているのですが、これも抽象 IDS と具象 IDS でファ
イルを分けたいと思っています。
;; ファイル名の付け方の案、募集中!
;; 漢字構造情報 (ideographic-structure 素性) の正規化プログラムもしな
;; くちゃと思いつつ、幾年月。(^_^;;;
--
===『幾千億の分子に分かれても ========================================
決して忘れない。
この宇宙が終るまで』 守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======
More information about the CHISE-ja
mailing list