KAGE部品のchise-dbへの統合について

守岡知彦 / MORIOKA Tomohiko tomo @ m17n.org
2005年 6月 9日 (木) 02:02:31 JST


>>>>> In [chise-ja : No.00421] 
>>>>>	 Koichi KAMICHI <kamichi @ fonts.jp> wrote:

> 当初、KAGE部品をchise-dbに統合するに当たって問題となる配置時変形(木
> が木偏になると4画目が変形する等)部品の扱いについては、「木」にあた
> るオブジェクトに強引に「木」「木偏」「茶の下部」などを分離記号でつな
> げてひとくくりで放り込んで、KAGEエンジン側で分離して必要な部品を取り
> 出そうと考えていました。

> しかし、せっかくなのでchiseらしい統合にしようと考え直しました。具体
> 的には、「->transform-left」「->transform-surround-from-upper-left」
> のような素性で独立字形とは別のオブジェクトに部品を入れる、ということ
> です。

> 2)素性名を新しく考えるにあたって、注意点はありますか?ユーザー定義、
> にあたるような前置詞をつけたほうが良いでしょうか

ユーザー定義素性に関する convention は今の所存在していないと思います。

漢字部品の配置時変形に関する情報であれば CHISE spec として大域的に決め
ちゃうのが良いのではないかと思います。

ちなみに、現在、漢字部品の情報は

<派生元> -->ideographic-component-forms--> <派生先>

  即ち、<派生元> の素性 ->ideographic-component-forms の要素として <派
  生先> が入り、<派生先> の <-ideographic-component-forms の要素として 
  <派生元> が入る。

というような形で表現されています。

ただ、異体字関係の「A を B に作る」や「B は A の別体」を

	A -->formed--> B

としようかと思っていて、部品に関連のドメイン(名前空間)として
`component' を定義し、これを併用して、

	<基底字> -->formed @ component--> <部品字>

としようかと思っています。

例えば、これに基づくのであれば、配置場所を示す情報をドメインか

`->formed @ component*location', `<-formed @ component*location'

といった素性に入れるというのはどうでしょうか?

配置場所指定は、左部(偏)とか右部(旁)とか下部(あし)という分析もあ
りだと思いますが、<IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO MIDDLE
AND RIGHT> や <IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO MIDDLE AND
BELOW> の真中のことを考えると、右側にくっつく(偏)とか左側にくっつく
(旁)とか上側にくっつく(あし)というような分析の方が良いのかもなんて
思ったりもするのですが、でも、良く考えると、真中だと変形しないのかもし
れませんね。

それから、名前はなるべく英語で付けるのがうれしいです。どうしても英語に
ならないときは、ピンイン風表記がお勧めです。

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======





More information about the CHISE-ja mailing list