KAGE部品のchise-dbへの統合について
守岡知彦 / MORIOKA Tomohiko
tomo @ m17n.org
2005年 6月 9日 (木) 02:02:31 JST
>>>>> In [chise-ja : No.00421]
>>>>> Koichi KAMICHI <kamichi @ fonts.jp> wrote:
> 当初、KAGE部品をchise-dbに統合するに当たって問題となる配置時変形(木
> が木偏になると4画目が変形する等)部品の扱いについては、「木」にあた
> るオブジェクトに強引に「木」「木偏」「茶の下部」などを分離記号でつな
> げてひとくくりで放り込んで、KAGEエンジン側で分離して必要な部品を取り
> 出そうと考えていました。
> しかし、せっかくなのでchiseらしい統合にしようと考え直しました。具体
> 的には、「->transform-left」「->transform-surround-from-upper-left」
> のような素性で独立字形とは別のオブジェクトに部品を入れる、ということ
> です。
> 2)素性名を新しく考えるにあたって、注意点はありますか?ユーザー定義、
> にあたるような前置詞をつけたほうが良いでしょうか
ユーザー定義素性に関する convention は今の所存在していないと思います。
漢字部品の配置時変形に関する情報であれば CHISE spec として大域的に決め
ちゃうのが良いのではないかと思います。
ちなみに、現在、漢字部品の情報は
<派生元> -->ideographic-component-forms--> <派生先>
即ち、<派生元> の素性 ->ideographic-component-forms の要素として <派
生先> が入り、<派生先> の <-ideographic-component-forms の要素として
<派生元> が入る。
というような形で表現されています。
ただ、異体字関係の「A を B に作る」や「B は A の別体」を
A -->formed--> B
としようかと思っていて、部品に関連のドメイン(名前空間)として
`component' を定義し、これを併用して、
<基底字> -->formed @ component--> <部品字>
としようかと思っています。
例えば、これに基づくのであれば、配置場所を示す情報をドメインか
`->formed @ component*location', `<-formed @ component*location'
といった素性に入れるというのはどうでしょうか?
配置場所指定は、左部(偏)とか右部(旁)とか下部(あし)という分析もあ
りだと思いますが、<IDEOGRAPHIC DESCRIPTION CHARACTER LEFT TO MIDDLE
AND RIGHT> や <IDEOGRAPHIC DESCRIPTION CHARACTER ABOVE TO MIDDLE AND
BELOW> の真中のことを考えると、右側にくっつく(偏)とか左側にくっつく
(旁)とか上側にくっつく(あし)というような分析の方が良いのかもなんて
思ったりもするのですが、でも、良く考えると、真中だと変形しないのかもし
れませんね。
それから、名前はなるべく英語で付けるのがうれしいです。どうしても英語に
ならないときは、ピンイン風表記がお勧めです。
--
===『幾千億の分子に分かれても ========================================
決して忘れない。
この宇宙が終るまで』 守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======
More information about the CHISE-ja
mailing list