2つの「芸」
守岡知彦 / MORIOKA Tomohiko
tomo @ kanji.zinbun.kyoto-u.ac.jp
2006年 12月 19日 (火) 14:45:20 JST
>>>>> [chise-ja : No.00519] にて
>>>>> KAMICHI Koichi <kamichi @ fonts.jp> さま曰く:
> 先週末に大津でJAETの大会があり、発表してきました。そのときに受けたコ
> メントについて、CHISEのchaonモデルで処理できるのか疑問に思ったので投
> 稿します。
> 「芸」には「ゲイ」と読む「藝」の新字体と、「ウン」と読む本来の字の、
> 2つの異なった漢字の同字形が重なった文字ですが、これを文字オブジェク
> トとして分けて考えることはできますか?
可能です。
> 単純に2つの文字オブジェクトがあると考えればいいのですが、それら2つ
> のオブジェクトいずれに対しても、たとえばJISの同じコードポイントが両
> 者に与えられます。私の理解ではCCSとcharIDは1対1でないと処理できない
> と思っているのですが大丈夫でしょうか?
そんなことはないです。
> indexのBDBファイルにはどうやって格納するのでしょうか。
自動割り当て(といっても、今の所 XEmacs CHISE で実装してます。すみませ
ん。(^_^;;)された char-id に素性が与えられます。
ただ、そのままではそのオブジェクトにアクセスしづらいので、
(define-char
'((<-denotational ?芸)
(sound @ ja/on . "gei")))
(define-char
'((<-denotational ?芸)
(sound @ ja/on . "un")))
のようにして
芸
│
┌──┴──┐
芸(ゲイ) 芸(ウン)
とするのがお勧めです。
また、必要なら CCS を作っちゃうのも1つの手です。
--
┯━…‥・懐かしい未来の記憶をふと思い出しかけた・‥…━━┯━━━┯━
││ ─ │ ─ / ─ ┼─ ┬ ─ ─┼ ┬┴─
┼┼─┼|〓━─┼ 守岡 知彦 (MORIOKA Tomohiko) <tomo @ m17n.org> ─ ─┬
┻┻━┻━┷━━━━━━━━━━━━━━━━━━━━━━━━━━━━━
More information about the CHISE-ja
mailing list