2つの「芸」

守岡知彦 / MORIOKA Tomohiko tomo @ kanji.zinbun.kyoto-u.ac.jp
2006年 12月 19日 (火) 14:45:20 JST


>>>>> [chise-ja : No.00519] にて
>>>>> KAMICHI Koichi <kamichi @ fonts.jp> さま曰く:

> 先週末に大津でJAETの大会があり、発表してきました。そのときに受けたコ
> メントについて、CHISEのchaonモデルで処理できるのか疑問に思ったので投
> 稿します。

> 「芸」には「ゲイ」と読む「藝」の新字体と、「ウン」と読む本来の字の、
> 2つの異なった漢字の同字形が重なった文字ですが、これを文字オブジェク
> トとして分けて考えることはできますか?

可能です。

> 単純に2つの文字オブジェクトがあると考えればいいのですが、それら2つ
> のオブジェクトいずれに対しても、たとえばJISの同じコードポイントが両
> 者に与えられます。私の理解ではCCSとcharIDは1対1でないと処理できない
> と思っているのですが大丈夫でしょうか?

そんなことはないです。

> indexのBDBファイルにはどうやって格納するのでしょうか。

自動割り当て(といっても、今の所 XEmacs CHISE で実装してます。すみませ
ん。(^_^;;)された char-id に素性が与えられます。

ただ、そのままではそのオブジェクトにアクセスしづらいので、

(define-char
  '((<-denotational ?芸)
    (sound @ ja/on . "gei")))

(define-char
  '((<-denotational ?芸)
    (sound @ ja/on . "un")))

のようにして

         芸
         │
   ┌──┴──┐
芸(ゲイ)  芸(ウン)

とするのがお勧めです。

また、必要なら CCS を作っちゃうのも1つの手です。

-- 
┯━…‥・懐かしい未来の記憶をふと思い出しかけた・‥…━━┯━━━┯━
││ ─ │  ─  /    ─   ┼─     ┬                ─   ─┼ ┬┴─
┼┼─┼|〓━─┼ 守岡 知彦 (MORIOKA Tomohiko) <tomo @ m17n.org> ─ ─┬
┻┻━┻━┷━━━━━━━━━━━━━━━━━━━━━━━━━━━━━





More information about the CHISE-ja mailing list