文字と文字列

Kouichirou Eto 2003 @ eto.com
2003年 2月 13日 (木) 13:59:00 JST


> ;; 太田さんって mohta さんのことで、plain text とは「いま日本語が危な
> ;; い」における「平文」のことで良いですよね?以下、そうだと仮定します。

そうです。

たしかに文法があっても平文として扱うことはできますが、
操作的定義そのものには意味があると思っています。

Chaonモデルでは、文字の一致判定をどのように行うのでしょうか?

例えば
<書体="明朝体">字</書体>
<書体="ゴシック">字</書体>
この二つの"字"だけを取り出したとして、それは一致するのですか?

高度化という意味は、「明朝体の"字"だけ検索したい」という要求にも答え
られるシステムを作りたいわけですよね。

ただ、現在のRuby/CHISEの実装だと、flyweightパターンを使っているので、
この要求には対応できません。

たしかに文字の扱いを高度化したいという要求はわかる気がします。
<コードネーム>キヤノン</コードネーム>
のヤは、表記としてはヤだが発音としてはャとするという特殊文字として扱える。

江渡 浩一郎 2003 @ eto.com






More information about the CHISE-ja mailing list