[ids] make install (Re: 漢字の部品化)

Shigeki Moro s-moro @ hanazono.ac.jp
2002年 11月 28日 (木) 16:16:23 JST


師です。今日は面接入試の審査員をしてました (^_^;)

On 27 Nov 2002 19:12:24 +0900
tomo @ kanji.zinbun.kyoto-u.ac.jp (守岡知彦 / MORIOKA Tomohiko) san wrote:

> 守岡> ;; 整理して Makefile に仕込もうと思ってるんですが、時間がなくて
> 守岡> ;; まだやってません。
> 
> 昨晩、ふと思い立って作ってみました。

をを、すばらしい。これもチュートリアルにいれましょうか。

あるいは、現在、トップページに併記されているXEmacs UTF-2000以外
のサブプロジェクトを別ページにし、文字知識サブグループの中に、
IDSのチュートリアルを作りましょうか。

トップ
 ├文字知識データベースに基づく文字処理アーキテクチャの開発
 │├XEmacs UTF-2000
 │└Ruby/UTF-2000
 ├TopicMaps
 ├文字知識DB
 │├IDS
 │└グリフ合成
 └可視化

みたいに。

# いつのまにかトップページが充実している。Rubyの提案よさげですね。

> ところで、ideographic-structure-search-chars で指定する部品として
> 
>  (a) 例えば、「水」で<さんずい>とか「肉」で<にくづき>とかにマッチした
>      方が良いでしょうか?

良いです。strictなマッチも残しておいて欲しいですが。

属性の拡張については、フォント合成に絡んでくると思うので、もう少
し考えてから後でコメントします。

> また、このとき、
> 
>  (a') 例えば、<さんずい>で「水」とか<にくづき>で「肉」とかにマッチした
>      方が良いでしょうか?

良いです。strictなマッチも(以下同)

ちなみに、ideographic-structure-search-charsで部品を指定する際、
cannaなどで入力すればもちろんちゃんと動きますが、cannaで入力でき
ないような文字(部首とか)をコピー&ペーストすると変な文字がマッ
チしませんか?(具体的な例は後で)

>  (b) 「ホ」のようなカタカナとか BOPOMOFO みたいなので似た形の漢字が見
>      つけられた方が良いでしょうか?

良いです。strictな(以下同) カタカナは漢字から派生したわけです
から、簡体字の部首みたいな位置づけでもよいと思ったりします。もち
ろん意味は失われているので、簡体字の部首よりも元の漢字とのつなが
りは薄くなるわけですが。

ありがちなのは「厶」と「ム」とかですね。「夕」と「タ」とか。「巛」
と「くくく」はちょっとあれか。「肉」→<にくづき>→same-glyph→
「月」とかもそうですかね。

BMPの範囲で適当にリストアップしたのを添付してみました。足したり
引いたりしなければならないと思いますが、とりあえず叩き台として。

# 2chの検索エンジンに使えたりして (^_^;)

> (b) に関しては、`->same-glyph', `<-same-glyph' とか `->confusing',
> `<-confusing' を導入してはどうかと思います。

OKだと思います。UnicodeのNormalizationとは分けるか、別立ての方が
いいですよね。

Shigeki Moro

Hanazono University
s-moro @ hanazono.ac.jp
moro @ ya.sakura.ne.jp
http://www.ya.sakura.ne.jp/~moro/
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: ka.txt
型:         application/octet-stream
サイズ:     580 バイト
説明:       無し
URL:        <http://lists.chise.org/pipermail/chise-ja/attachments/20021128/1b2f0e4a/attachment.obj>


More information about the CHISE-ja mailing list