[ids] make install (Re: 漢字の部品化)
Shigeki Moro
s-moro @ hanazono.ac.jp
2002年 11月 28日 (木) 16:16:23 JST
師です。今日は面接入試の審査員をしてました (^_^;)
On 27 Nov 2002 19:12:24 +0900
tomo @ kanji.zinbun.kyoto-u.ac.jp (守岡知彦 / MORIOKA Tomohiko) san wrote:
> 守岡> ;; 整理して Makefile に仕込もうと思ってるんですが、時間がなくて
> 守岡> ;; まだやってません。
>
> 昨晩、ふと思い立って作ってみました。
をを、すばらしい。これもチュートリアルにいれましょうか。
あるいは、現在、トップページに併記されているXEmacs UTF-2000以外
のサブプロジェクトを別ページにし、文字知識サブグループの中に、
IDSのチュートリアルを作りましょうか。
トップ
├文字知識データベースに基づく文字処理アーキテクチャの開発
│├XEmacs UTF-2000
│└Ruby/UTF-2000
├TopicMaps
├文字知識DB
│├IDS
│└グリフ合成
└可視化
みたいに。
# いつのまにかトップページが充実している。Rubyの提案よさげですね。
> ところで、ideographic-structure-search-chars で指定する部品として
>
> (a) 例えば、「水」で<さんずい>とか「肉」で<にくづき>とかにマッチした
> 方が良いでしょうか?
良いです。strictなマッチも残しておいて欲しいですが。
属性の拡張については、フォント合成に絡んでくると思うので、もう少
し考えてから後でコメントします。
> また、このとき、
>
> (a') 例えば、<さんずい>で「水」とか<にくづき>で「肉」とかにマッチした
> 方が良いでしょうか?
良いです。strictなマッチも(以下同)
ちなみに、ideographic-structure-search-charsで部品を指定する際、
cannaなどで入力すればもちろんちゃんと動きますが、cannaで入力でき
ないような文字(部首とか)をコピー&ペーストすると変な文字がマッ
チしませんか?(具体的な例は後で)
> (b) 「ホ」のようなカタカナとか BOPOMOFO みたいなので似た形の漢字が見
> つけられた方が良いでしょうか?
良いです。strictな(以下同) カタカナは漢字から派生したわけです
から、簡体字の部首みたいな位置づけでもよいと思ったりします。もち
ろん意味は失われているので、簡体字の部首よりも元の漢字とのつなが
りは薄くなるわけですが。
ありがちなのは「厶」と「ム」とかですね。「夕」と「タ」とか。「巛」
と「くくく」はちょっとあれか。「肉」→<にくづき>→same-glyph→
「月」とかもそうですかね。
BMPの範囲で適当にリストアップしたのを添付してみました。足したり
引いたりしなければならないと思いますが、とりあえず叩き台として。
# 2chの検索エンジンに使えたりして (^_^;)
> (b) に関しては、`->same-glyph', `<-same-glyph' とか `->confusing',
> `<-confusing' を導入してはどうかと思います。
OKだと思います。UnicodeのNormalizationとは分けるか、別立ての方が
いいですよね。
Shigeki Moro
Hanazono University
s-moro @ hanazono.ac.jp
moro @ ya.sakura.ne.jp
http://www.ya.sakura.ne.jp/~moro/
-------------- next part --------------
テキスト形式以外の添付ファイルを保管しました...
ファイル名: ka.txt
型: application/octet-stream
サイズ: 580 バイト
説明: 無し
URL: <http://lists.chise.org/pipermail/chise-ja/attachments/20021128/1b2f0e4a/attachment.obj>
More information about the CHISE-ja
mailing list