Ruby/UTF-2000 2003-0117

Kouichirou Eto 2003 @ eto.com
2003年 1月 17日 (金) 23:50:27 JST


江渡です。

Ruby/UTF-2000の新版をあげました。
http://eto.com/2003/ruby/
http://eto.com/2003/ruby/ruby-utf2000-20030117.tar.bz2
→XStringを廃止し、Stringに一本化した。
→IDSテキストファイルを読みこみ、idsという属性にいれる機能を追加
→それを再帰的に分割し、ids-decomposeという属性にいれる機能を追加
p "字".decompose
というメソッドで分割する。
p "榊".decompose_all
とすると、再帰的に分割する。

今後、compose機能、その部品を使用している漢字への逆変換、
統計機能などをつける予定です。
あとHTMLを出力する機能ができたら、version.0.1とかにする予定つもりです。

IDSに間違いを発見したのですが、まだ自分で直せません…。
(CVSのアカウントは取得したので、これから勉強してみます。)

<C5-4C4D,chinese-cns11643-5:19533,ucs:136240>
<C6-4A37,chinese-cns11643-6:18999,ucs:144618>
この二つが、IDSに自分自身が含まれています。

また、二文字しかないIDS、つまり構造がおかしい漢字もたくさんあります。
IDSの構造分析をして、integrity checkをするプログラムも書く予定。

> このように新たな文字オブジェクトや文字属性を定義するという機能がXEmacs
> UTF-2000の真骨頂だという気がするのですが,そういうのをruby/utf2000,
> perl/utf2000で実装し,マイ文字オブジェクトやマイ属性を共有し合うとか,
> 仏典研究者間で公開するとかいうことは可能なのでしょうか.単にユーザーと
> しての意見でした(^^;).

このへん、どう実装すればいいのか、相当に悩みどころです。

江渡 浩一郎 new! 2003 @ eto.com






More information about the CHISE-ja mailing list