WWW pages and XEmacs UTF-2000 in cvs (Re: XEmacs UTF-2000 install)

守岡 知彦 / MORIOKA Tomohiko tomo @ mousai.as.wakwak.ne.jp
2002年 10月 2日 (水) 01:01:53 JST


>>>>> In [utf-2000 : No.00274] 
>>>>>	"師さん" = Shigeki Moro <s-moro @ hanazono.ac.jp> wrote:

師さん> CHISEの英語ページができてますね。ごくろうさまです。

Wittern さんが作業してくださいました。ありがとうございます > Wittern
さん。

師さん> # HTMLもどこかにCVSがあるんですか? 守岡さんの単独管理?

cvs.m17n.org の /cvs/root の www/chise (= /cvs/chise の www) です。
cvs.m17n.org に commit 権限を持ってればいじれます。そういう訳で、皆様、
commit 権を取ってくださいませ。


師さん> On 01 Oct 2002 02:05:32 +0900
師さん> tomo @ mousai.as.wakwak.ne.jp (守岡 知彦 / MORIOKA Tomohiko) san
	wrote:

師さん> おっしゃるとおり、CVSからチェックアウトしたらこのオプションな
師さん> しでいけました。ついでに、texiのところで止まることもありません
師さん> でしたね。

ところで、lazy-loading 化してから utf-8 系 coding-system での decode
が異常な程遅かったのですが、昨晩ついにその原因を見つけちょっとのけぞっ
てしまいました。何と ucs 系 coded-charset の decoding-table の cache
が効いてなくて、文字を decode する度に外部 DB に access してました!!!

そういう訳で、早速、ちゃんと cache するようにすると、劇的に早くなりま
した(というか、今までが異常だったんですが)。もちろん、はじめて
decode する文字は遅いですが、多くの場合、局在性が存在するので、はじめ
てファイルを開く時でも以前より早くなっていると思います。また、2度目以
降は lazy-loading 化する前と同等の速度で動くので、ある程度以上大きなファ
イルならその速度を体感できると思います。

これは昨晩 CVS に commit したので、CVS の方をお使いの方は是非お試しく
ださい。


それから、ids の IDS-*.txt の coding-system を utf-8 (= utf-8-er) から
utf-8-mcs-er に変更し UCS/Unicode にない文字を実体参照形式で表現する作
業をはじめました。これにより、IDS-*.txt は Unicode の範囲内の UTF-8
stream となり、XEmacs UTF-2000 以外でも扱えるようになると思います。

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======




More information about the CHISE-ja mailing list