xemacs + ruby/utf-2000

Kouichirou Eto 2003 @ eto.com
2003年 1月 16日 (木) 00:34:37 JST


江渡です。

> XEmacs UTF-2000上でshellを動かして下記を実行したのですが,unicode 部分
> が見れません.

C-x RET p
で、utf-8, utf-8と設定するといいと思います。

M-x set-buffer-process-coding-system でも同じ。
processの入力と出力の二回聞いてくるので、両方ともutf-8と答えるといいです。

(というのはMeadowの場合なのですが、XEmacs UTF-2000上では未確認。)

ちなみにファイルの編集そのものも、私はUTF-8でやっています。
C-x RET f で、utf-8と設定する。

ちなみに今日いろいろ実装していて、今のXStringとCharacterという二段構えで
実装している方法は、どう考えても間違いだと思うようになりました。
String一つに全部を実装するほうが効率がいいと思いました。
なのでそのように変えちゃおうかなと思います。

ただそのときにいろいろ悩みがあるのですが、原理原則的に考えると、
UTF-2000モデル的に言うところの文字というのは、属性によって定義されるので、
あらかじめbyte列が定義されるということはない。なんらかの文字オブジェクトが
あり、それに属性が付与される、というのが理論的な正統派です。

しかしその結果定義された文字は4byteで指示され、UTF-8的な一文字として
扱うことができる。

XStringとCharacterとの二段構えで実装する方法は、UTF-2000モデルにおける
理論的な正しい方向性とは合致しているのですが、String一本で実装すると、
どうしてもbyte列がまずありき、という実装になってしまう。

XEmacs UTF-2000でdefine-char形式で定義された標準文字データベースが
あらかじめ与えられていることを前提にできるのならば、それでもあまり
不都合はないのですが、不都合は無いとは言え理論的には後退だったりして、
これでいいんだろうか? と悩んでいるところ。

江渡 浩一郎 new! 2003 @ eto.com






More information about the CHISE-ja mailing list