UTF-2000 char-db

Kouichirou Eto 2003 @ eto.com
2003年 1月 15日 (水) 03:00:24 JST


守岡さん、江渡です。

わからないことがいろいろあって人文研に何度かお電話したのですが、
風邪だったのですね。お大事に。

いくつか質問です。実体参照で&I-J90-3029;と&J90-302A;というふうにI-が
ついているものとついていないものがありますが、このついている意味は
なんなのでしたっけ。一度聞いたような気もするのですが、違いが
よく理解できませんでした。

jisx0208が、=jis-x0208, japanese-jisx0208-1978, japanese-jisx0208-1990
の三つに分かれましたが、これはどのように扱うのがいいのでしょうか。
例えば「JISX0208に含まれる漢字全部」というのを扱いたい場合は、
=jis-x0208とjapanese-jisx0208-1990の二つを合成したものを対象にすれば
いいのでしょうか。

例えば、「学」の古い字体が「學」である、といった時代別の情報は、
現在は文字データベースには入ってないのでしょうか?

標準文字データベースの配付について:
> というだけの目的であれば、XEmacs UTF-2000 に作らせたデータベースを
> db_dump とかで text file に dump するのはいかがでしょうか?

とりあえず、これがいいと思います。db_dumpはどうやるのでしょうか。

データベースを独立してほしいのは、Windowsだけしか持ってない人にはBDBファ
イルが入手できないからです。それならBDB化したファイルを提供すればいい
のですが、できればデータベースに手を入れられるようにしてほしいからなの
ですが、それは次の段階でいいです。
テキストファイルの方が楽ですが、define-char形式でも大丈夫です。

specs制定、というのが若干意味がわからないのですが、どのようなattribute
があるか、またそのattribute名の決定、みたいな感じですか?  attributeは
増えたり減ったりするようなもんだと思うので、どこかで決定したりはしない
と思うのですが。

江渡 浩一郎 new! 2003 @ eto.com






More information about the CHISE-ja mailing list