chise-core / chise-base 0.23 released.

守岡知彦 / MORIOKA Tomohiko tomo @ m17n.org
2006年 5月 21日 (日) 07:25:47 JST


>>>>> In [chise-ja : No.00508] 
>>>>>	NIIBE Yutaka <gniibe @ m17n.org> wrote:

> すみません。外していたらごめんなさい。
> 
> 守岡知彦 / MORIOKA Tomohiko wrote:
> > CHISE-core は CHISE 環境の基本ライブラリ・データベースをインストールす
> > るためのパッケージです。CHISE-core の中には、Concord ライブラリ、CHISE
> > ライブラリ (libchise), および、CHISE 汎用文字データベース (chise-db)
> > が含まれています。CHISE-core を使うことにより、これらのモジュールを簡
> > 単にインストールすることができます。
> 
> chise-db のソースコードはどこにあるのでしょうか。
> 
> chise-db のソースコードから libchise を使って chise-db が作られること
> が期待されますが、それは現在のバージョンでは可能でしょうか。

chise-db はポータブルなデータなので、プログラムと同様な意味でのソース
コードはありません。


ただ、現在の管理体制のもとでどうやって作っているかといえば、
xemacs-chise/lisp/utf-2000/ 以下の define-char 形式の文字定義を XEmacs
CHISE で評価して作った文字データベースに対し、CHISE-IDS の IDS-*.txt
の評価結果を加えて作っています。そういう意味では、これらが chise-db の
ソースです。

一方、xemacs-chise/lisp/utf-2000/ 以下の define-char 形式の文字定義は 
chise-db を M-x char-db-dump [CR] して作ったものであり、CHISE-IDS の 
IDS-*.txt も chise-db を M-x ids-dump-* [CR] して作ったもので(実際に
は、IDS 関連のデータはまだ不動点に達してないのでちょっと嘘ですが、dump
結果とのチェック & 修正作業は行っています。また、別形式で入力した新た
なデータ等を取り込む場合は、chise-db を介して、M-x char-db-dump [CR] 
して define-char 形式にしています)、そういう観点でいえば、chise-db が
これらのファイルのソースと看做せます。

このように、本質的に変換可能なデータなので、XEmacs CHISE と CHISE-IDS
を含まない CHISE-core には chise-db のみを添付しています。

;; 将来的には、直接 chise-db を編集するための UI とか WWW application 
;; が欲しいなあと思っています。


ところで、XEmacs CHISE と CHISE-IDS を含む CHISE-base では

  % make generate-db

  % make db-clean

  % make chise-db

することで、chise-db を define-char 形式の文字定義 + IDS-*.txt から再
構成できます(CHISE-core の場合でも、anonymous CVS が利用可能であれば、
実行可能です)。

また、前述のように、XEmacs CHISE 上で M-x char-db-dump [CR] することで、
define-char 形式の文字定義、M-x ids-dump-* [CR] することで IDS-*.txt
形式の漢字構造情報を再構成できます。

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======





More information about the CHISE-ja mailing list