libchise化の問題

守岡知彦 / MORIOKA Tomohiko tomo @ kanji.zinbun.kyoto-u.ac.jp
2004年 7月 16日 (金) 16:04:12 JST


>>>>> In [chise-ja : No.00380] 
>>>>>	"守岡" = tomo @ kanji.zinbun.kyoto-u.ac.jp (守岡知彦 / MORIOKA
	Tomohiko) wrote:

守岡> <chise-ja:00242> によれば

守岡> ・文字素性 → 属性値

守岡> 	$CHISE-ROOT/feature/property/<name>

守岡> 	但し、<name> は属性名

(略)

守岡> ということで、directory 構成はとりあえず決めてた模様です。

守岡> 形式は plain text でしょうか?

昨日、現実逃避してちょっとやってみたんですが、plain text だともうひと
つ directory 掘るか表にしないとだめなのと、既存のデータとの対称性、
code の流用性・対称性を考えると、plain text ではなく、これも Berkeley
DB にするのが妥当だという結論に達しました。

そういう訳で、文字素性 → 属性値 の場合、

	ファイル名: 属性名(を変換したもの)
	キー:	     文字素性名
	値:	     属性値

という Berkeley DB のファイルが置かれることになります。


守岡> ちゃんと確認してないんですが、endian が違うはずの x86 Linux の 
守岡> BDB ファイルが Mac OS X で読めたような気もするので、実は 
守岡> portable なのではないかという疑問があるのですがちゃんと調べてま
守岡> せん。ご存知の方がいらっしゃいましたら是非情報をお寄せくださいま
守岡> せ。

http://www.sleepycat.com/docs/ref/am_misc/faq.htmlhttp://www.sleepycat.com/docs/ref/am_conf/byteorder.html にちゃんとアー
キテクチャ(エンディアン)非依存だって書いてありました。お恥ずかしい。

そういう訳で、どっかのタイミングで、

	${PREFIX}/libexec/chise/${VERSION}/${CPU-VENDOR-OS}/db/

から

	${PREFIX}/share/chise/${VERSION}/db/

に場所を変えようと思います。

;; libchise の変数 chise_system_db_dir を使ってる場合は意識しなくても
;; 済むはずの予定。

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======




More information about the CHISE-ja mailing list