libchise化の問題
守岡知彦 / MORIOKA Tomohiko
tomo @ kanji.zinbun.kyoto-u.ac.jp
2004年 7月 16日 (金) 16:04:12 JST
>>>>> In [chise-ja : No.00380]
>>>>> "守岡" = tomo @ kanji.zinbun.kyoto-u.ac.jp (守岡知彦 / MORIOKA
Tomohiko) wrote:
守岡> <chise-ja:00242> によれば
守岡> ・文字素性 → 属性値
守岡> $CHISE-ROOT/feature/property/<name>
守岡> 但し、<name> は属性名
(略)
守岡> ということで、directory 構成はとりあえず決めてた模様です。
守岡> 形式は plain text でしょうか?
昨日、現実逃避してちょっとやってみたんですが、plain text だともうひと
つ directory 掘るか表にしないとだめなのと、既存のデータとの対称性、
code の流用性・対称性を考えると、plain text ではなく、これも Berkeley
DB にするのが妥当だという結論に達しました。
そういう訳で、文字素性 → 属性値 の場合、
ファイル名: 属性名(を変換したもの)
キー: 文字素性名
値: 属性値
という Berkeley DB のファイルが置かれることになります。
守岡> ちゃんと確認してないんですが、endian が違うはずの x86 Linux の
守岡> BDB ファイルが Mac OS X で読めたような気もするので、実は
守岡> portable なのではないかという疑問があるのですがちゃんと調べてま
守岡> せん。ご存知の方がいらっしゃいましたら是非情報をお寄せくださいま
守岡> せ。
http://www.sleepycat.com/docs/ref/am_misc/faq.html や
http://www.sleepycat.com/docs/ref/am_conf/byteorder.html にちゃんとアー
キテクチャ(エンディアン)非依存だって書いてありました。お恥ずかしい。
そういう訳で、どっかのタイミングで、
${PREFIX}/libexec/chise/${VERSION}/${CPU-VENDOR-OS}/db/
から
${PREFIX}/share/chise/${VERSION}/db/
に場所を変えようと思います。
;; libchise の変数 chise_system_db_dir を使ってる場合は意識しなくても
;; 済むはずの予定。
--
===『幾千億の分子に分かれても ========================================
決して忘れない。
この宇宙が終るまで』 守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======
More information about the CHISE-ja
mailing list