IDS (Re: グリフ・データ整備)

守岡知彦 / MORIOKA Tomohiko tomo @ mousai.as.wakwak.ne.jp
2003年 8月 7日 (木) 02:37:21 JST


>>>>> In [utf-2000 : No.00379] 
>>>>>	"江渡さん" = Kouichirou Eto <2003 @ eto.com> wrote:

江渡さん> IDSのデータは以前じっくり見ていて、たしかにどのような意味で
江渡さん> このようなデータになっているのかわかりにくい部分がいろいろと
江渡さん> あります。
江渡さん> 簡単に言うと、様々な意味で、データを作る際に「解釈」がからん
江渡さん> でくるので、そのデータを作った意図を頭におかないと理解できて
江渡さん> こないと思います。

まあ、何というか文書化が不十分というのはあるかも知れません。

また、CHISE-IDS の IDS-*.txt はそれだけで完結したものではなくて、CHISE
文字データベースに取り込んで使うことが前提になってたり、人手で直す部分
と機械処理による再構成を繰り返してる部分が混在していて、どこが意図なの
か判りにくいのかも知れません。そういう訳で、それだけ眺めてるとかえって
混乱しちゃうんでしょうか?


江渡さん> I- がついている実体参照は、定義が存在しないけど、形だけが存
江渡さん> 在する文字。「フォント(または画像)として使っている」という説
江渡さん> 明があるのだけど、それだといまいち背景が理解できなくて、なぜ
江渡さん> 定義がない文字を使用する必要があるのかという点を理解する必要
江渡さん> があると思います。

これは明白で、作業するのに画面上に文字画像が見えた方が便利だからです。
そして、それは本質的に画像で文字じゃない訳です。もし、plain text に画
像ファイルが張り付けられ、埋め込み可能な自由に利用可能な字形があるなら、
&I-*; ではなく画像を埋め込んだ方が自然なのかも知れません。単に、現状の
XEmacs CHISE での方便というか。

そして、IDS-*.txt の第2カラムの『文字画像』はデータ的には意味がなく、
人間用のコメントです。ここに深い意味はないんです。


江渡さん> と、いろいろあるのですが、発展的に解消するとすると、このIDS
江渡さん> データも、現在の素性と同じようにdefine-char-ids形式のデータ
江渡さん> ベースへと発展させるしか無いのではないかなと思います。

そういう気はします。文字素性の集合を現在のように集中的に表現するのでは
なく、分散的に表現し編集する仕組が必要なのだと思います。

今、素性に導入しつつある domain (name space) の仕組をうまく分散データ
ベースでの衝突や名前解決の仕組に対応させられたらなあと思ってます。また、
Wittern さんがもうそろそろ TopicMaps で何とかしてくれるんじゃないかと
思ってるんですが…。

また、いろんな専用の編集用のモードや XEmacs CHISE の外で動く編集ツール
もいるのだと思います。個人的には可視化の技術を活かした cool で便利な
編集ツールができたら良いなあと思います。

-- 
守岡 知彦 (MORIOKA Tomohiko) <tomo @ kanji.zinbun.kyoto-u.ac.jp>




More information about the CHISE-ja mailing list