IDS (Re: グリフ・データ整備)

守岡知彦 / MORIOKA Tomohiko tomo @ mousai.as.wakwak.ne.jp
2003年 8月 7日 (木) 01:10:09 JST


;; cc: chise-ja @ m17n.org, utf-2000 @ m17n.org しときます。

>>>>> <20030805220314.B075.KAMICHI @ fonts.jp> にて
>>>>> “上地さま”= Koichi KAMICHI <kamichi @ fonts.jp> さま曰く:

上地さま> 一連の話とまったく関係ないのですが、手元のidsデータ
上地さま> (私の作ったデータとchiseのちゃんぽん)を、そろそろ
上地さま> chiseのデータにそっくり入れ替えようかと思い、cvsから
上地さま> IDS-JIS-X0208-1990.txtを落としてきて眺めているところです。

上地さま> ところが、なんか以前見たものと変わってきたような気がして、こ
上地さま> れは現在守岡さんが着手されているデータ整備の成果なのだと思い
上地さま> ます。

確かに、時々、いじってます。

上地さま> そこで、いくつかわからないところがあるのですが、
上地さま> お尋ねしてもよろしいでしょうか?

上地さま> 1.J90-7264	&I-J90-7264;	?魚票というデータの
上地さま> 「&I-J90-7264;」の「I」の意味を教えてください。

>>>>> [chise-ja : No.00121] にて
>>>>> “守岡”= tomo @ kanji.zinbun.kyoto-u.ac.jp (守岡知彦 / MORIOKA
      Tomohiko) 曰く:

守岡> &I-*; は builtin character (isolated character) ないしはグリフを
守岡> 表すものとして使っています。

です。


上地さま> 2.最近、GTの番号をGT-K番号に移しているような気がしますが
上地さま> この作業はまだ途中と考えていいのでしょうか?

そのような作業は特に意識して行ってはいません。どの実体参照を用いるかは
XEmacs CHISE の設定次第です(変数 coded-charset-entity-reference-alist 
の優先順位に従います。GT の方が GT-K よりも優先順位高いみたいです)。

;; 最近、GT 関連の文字データを増やしたので、若干変動があったかも知れま
;; せん。


上地さま> 3.「&JX2-2359;」の「jx2」というのはjis2000であっていますで
上地さま> しょうか?

JIS X 0213:2000 第2面(の GL 表現)です。

なお、各実体参照の一覧は XEmacs CHISE の lisp/mule/mule-coding.el の変
数 coded-charset-entity-reference-alist の設定をご参照ください。


上地さま> 4.こないだも同じことを聞きましたが^^;;もしidsに、コード系
上地さま> の参照番号を持たないようなcharをidsに使った場合、
上地さま> utf-8-mcs-erではどういう表現になるのでしょうか?

&MCS-*; という形になります。でも、これは文字オブジェクトの内部 ID を示
していて交換不可能なので、使うのはまずいです。


上地さま> 5.そのほか今後データを変換していく方向性があれば教えてください。
上地さま> (たとえば文字鏡番号は消していくとか)

&MCS-*; を見つけたら(文字定義を増やしたり、変数 
coded-charset-entity-reference-alist の設定を追加したりして)&MCS-*; 
を潰すということがあります。ただ、これは主に CHISE 文字データベース側
(現状では XEmacs CHISE)の設定になると思います。

また、IDS 中の &I-*; は I- のない形に書き換えます(第2カラム(例示字
形表示)中の &I-*; はそのままにしておきます)。

この他、KAGE の部品 variant レベルの表現を IDS でしたいとか、なるべく
字源的にデータを書きたいとかありますが、この当たりは一度ちゃんと考えた
いです。上地さんのご意見もお聞かせください。

;; というか、また一度 meeting 開いた方が良いのかも。


上地さま> LC2003の原稿は、まだ着手できていないのですが、kage、
上地さま> kage-with-chiseと外字共有の3つをネタに数枚書ければと思って
上地さま> います。

上地さま> できればlc2003でプレゼン用のフォントぐらいは自前で用意したい
上地さま> ですね。なんとかなると思っています。

私もまだです。一応、libchise ネタで書こうと思って、XEmacs CHISE と
libchise 関係の code をいじりはじめました。前回作った時に手抜きした部
分の報いを今受けてる所です。(^_^;;;

-- 
┯━…‥・懐かしい未来の記憶をふと思い出しかけた・‥…━━┯━━━┯━
││ ─ │  ─  /    ─   ┼─     ┬                ─   ─┼ ┬┴─
┼┼─┼|〓━─┼ 守岡 知彦 (MORIOKA Tomohiko) <tomo @ m17n.org> ─ ─┬
┻┻━┻━┷━━━━━━━━━━━━━━━━━━━━━━━━━━━━━




More information about the CHISE-ja mailing list