ISO/IEC 10646のGBソース、ほか

守岡知彦 / MORIOKA Tomohiko tomo @ kanji.zinbun.kyoto-u.ac.jp
2005年 8月 18日 (木) 20:28:29 JST


>>>>> In [chise-ja : No.00462] 
>>>>>	Koichi Kamichi <kamichi @ fonts.jp> wrote:
> 
> KAGE部品をchise-dbに移行する際、4つ問題が出てきました。
> 
> 1)chise-dbで扱っていないGBソース
> 
> 2000年版の10646-1では、CJK漢字のG欄は全コードに強引に字を割り振って
> きていますが、細かい字形の差異を区別するために、その追加G欄字形を使
> いたいことがあります。ところが、chise-dbではCCSは
> G0(GB2312),G1(GB12345)しか持っていません。そこで以下のCCSを追加して
> ほしいと思います。
> 
> (省略 feature true-name)
> G3 =GB7589 chinese-gb7589
> G5 =GB7590 chinese-gb7590
> GE =GB16500 chinese-gb16500
> 
> といっても全部で数文字なので、とりあえず手元では勝手に追加します。

うう、やっぱり要りますか。了解です。とりあえず空の CCS だけ(文字定義
の追加はおいおい)で良いでしょうか?

それから、既存の GB 系 CCS の名前は

=gb2312		 (chinese-gb2312)
=gb12345	 (chinese-gb12345)
=iso-ir165	 (chinese-isoir165)

となってるので、=gb7589, =gb7590, =gb16500 という名前にしたいと思いま
す。また、chinese-gb* は要りますか?


> 2)chise-dbでは同定しているが、規格表を上地が見たときに分離したいと判断
> したもの
> 
> &u+4e57; のT欄を分離したい
> &u+5313; のT欄を分離したい
> 
> これは、難しいでしょうか?正しい変更(申請)プロセスがあれば教えてください。
> 無理であれば、それほど必要性はないので削ってしまいます。現状では2つだけ
> です。

ここで指摘・要望してください。

U+4E57 の分離は行いました。

U+5313 は既に分離されていますが、`=>ucs' / `->ucs-unified' を用いる旧
形式だったので、`->subsumptive' 形式に変更します。


> 3)IDSの解釈の違い
> 
> まだデータはありませんが、おいおい問題になってくることに、分解のため
> のIDSと合成のためのIDSは性格が違うため、字によっては
> ideographic-structure素性以外のIDSを持たせたいと思います。現状では
> ideographic-structure @ kage という素性を追加し、KAGEエンジンは @kage
> →@kageなし の順で探していくことにします。

「旗」などの場合に、『解字的 IDS』とは別に『視覚的 IDS』を設けたいとい
うことですよね?もし、KAGE 固有の記述ではなくある程度一般的な視覚的
IDS と呼べるもので良いなら、例えば、@visual というのではいかがでしょう
か?

;; 『解字的 IDS』から『視覚的 IDS』を生成する変換プログラムを作りたい
;; と思ってます。


> 4)漢字合成部品としては頻度が高いが、字源的には独立字になれない・既存
> CCSにコードポイントがない、(部分)部品の扱い
> 
> たとえば、「業」のIDSは、縦3分解(冠部分+ソ一+未)となっています
> が、グリフ合成エンジンのデータを用意する立場としては「ソ一+未」を1
> つの部品としたいです。しかし、頼みのGT-Kにも(笑)、ありませんでした。
> このような場合に、どうすべきか悩んでいます。KAGEでは「私用定義部品」
> もしくは「ソ一+未を部品名として持つ」という方法がありました。
> 
> 1つの方法としては、KAGE部品CCSを用意して、ただしKAGE部品CCSは一般の
> ideographic-structureでは用いずにideographic-structure @ kageでのみ使っ
> てよい、とすれば、既存のデータに影響が出ないかと思っています。今は1
> 0個ほど追加したい部分部品があります。

KAGE 部品 CCS を設ける案に賛成します。フォントと文字定義を出して頂けれ
ば、マージします。

-- 
===『幾千億の分子に分かれても ========================================
     決して忘れない。    
     この宇宙が終るまで』              守岡 知彦 (MORIOKA Tomohiko)
====================== Email: <tomo @ kanji.zinbun.kyoto-u.ac.jp> ======





More information about the CHISE-ja mailing list