[CHISE-ja:1076] Re: CHISEのデータについて
守岡知彦 / MORIOKA Tomohiko
tomo @ chise.org
2017年 8月 11日 (金) 17:29:46 JST
王さま、
守岡です。
御報告ありがとうございます。
>>>>> In <CAF5KyEybg3B9447EhA46yUVqJM60cq2DLxiniLrz6ASL+j1AxA @ mail.gmail.com>
>>>>> Yifán Wáng <747.neutron @ gmail.com> wrote:
> CHISEのデータについて気づいた点をご報告いたします。
>
> ----
> CHISEの𩮺のIDSがない
IDS の構文エラーが起こっていたので修正しました。後日、サーバー上のデー
タにも反映します。
> CHISEの𢿄のIDSが違う
修正しました。後日、サーバー上のデータにも反映します。
> CHISEの㘅とrep.hanziku-2:0xE1A5が統合されていない?全体的にそう?
統合しました。
Hanziku の取り込みは(IDS 開発の一貫として?)十数年前に一部実験的に組
織的取り込みを行ったものの、現在はあまり真面目にやってないので全体的に
そんな感じになっています。
> CHISEの林月から𨝵が出て𢿱が出ない
これは
http://www.chise.org/est/view/character/a.ucs-itaiji-001:0x6614
を定義して、その中の「林」を
http://www.chise.org/est/view/character/a.iwds-1:229
「月」を
http://www.chise.org/est/view/character/a.iwds-1:053
にしてからは解消したと思っていたのですが、現在でも見つからないでしょう
か?
> CHISEの𪷎は戈で良いのか
検討します。
> CHISEの𦃿のIDSが違う
修正しました。後日、サーバー上のデータにも反映します。
> CHISEの𣫂は𣪊で良いのか
部品の生産性の観点から「⿹𣪊x」でかつ x と他の部品の結合性がこのパター
ンより弱いものに関しては(明らかに字源的におかしいものを除き)原則とし
てこのパターンにしたのですがまずいでしょうか?
> CHISEの名称バグ http://www.chise.org/est/view/character/system-char-id:0x1070C9
EsT に ===CNS11643-* 用の設定を追加しました。
既にサーバーに反映しています。
> CHISEの𦿐のIDSはこれでよいのか
IWDS-1:283 より、「雀」は「⿱𣥂隹」を包摂するため、現状でも問題がない
と思います。ただ、せっかくなので、「雀」を a.ucs:0x96C0 と
rep.ucs @ unicode:0x96C0 に分離し、a.ucs:0x96C0 に包摂される字体
rep.ucs-var-001:0x96C0 (⿱𣥂隹) を追加しました。同様に、「𢧵」を
a.ucs:229F5 と rep.ucs @ iso:0x229F5 に分離し、rep.ucs-var-002:0x229F5
(⿰⿱𣥂隹戈) を追加しました。そして、「𦿐」の IDS を組み上げて「⿱艹𢧵」
とし、rep.ucs @ iso:0x26FD0 では rep.ucs-var-002:0x229F5 を用いて構造記
述を行いました。
これは、後日、サーバー上のデータにも反映します。
> CHISEの𦽜のIDSは⿱艹窞も与えるべきではないか
現状、一つの文字オブジェクトには1つの漢字構造記述しか持てないため、
「窞」(a.ucs:0x7A9E) に包摂される字体として rep.ucs-itaiji-001:0x7A9E
を定義し、その IDS を「⿳宀分臼」としました。
そして、「𦽜」(a.ucs:0x26F5C) の IDS を「⿱艹窞」とし、それに包摂され
る字体 rep.ucs @ iso:0x26F5C の漢字構造記述で rep.ucs-itaiji-001:0x7A9E
を用いるようにしました。
この結果、「宀分臼」でも「艹窞」や「艹穴臽」でもどれかのオブジェクトに
到達できるようになりました。
これは、後日、サーバー上のデータにも反映します。
> CHISEの名称バグ http://www.chise.org/est/view/character/system-char-id:0x10801A
EsT に =+>ucs @ iso 用の設定を追加しました。
既にサーバーに反映しています。
> CHISEの名称バグ http://www.chise.org/est/view/character/system-char-id:0x108189
EsT に ===adobe-japan1 用の設定を追加しました。
既にサーバーに反映しています。
> CHISEの𠸤、𣹘のIDSが違う
それぞれ「侍」を「待」に修正しました。
後日、サーバー上のデータにも反映します。
> CHISEの𪰞のIDSはこれでよいのか
修正しました。
後日、サーバー上のデータにも反映します。
--
守岡 知彦 (MORIOKA Tomohiko) <tomo @ zinbun.kyoto-u.ac.jp>
CHISE-ja メーリングリストの案内