[CHISE-ja:1076] Re: CHISEのデータについて

守岡知彦 / MORIOKA Tomohiko tomo @ chise.org
2017年 8月 11日 (金) 17:29:46 JST


王さま、

守岡です。

御報告ありがとうございます。

>>>>> In <CAF5KyEybg3B9447EhA46yUVqJM60cq2DLxiniLrz6ASL+j1AxA @ mail.gmail.com> 
>>>>>	Yifán Wáng <747.neutron @ gmail.com> wrote:

> CHISEのデータについて気づいた点をご報告いたします。
> 
> ----
> CHISEの𩮺のIDSがない

IDS の構文エラーが起こっていたので修正しました。後日、サーバー上のデー
タにも反映します。

> CHISEの𢿄のIDSが違う

修正しました。後日、サーバー上のデータにも反映します。

> CHISEの㘅とrep.hanziku-2:0xE1A5が統合されていない?全体的にそう?

統合しました。

Hanziku の取り込みは(IDS 開発の一貫として?)十数年前に一部実験的に組
織的取り込みを行ったものの、現在はあまり真面目にやってないので全体的に
そんな感じになっています。


> CHISEの林月から𨝵が出て𢿱が出ない

これは

http://www.chise.org/est/view/character/a.ucs-itaiji-001:0x6614

を定義して、その中の「林」を

http://www.chise.org/est/view/character/a.iwds-1:229

「月」を

http://www.chise.org/est/view/character/a.iwds-1:053

にしてからは解消したと思っていたのですが、現在でも見つからないでしょう
か?


> CHISEの𪷎は戈で良いのか

検討します。


> CHISEの𦃿のIDSが違う

修正しました。後日、サーバー上のデータにも反映します。


> CHISEの𣫂は𣪊で良いのか

部品の生産性の観点から「⿹𣪊x」でかつ x と他の部品の結合性がこのパター
ンより弱いものに関しては(明らかに字源的におかしいものを除き)原則とし
てこのパターンにしたのですがまずいでしょうか?


> CHISEの名称バグ http://www.chise.org/est/view/character/system-char-id:0x1070C9

EsT に ===CNS11643-* 用の設定を追加しました。

既にサーバーに反映しています。


> CHISEの𦿐のIDSはこれでよいのか

IWDS-1:283 より、「雀」は「⿱𣥂隹」を包摂するため、現状でも問題がない
と思います。ただ、せっかくなので、「雀」を a.ucs:0x96C0 と
rep.ucs @ unicode:0x96C0 に分離し、a.ucs:0x96C0 に包摂される字体
rep.ucs-var-001:0x96C0 (⿱𣥂隹) を追加しました。同様に、「𢧵」を
a.ucs:229F5 と rep.ucs @ iso:0x229F5 に分離し、rep.ucs-var-002:0x229F5
(⿰⿱𣥂隹戈) を追加しました。そして、「𦿐」の IDS を組み上げて「⿱艹𢧵」
とし、rep.ucs @ iso:0x26FD0 では rep.ucs-var-002:0x229F5 を用いて構造記
述を行いました。

これは、後日、サーバー上のデータにも反映します。


> CHISEの𦽜のIDSは⿱艹窞も与えるべきではないか

現状、一つの文字オブジェクトには1つの漢字構造記述しか持てないため、
「窞」(a.ucs:0x7A9E) に包摂される字体として rep.ucs-itaiji-001:0x7A9E
を定義し、その IDS を「⿳宀分臼」としました。

そして、「𦽜」(a.ucs:0x26F5C) の IDS を「⿱艹窞」とし、それに包摂され
る字体 rep.ucs @ iso:0x26F5C の漢字構造記述で rep.ucs-itaiji-001:0x7A9E
を用いるようにしました。

この結果、「宀分臼」でも「艹窞」や「艹穴臽」でもどれかのオブジェクトに
到達できるようになりました。

これは、後日、サーバー上のデータにも反映します。


> CHISEの名称バグ http://www.chise.org/est/view/character/system-char-id:0x10801A

EsT に =+>ucs @ iso 用の設定を追加しました。

既にサーバーに反映しています。


> CHISEの名称バグ http://www.chise.org/est/view/character/system-char-id:0x108189

EsT に ===adobe-japan1 用の設定を追加しました。

既にサーバーに反映しています。


> CHISEの𠸤、𣹘のIDSが違う

それぞれ「侍」を「待」に修正しました。

後日、サーバー上のデータにも反映します。


> CHISEの𪰞のIDSはこれでよいのか

修正しました。

後日、サーバー上のデータにも反映します。

-- 
守岡 知彦 (MORIOKA Tomohiko) <tomo @ zinbun.kyoto-u.ac.jp>


CHISE-ja メーリングリストの案内