[CHISE-ja:1077] Re: CHISEのデータについて

Yifán Wáng 747.neutron @ gmail.com
2017年 8月 16日 (水) 13:56:34 JST


守岡様

早速のご対応ありがとうございます。珍しく多忙につき返信が遅れまして申し訳ありません。

>> CHISEの林月から𨝵が出て𢿱が出ない

前回のご報告以降の記録をそのまま提出していましたので、修正済のものが混入してしまい申し訳ありませんでした。
提出前にもう一度確認してからご報告するようにします。

>> CHISEの𣫂は𣪊で良いのか
>
> 部品の生産性の観点から「⿹𣪊x」でかつ x と他の部品の結合性がこのパター
> ンより弱いものに関しては(明らかに字源的におかしいものを除き)原則とし
> てこのパターンにしたのですがまずいでしょうか?

いえ、そこまでは考えていませんでした。
字の由来を見ると漢語大詞典が出典のようで、原本を確認できていないので轂と区別されているかわかりませんが、
もし別立てになっているのであれば字形を尊重した方がいいかもしれないと思いました。

王



2017年8月11日 17:29 守岡知彦 / MORIOKA Tomohiko <tomo @ chise.org>:
> 王さま、
>
> 守岡です。
>
> 御報告ありがとうございます。
>
>>>>>> In <CAF5KyEybg3B9447EhA46yUVqJM60cq2DLxiniLrz6ASL+j1AxA @ mail.gmail.com>
>>>>>>   Yifán Wáng <747.neutron @ gmail.com> wrote:
>
>> CHISEのデータについて気づいた点をご報告いたします。
>>
>> ----
>> CHISEの𩮺のIDSがない
>
> IDS の構文エラーが起こっていたので修正しました。後日、サーバー上のデー
> タにも反映します。
>
>> CHISEの𢿄のIDSが違う
>
> 修正しました。後日、サーバー上のデータにも反映します。
>
>> CHISEの㘅とrep.hanziku-2:0xE1A5が統合されていない?全体的にそう?
>
> 統合しました。
>
> Hanziku の取り込みは(IDS 開発の一貫として?)十数年前に一部実験的に組
> 織的取り込みを行ったものの、現在はあまり真面目にやってないので全体的に
> そんな感じになっています。
>
>
>> CHISEの林月から𨝵が出て𢿱が出ない
>
> これは
>
> http://www.chise.org/est/view/character/a.ucs-itaiji-001:0x6614
>
> を定義して、その中の「林」を
>
> http://www.chise.org/est/view/character/a.iwds-1:229
>
> 「月」を
>
> http://www.chise.org/est/view/character/a.iwds-1:053
>
> にしてからは解消したと思っていたのですが、現在でも見つからないでしょう
> か?
>
>
>> CHISEの𪷎は戈で良いのか
>
> 検討します。
>
>
>> CHISEの𦃿のIDSが違う
>
> 修正しました。後日、サーバー上のデータにも反映します。
>
>
>> CHISEの𣫂は𣪊で良いのか
>
> 部品の生産性の観点から「⿹𣪊x」でかつ x と他の部品の結合性がこのパター
> ンより弱いものに関しては(明らかに字源的におかしいものを除き)原則とし
> てこのパターンにしたのですがまずいでしょうか?
>
>
>> CHISEの名称バグ http://www.chise.org/est/view/character/system-char-id:0x1070C9
>
> EsT に ===CNS11643-* 用の設定を追加しました。
>
> 既にサーバーに反映しています。
>
>
>> CHISEの𦿐のIDSはこれでよいのか
>
> IWDS-1:283 より、「雀」は「⿱𣥂隹」を包摂するため、現状でも問題がない
> と思います。ただ、せっかくなので、「雀」を a.ucs:0x96C0 と
> rep.ucs @ unicode:0x96C0 に分離し、a.ucs:0x96C0 に包摂される字体
> rep.ucs-var-001:0x96C0 (⿱𣥂隹) を追加しました。同様に、「𢧵」を
> a.ucs:229F5 と rep.ucs @ iso:0x229F5 に分離し、rep.ucs-var-002:0x229F5
> (⿰⿱𣥂隹戈) を追加しました。そして、「𦿐」の IDS を組み上げて「⿱艹𢧵」
> とし、rep.ucs @ iso:0x26FD0 では rep.ucs-var-002:0x229F5 を用いて構造記
> 述を行いました。
>
> これは、後日、サーバー上のデータにも反映します。
>
>
>> CHISEの𦽜のIDSは⿱艹窞も与えるべきではないか
>
> 現状、一つの文字オブジェクトには1つの漢字構造記述しか持てないため、
> 「窞」(a.ucs:0x7A9E) に包摂される字体として rep.ucs-itaiji-001:0x7A9E
> を定義し、その IDS を「⿳宀分臼」としました。
>
> そして、「𦽜」(a.ucs:0x26F5C) の IDS を「⿱艹窞」とし、それに包摂され
> る字体 rep.ucs @ iso:0x26F5C の漢字構造記述で rep.ucs-itaiji-001:0x7A9E
> を用いるようにしました。
>
> この結果、「宀分臼」でも「艹窞」や「艹穴臽」でもどれかのオブジェクトに
> 到達できるようになりました。
>
> これは、後日、サーバー上のデータにも反映します。
>
>
>> CHISEの名称バグ http://www.chise.org/est/view/character/system-char-id:0x10801A
>
> EsT に =+>ucs @ iso 用の設定を追加しました。
>
> 既にサーバーに反映しています。
>
>
>> CHISEの名称バグ http://www.chise.org/est/view/character/system-char-id:0x108189
>
> EsT に ===adobe-japan1 用の設定を追加しました。
>
> 既にサーバーに反映しています。
>
>
>> CHISEの𠸤、𣹘のIDSが違う
>
> それぞれ「侍」を「待」に修正しました。
>
> 後日、サーバー上のデータにも反映します。
>
>
>> CHISEの𪰞のIDSはこれでよいのか
>
> 修正しました。
>
> 後日、サーバー上のデータにも反映します。
>
> --
> 守岡 知彦 (MORIOKA Tomohiko) <tomo @ zinbun.kyoto-u.ac.jp>


CHISE-ja メーリングリストの案内