『新字』←→『舊字』関係 (Re: UTF-2000 char-db)
Kouichirou Eto
2003 @ eto.com
2003年 1月 18日 (土) 01:09:51 JST
江渡です。
> これはいわゆる『新字』(日本の常用漢字や中国の簡体字)と『旧字』(伝統
> 的字体)の関係のことでしょうか?
> この話は深く追求するとなかなか大変なので、とりあえず深く追求せずに話を
> 進めると、現在の XEmacs UTF-2000 では、『新字』の文字属性として
> `<-simplified-ideograph' を付け、対応する『旧字』を示すことで、こうし
> たものを表現しています。しかしながらご察しのようにまだほとんどデータが
> 入っていません。
>
> でもこういうのはわりと良く使うので、とりあえず近日中に常用漢字表を機械
> 可読なデータとして用意しようと思います。
ぜひおねがいします。私はそもそもこの分野の素養が無いので、
舊が旧の古い字形だとか、また、旧が新しい字形で昔は違う字形だった
ということ自体を知らないわけなのです。
なのでこういうデータが入っていると、非常にありがたいです。
> また、いわゆる『朝日文字』のような、ある程度流通している簡略字もあった
> りしますがこれはどうしましょう?
奥が深いですね。とりあえずすでにはいっている字の範囲でいいんじゃないで
しょうか。
> 一方、本当の意味での時代別の情報ですが、本質的には、対応関係を書くとい
> うよりも、出典・用例を書くという形になるのではないかと思います。また、
> 高麗大蔵経異体字辞典みたいになるとかえって使いにくそうなので、標準的な
> 文字データベースでどこまで取り込むべきなのかはなかなか考え所だと思いま
> す。ある程度までは取り込むとしても、その他は各種資料のテキスト・データ
> ベースと連動して、そこから用例を自動的に探して来るみたいな形が良いんだ
> ろうなと思ってるんですが、実際にはいろいろ実験する必要がありそうです。
そうですね。私の興味の範囲だと、説文解字と白川静の字統とかでしょうか。
つまり本当は、甲骨文字を含めて、時代毎の字の変遷が辿れるといいと思うのですが。
まぁ難しいですね。
師さん
> wwwをいじったついでに、リンクを張ってみました。不都合があれば御連絡くだ
> さい。
> http://cvs.m17n.org/chise/ruby/index.html.ja.iso-2022-jp
どうもありがとうございます。
江渡 浩一郎 new! 2003 @ eto.com
More information about the CHISE-ja
mailing list