『新字』←→『舊字』関係 (Re: UTF-2000 char-db)

2003年 1月 22日 (水) 22:41:07 JST

江渡です。

阿辻哲次「図説 漢字の歴史」大修館書店、1989. (阿辻の辻は、二点シンニョウ)
最近これを読みおわりましたが、面白いですね。

p.156,図版132: 篆・隷・行・楷の各書体による「千字文」(明の文徴明書)
この写真を見ると、同じ時代でも書体ごとに字形が違うのが当たり前として
認識されていたことがよくわかります。
この写真の全体像を見ることってできませんかね。

ここに篆書による千字文が含まれているので、これをデータ化することができれば、
千字文そのものは手に入るので、それとてらしあわせることによって1000文字
だけならすぐに楷書との対応表が手に入りますね。
http://www.l-h.co.jp/lhcontents/l-hlib/senji_newjis.html

そして次に部品に分解していけば、篆書と楷書の部品ごとの対応関係も
データ化することができる。そこまでできれば、あとは楷書のIDSに対応して
篆書がどのようにできるかが、ほぼ自動的に生成できるようになる。
このようにして、篆書の生成はかなり低コストでできるようになるはずだ。
というのは素人考えでしょうか?

db3_dump -pを試してみたのですが、これで公開するくらいなら、
IDSのtext fileみたいに、それらしいplain textのデータフォーマットを決めて、
それで公開したほうがいいんじゃないかと思いました。
それだったらwhat-char-definition形式でいいじゃんって? そうかも。
S式をパースすればいいだけってことですかね。。

そこまでやったら、うっかりするとRubyでlispを実装しそうになっちゃうので、
自制しようと思っているところです。まったく意味無いよな。

江渡 浩一郎 new! 2003 ＠ eto.com