朝日文字について

Kouichirou Eto 2003 @ eto.com
2003年 1月 19日 (日) 23:24:13 JST


江渡です。

守岡さんのメールにあった朝日文字についてちょっと考えてみたのですが、
UTF-2000モデルの原理的に考えると、文字について問題がある場合は、
全てその問題を解決可能とするべきだと思います。つまり朝日文字についても、
変換可能であるのならば、変換の手段を提供するべきだと思います。

もともと文字について様々な問題が山積みになっていて、そういった問題に
小手先の対処を積み重ねても本質的な問題解決にならないという認識から
UTF-2000モデルが生まれたわけなので、つまり文字についての問題があるのなら
その問題は全て解決する、というのが理想的な方向性なのだと思います。

もし合意可能な文字集合だけを対象とすればいいのなら、わざわざ
文字データベースのような高コストの手法を採用する必要はない。

しかし現実には私達のリソースは限られていて、全ての問題を一projectの範囲で
解決できるはずもない。そこでやはり文字データベースに委譲のような
仕組みを導入するのがいいんじゃないでしょうか。朝日文字のようなデータを
取り込みたい人がいたら、自分でそのデータベースを作って、MIX-INして
使えるような仕組みを提供する。

また同時にできればネットワーク透過のメカニズムもあるといいと思います。
そういうったデータベースをネットワーク上でなんらかの形で公開しておくと、
他のプログラムからも透過的にそれを利用できるようになるとか。

ただ一番問題なのは、解決の手法を提供することができたとしても、そういった
問題が存在すること自体を知らない場合はどうしようもない、ということ。

例えばある朝日文字を入力したいとして、でも当然文字が無いから入力できない。

朝日文字とは朝日新聞が勝手に作った省略字形だから、文字コード表の中には
存在しない。しかしその人は、それが朝日文字だとは知らないので、その文字
自身を入力しなくちゃいけないと思い、悩むわけです。この場合、
朝日文字というデータベースをMIX-INするとその文字が使えるようになるという
メカニズムを提供したとしても、その人がその入力したい文字が朝日文字なん
だよというのは事前に知ってなくちゃいけない。この問題だけは解決できないですね。

> ちょっと細かいですが、字形は時代よりもむしろメディア(筆記具とか)
> への依存度が強いので、所謂「旧字」は、文字通り「古い字(形)」と
> いう意味ではなかったりします。
> 
> 守岡さんの「<-simplified-ideograph」という属性のつけ方は、新字・
> 旧字に付随する時間性を排除する意図があるのではないかと、勝手に思っ
> ていたりします。

そうですね。問題が深いというのはよくわかりました。
私が言っていたのはいわゆる常用漢字、当用漢字のレベルを意図していました。
どこかのある時点で、明確に規定できるような形で意図的に変化が導入された
のならば、その変化情報そのものを扱えるのではないかと思ったのです。

江渡 浩一郎 new! 2003 @ eto.com






More information about the CHISE-ja mailing list