名前問題

守岡知彦 / MORIOKA Tomohiko tomo @ m17n.org
2002年 12月 11日 (水) 04:41:01 JST


>>>>> In [utf-2000 : No.00301] 
>>>>>	"江渡さん" = 江渡 浩一郎 <2002 @ eto.com> wrote:

江渡さん>>> この部分、私はまだよくわかってない。
江渡さん> > 
江渡さん> > 「よくわかってない」が指しているのは何でしょうか?

江渡さん> 「UTF-2000 モデルおよび UTF-2000 実装」とは何を意味するのか
江渡さん> が、よくわかってません。

割としつこく言ってきてるつもりである割には伝わってないと言うことは、きっ
と私の説明が悪いんでしょうね。(;_;)

名称を議論するには中身について理解してなければならない気はしますが、中
身に関する議論は名称問題ではないので、名称問題とは切り離して議論した方
が判りやすいです。


江渡さん> 「UTF-2000 モデルおよび UTF-2000 実装」を外部から利用したい
江渡さん> 人にとってみれば、それはライブラリーのように見えるのではない
江渡さん> でしょうか?
江渡さん> もしくはライブラリーのように見えるようにするべきなのではない
江渡さん> でしょうか?  という質問です。

江渡さん> たしかにこの質問はよく考えてみたらちょっと的外れですね。
江渡さん> 単にその機能だけを利用したい人にとっては、モデルに名前がつい
江渡さん> てなくても困らないが、モデルそのものに名前があってもいい。

だと思います。

結局、江渡さんは x = 『文字を文字属性の集合で構成されるオブジェクトと
して表現し、処理する手法』とか『x の XEmacs に基づく実装』である 
XEmacs UTF-2000(仮称)とか『x の Ruby に基づく実装』の名称とかについ
ては議論してなかった訳ですね。その代わり、CHISE 環境の基盤となる共通ラ
イブラリである libchise とか、それをリンクしたシステムの名称を議論して
いると。

ただ問題なのは、『x の XEmacs に基づく実装』とか『x の Ruby に基づく実
装』はもしかすると『libchise をリンクしたシステムの一種』かも知れなく
て、視点・論点が錯綜していたのでしょうか?

まあ、現実の XEmacs UTF-2000(仮称)が本当に『x の XEmacs に基づく実装』
なのかと言われると不十分な点もあり逆に越えちゃってる点もあるので何とも
はやなんですが、『libchise をリンクしたシステムの一種』にもならないか
も知れないので、なかなか難しい所です。まあ、XEmacs/CHISE でも良いかと
いう気もしますが。

;; ちなみに、現在の XEmacs UTF-2000(仮称)では『x に関する機能』(≒
;; 文字属性や文字オブジェクトに関する機能)を持つ場合に `utf-2000' と
;; いう module を provide し、外部文字データベース関連機能を提供する場
;; 合に `chise' という module を provide しています。


江渡さん> > なお、ここで「x モデル」とは『文字を文字属性の集合で構成さ
江渡さん> > れるオブジェクトとして表現し、処理する手法』のことです。

江渡さん> なるほど、手法についている名前なわけですね。

江渡さん> 「Postscript」に対する「ベジェ曲線」みたいなもんでしょうか。

うーむ、XEmacs UTF-2000(仮称)において「ベジェ曲線」に対応するのは、
(文字属性の)集合とか連想リストとかのような気がします。

「Postscript」における x に対応する概念は「(ベジェ曲線を用いた)画像
のベクトル表現」とか「デバイス独立性」とか「scalable」とかだと思います。



江渡さん> > ところで、私見ですが、x として文字とか表現とか情報の単位と
江渡さん> > かを想起させる名称が適切だと思います。そこで、character と
江渡さん> > 粒子をイメージした -onを合成した chaon(状況理論に於ける情
江渡さん> > 報の単位である infon の文字版という気持ちも入っています)
江渡さん> > を提案してみました。

江渡さん> ちょっと考えてみないとわからないですが、あまりに抽象的に聞こ
江渡さん> えるような気がします。

;; 抽象的なものではありますが…

;;; やっぱ、うちの猫にこじつけるのはだめっすか?(^_^;

江渡さん> x の対立概念とはなんでしょうか?
江渡さん> 『文字を数値によって表現し、処理する手法』でしょうか。

現在の x の対立概念そのものではないですが、x を作ろうとした時の気持ち
の対立概念ではあります。

江渡さん> これにはどんな名前がついているのでしょうか? やっぱり「文字コー
江渡さん> ド」?  「文字符号化」?

「符号化文字モデル」とか「符号化文字方式」と呼んでいます。

但し、『文字を数値によって表現し、処理する手法』というのはちょっと正確
ではなくて、『社会的に共有される文字の抽象的な概念(抽象文字)が存在す
ると仮定し、抽象文字を数値によって表現し、処理する手法』といった方が良
いかも知れません。なぜなら、符号化文字モデルは、字体≒グリフや字形、あ
るいは、ある(少数の)文脈やテキストや用例の中でのみ現われるような文字
概念は抽象文字と見倣さず、コード化もしないことも含意しており、利用者か
ら見た現象面ではこちらの方が重要な要素だと言えます。

x はさまざまな状況の中で用いられる文字(や文字のようなもの)を適切に扱
うことを目的に、通常の 8 bit とか 16 bit とか 32 bit とかの(短い)数
値ではなく、集合(とかそれを encode したとても長い数値)(*1) を文字の
表現とする方法です。

;; この時、かつて g新部さんは『それを encode したとても長い数値』とい
;; う部分を取って「UTF-2000」と名付けた訳ですが(VLIW のイメージだったっ
;; け?文字を表現する要素が並んでて、全体が非常に長い bit 数で表現され
;; るというイメージだったかな?)…

(*1) この表現自体はスパースなので、実際にはこれを変換して(短い)数値
     を作るかも知れませんが、ここでは『本名』を議論しています。Unicode
     の文字は UTF-8 でも UTF-16-LE でも UCS-4 のハッシュ値でも表現でき
     ますが、『本名』が UCS-4 ないしは UTF-32 であるのと同様です。

江渡さん> だとすると「文字符号化」の対立概念であることがすぐにわかる名
江渡さん> 前がいいと思います。

;; 文字を符号化するのは良いというか仕方がないですが、誰かが符号化した
;; 文字のみを唯一の文字とするのはいかがなものかという訳ですので、どっ
;; ちかっていうと「文字符号化」方式よりも「符号化文字(集合)」方式の
;; 対立概念だといえます。

この時、表現形式が(短い)数値であることの対立概念であるだけでなく(以
上に)、表現対象が符号化文字(≒抽象文字)に限られることの対立概念であ
ることも伝えられたら良いですし、このことが暗示している『(文字が表現・
利用の)自由』を伝えられたら良いなあと思います。

;; あと、「責難は成事にあらず」(*2) という訳で、できれば何かの否定では
;; ない表現が良いなあと思います。

;;; (*2) どうもオタクなのがばればれ。(^_^;;


;; なんだかますます訳が判んなくなったらごめんなさい。どうも煮詰まって
;; るのかなぁ。いじいじ。
-- 
守岡 知彦 (MORIOKA Tomohiko) <tomo @ kanji.zinbun.kyoto-u.ac.jp>




More information about the CHISE-ja mailing list