distance
守岡 知彦 / MORIOKA Tomohiko
tomo @ m17n.org
2002年 8月 26日 (月) 16:08:19 JST
>>>>> In <000e01c24b54$c2ad7980$37ec13ca @ R505>
>>>>> "江渡さん" = "Kouichirou Eto" <2002 @ eto.com> wrote:
江渡さん> 漢字プロジェクトについてはいろいろあってあれでしたが、
江渡さん> そろそろ続きをやりたいですね。
はい。是非。CHISE mailing lists も盛り上げましょう。
;; という訳で、chise-ja @ m17n.org に Cc: してみました。
江渡さん> 私は、漢字に対してアプローチした様々な表現やアートや
江渡さん> Visualizationの研究や教育の実験などをいろいろ探したり、人に
江渡さん> 話を聞いてみたりしていたところです。そしてようやくわかってき
江渡さん> たことは、漢字をテーマにした研究や作品は実はかなり多く、新し
江渡さん> いアプローチを探すためにはきちんと考えなくてはいけなさそうだ…、
江渡さん> ということでした。
そうですね。その割には『最先端』の世界があんまり知られてない面もあり
(vaporware も多かったし)、地に足付けてラディカルなことできたら良いな
あと思います。
江渡さん> 漢字や文字にまつわる研究についてはだんだんとわかってきたので
江渡さん> すが、逆に、今回の核となるUTF-2000については、技術的にも思想
江渡さん> 的にもまだ核となるものがなんなのか、いまだによくわかっていな
江渡さん> くて、そこがわからないとここから先にすすめられなさそうだと思っ
江渡さん> てます。これについてレクチャーしていただける場をもうけてほし
江渡さん> いなと思ってます。
えっと、一応、今回は UTF-2000 じゃなくて、その次に来る文字データベース・
システムを核にしたいんですけども、開発が遅れてて申し訳ないです。
CHISE のコンセプトは UTF-2000 以前に考えた、文字符号を前提としない文字
処理を考えてみようという仮想実験に始まります。これはこんな思考の経過を
辿りました:
文字符号好きだけど嫌い
↓
いっそ文字符号やめたらどう?
↓
↓→ Lisp のシンボルって文字列で表現するけど
↓ 別にそうじゃなくても良いよね。
↓ 例えば絵でも → 『My Symbolic System』(*1)
↓
そもそも文字符号って何で要るの
データ削減、表現、表示、検索、再利用 等
↓
用途毎にあった表現を使えば良いやん
データ削減: 富豪的に行こう
表現: code じゃなくても良いやん
マークアップすればもっと細かく書けるぞ
表示: code → font じゃなくても良いやん
検索: code は便利だけど、code なくてもやれなくはない
属性の集合なら記号処理で OK.
画像ならパターン認識。bitmap 計算なんてのもあるなあ
再利用: code は便利だけど、code なくてもやれなくはない
張り付けるだけなら絵でも OK
↓
↓→ 表現は絵でやっちゃおう
↓ ↓
↓ 検索できる文字画像
↓ ↓
↓ ↓→ PDF の埋め込み font 技術を使った方法
↓ ↓ (文字は code を使う)(*2)
↓ ↓→ SVG による文字画像の印付け (*3)
↓ ↓
文字を『状況』(*4)として捉えよう ↓
→ (UTF-2000 モデル) ↓
↓→ XEmacs による実装 ↓
↓ (XEmacs UTF-2000) ↓
↓ ↓ ↓
パロールからラングへ!?(^_^; (連携・合流?)
→ オントロジー ↓
→ データベース・サーバー化 → アプリケーションから環境へ
→ 文字知識の大域的表現
(TopicMaps 化?)
(*1) <utf-2000 ML:58> より
「これは文字のない Lisp のようなものです。
Lisp は2つの世界があれば構成できます。即ち、指すもの(表象)の世
界と指されるもの(オブジェクト)の世界です。そしてこの2つの世界
を symbolが橋渡しします。利用者は指すものの世界だけしか指示できま
せんが、それを評価することにより、指されるものの世界を操作できる
訳です。
通常の Lisp では symbol の表象形は文字列です。つまり、関数
symbol-name の返り値は文字列です。利用者は文字列によって symbol
を表現する訳です。
しかしながら symbol を文字列で表現するのが Lisp の本質ではないと
考えられます。文字列でなくても、例えば、絵で symbol を表現したっ
て良い訳です。
そういう考えに立って構成した Lisp のことを ``My Symbolic System''
と呼んでいます。
My Symbolic System は起動すると graphic editor のような画面が出て
来ます。で、car とか cdr とか cons とか lambda とか apply といっ
た Lisp の組込み関数に相当する icon も見えます。また、小さな
canvas も見えます。canvas には絵を書くことができます。canvas の枠
の外には確定用のボタンもあり、それを押すと canvas に書いた絵が
icon となって全体の大きな画面に現れます。そう、その小さな canvas
こそが intern なのです。
My Symbolic System には文字はありませんから、必要とする文字を My
Symbolic System の組込み機能を使って定義してはじめて文字が使える
ようになります。例えば、ASCII 文字もありませんから、生のままでは
ASCII 文字を使って Lisp の program を読み書きすることはできない訳
です。」
(*2) 安岡孝一「外字と異体字」、
「アジア情報学のフロンティア」pp.25--34,
全国文献・情報センター人文社会学学術セミナーシリーズ No.10
(*3) http://www.kanji.zinbun.kyoto-u.ac.jp/~tomo/svg/
(*4) Jon Barwize and John Perry,
“Situation and Attitude”(「状況と態度」)
UTF-2000 モデルに関しては私が書いたものもありますが、もしかすると師さ
んの解説や横田さんが書いた
「パソコン悠悠漢字術2001 今昔文字鏡徹底活用」
第15章 「UNIX で文字鏡」
とかの方が判りやすいかも知れません。うーむ。
では。
--
守岡 知彦 (MORIOKA Tomohiko) <tomo @ kanji.zinbun.kyoto-u.ac.jp>
More information about the CHISE-ja
mailing list