improving eword-decode.el

Katsumi Yamaoka yamaoka @ jpl.org
2005年 10月 18日 (火) 23:35:38 JST


>>>>> In <htxbr1m2a7j.fsf @ sappho.local> 守岡知彦さん wrote:

>> 結局のところ、RFC2047 が文字の切れ目以外の場所でぶった切ることの
>> 是非を明確に規定していないのが問題なんですよね。

> 後藤さんの記事 [emacs-mime-ja:01991] にあるように、文字をぶった切るの
> は明らかにだめですね(encoder の挙動としては禁止)。

そうですか。あれは「明らか」なんですね。ぼくは今後も自分でそう判
断できるかどうか自信がなくなりました。^^;;

> Decoder の挙動に関しては

> 6.3. Mail reader handling of incorrectly formed 'encoded-word's

>    It is possible that an 'encoded-word' that is legal according to the
>    syntax defined in section 2, is incorrectly formed according to the
>    rules for the encoding being used.   For example:

>    (1) An 'encoded-word' which contains characters which are not legal
>        for a particular encoding (for example, a "-" in the "B"
>        encoding, or a SPACE or HTAB in either the "B" or "Q" encoding),
>        is incorrectly formed.

>    (2) Any 'encoded-word' which encodes a non-integral number of
>        characters or octets is incorrectly formed.

>    A mail reader need not attempt to display the text associated with an
>    'encoded-word' that is incorrectly formed.  However, a mail reader
>    MUST NOT prevent the display or handling of a message because an
>    'encoded-word' is incorrectly formed.

> という訳で、どっちでも良さそうですね。

encoded-words に関する `need not' は、対応してもしなくても良いわ
けですね。

;; あまり話を広げたくないですが、先月の fj.sys.mac, fj.kanji に
;; 出てきた "=?ISO-2022-JP?Q?^[$B%F%9%H^[(B?=" というものは (1)
;; に該当しそうです。

> そういう訳で、どっちがより安全側かという観点で議論するのが良いかなと思
> います。

実は現在の ftp://ftp.jpl.org/pub/tmp/eword-decode.el.gz では、安
全ではないことをやってしまった気がしています。複数の連続した
encoded-words は、途中の空白文字を取り除いてデコードしたものを連
結 (または連結したものをデコード) しますが、それらのうちの一つだ
けがデコードできなかった場合でも、他を活かすようにしました。まあ、
あまり起きそうもない事故ですけれど。




More information about the Emacs-mime-ja mailing list