ruby-list

後藤＠太陽計測です

base64.rbのためにも、続けちゃいます (._.)>

＃私自身はRFC2047は「欠陥がある」というよりは「十分でない」というくらい
＃に感じてるです。（間違った解釈している可能性も大ではありますが）


>>>>> at Fri, 13 Nov 1998 21:56:01 +0900
>>>>> dezawa <dezawa@miya.fujifilm.co.jp> said,

dezawa> １ ○１行の文字長の最大は、エンコードのみ、エンコードなしのみ、
dezawa>      そのごちゃまぜ含め、行頭の空白を含めて 76Byte。
dezawa>    ×１行76Byteではなくて、１行中のエンコード文字列長(合計)が76Byte

これは先のメールに書いたとおりかと。


dezawa> ２ ？"漢字file" は空白が無いから、全体をまとめて エンコードすべし。
dezawa>       英数字をスルーしないで一緒くたにencodeするのが正しい解釈

これが「空白保存の問題」かと思います。

Section 5 の (1)で

>    Ordinary ASCII text and 'encoded-word's may appear together in the
>    same header field.  However, an 'encoded-word' that appears in a
>    header field defined as '*text' MUST be separated from any adjacent
>    'encoded-word' or 'text' by 'linear-white-space'.

とあるため、encoded-word と それ以外のテキストとの間には liner-white-space
がMUSTなので。逆に、"漢字" と "file"に分けて前者のみをエンコードすると、
間にliner-white-spaceを入れねばならず、とすると、decode時に空白が取り除け
ない以上、原文と同じにならないじゃないか。じゃぁ、いっしょにエンコード
しなければならないじゃないか。という結論が導かれるわけです。

RFC2047には「分けてはいけない」とか、われわれが知りたいケースについて
は書いてありません。そういう明確な例がありませんし、分割のアルゴリズム
も提示していません。そこいらへんを考慮してくれてるのかいな？ と、疑っ
てしてしまいたくもなります。

＃そのあたりが、「word間にスペースはフツーあるでしょ」的な雰囲気を
＃感じる点です。


dezawa>    ？いっしょにエンコードするのは、必要最小限にすべき

「最小限にすべき」というのはちょっと言い過ぎでしたね。これは後述。
そうあって欲しいし、そうあってくれないとMLなどで困るし、という
一般的意識があるため、そう書いてしまいました。


dezawa> ３ ？"漢字 file" をデコードすると
dezawa>      "漢字 file" と間に空白が入る。

rfc2047には削除して良いとは書いてありませんから、そういうことになるで
しょう。ただし、encoded-wordの並びの間のliner-white-spaceに関しては削
除(無視)されると書かれています。これはコンコードされた文字列に長さ制限
を設けているため、長いエンコードの分割を許すために必要だからだというこ
とです。

section 6.2 
>6.2. Display of 'encoded-word's
...snip...
>   When displaying a particular header field that contains multiple
>   'encoded-word's, any 'linear-white-space' that separates a pair of
>   adjacent 'encoded-word's is ignored.  (This is to allow the use of
>   multiple 'encoded-word's to represent long strings of unencoded text,
>   without having to separate 'encoded-word's where spaces occur in the
>   unencoded text.)


dezawa> じつは、１は英語を読み違えてた様で、rfcを読み直す前の方が合っていた。
dezawa>   読む直前に、mew でどうなるかみたら、ずらーーっと長ーくエンコード
dezawa>   してたので、あれ？って思ってたんです。で、英語読む時に間違えた、、

ちなみにMewでは 76 char width をまじめに考慮してエンコードしているわけ
ではなく、オーバーしたらば元テキストを半分ずつにしてエンコード、を繰り
返して実現してます。

先のメールで挙げたFLIMは、結構まじめに、76を超えない最大となるように
がんばってます。


dezawa> ２ はどちらが正しいのでしょう。後藤さん「最小限にすべき」というのは
dezawa> どのあたりからそのようになったのでしょうか。

人間的にも「極力可読であってほしい」という一般的思いもあるため「すべき」
などと書きましたが、rfc2047でははっきり書いてあったかなぁ。このあたりかな？
ニュアンスがよく理解できないので違うかも。

section 5 の最後の、"Use of ..., but discouraged."

>5. Use of encoded-words in message headers
...snip...
>   Use of these methods to encode non-textual data (e.g., pictures or
>   sounds) is not defined by this memo.  Use of 'encoded-word's to
>   represent strings of purely ASCII characters is allowed, but
>   discouraged.  In rare cases it may be necessary to encode ordinary
>   text that looks like an 'encoded-word'.

（「その他の注意」の一部になるかな。。。）
訳： これらの非テキストデータ(例えば絵や音)のエンコード方法は
     本書では定義されません。 ピュアなASCII文字列を表すのにencoded-word
     を試用することは許されていますが、考え直してください。極まれに
     encoded-wordのよう（に解釈され得てしまう）な通常のテキストを
     エンコードする必要があるかもしれません。



dezawa> ３ ですが、(２とも絡むのですが、)これは正しいのでしょうか。

dezawa>    (a b)                      (a b)

dezawa>            Within a 'comment', white space MUST appear between an
dezawa>            'encoded-word' and surrounding text.  [Section 5,

dezawa> という記述があります。一見では "漢字 file"を支持するのですが、
dezawa> "Within a 'comment'" という断りが気になります。
dezawa> commentではない、すなわち( ) で囲まれない場合はどうなの？って
dezawa> 探してるんですが、未だ見付からず。

上記は確かに "Within a 'comment'"なので、そのまま全体には適用できない
ですよね。

では、comment以外の場合はどうかというと、明確に空白が保存されるとも書
いていませんが、先に挙げたように、text中でencoded-wordは単なるwordなの
で、当然空白を削除する根拠がありません。なので、空白が入る、と理解して
います。


ということで、どーでしょーか

--- Regards,
 Shun-ichi Goto  <gotoh@taiyo.co.jp>
   R&D Group, TAIYO Corp., Tokyo, JAPAN

Thread

Prev Next

In This Thread

Prev Next

[#10553] base64.rb — Sinichiro Dezawa <dezawa@...>

[#10554] telnet.rb — Sinichiro Dezawa <dezawa@...>

[#10564] ruby-man-1.1-jp-c0/syntax.html — TEI meiki <tei@...>

[#10580] Re: rskkfep alpha 0.1 — toyofuku@...

[#10589] LoadError on FreeBSD 3.0-RELEASE — gotoken@... (GOTO Kentaro)

[#10598] bug?: private writer can be called — Hiroshi Takenaka <pirozeau@...>

[#10600] Re: Ruby Document Format — m_seki@... (SEKI)

[#10602] ':' — Daisuke Sato <densuke@...2.so-net.ne.jp>

[#10624] メーリングリストに参加 — t.togami@... (Takeo Togami)

[#10639] tgif_expr — aito@...

[#10640] 入会します — Tadashige Morii <m_tada@...>

[#10649] Array.pack — Sinichiro Dezawa <dezawa@...>

[#10665] World Wide grep — toyofuku@...

[#10676] 11/10 tokyo offline meeting — matz@... (Yukihiro Matsumoto)

[#10684] Re: 11/10 tokyo offline meeting — toyofuku@...

[#10690] ruby-mode.el — Takao KAWAMURA <kawamura@...>

[#10694] IMAP via HttpTunnel — Kikutani Makoto <kikutani@...>

[#10697] Re: 11/10 tokyo offline meeting — KIMURA Koichi <kkimura@...>

[#10698] 式の評価順序は ? — Takao KAWAMURA <kawamura@...>

[#10701] bignum and x^4 + y^4 + z^4 — Noritsugu Nakamura <nnakamur@...>

[#10720] Re: 11/10 tokyo offline meeting — greentea@...2.so-net.ne.jp (Tomoyuki Kosimizu)

[#10722] — polygon@... (polygon)

[#10725] ruby-gtk-0.14 — "D.Kanda" <MAP2303@...>

[#10727] Re: 11/10 tokyo offline meeting — SHIROYAMA Takayuki <psi@...>

[#10747] ruby 1.1c7 released — matz@... (Yukihiro Matsumoto)

[#10752] Re: case with Class — toyofuku@...

[#10753] Re: ruby:struct -> ext module -> ruby — toyofuku@...

[#10759] COMPUMODA — greenmanalishi@...

[#10767] HttpTunnelServer shoud be run as root ? — Kikutani Makoto <kikutani@...>

[#10772] Re: 11/10 tokyo offline meeting — ARIMA Yasuhiro <fit0298@...>

[#10780] ring — "D.Kanda" <MAP2303@...>

[#10783] ruby senden? — Noritsugu Nakamura <nnakamur@...>

[#10785] Re: case with Class — toyofuku@...

[#10788] 0th(?) Ruby Conference Report — greentea@...2.so-net.ne.jp (Tomoyuki Kosimizu)

[#10799] make ruby on WinNT with VC++6.0 — Koji Oda <oda@...1.qnes.nec.co.jp>

[#10831] shard-library support by libtool — EGUCHI Osamu <eguchi@...>

[#10836] 文字の型は何？ — "Kozuka Masahiro" <kozuka@...>

[#10847] RE: 文字の型は何？ — "Kozuka Masahiro" <kozuka@...>

[#10848] IO#pos= — Yoshinori Toki <toki@...>

[#10850] patch for mswin32 — 助田 雅紀 <masaki.suketa@...>

[#10856] win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10868] Re: case with Class — Toyofuku <toyofuku@...>

[#10876] Re: REBOL — "MAEDA Shugo" <shugo@...>

[#10877] Re: REBOL — "MAEDA Shugo" <shugo@...>

[#10878] 組み込み関数と同じ名前のクラスメソッド — Yoshiki WADA <wada@...>

[#10879] Re: 組み込み関数と同じ名前 — "MAEDA Shugo" <shugo@...>

[#10892] Re: win32 OLE — Koji Oda <oda@...1.qnes.nec.co.jp>

[#10898] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10899] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10900] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10902] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10904] ruby 1.1c8 released — matz@... (Yukihiro Matsumoto)

[#10910] require error (tkutil.so -> tk.so) — ttate@...

[#10915] mod_ruby? — "MAEDA Shugo" <shugo@...>

[#10938] Re: 0th(?) Ruby Conference Report — 助田 雅紀 <masaki.suketa@...>

[#10949] Re: 0th(?) Ruby Conference Report — 助田 雅紀 <masaki.suketa@...>

[#10951] great ideas — matz@... (Yukihiro Matsumoto)

[#10953] Re: World Wide grep — toyofuku@...

[#10958] Re: 0th(?) Ruby Conference Report — greentea@...2.so-net.ne.jp (Tomoyuki Kosimizu)

[#10965] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10967] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10969] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10970] tr の使い方について — "Hirotaka Ishida" <h-ishida@...>

[#10973] gets のクラス — Yoshiki WADA <wada@...>

[#10976] スコープの範囲 — Koji Arai <JCA02266@...>

[#10979] Ruby/Forms (ver 0.5) — ttate@...

[#10984] Re: gets のクラス — 助田 雅紀 <masaki.suketa@...>

[#10992] Re: case with Class — "豊福" <toyofuku@...>

[#11001] 文字列の抽出について — "Hirotaka Ishida" <h-ishida@...>

[#11006] usage of TkcImage class — Noritsugu Nakamura <nnakamur@...>

[#11009] GD::Polygon.length mismatch — Noritsugu Nakamura <nnakamur@...>

[#11015] バックスラッシュのエスケープ — Yoshiki WADA <wada@...>

[#11018] ruby/tk FAQ? — Noritsugu Nakamura <nnakamur@...>

[#11022] cgi-lib.rb — Sinichiro Dezawa <dezawa@...>

[#11026] Re: make ruby on WinNT with VC++6.0 — Koji Oda <oda@...1.qnes.nec.co.jp>

[#11031] Linux Japan Jan., 1999 — ozawa@...

[#11035] inspect, to_s — "D.Kanda" <MAP2303@...>

[#11043] enumerable.rb — Shin-ichro Hara <sinara@...>

[#11044] Ruby on SAL — aito@...

[#11046] 宴会サーバ改め会合調整サーバ — hisanori@...

[#10850] patch for mswin32 — 助田　雅紀 <masaki.suketa@...>

[#10856] win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10898] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10899] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10900] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10902] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10938] Re: 0th(?) Ruby Conference Report — 助田　雅紀 <masaki.suketa@...>

[#10949] Re: 0th(?) Ruby Conference Report — 助田　雅紀 <masaki.suketa@...>

[#10965] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10967] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10969] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10984] Re: gets のクラス — 助田　雅紀 <masaki.suketa@...>

[#11108] RE: 日本語の配列の内容を１字ずつ取り出す方法について — 助田　雅紀 <masaki.suketa@...>

[#11129] RE: — 助田　雅紀 <masaki.suketa@...>