ruby-list

後藤＠太陽計測です

>>>>> From: Toru Hoshina <toru@gte.net>
> ちょっと、うまく切れないので引用が長くなってしまいましたが、
> Sinichiro Dezawa さんがおっしゃることと、後藤＠太陽計測さんの
> おっしゃることって大意は同じですよね？

あーわたしもちょっとDezawaさんのメールを勘違いしてたようです。

で、上記とはちょっとずれますが、

> 後藤＠太陽計測さんは、multiple header lineのための行頭の空白、えっと
> Non Linear White Spaceでしたっけ？を計算に入れて、75charsという
> 解釈のようですが、細かいことですが、私はやはり読んだとおりで、
> encoded-wordの長さは76charsまで、つまり=?から?=までで76bytesだと
> 思います。

これに関しては一応、以下のように75に制限されています。
先の引用個所の直前です。

>   An 'encoded-word' may not be more than 75 characters long, including
>   'charset', 'encoding', 'encoded-text', and delimiters.  If it is
>   desirable to encode more text than will fit in an 'encoded-word' of
>   75 characters, multiple 'encoded-word's (separated by CRLF SPACE) may
>   be used.

1行が単一のencoded-wordであれば 1+75で76が最大。
複数の encoded-wordがあったとしても、1行は76が最大。
結局1行は76文字以内ということです。


> > エンコード後の長さが妥当になるような、元文の区切り点を見つける処理が面
> > 倒だとは思いますが。
> 
> 実際には =?ISO-2022-JP?B?...?= という形のencoded wordになるわけですが
> iso-2022-jpだよ、と言う以上、それらしくESC$Bではじまって、ESC(Bなどで
> us-asciiなりJIS1バイト英数字なりに戻してやるのがお約束なのだろうとは
> 思います。

当然そうですね。encoded-wordはそれ自体で閉じていなければならないと
明記されていますからね。


> =?ISO-2022-JP?B?...?= abc =?ISO-2022-JP?B?...?=
> 
> などという形式になるってことは、エスケープシーケンスはencoded wordの中です。
> これって、フザケんなよ凸(-_-#)って感じですよねぇ。

JISベースでバイトストリームを扱おうとすると面倒ですが、エンコード対象
文字列を、バイトではなく「文字」単位で考え、MIMEエンコードする直前で
iso-2022-jpにエンコード(ESC$Bなどの付加も含む)して考えるとよいと思います。

でもなんにしても、区切り点が計算1発で求まらないので、悩ましいですよね。


> iso-2022-jpというと、code set も encode method もJIS X 0208(でしたっけ？)
> をそのまま使いますが、2バイト文字集合だけで、1バイトカナは含まず、という
> ものだったと思うので、実際には、1バイトの英数字は含まないですよね。
> 
> 思うにUnix系のユーザさんは英数字は1バイトの文字を使うかたがほとんどな
> ように見えるので、放っておいてもそこでencoded wordは切れることになるので
> 実際にはencoded wordの76bytesな縛りってのは効いてこないような気もします。

ここはおっしゃる意図が良くわからないのですが。。。
iso-2022-jpでのcharsetでは英数字は含みます。

それから、RFC2047では、例えば "漢字file" というのは white-spaceで
区切られていないので、"漢字 file" と
してはダメで、漢字file といっしょに
エンコードしなければなりません。そうしないと、decodeすると
 "漢字 file"となってしまうからです。
＃このへんはまじめに実装していないメーラーも多いのよね。

なので、半角がある個所で切れるわけではないです。


> base64って3bytesが4bytesになる勘定ですから、え〜〜っと、
> 76 から =?ISO-2022-JP?B? と ?= の分だけ引いて、58。4で割って14と2余り(笑)
> 14かける3で42。エスケープシーケンスの分6bytesを引くと、36。2で割って18。
>
> 半角カナの全角化をしないですむような素直なEUCの文字列とすると、18文字で
> 切って8bit目を立て、前後をESC hogeではさみ、B encodeして余りの2バイトは
> paddingということになるでしょうか。はぁ大変…

そうやって逆向きに1発で計算しちゃおうとするとドツボにはまりますよ(^^;
適当な個所で切ってみて長ければ、短くする（ヘンな日本語）手順は
必ず必要だと思います。

--- Regards,
 Shun-ichi Goto  <gotoh@taiyo.co.jp>
   R&D Group, TAIYO Corp., Tokyo, JAPAN

Thread

Prev Next

In This Thread

Prev Next

[#10553] base64.rb — Sinichiro Dezawa <dezawa@...>

[#10554] telnet.rb — Sinichiro Dezawa <dezawa@...>

[#10564] ruby-man-1.1-jp-c0/syntax.html — TEI meiki <tei@...>

[#10580] Re: rskkfep alpha 0.1 — toyofuku@...

[#10589] LoadError on FreeBSD 3.0-RELEASE — gotoken@... (GOTO Kentaro)

[#10598] bug?: private writer can be called — Hiroshi Takenaka <pirozeau@...>

[#10600] Re: Ruby Document Format — m_seki@... (SEKI)

[#10602] ':' — Daisuke Sato <densuke@...2.so-net.ne.jp>

[#10624] メーリングリストに参加 — t.togami@... (Takeo Togami)

[#10639] tgif_expr — aito@...

[#10640] 入会します — Tadashige Morii <m_tada@...>

[#10649] Array.pack — Sinichiro Dezawa <dezawa@...>

[#10665] World Wide grep — toyofuku@...

[#10676] 11/10 tokyo offline meeting — matz@... (Yukihiro Matsumoto)

[#10684] Re: 11/10 tokyo offline meeting — toyofuku@...

[#10690] ruby-mode.el — Takao KAWAMURA <kawamura@...>

[#10694] IMAP via HttpTunnel — Kikutani Makoto <kikutani@...>

[#10697] Re: 11/10 tokyo offline meeting — KIMURA Koichi <kkimura@...>

[#10698] 式の評価順序は ? — Takao KAWAMURA <kawamura@...>

[#10701] bignum and x^4 + y^4 + z^4 — Noritsugu Nakamura <nnakamur@...>

[#10720] Re: 11/10 tokyo offline meeting — greentea@...2.so-net.ne.jp (Tomoyuki Kosimizu)

[#10722] — polygon@... (polygon)

[#10725] ruby-gtk-0.14 — "D.Kanda" <MAP2303@...>

[#10727] Re: 11/10 tokyo offline meeting — SHIROYAMA Takayuki <psi@...>

[#10747] ruby 1.1c7 released — matz@... (Yukihiro Matsumoto)

[#10752] Re: case with Class — toyofuku@...

[#10753] Re: ruby:struct -> ext module -> ruby — toyofuku@...

[#10759] COMPUMODA — greenmanalishi@...

[#10767] HttpTunnelServer shoud be run as root ? — Kikutani Makoto <kikutani@...>

[#10772] Re: 11/10 tokyo offline meeting — ARIMA Yasuhiro <fit0298@...>

[#10780] ring — "D.Kanda" <MAP2303@...>

[#10783] ruby senden? — Noritsugu Nakamura <nnakamur@...>

[#10785] Re: case with Class — toyofuku@...

[#10788] 0th(?) Ruby Conference Report — greentea@...2.so-net.ne.jp (Tomoyuki Kosimizu)

[#10799] make ruby on WinNT with VC++6.0 — Koji Oda <oda@...1.qnes.nec.co.jp>

[#10831] shard-library support by libtool — EGUCHI Osamu <eguchi@...>

[#10836] 文字の型は何？ — "Kozuka Masahiro" <kozuka@...>

[#10847] RE: 文字の型は何？ — "Kozuka Masahiro" <kozuka@...>

[#10848] IO#pos= — Yoshinori Toki <toki@...>

[#10850] patch for mswin32 — 助田 雅紀 <masaki.suketa@...>

[#10856] win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10868] Re: case with Class — Toyofuku <toyofuku@...>

[#10876] Re: REBOL — "MAEDA Shugo" <shugo@...>

[#10877] Re: REBOL — "MAEDA Shugo" <shugo@...>

[#10878] 組み込み関数と同じ名前のクラスメソッド — Yoshiki WADA <wada@...>

[#10879] Re: 組み込み関数と同じ名前 — "MAEDA Shugo" <shugo@...>

[#10892] Re: win32 OLE — Koji Oda <oda@...1.qnes.nec.co.jp>

[#10898] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10899] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10900] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10902] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10904] ruby 1.1c8 released — matz@... (Yukihiro Matsumoto)

[#10910] require error (tkutil.so -> tk.so) — ttate@...

[#10915] mod_ruby? — "MAEDA Shugo" <shugo@...>

[#10938] Re: 0th(?) Ruby Conference Report — 助田 雅紀 <masaki.suketa@...>

[#10949] Re: 0th(?) Ruby Conference Report — 助田 雅紀 <masaki.suketa@...>

[#10951] great ideas — matz@... (Yukihiro Matsumoto)

[#10953] Re: World Wide grep — toyofuku@...

[#10958] Re: 0th(?) Ruby Conference Report — greentea@...2.so-net.ne.jp (Tomoyuki Kosimizu)

[#10965] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10967] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10969] Re: win32 OLE — 助田 雅紀 <masaki.suketa@...>

[#10970] tr の使い方について — "Hirotaka Ishida" <h-ishida@...>

[#10973] gets のクラス — Yoshiki WADA <wada@...>

[#10976] スコープの範囲 — Koji Arai <JCA02266@...>

[#10979] Ruby/Forms (ver 0.5) — ttate@...

[#10984] Re: gets のクラス — 助田 雅紀 <masaki.suketa@...>

[#10992] Re: case with Class — "豊福" <toyofuku@...>

[#11001] 文字列の抽出について — "Hirotaka Ishida" <h-ishida@...>

[#11006] usage of TkcImage class — Noritsugu Nakamura <nnakamur@...>

[#11009] GD::Polygon.length mismatch — Noritsugu Nakamura <nnakamur@...>

[#11015] バックスラッシュのエスケープ — Yoshiki WADA <wada@...>

[#11018] ruby/tk FAQ? — Noritsugu Nakamura <nnakamur@...>

[#11022] cgi-lib.rb — Sinichiro Dezawa <dezawa@...>

[#11026] Re: make ruby on WinNT with VC++6.0 — Koji Oda <oda@...1.qnes.nec.co.jp>

[#11031] Linux Japan Jan., 1999 — ozawa@...

[#11035] inspect, to_s — "D.Kanda" <MAP2303@...>

[#11043] enumerable.rb — Shin-ichro Hara <sinara@...>

[#11044] Ruby on SAL — aito@...

[#11046] 宴会サーバ改め会合調整サーバ — hisanori@...

[#10850] patch for mswin32 — 助田　雅紀 <masaki.suketa@...>

[#10856] win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10898] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10899] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10900] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10902] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10938] Re: 0th(?) Ruby Conference Report — 助田　雅紀 <masaki.suketa@...>

[#10949] Re: 0th(?) Ruby Conference Report — 助田　雅紀 <masaki.suketa@...>

[#10965] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10967] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10969] Re: win32 OLE — 助田　雅紀 <masaki.suketa@...>

[#10984] Re: gets のクラス — 助田　雅紀 <masaki.suketa@...>

[#11108] RE: 日本語の配列の内容を１字ずつ取り出す方法について — 助田　雅紀 <masaki.suketa@...>

[#11129] RE: — 助田　雅紀 <masaki.suketa@...>