ruby-list

5.5 さん

信岡です。

>> result = ''
>> str = 'ab12cd'
>> while true do
>>    i = ( str =~ /\d+/ )
>>    result<<  $`.upcase<<  "<#{$&}>"
>>      str = $'
>> end
>> result<<  str #=>  "AB<12>CD"
>
> これだとループの二回めで =~ が失敗し，$`.upcase で例外が発生しますが，

ああっ、ごめんなさい。 メールを書きながら適当にいじっていて
直すのを忘れてたみたいです。

> 大きなテキストで，かつマッチ箇所が多数あると，大量の文字列ゴミが出ま
> すよね。

そうですね、ごみは出てしまいますね。 ごみを出さないようにするには、
$' を str に代入するのではなく、マッチした位置を index として記録しておいて、
String#match メソッドの第 2 引数に渡すような処理にするとか、すれば
いいのでしょうか。

>> 正規表現中にグルーピングのための括弧があると、とのことですが、
>> グルーピングにはグルーピングのための記法 ("(?:XXX)" の形式) が
>> あるので、これを用いれば問題にはならないと思います。
>
> そうなのですが，以下の理由で避けました。
>
> [1] /(\d).\1/ のように正規表現中で後方参照を使いたい場合もある。
> [2] あまり慣れていない人に使ってもらうツールを考えていたので，
> 　エンドユーザーに (?: ) の使用を強いるのが憚られた。
> [3] ブロック内でマッチデータを積極的に使いたい場合もある。

なるほど。
後方参照のための括弧は 「キャプチャリングのための括弧」 であって、
「グルーピングのための括弧」 ではないので、単にグルーピングするだけなら
"(?:XXX)" を使えばいいかなーと思ったのですが、キャプチャリングも必要なら
確かにダメですね。。


実を言うと私も 5.5 さんが提案されたようなメソッドが欲しいなーと思ったことがあって、
その時は自分で適当にそういうメソッドを作ったのですが、確かに実行速度などを
考えると C での実装で提供して貰えるとありがたいですよね。

ただ、String クラスや Regexp クラスに新しく追加すべきメソッドかというとそうでもないなぁ、
とも感じていて。。 追加されるとすれば StringScanner あたりが適当ですかね。

> 一般論として、実際のユースケースを示した方が良いです。
> 特に新しいメソッドを提案するときには。

ちなみに私がそういうメソッドを欲しいと思ったのは、XML のタグ部分 ('<' と '>' で囲まれた部分)
とそれ以外の部分を分けるという処理を書いたときです。 以下のように書けると便利ですよね。

 xml_str.each_segment /<[^>]*>/ do |str, matched|
   if matched
     proc_for_tag( str )
   else
     proc_for_text( str )
   end
 end


-- 
信岡 ゆう (NOBUOKA Yu)

Thread

Prev Next

In This Thread

Prev Next

[#47953] [ANN]るびま33号リリース — sunao tanabe <sunao.tanabe@...>

[#47954] postgresql接続モジュール — 中川貴 <nora1962@...>

[#47955] るびま記事募集：FiberとかSinatra/PadrinoとかBundlerとか — Makoto Kuwata <kwa@...>

[#47959] Ruby用のリアルタイムプロファイラ — Takahiro Sunaga <sunagae@...>

[#47966] CSV.read で読むとUTF-8の扱いがおかしい？ — Dezawa <dezawa@...>

[#47967] Re: CSV.read で読むとUTF-8の扱いがおかしい？ — "Endo Akira" <endo4917@...>

[#47974] [ANN] Feature matrix of Ruby HTTP clients — Hiroshi Nakamura <nahi@...>

[#47976] Fiber#resumeの引数について — Satoshi GUNJI <gunjisatoshi@...>

[#47978] PostgrSQL7.3との接続方法 — 大井 俊介 <tbe02663@...>

[#47979] Ruby/Pcapのコンパイルについて — 重松邦彦 <sigematu@...>

[#47980] unsubscribe — hrkt0115311 <hrkt0115311@...>

[#47982] TokyuRuby会議03: LT発表者募集のお知らせ — SAWADA Tadashi <moc.liamg.cesare@...>

[#47990] String#gsub への委譲 — "5.5" <5.5@...>

[#47997] lambda中のProc中のreturnの挙動について — m_takao <threewayhandshake@...>

[#48009] randの挙動 — YAGUCHI Yuya <yayugu@...>

[#48014] [ANN] RubyKaigi2011の当日ボランティアスタッフの募集を開始します — Kei Shiratsuchi <kei.shiratsuchi@...>

[#48016] 文字列を正規表現にマッチする部分と他の部分に分割 — "5.5" <5.5@...>

[#48018] 「Rubyリファレンスマニュアル刷新計画」2011-04分のスナップショットリリース — okkez <okkez000@...>

[ruby-list:48022] Re: 文字列を正規表現にマッチする部分と他の部分に分割

Thread

In This Thread

[#47978] PostgrSQL7.3との接続方法 — 大井俊介 <tbe02663@...>