[#11357] [PATCH] an analogue of `long long' — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
えぐち@エスアンドイー です。
まつもと ゆきひろです
>From: matz@zetabits.com (Yukihiro Matsumoto)
まつもと ゆきひろです
[#11440] class Character (was: Ruby I18N) — Yasushi Shoji <yashi@...>
[ruby-dev:11428] からの続きですが、threadは切りました。
高橋征義です。用語について。
At Wed, 8 Nov 2000 20:44:55 +0900,
高橋征義です。
At Thu, 9 Nov 2000 13:30:34 +0900,
まつもと ゆきひろです
[#11447] gets は secure? — Kazuhiro NISHIYAMA <zn@...>
出力がInsecureなのに入力はsecureなのでしょうか?
[#11467] debug write in regex.c? — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11500] rb_to_integer/rb_to_int — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
[#11520] A problem of Socket methods on Windows — OKA Toshiyuki <oka@...>
岡と申します。
なかだです。
まつもと ゆきひろです
なかだです。
岡です。
なかだです。
なかだです。
岡です。
なかだです。
[#11569] blocking on socket? — Shugo Maeda <shugo@...>
前田です。
[#11591] object.c パッチ — Kazuhiro NISHIYAMA <zn@...>
使われてなかったnil_plusの削除とOBJ_INFECTへの変更です。
[#11611] return value of waitpid2 — Koji Arai <JCA02266@...>
新井です。
まつもと ゆきひろです
荒井です。いや、新井です。(よくあることさ)
まつもと ゆきひろです
新井です。
新井です。
[#11618] Re: class variable — "Koji Arai" <jca02266@...>
新井です
なかだです。
まつもと ゆきひろです
> まつもと ゆきひろです
まつもと ゆきひろです
まつもと ゆきひろです
新井です。
[#11641] eval too slow — Wakou Aoyama <wakou@...>
青山です。
[#11650] conflict of NODE_DREGX_ONCE — "Nobuyoshi.Nakada" <nobu.nakada@...>
なかだです。
まつもと ゆきひろです
[#11662] IO (Re: fork problem?) — Tanaka Akira <akr@...17n.org>
In article <E140cR3-0002ls-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E140fxW-0002u9-00@ev.netlab.zetabits.co.jp>,
In article <hvor93w5wb8.fsf@coulee.m17n.org>,
In article <hvoofz05uwz.fsf@coulee.m17n.org>,
まつもと ゆきひろです
新井です。
まつもと ゆきひろです
In article <E141eaC-0003w0-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E142ZqF-0004rX-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143Zem-000271-00@ev.netlab.zetabits.co.jp>,
まつもと ゆきひろです
In article <E143amj-00028V-00@ev.netlab.zetabits.co.jp>,
[ruby-dev:11527] Re: Proposal of "Array of CharCode"
まつもと ゆきひろです
In message "[ruby-dev:11521] Re: Proposal of "Array of CharCode""
on 00/11/15, "たけ(tk)" <ggb03124@nifty.ne.jp> writes:
|(1)文字列中のN文字目の文字にランダムにアクセスするようなスクリプトの
|とき。
このよう場合には、こちらの方が速いことは全面的に認めます。が、
今問題にしているのは速度のことよりも、これは前提を崩すほどの
トレードオフかということです。
|(2)文字集合が同じでエンコードだけが異なる場合の処理の共通化。
そういうプレーン(で1文字4バイト)の文字コード系の存在は否定し
ません。が、そういう話なんですか?
|(3)文字コードでの変換の方が簡単な場合。
これちょっと分かりませんでした。
| (4)前寺さん(TM-Editor という、多言語エディタの作者)の経験談は次の
|とおり。
<中略>
いや、この方のおっしゃることは分かるんですけど、エディタとス
クリプト言語では重点の置き方はかなり違うと思います。エディタ
では、ファイルを読み込んだ時点で内部構造に変換することは非常
に自然ですが、スクリプト言語ではそれは仮定できないと思います。
だから工夫が必要なわけで。
たけさんのおっしゃることはよく分かんないです。UCS4とかあるい
は別の文字集合でも構いませんが、1文字4バイトの固定長文字列を
対象とする文字コード系*も*扱えるようにすることに対して反対す
る理由はひとつもないです。が、それを標準で提供するかどうかは
別の問題で、おそらく提供しないと思います。私が今回考えている
のは、そのような文字コード系も後付で定義できる「仕組み」とは
なにかということです。
極端な話、仕組みさえできれば個々の文字コード系については、ど
うでも良いと言っても良いです。いつでも作れるから。
もちろん、私は全知ではないんで不適切な仕組みを作っちゃうかも
しれなくて、だからこそ実際に使う(可能性のある)みなさんの意見
を聞いているわけです。
| * ユーザーサイドから見ると「DBCS + (&M;)Mojikyo Tag=DBCS文字列+文
|字鏡番号を指定するタグ」が扱いやすいとのこと。TM-Editor が吐き出したファ
|イルを Ruby で扱えるようになると、うれしい。
ふーむ、このTM-Editorってのが、たけさんの発想の原点なんです
かね。このファイル(外部表現)はそのまま扱えそうにないんで、な
んらかの方法で内部表現に変換して扱えることは可能であって欲し
いです。
| 「処理モジュール」(CharCodeType)に次のメソッドがあれば、 簡単に作れ
|ると思います。
|
|(1)decode バイト列を受け取って、文字コードの配列を返す
|(2)encode 文字コードの配列を受け取って、バイト列を返す。
ちゅーか、バイト列から1文字(コードポイント)ずつ取り出すとい
う処理は本質なので、decode/encode処理は(それを関数として独立
させるかどうかはともかく)簡単に実現できるでしょう。
が、decode/encodeがあれば、本当にたけさんのおっしゃることが
簡単に実現できるかどうかは私には分かりません。
まつもと ゆきひろ /:|)