[ruby-list:49828] Re: Nokogiri で文字実体参照が

From: Kazuhiro NISHIYAMA <zn@...>
Date: 2014-05-20 15:11:22 UTC
List: ruby-list #49828
西山和広です。

At Tue, 20 May 2014 08:54:34 +0900,
5.5 wrote:
> 
> Nokogiri で HTML を読み込んで書き出すと,文字実体参照がリテラルに
> 変えられます。
> たとえば &copy; が © になります。

ちょっと検索してみると
http://stackoverflow.com/questions/7756123/nokogiri-leaving-html-entities-untouched
に同じような話があって、libxml の挙動のようなので libxml を使っている
nokogiri を使っている限りはどうしようもなさそうな気がしました。

stackoverflow の回答でも書いてありますが NOENT というオプションがある
ようなので、その辺りの挙動が変わるのかと思ったら、試してみても何も
変わらないようで、よくわかりませんでした。


-- 
|ZnZ(ゼット エヌ ゼット)
|西山和広(Kazuhiro NISHIYAMA)

In This Thread