Hatena::Grouprubyist

oqunoのわくわくRuby日記

2009-08-03

rubyのmechanizeで機種依存文字に対応する

03:59

http://rubyist.g.hatena.ne.jp/oquno/20090802/1249244198

これの解決編

page=agent.get(url)
content=page.search('.hehehe')
p content[0]

としていたところを

require "nokogiri" とかを追加しつつ

def fixpage(page)
     return Nokogiri(page.content.toutf8)
end

page=agent.get(url)
page=fixpage(page)
content=page.search('.hehehe')
p content[0]

の様に、HTMLソースを一度テキストで取得してからUTF-8に変換し、それをNokogiriに食わせるといけた。