HTMLを解析するライブラリHpricot
HTMLを解析しないといけないことになったので、
Rubyでないかなと探してたらありました。
できることは
- ある名前のタグを全て検索する
- あるタグの子要素を列挙する
- HTMLのあるタグの部分だけ切り出す
- HTMLに変更を加える
だそうです。
メインのページ?
http://code.whytheluckystiff.net/hpricot/
日本語での説明のページ
http://mono.kmc.gr.jp/~yhara/rubyscraping/?Hpricot