ruby+nokogori抓取糗事百科前10頁并存儲(chǔ)進(jìn)數(shù)據(jù)庫示例
更新時(shí)間:2014年05月04日 11:26:56 作者:
這篇文章主要介紹了ruby+nokogori抓取糗事百科前10頁并存儲(chǔ)進(jìn)數(shù)據(jù)庫示例,需要的朋友可以參考下
ruby,nokogori,爬取糗事百科最新的10頁加圖片比并同時(shí)保存進(jìn)文本跟數(shù)據(jù)庫
復(fù)制代碼 代碼如下:
#encoding:utf-8
require "open-uri"
require "nokogiri"
require "mysql"
@dbh=Mysql.real_connect("localhost","root","dengli","pachong")
@file=open("qb.txt","w")
def getQiubai(url)
data=open(url){|f| f.read}
doc=Nokogiri::HTML(data)
doc.css('div.block.untagged.mb15.bs2').each{|p|
content=p.css('div.content').text
@file.puts("#{content}\n")
img=p.css('div.thumb img').each{|img|
imgAddr=img.attr('src')
@file.puts("#{imgAddr}\n")
time=Time.now
sql="INSERT INTO qiushibaike (`body`,`img`,`time`) VALUES ('#{content}','#{imgAddr}','#{time}')"
@dbh.query(sql)
}
}
end
for i in 1..10
@file.puts("這是第#{i}頁")
url="http://www.qiushibaike.com/8hr/page/#{i}"
getQiubai(url)
end
相關(guān)文章
Ruby元編程之夢(mèng)中情人method_missing方法詳解
這篇文章主要介紹了Ruby元編程之夢(mèng)中情人method_missing方法詳解,本文講解了我該怎么用 method_missing 、方法代理、define_method、什么時(shí)候用 method_missing、元方法等內(nèi)容,需要的朋友可以參考下2015-05-05
Ruby中的反射(Reflection)應(yīng)用實(shí)例
這篇文章主要介紹了Ruby中的反射(Reflection)應(yīng)用實(shí)例,實(shí)現(xiàn)通過一個(gè)類名字符串構(gòu)造一個(gè)類對(duì)象和訪問成員變量和私有方法 ,需要的朋友可以參考下2014-06-06
Ruby實(shí)現(xiàn)的最優(yōu)二叉查找樹算法
這篇文章主要介紹了Ruby實(shí)現(xiàn)的最優(yōu)二叉查找樹算法,本文直接給出實(shí)現(xiàn)代碼,需要的朋友可以參考下2015-05-05
介紹Ruby中的模塊與混合類型的相關(guān)知識(shí)
這篇文章主要介紹了Ruby中的模塊與混合類型的相關(guān)知識(shí),包括平常人們常說的多態(tài)與繼承等相關(guān)知識(shí)點(diǎn),需要的朋友可以參考下2015-05-05
Windows下Ruby on Rails開發(fā)環(huán)境安裝配置圖文教程
這篇文章主要介紹了Windows下Ruby on Rails開發(fā)環(huán)境安裝配置圖文教程,ROR初學(xué)者必看,需要的朋友可以參考下2014-07-07

