国产精品亚洲成人_国产伦精品一区二区三区在线观看 _国产成人精品在线看_成人免费看视频_国产在线视频精品一区_国产91精品欧美_国内成人免费视频_久久国产欧美日韩精品_精品亚洲欧美一区_日韩国产欧美一区二区三区

您所在的位置: 首頁 > 裝修知識 >

基于python的租房數據分析「python爬取個人信息」

今天的Python教程講信息數據的獲取,這里首先收集趕集網和自如網的信息。

1. 趕集網信息獲取

I. 獲取當頁內容

這里的規則比較明顯,獲取網頁內容用xpath解析即可,各個板塊的信息都很容易獲取,最后用列表保存并返回即可,首先循環出每個divs塊,對里面的每個版塊內容逐個獲取

def get_this_page_gj(url, tmp): html = etree.HTML(requests.get(url).text) divs = html.xpath("http://div[@class="f-list-item ershoufang-list"]") for div in divs: title = div.xpath("./dl/dd[@class="dd-item title"]/a/text()")[0] house_url = div.xpath("./dl/dd[@class="dd-item title"]/a/@href")[0] size = "、".join(div.xpath("./dl/dd[@class="dd-item size"]/span/text()")) address = "-".join([ data.strip() for data in divs[0].xpath("./dl/dd[@class="dd-item address"][1]//a//text()") if data.strip() != "" ] ) agent_string = div.xpath("./dl/dd[@class="dd-item address"][2]/span/span/text()")[0] agent = re.sub(" ", "", agent_string) price = div.xpath("./dl/dd[@class="dd-item info"]/div[@class="price"]/span[@class="num"]/text()")[0] tmp.append([ title, size, price, address, agent, house_url ]) return tmp

II. URL構造

訪問首頁鏈接,獲取總頁數,按照url的訪問規則構造url,調用獲取當頁數據的方法即可,這里的url都是以http://cd.ganji.com/zufang/pn開頭的,后面跟上網頁的頁碼

def house_gj(headers): index_url = "http://cd.ganji.com/zufang/" html = etree.HTML(get_html(index_url, headers)) total = html.xpath("http://div[@class="pageBox"]/a[position() = last() -1]/span/text()")[0] result = [] for num in range(1, int(total) 1): result = get_this_page_gj("http://cd.ganji.com/zufang/pn{}".format(num), []) print("完成讀取第{}頁/趕集網".format(num)) return result

2 .

這里和趕集網類似,結構也相似,同樣的獲取方式,我們也抓取基礎信息加url鏈接,區別在于這里的價格可能不太好獲取,并不是直接顯示,而是以圖片 偏移量的形式展示

1. 價格獲取

每個數字對應一張圖片,圖片中的數字會根據style中設置的偏移去原圖中獲取,每頁的原圖也不盡相同,所以處理起來比較麻煩

這里我們仔細留心的會發現其實每個數字間的間距是一樣的,可以自己在頁面上更改數值查看規律,每個數字間的距離是21.4px,從原圖的左邊開始做偏移,根據偏移確定對應的數字,返回的數字下標 = |偏移量/21.4|,當然這里根據頁面圖片、內容等元素會有微小的誤差,但都是極小的誤差了,最后取個整去原圖的數字列表中取得對應下標的值即可,這里我們用到tesseract來對圖片進行解析

............price_strings = div.xpath("./div[@class="info-box"]/div[@class="price"]/span[@class="num"]/@style")offset_list = []for data in price_strings: offset_list.append(re.findall("position: (.*?)px", data)[0])style_string = html.xpath("http://div[@class="info-box"]/div[@class="price"]/span[@class="num"]/@style")[0]pic = "http:" re.findall(r"background-image: url((.*?));.*?", style_string)[0]price = get_price_zr(pic, offset_list)def get_price_zr(pic_url, offset_list): """ 這里的index保存所有數字的下標值,等待圖片解析完成獲取對應下標的價格數字 """ index, price = [], [] with open("pic.png", "wb") as f: f.write(requests.get(pic_url).content) code_list = list(pytesseract.image_to_string(Image.open("pic.png"))) for data in offset_list: index.append(int(math.fabs(eval(data)/21.4))) for data in index: price.append(code_list[data]) return "".join(price) pic_url是每頁的原圖地址,將之下載下來后用pytesseract解析,最后返回每個下標對應的數字所組成的新的數字字符串(價格),offset_list是獲取的每個數字的偏移值組成的列表

2. 自如網數據獲取

這里和趕集網類似,結構也相似,同樣的獲取方式,我們也抓取基礎信息加url鏈接,區別在于這里的價格可能不太好獲取,并不是直接顯示,而是以圖片 偏移量的形式展示

I. 價格獲取

每個數字對應一張圖片,圖片中的數字會根據style中設置的偏移去原圖中獲取,每頁的原圖也不盡相同,所以處理起來比較麻煩

這里我們仔細留心的會發現其實每個數字間的間距是一樣的,可以自己在頁面上更改數值查看規律,每個數字間的距離是21.4px,從原圖的左邊開始做偏移,根據偏移確定對應的數字,返回的數字下標 = |偏移量/21.4|,當然這里根據頁面圖片、內容等元素會有微小的誤差,但都是極小的誤差了,最后取個整去原圖的數字列表中取得對應下標的值即可,這里我們用到tesseract來對圖片進行解析

............price_strings = div.xpath("./div[@class="info-box"]/div[@class="price"]/span[@class="num"]/@style")offset_list = []for data in price_strings: offset_list.append(re.findall("position: (.*?)px", data)[0])style_string = html.xpath("http://div[@class="info-box"]/div[@class="price"]/span[@class="num"]/@style")[0]pic = "http:" re.findall(r"background-image: url((.*?));.*?", style_string)[0]price = get_price_zr(pic, offset_list)def get_price_zr(pic_url, offset_list): """ 這里的index保存所有數字的下標值,等待圖片解析完成獲取對應下標的價格數字 """ index, price = [], [] with open("pic.png", "wb") as f: f.write(requests.get(pic_url).content) code_list = list(pytesseract.image_to_string(Image.open("pic.png"))) for data in offset_list: index.append(int(math.fabs(eval(data)/21.4))) for data in index: price.append(code_list[data]) return "".join(price) pic_url是每頁的原圖地址,將之下載下來后用pytesseract解析,最后返回每個下標對應的數字所組成的新的數字字符串(價格),offset_list是獲取的每個數字的偏移值組成的列表

II. 獲取當頁數據

這里和趕集網類似,我們構造獲取每頁數據的函數,之后調用函數傳入每頁的url即可,這里可以關注一下xpath的擴展用法(contains函數)和正則獲取原圖鏈接

def get_this_page_zr(url, tmp): html = etree.HTML(requests.get(url).text) divs = html.xpath("http://div[@class="item"]") for div in divs: if div.xpath("./div[@class="info-box"]/h5/a/text()"): title = div.xpath("./div[@class="info-box"]/h5/a/text()")[0] else: continue link = "http:" div.xpath("./div[@class="info-box"]/h5/a/@href")[0] location = div.xpath("./div[@class="info-box"]/div[@class="desc"]/div[@class="location"]/text()")[0] area = div.xpath("./div[@class="info-box"]/div[@class="desc"]/div[contains(text(), "㎡")]/text()")[0] price_strings = div.xpath("./div[@class="info-box"]/div[@class="price"]/span[@class="num"]/@style") offset_list = [] for data in price_strings: offset_list.append(re.findall("position: (.*?)px", data)[0]) style_string = html.xpath("http://div[@class="info-box"]/div[@class="price"]/span[@class="num"]/@style")[0] pic = "http:" re.findall(r"background-image: url((.*?));.*?", style_string)[0] price = get_price_zr(pic, offset_list) tag = "、".join(div.xpath("./div[@class="info-box"]//div[@class="tag"]/span/text()")) tmp.append([ title, tag, price, area, location, link ]) return tmp

III. url構造

原理同趕集網的一樣,主要關注一下xpath的擴展用法position()=last()

def house_zr(headers): index_url = "http://cd.ziroom.com/z/" html = etree.HTML(get_html(index_url, headers)) total = html.xpath("http://div[@class="Z_pages"]/a[position()=last()-1]/text()")[0] result = [] for num in range(1, int(total) 1): result = get_this_page_zr("http://cd.ziroom.com/z/p{}/".format(num), []) print("完成讀取第{}頁/自如網".format(num)) return result鄭重聲明:本文版權歸原作者所有,轉載文章僅為傳播更多信息之目的,如有侵權行為,請第一時間聯系我們修改或刪除,多謝。

免責聲明:本網站所有信息僅供參考,不做交易和服務的根據,如自行使用本網資料發生偏差,本站概不負責,亦不負任何法律責任。如有侵權行為,請第一時間聯系我們修改或刪除,多謝。

国产精品亚洲成人_国产伦精品一区二区三区在线观看 _国产成人精品在线看_成人免费看视频_国产在线视频精品一区_国产91精品欧美_国内成人免费视频_久久国产欧美日韩精品_精品亚洲欧美一区_日韩国产欧美一区二区三区
成人av一区二区三区| 大桥未久av一区二区三区中文| 蜜桃久久精品一区二区| 国产美女精品在线| 99精品一区二区三区| 国内精品伊人久久久久影院对白| 成人v精品蜜桃久久一区| 六月丁香综合在线视频| 成人一级片在线观看| 美女视频黄免费的久久| 波多野结衣中文一区| 久久er99热精品一区二区| 成人黄色777网| 国产一区二区三区四| 日日夜夜免费精品| 成人精品免费看| 国产剧情av麻豆香蕉精品| 三级成人在线视频| 成人激情校园春色| 国产精品99久久久| 韩日av一区二区| 日韩av网站免费在线| 成人爱爱电影网址| 国产精品一二三四五| 久久成人精品无人区| 日日夜夜免费精品| 99久久精品一区| 成人动漫在线一区| 国产成人av影院| 国内国产精品久久| 狠狠色狠狠色综合日日91app| 青青草国产精品亚洲专区无| 99re热这里只有精品视频| 成人免费av网站| 成人中文字幕合集| 粉嫩久久99精品久久久久久夜| 国产一区二区三区免费看| 蜜桃av一区二区三区| 免费人成黄页网站在线一区二区| 91玉足脚交白嫩脚丫在线播放| 成人晚上爱看视频| 成人动漫一区二区在线| 成人动漫视频在线| 91亚洲永久精品| 天堂久久久久va久久久久| 99精品国产视频| 天堂在线亚洲视频| 日韩不卡免费视频| 美女久久久精品| 久久爱www久久做| 国产在线精品一区在线观看麻豆| 精品一区二区三区蜜桃| 国产精品资源在线| 粉嫩aⅴ一区二区三区四区| 大白屁股一区二区视频| caoporm超碰国产精品| 91老司机福利 在线| 三级欧美在线一区| 激情伊人五月天久久综合| 国产综合色精品一区二区三区| 国产精品一区二区久久精品爱涩| 国产成人在线电影| 99re视频精品| 久久国产精品99久久久久久老狼| 国内精品伊人久久久久av影院| 国产精品99久久不卡二区| 成人免费毛片片v| 日日夜夜免费精品视频| 久久99精品久久久| 成人免费黄色在线| 美日韩一区二区| 国产成a人亚洲精| 视频在线观看一区二区三区| 久久黄色级2电影| 岛国精品一区二区| 免费看黄色91| 懂色av一区二区三区免费观看| 91亚洲精品久久久蜜桃网站 | 成人亚洲精品久久久久软件| 97精品久久久午夜一区二区三区| 秋霞影院一区二区| 国产91丝袜在线18| 免费成人你懂的| 成人免费视频免费观看| 日本在线播放一区二区三区| 国产激情91久久精品导航| 免费日本视频一区| 国产精品原创巨作av| 99久久免费精品| 国内精品视频666| 91麻豆精东视频| 国产精品系列在线播放| 日韩国产精品久久久久久亚洲| 久久99国产精品久久99果冻传媒| av激情亚洲男人天堂| 精品写真视频在线观看| 三级欧美在线一区| 成人黄色777网| 国产高清成人在线| 久久国产生活片100| 91网站在线播放| 成人夜色视频网站在线观看| 国产综合久久久久久鬼色| 日日噜噜夜夜狠狠视频欧美人| 国产成人亚洲综合a∨婷婷图片| 蜜臀久久99精品久久久久久9| 不卡免费追剧大全电视剧网站| 激情五月婷婷综合网| 日韩和欧美一区二区三区| 成人18视频在线播放| 国产福利精品一区二区| 国产老肥熟一区二区三区| 免费看精品久久片| av网站一区二区三区| 国产酒店精品激情| 久草中文综合在线| 蜜臀av一区二区在线免费观看| 97成人超碰视| 99精品视频一区| 成人性视频网站| 成人午夜电影小说| 成人在线视频首页| 成人国产精品免费观看动漫| 成人精品一区二区三区四区| 成人免费视频视频在线观看免费| 国产999精品久久久久久绿帽| 国产乱子轮精品视频| 国内精品久久久久影院色| 久久草av在线| 国精品**一区二区三区在线蜜桃| 精品一区二区三区免费观看| 黑人巨大精品欧美黑白配亚洲| 精品中文字幕一区二区| 久草热8精品视频在线观看| 久国产精品韩国三级视频| 精品制服美女丁香| 国产一区二区三区不卡在线观看| 成人一区在线看| 国产精品亚洲а∨天堂免在线| 免费看黄色91| 久久99国内精品| 国产乱人伦偷精品视频免下载 | 国产精品综合在线视频| 国产福利一区二区三区视频| 国产乱淫av一区二区三区| 国产综合色在线| 国产盗摄视频一区二区三区| 成人视屏免费看| 日韩电影免费在线观看网站| 久久精品免费看| 国产盗摄女厕一区二区三区| gogogo免费视频观看亚洲一| 蜜臀99久久精品久久久久久软件| 精品在线观看免费| 成人福利视频网站| 麻豆一区二区三区| 国产成人av电影在线| 99re在线视频这里只有精品| 国产精品99久久久| 麻豆91在线看| 国产资源在线一区| 成人精品国产一区二区4080| 欧美aaa在线| 国产99久久久精品| 日本在线不卡视频| 国产高清不卡一区| 蜜臀av国产精品久久久久| 岛国精品一区二区| 麻豆成人综合网| av亚洲精华国产精华| 国内久久婷婷综合| 日韩国产精品久久久| 国产精品亚洲一区二区三区在线| 99久久99精品久久久久久 | 国产白丝精品91爽爽久久| 日韩精彩视频在线观看| 国产福利一区二区三区视频 | 激情另类小说区图片区视频区| 成人午夜在线免费| 国产一区不卡精品| 日韩极品在线观看| 成人av影院在线| 国产精品88888| 久久精品国产第一区二区三区| 成人激情小说乱人伦| 国产毛片精品视频| 秋霞午夜鲁丝一区二区老狼| 99久久99久久久精品齐齐| 国产精品一区一区三区| 久久福利资源站| 日韩激情视频网站| 96av麻豆蜜桃一区二区| 成人免费毛片片v| 国产福利一区二区三区在线视频| 久久精品国产久精国产爱| 手机精品视频在线观看| 不卡一区二区中文字幕| 国产成人午夜精品5599| 国内成人免费视频| 精品亚洲国产成人av制服丝袜 | 日本成人在线电影网| 不卡电影一区二区三区| 国产成人超碰人人澡人人澡| 国产伦精品一区二区三区免费 | 精品亚洲国内自在自线福利| 蜜桃久久久久久久| 蜜乳av一区二区三区| 日韩在线一区二区| 日韩av一区二| 蜜臀av性久久久久av蜜臀妖精| 日日摸夜夜添夜夜添国产精品 | 国产在线不卡视频| 国内精品在线播放| 国产一区二区三区久久久| 国产一区二区网址| 国产精品系列在线观看| 高清在线成人网| 99视频有精品| 奇米在线7777在线精品| 麻豆精品国产传媒mv男同| 精品一区二区三区在线观看国产| 黄色小说综合网站| 高清shemale亚洲人妖| www.66久久| 日本不卡一区二区三区高清视频| 日韩avvvv在线播放| 久草热8精品视频在线观看| 激情欧美日韩一区二区| 高清免费成人av| 91免费观看视频在线| 麻豆一区二区在线| 国产iv一区二区三区| 99精品视频一区二区| 免费看日韩精品| 国产精品18久久久| av电影天堂一区二区在线观看| 日本成人中文字幕| 国产原创一区二区| 成人高清在线视频| 久久精品av麻豆的观看方式| 国产成人免费在线视频| 天堂va蜜桃一区二区三区 | 青娱乐精品视频在线| 久久99国产精品尤物| 丁香激情综合国产| 蜜臀久久99精品久久久画质超高清| 国产一区二区三区在线观看免费视频| 国产91精品精华液一区二区三区 | 国产一区二区电影| 99国产麻豆精品| 韩国女主播成人在线观看| 成人一区二区三区视频| 理论电影国产精品| av网站一区二区三区| 久久99久久久久久久久久久| www.亚洲免费av| 国内精品视频一区二区三区八戒| 成年人国产精品| 国产一区二区免费在线| 日韩极品在线观看| 成人午夜精品在线| 国产一区欧美日韩| 美女视频网站黄色亚洲| 不卡一区中文字幕| 国产精品77777| 久久国产精品免费| 日日摸夜夜添夜夜添精品视频| 国产91对白在线观看九色| 乱一区二区av| 日韩电影在线免费看| 成人午夜电影久久影院| 激情国产一区二区| 麻豆精品国产91久久久久久| 天堂资源在线中文精品 | 国产乱子伦一区二区三区国色天香| 99re66热这里只有精品3直播| 国产成人在线视频网址| 久久精品国产亚洲a| 日韩电影在线观看电影| 99国产精品久久久| 成人精品国产免费网站| 国产成人精品午夜视频免费| 国产一区二三区好的| 激情成人综合网| 紧缚奴在线一区二区三区| 麻豆成人av在线| 美日韩一级片在线观看| 免费成人在线影院| 日产国产欧美视频一区精品| 天堂成人国产精品一区| 91免费在线视频观看| 99久久婷婷国产综合精品电影 | 欧美aaa在线| 奇米影视在线99精品| 日本强好片久久久久久aaa| 日韩精品五月天| 91视频一区二区三区| 91色九色蝌蚪| 青草国产精品久久久久久| 日韩精品每日更新| 蜜臀av性久久久久蜜臀aⅴ流畅 | 免费观看在线综合| 麻豆91精品91久久久的内涵| 久久99精品国产.久久久久久| 久热成人在线视频| 国产专区综合网| 国产高清成人在线| 成人国产精品免费网站| 91在线一区二区三区| 日本sm残虐另类| 久久99精品久久久久| 国产精品18久久久久| 成人黄色在线看| 日韩精品一卡二卡三卡四卡无卡 | 美国十次了思思久久精品导航| 麻豆精品在线看| 国精产品一区一区三区mba视频| 国产精一品亚洲二区在线视频| 国产999精品久久久久久绿帽| av不卡在线播放| 欧美a级理论片| 国产美女娇喘av呻吟久久| 丁香激情综合国产| 日本亚洲欧美天堂免费| 激情综合一区二区三区| 成人黄色在线看| 麻豆91在线看| 丁香天五香天堂综合| 男男视频亚洲欧美| 国产成人在线免费观看| 视频一区中文字幕| 国产真实乱偷精品视频免| av不卡一区二区三区| 久久精品久久久精品美女| 成人毛片视频在线观看| 麻豆精品一区二区三区| 成人性生交大片免费| 久久精品国产久精国产| 成人黄色av电影| 精品一区二区在线视频| av在线播放成人| 国产伦精一区二区三区| 日韩va亚洲va欧美va久久| 国产a久久麻豆| 久久99精品久久久久久国产越南 | 国内精品写真在线观看| 99re成人精品视频| 韩国一区二区在线观看| 91蜜桃免费观看视频| 国产成人一区在线| 久久草av在线| 日日夜夜免费精品视频| 丁香一区二区三区| 国产主播一区二区三区| 日本aⅴ亚洲精品中文乱码| 成人黄色网址在线观看| 国产尤物一区二区| 免费高清在线视频一区·| 91视频在线观看免费| 国产成人av影院| 国产一区二区在线看| 蓝色福利精品导航| 91视频免费播放| www.亚洲色图| 高清久久久久久| 国产乱人伦偷精品视频免下载| 美女高潮久久久| 日韩激情一区二区| 91亚洲精品乱码久久久久久蜜桃| 国产福利一区二区三区视频 | 久草热8精品视频在线观看| 日本成人在线电影网| 91首页免费视频| 99国产精品久| 91在线国产福利| 99精品视频在线播放观看| 丁香另类激情小说| 国产91对白在线观看九色| 国产二区国产一区在线观看| 国产综合色视频| 国产一区欧美一区| 国产一区二区美女| 国产成人在线免费观看| 国产电影一区二区三区| 处破女av一区二区| 不卡一二三区首页| 91丨porny丨中文| 日本va欧美va精品| 久久精品国产999大香线蕉| 久久精品国产99| 国产剧情一区二区| 国产大陆精品国产| 成人18视频在线播放| 91美女片黄在线观看| 免费欧美日韩国产三级电影| 老汉av免费一区二区三区| 精品一区二区三区蜜桃| 国产乱码精品一区二区三区av| 大尺度一区二区| 91蝌蚪porny|