<noframes id="5hjpd"><progress id="5hjpd"><form id="5hjpd"></form></progress>

    <noframes id="5hjpd">

    <span id="5hjpd"><progress id="5hjpd"><progress id="5hjpd"></progress></progress></span>
      <noframes id="5hjpd">
      <ins id="5hjpd"><sub id="5hjpd"><rp id="5hjpd"></rp></sub></ins>
      <del id="5hjpd"><big id="5hjpd"></big></del>
      <track id="5hjpd"></track>

      Python學習筆記之簡單爬蟲

      導語 所謂的爬蟲就是通過代碼的方式,抓取網站上的你想要的任何信息,比如你在網上看見很多有意思的圖片,如果不會爬蟲的話,我是不是的一張張另存下來,如果會了爬蟲,就能悄無聲息 的吧圖片下載下來,慢慢欣賞。

        現階段我們利用urllib模塊,去做最簡單的爬蟲,因為比較簡單,所以直接看代碼就行。主要知識就是通過urllib模塊的各個函數加上正則表達式去完成。
       

      1. #encoding:utf-8 
      2.  
      3. import re 
      4. import urllib 
      5.  
      6. #利用urllib的urlopen()函數打開一個url地址 
      7. #并讀取所有的html代碼, 
      8. def gethtml(url): 
      9.     content=urllib.urlopen(url) 
      10.     html=content.read() 
      11.     return html 
      12.  
      13.  
      14. #根據正則表達式去匹配符合規則的內容 
      15. def geturls(html): 
      16.     r=r'data-src="(http://.*?)"' 
      17.     alllist=re.findall(r,html) 
      18.     return alllist 
      19.  
      20. #利用urlretrieve()下載文件 
      21. def download(list): 
      22.     x=0 
      23.     for li in list: 
      24.         x=x+1 
      25.         urllib.urlretrieve(li,"%s.jpg"%x) 
      26.  
      27. if  __name__ == '__main__'
      28.     #內涵段子 
      29.     url = "http://neihanshequ.com/pic/" 
      30.     #獲取網頁源碼 
      31.     html = gethtml(url) 
      32.     #根據一定規則過濾出想要的內容 
      33.     list = geturls(html) 
      34.     #下載圖片 
      35.     download(list) 
      36.  
      37.     print list 
      http://www.randomwithlife.com/ true Python學習筆記之簡單爬蟲 http://www.randomwithlife.com/show-18-1109-1.html report <?php echo strlen($content) / 2; ?> 所謂的爬蟲就是通過代碼的方式,抓取網站上的你想要的任何信息,比如你在網上看見很多有意思的圖片,如果不會爬蟲的話,我是不是的一張張另存下來,如果會了爬蟲,就能悄無聲息 的吧圖片下載下來,慢慢欣賞。
      TAG:爬蟲 Python
      本站歡迎任何形式的轉載,但請務必注明出處,尊重他人勞動成果
      轉載請注明: 文章轉載自:愛思資源網 http://www.randomwithlife.com/show-18-1109-1.html

      [前端插件推薦] Plugin

      1 2 3 4
      • jQuery實現逐字逐句顯示插件l-by-l.min.js
      • jQuery帶方向感知的鼠標滑過圖片邊框特效插件
      • jQuery HotKeys監聽鍵盤按下事件keydown插件
      • 響應式無限輪播jQuery旋轉木馬插件
      響應式無限輪播jQuery旋轉木馬插件
      web前端開發
      愛思資源網 Copyright 2012-2014 www.randomwithlife.com All rights reserved.(晉ICP備13001436號-1)
      欧美精品久久久久久久自慰

      <noframes id="5hjpd"><progress id="5hjpd"><form id="5hjpd"></form></progress>

        <noframes id="5hjpd">

        <span id="5hjpd"><progress id="5hjpd"><progress id="5hjpd"></progress></progress></span>
          <noframes id="5hjpd">
          <ins id="5hjpd"><sub id="5hjpd"><rp id="5hjpd"></rp></sub></ins>
          <del id="5hjpd"><big id="5hjpd"></big></del>
          <track id="5hjpd"></track>