久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

您的位置:首頁技術文章
文章詳情頁

python - 爬蟲獲取網站數據,出現亂碼怎么解決。

瀏覽:104日期:2022-08-04 09:36:09

問題描述

#!/usr/bin/python# -*- coding: utf-8 -*-import urllib2import reimport HTMLParserclass WALLSTREET: def __init__(self, baseUrl):self.url = baseUrl def get_html_content(self):url = self.urlresponse = urllib2.urlopen(url)str = response.read()print strbaseUrl='https://wallstreetcn.com/live/global' #華爾街見文urlws = WALLSTREET(baseUrl)ws.get_html_content()

以上是代碼,寫的很簡單,但是print出來的是亂碼嘗試了 print str.decode(“utf-8“”)但是報錯UnicodeDecodeError: ’utf8’ codec can’t decode byte 0x8b in position 1: invalid start byte

問題解答

回答1:

str = response.read()這句有兩個問題:1、str是內置關鍵字必須更改為其他變量名2、查看網頁源代碼的編碼方式,如果為utf-8在read()后加.decode(’utf-8’),若為其他可以相應解碼

小建議這種小程序寫個函數會比用類來更加方便,無論是使用還是實現

回答2:

推測用的是sublime text?參考這個

回答3:

這兒應該是encode不是decode,而且你的變量名居然是跟內置關鍵字名字一樣

回答4:

應該是encode吧

標簽: Python 編程
主站蜘蛛池模板: av片网站| 久久不卡日韩美女 | 夜夜草| 久久精品1区2区 | 国产精品二区三区 | 精品一区二区在线观看 | 亚洲一区二区三区高清 | 超碰高清 | www伊人| 亚洲精品一区二区在线 | 久久久精品网 | 一二三区av | 日日爱夜夜操 | 欧洲一区二区三区 | 日韩一区二区三区在线观看 | 久久精品国产亚洲blacked | 特级淫片日本高清视频免费 | 日韩欧美国产一区二区 | 五月婷婷激情 | 日韩一区二区三区在线观看 | 亚洲一区成人在线观看 | h免费在线| 韩国精品一区 | 国产一级特黄aaa大片 | 成人在线视频免费观看 | 精品视频在线免费观看 | 久久久久久久久久久免费视频 | 国产精品久久久久久一区二区三区 | 日韩成人在线播放 | 81精品国产乱码久久久久久 | 日本一级淫片免费看 | 日韩国产欧美 | 久久久久久亚洲 | 狠狠狠色丁香婷婷综合久久五月 | 日本不卡免费新一二三区 | 精品亚洲网 | 北条麻妃国产九九九精品小说 | 日韩色av | 黑人巨大精品欧美黑白配亚洲 | 国产a免费 | 狠狠撸在线视频 |