python - Notepad2與PyCharm區別
問題描述
同樣的代碼在 Notepad 環境(測試過記事本)過不了,在 Pycharm 可以過( Python3.5 )代碼:
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data = data.decode(’UTF-8’)
這條語句,兩個環境都可以過
data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
在 Pycharm 顯示爬出的網頁,在 cmd 窗口顯示
UnicodeEncodeError: ’gbk’ codec can’t encode character ’xbb’ in position 26830:illegal multibyte sequence
必須去除無效字符。
import urllibimport urllib.requesturl = 'http://www.baidu.com'data = urllib.request.urlopen(url).read()data.decode(’gbk’, ’ignore’).encode(’UTF-8’)print(data)
這樣可以過,求解釋
問題解答
回答1:你遇到的可能和我一樣是python編碼問題,或者使用的terminal的編碼支持問題。看看下面的問題。
【python編碼問題?】分享自@SegmentFault,傳送門:/q/10...
相關文章:
1. 怎么在phpstudy中用phpexcel上傳數據到MYSQL?2. javascript - 百度搜索網站,如何讓搜索結果顯示一張圖片加上一段描述,如圖;求教3. phpadmin的數據庫,可以設置自動變化時間的變量嗎?就是不需要接收時間數據,自動變化4. html5和Flash對抗是什么情況?5. 求救一下,用新版的phpstudy,數據庫過段時間會消失是什么情況?6. html - 爬蟲時出現“DNS lookup failed”,打開網頁卻沒問題,這是什么情況?7. mac里的docker如何命令行開啟呢?8. boot2docker無法啟動9. 這是什么情況???10. gosts內容是空的
