文章詳情頁

python - ulipad爬網頁時中文為何是16進制？

瀏覽：132日期：2022-08-15 18:33:50

問題描述

#! /usr/bin/env python#coding=utf-8import urlliburl = 'http://www.tust.edu.cn'content = urllib.urlopen(url).read()print content

python初學者，也是編程初學者。上面是代碼，用python2.7編譯的時候網頁上的中文可以正常顯示，但是用ulipad編譯的時候，網頁中的文字就是以16進制的方式顯示的。請問這個是什么問題？

我搜索的時候，看到有的回答說是在代碼后面加上encode

然而我在content后面接encode(’utf-8’)或者encode(’gb2312’)的時候都會提示報錯

ascii codec can’t decode byte 0Xef in position 0:ordinal not in range

我查了一下，找到了下面這個網址

http://blog.csdn.net/qian_f/a...

好像是說是字符編碼不統一的問題。緊接著我查了一下read返回的好像就是byte string呀....

求各位大神解答...

問題解答

回答1：

個人理解，應該是read()默認的編碼無法解析網頁內容，查下資料，嘗試在read的括號內指定編碼，應該沒有必要用encode的

回答2：

unicode.encode(content,’utf-8’);

Python 編程

上一條：mysql for python安裝不上，總是顯示需要python2.7版本，可是本機版本就是2.7下一條：python怎么使用matplotlib畫出下面這樣的圖？

相關文章：

1. 在應用配置文件 app.php 中找不到’route_check_cache’配置項2. html按鍵開關如何提交我想需要的值到數據庫3. HTML 5輸入框只能輸入漢字、字母、數字、標點符號？正則如何寫？4. gvim - 誰有vim里CSS的Indent文件, 能縮進@media里面的5. 利用百度地圖API定位及附件商家信息服務6. 跟著課件一模一樣的操作使用tp6,出現了錯誤7. PHP類屬性聲明？8. javascript - 求助canvas繪制馬賽克的問題，老是取色不準9. java - 安卓接入微信登錄,onCreate不會執行10. javascript - 請教如何獲取百度貼吧新增的兩個加密參數

排行榜

					
					在應用配置文件 app.php 中找不到’route_check_cache’配置項
html按鍵開關如何提交我想需要的值到數據庫
gvim - 誰有vim里CSS的Indent文件, 能縮進@media里面的
HTML 5輸入框只能輸入漢字、字母、數字、標點符號？正則如何寫？
利用百度地圖API定位及附件商家信息服務
跟著課件一模一樣的操作使用tp6,出現了錯誤
PHP類屬性聲明？
macos - mac下docker如何設置代理
java - 安卓接入微信登錄,onCreate不會執行
html - css中怎么命名顏色比較好？
javascript - 求助Angular 1 在$scope里向對象屬性賦值不起效的原因（作用域問題），無盡感激！
				

熱門標簽

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

python - ulipad爬網頁時中文為何是16進制？

python - ulipad爬網頁時中文為何是16進制？