文章詳情頁

Python request中文亂碼問題解決方案

瀏覽：143日期：2022-07-11 08:07:16

Python request獲取網頁中文亂碼問題

r = requests.get(“http://www.baidu.com“)

**r.text返回的是Unicode型的數據。

使用r.content返回的是bytes型的數據。

也就是說，如果你想取文本，可以通過r.text。

如果想取圖片，文件，則可以通過r.content。**

方法1：使用r.text

Requests 會自動解碼來自服務器的內容。大多數 unicode 字符集都能被無縫地解碼。請求發出后，Requests 會基于 HTTP 頭部對響應的編碼作出有根據的推測。當你訪問 r.text 之時，Requests 會使用其推測的文本編碼。你可以找出 Requests 使用了什么編碼，并且能夠使用 r.encoding 屬性來改變它.

但是Requests庫的自身編碼為: r.encoding = ‘ISO-8859-1’

可以 r.encoding 修改編碼

url=’http://music.baidu.com’r=requests.get(url)r.encoding=’utf-8’print(r.text)

方法2：使用r.content

使用r.content，得到的是bytes型，再轉為str

url=’http://music.baidu.com’r = requests.get(url)html=r.contenthtml_doc=str(html,’utf-8’) #html_doc=html.decode('utf-8','ignore')print(html_doc)

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持好吧啦網。

Python 編程

上一條：Python繪制組合圖的示例下一條：python如何使用騰訊云發送短信

相關文章：

1. Django中如何使用Channels功能2. ASP.NET MVC使用Quartz.NET執行定時任務3. CSS3+Js實現響應式導航條4. CSS3中Transition屬性詳解以及示例分享5. ASP.NET MVC實現下拉框多選6. PHP中文亂碼分類及解決辦法大全7. python tkinter實現下載進度條及抖音視頻去水印原理8. asp畫中畫廣告插入在每篇文章中的實現方法9. PHP時間相關常用函數用法示例10. 在python中修改.properties文件的操作

排行榜

					
					Django中如何使用Channels功能
ASP.NET MVC使用Quartz.NET執行定時任務
CSS3+Js實現響應式導航條
CSS3中Transition屬性詳解以及示例分享
ASP.NET MVC實現下拉框多選
將Git存儲庫克隆到本地IntelliJ IDEA項目中的詳細教程
win2003 iis整合php后 環境變量無法讀取到
PHP中文亂碼分類及解決辦法大全
vue中defineProperty和Proxy的區別詳解
asp畫中畫廣告插入在每篇文章中的實現方法
Django與pyecharts結合的實例代碼