久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

您的位置:首頁技術(shù)文章
文章詳情頁

一篇文章搞懂Python反斜杠的相關(guān)問題

瀏覽:93日期:2022-06-24 13:43:42

大家在開發(fā)Python的過程中,一定會遇到很多反斜杠的問題,很多人被反斜杠的數(shù)量搞得頭大。

首先我們寫一段非常簡單的Python代碼,它的作用是把一個字段先轉(zhuǎn)換為JSON格式的字符串,然后把這個字符串再轉(zhuǎn)換為JSON格式的字符串:

import json info = {’name’: ’kingname’, ’address’: ’杭州’, ’salary’: 99999}info_json = json.dumps(info) # 第一次轉(zhuǎn)換以后,打印出來print(info_json) info_json_json = json.dumps(info_json) # 第二次轉(zhuǎn)換以后,再打印出來print(info_json_json)

它的運(yùn)行效果如下圖所示。

一篇文章搞懂Python反斜杠的相關(guān)問題

第一次,字典轉(zhuǎn)成JSON格式的字符串,只有中文杭州變成了Unicode編碼u676du5dde,其余地方?jīng)]有出現(xiàn)反斜杠。

在Python里面,反斜杠不能單獨(dú)出現(xiàn),這里u676du5dde中的兩根反斜杠,實(shí)際上應(yīng)該是u。表示這兩個編碼是Unicode編碼。

接下來,把第一次生成的JSON字符串:{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}再一次轉(zhuǎn)成JSON格式的字符串,這一次變成了:

'{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}'

為什么突然出現(xiàn)了這么多反斜杠?這是因?yàn)椋琂SON格式的字符串本身是使用雙引號來表示字符串的。如果原來的字符串里面本身就有雙引號,那就會導(dǎo)致混淆。此時,Python需要把原來字符串的雙引號變成普通的字符,失去雙引號的作用。因此使用'讓雙引號變成普通的字符。

這就相當(dāng)于在Python中,可以這樣定義一個包含雙引號的字符串:

>>> a = '跟我說:'你好''>>> print(a)跟我說:'你好'

這里,你好兩側(cè)的雙引號都加上了反斜杠,讓它成為普通的字符,防止它們提前與最外層的雙引號配對。

如果不加反斜杠,就會導(dǎo)致字符串里面的雙引號提前與外層的雙引號配對,引起語法錯誤:

>>> b = '跟我說:'你好'' File '<stdin>', line 1 b = '跟我說:'你好'' ^SyntaxError: invalid syntax

這里,'跟我說:'成為了一個字符串,末尾的''成為了一個空字符串。那么中間的你好就變成了一個沒有定義的變量。而Python里面,是不存在字符串未定義的變量字符串這種寫法的,所以會報(bào)語法錯誤。

而JSON格式的字符串,本質(zhì)上也是字符串,所以自然而然也需要遵循這樣的規(guī)則。因此,字符串原來自帶的雙引號左側(cè)就被加上了反斜杠。

那么,原來的u676du5dde為什么變成了u676du5dde?

這是因?yàn)椋?dāng)?shù)诙螆?zhí)行json.dumps的時候,傳入的參數(shù)是一個JSON格式的字符串,本質(zhì)就是字符串。而一個字符串里面如果自帶反斜杠,那么JSON在對他再次轉(zhuǎn)換的時候,需要標(biāo)記這是一個普通的字符串形式的反斜杠,不是一個有特殊意義的反斜杠,所以使用表示一個普通的反斜杠。

好了,那么你可以猜一下,如果把info_json_json再json.dumps一下會怎么樣?

會變成:

''{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}''

為什么出現(xiàn)了三個反斜杠連用和四個反斜杠連用的問題?

實(shí)際上非常簡單,當(dāng)你對info_json_json執(zhí)行json.dumps的時候,Python是怎么轉(zhuǎn)換的?

我們來看:

'{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}'

對字符串執(zhí)行json.dumps的時候,記住一個關(guān)鍵方法——從左到右,一個字符一個字符的轉(zhuǎn)換。

1. 第一個字符是雙引號,所以變成'2. 第二個字符是{,不是特殊符號,保留3. 第三個字符是,把它變成4. 第四個字符是',把它變成'5. ……

全部執(zhí)行完成了,由于這次轉(zhuǎn)換是把一個字符串轉(zhuǎn)換為JSON格式的字符串,所以最外側(cè)加上雙引號。

于是就得到了:

''{'name': 'kingname', 'address': 'u676du5dde', 'salary': 99999}''

我們在爬蟲開發(fā)過程中,可能會遇到上面這種經(jīng)過多次JSON轉(zhuǎn)換后的字符串,此時,千萬不要輕易使用字符串的.replace方法把多個反斜杠替換為空或者把兩個反斜杠替換為一個反斜杠。那樣做只會導(dǎo)致你的數(shù)據(jù)更難解析。

正確的做法應(yīng)該是嘗試對數(shù)據(jù)一層一層使用json.loads,把它一層一層還原,還原到最初的{’name’: ’kingname’, ’address’: ’杭州’, ’salary’: 99999}這種簡單形式。

好了,今天的介紹就到這里,最后留一個思考題:

還是上面的代碼,現(xiàn)在把PyCharm的調(diào)試模式打開,然后數(shù)一數(shù)info_json和info_json_json里面反斜杠的個數(shù),如下圖所示:

一篇文章搞懂Python反斜杠的相關(guān)問題

為什么在info_json里面,出現(xiàn)了u676du5dde,為什么在info_json_json里面雙引號前是兩根反斜杠,而'u676du5dde'竟然變成了'u676du5dde。

總結(jié)

到此這篇關(guān)于一篇文章搞懂Python反斜杠的文章就介紹到這了,更多相關(guān)Python反斜杠內(nèi)容請搜索好吧啦網(wǎng)以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持好吧啦網(wǎng)!

標(biāo)簽: Python 編程
相關(guān)文章:
主站蜘蛛池模板: 狠狠躁日日躁夜夜躁东南亚 | 国产激情综合五月久久 | 91碰碰| 亚洲综合色自拍一区 | 日韩在线观看 | 午夜精品久久久久久久99黑人 | 精品91久久久 | 亚洲成人一区二区 | 四虎影院最新网站 | 91精品国产综合久久福利软件 | 美女超碰在线 | 日韩精品网站在线观看 | 亚洲一区二区三区四区五区午夜 | 国产三级视频 | 欧美日韩一区不卡 | 一级毛片在线播放 | 伊人精品影院 | 亚洲一区二区国产 | 日韩免费网 | 亚洲视频观看 | 视频一区二区三区中文字幕 | 精品网站999www | 日本妇人成熟免费视频 | 精品国产31久久久久久 | 成年人毛片视频 | 黄色av毛片| 国产成人小视频 | 国产精品久久久久久亚洲调教 | 精品国产不卡一区二区三区 | 可以在线观看的av网站 | 超碰一区二区三区 | 欧美a级成人淫片免费看 | av日韩一区| 欧美日韩一区在线观看 | 欧美日韩专区 | 欧美一二三四成人免费视频 | 亚洲高清电影 | 亚洲综人网 | 国产中文一区二区三区 | 伊人网页 | 天天玩天天操天天射 |