文章詳情頁
python - 把<dl></dl>標簽包含進去如何拿到我想要的內容
瀏覽:123日期:2022-07-21 08:07:19
問題描述
1.我把<dl>標簽加進去拿到的是空內容,我該怎么寫匹配規則,不加<dl>標簽倒是可以拿到想要的內容2.問題代碼
pattern = re.compile(r’<dl>.*?<dd><a href='http://www.gepszalag.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’)
3.不把<dl>標簽加進去可以拿到想要的內容
4.附上網頁源代碼
<dl><dt>《明末工程師》正文</dt><dd><a href='http://www.gepszalag.com/book/1440/xx'>第一章 穿越后的窘境</a></dd></dl>
問題解答
回答1:# 你可能需要加個模式# re.S 使 . 匹配包括換行在內的所有字符pattern = re.compile(r’<dl>.*?<dd><a href='http://www.gepszalag.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>’, re.S)print re.findall(pattern, a)回答2:
// /需要轉義下<dl>.*?<dd><a href='http://www.gepszalag.com/wenda/(.*?)'>(.*?)</a></dd>.*?</dl>
相關文章:
1. 如何解決Centos下Docker服務啟動無響應,且輸入docker命令無響應?2. 我在centos容器里安裝docker,也就是在容器里安裝容器,報錯了?3. 微信小程序session無法緩存的問題4. 怎么用 css3實現波浪底紋效果?5. vue.js - 關于Vue-cli項目在VPS中用Nginx部署完請求頁面app.js找不到提示404錯誤。6. docker 17.03 怎么配置 registry mirror ?7. html - 這種錯位的時間軸怎么布局,然后用css實現?8. 基于Nginx的Wordpress安裝失敗?9. css3 - 何時需要 flex-basis: 100% ?10. mysqld無法關閉
排行榜
