文章詳情頁

正則表達式 - 請問用 Python 如何匹配漢語拼音？

瀏覽：168日期：2022-06-30 09:24:43

問題描述

比如用正則表達式匹配出 shá 這個拼音。 ps:之前說的可能不明確，我用了 “ 比如 ” 兩字哈，就是待處理文本里有拼音，但是不知道具體拼音是什么，需要找出這些拼音，待處理文本會有中文、拼音、符號（，。：之類的），所以請不要回答諸如re.search(u’shá’,text) 要正則哈，不是簡單固定的字符串。。。

問題解答

回答1：

import reregex = re.compile(r’b[a-z]*[āáǎàōóǒòêēéěèīíǐìūúǔùǖǘǚǜüńň?ɑɡ]+[a-z]*b’)text = 'Thǐs ís à pìnyin abóut shá'm = regex.findall(text)print(m)

匹配結果：[’ís’, ’à’, ’pìnyin’, ’abóut’, ’shá’]沒有匹配第一個Thǐs，因為默認拼音都是小寫，排除了大寫。

回答2：

你是要匹配所有合法的拼音嗎？

如果是，你去找個字典的拼音索引，把里邊的所有拼音全部 | 到一起就可以了。也只能這樣，因為拼音不是根據正則，或者其它某種機械的規則定義出來的。你想不漏又不多就只能這樣了，反正也沒多少個。

回答3：

>>> import re>>> d=’shá’>>> data=’This is a pinyin about shá’>>> re.search(d,data)<_sre.SRE_Match at 0x404e308>

Python 編程

上一條：python - 我該怎么寫正則?下一條：python - pyqt 調用tablewidget窗口時無法顯示窗口內容

相關文章：

1. docker 下面創建的IMAGE 他們的 ID 一樣？這個是怎么回事？？？？2. 在應用配置文件 app.php 中找不到’route_check_cache’配置項3. html按鍵開關如何提交我想需要的值到數據庫4. css - width設置為100%之后列表無法居中5. ios - vue－cli開發項目webstrom會在stylus樣式報錯，飆紅，請大神幫忙6. css3 - 怎么感覺用 rem 開發的不多啊7. python - 在pyqt中做微信的機器人,要在表格中顯示微信好友的名字,卻顯示不出來,怎么解決?8. html5 - 用Egret寫的小游戲，怎么分享到微信呢？9. javascript - 一個頁面有四個圖片，翻頁的時候想固定住某個圖片然后翻頁，如何實現呢?10. objective-c - 自定義導航條為類似美團的搜索欄樣式

排行榜

					
					docker  下面創建的IMAGE 他們的 ID 一樣？這個是怎么回事？？？？
在應用配置文件 app.php 中找不到’route_check_cache’配置項
html按鍵開關如何提交我想需要的值到數據庫
html5 - 用Egret寫的小游戲，怎么分享到微信呢？
css - width設置為100%之后列表無法居中
ios - vue－cli開發項目webstrom會在stylus樣式報錯，飆紅，請大神幫忙
css - BEM 中塊(Block)有木有什么標準 何時決定一個部分提取為塊而不是其父級的元素呢(Element)?~
python - 在pyqt中做微信的機器人,要在表格中顯示微信好友的名字,卻顯示不出來,怎么解決?
javascript - 一個頁面有四個圖片，翻頁的時候想固定住某個圖片然后翻頁，如何實現呢?
objective-c - 自定義導航條為類似美團的搜索欄樣式
css3 - 怎么感覺用 rem 開發的不多啊
				

熱門標簽

久久福利_99r_国产日韩在线视频_直接看av的网站_中文欧美日韩_久久一

正則表達式 - 請問用 Python 如何匹配漢語拼音？