正則表達(dá)式之文本模式的匹配和查找
1、需求
我們想要按照特定的文本模式進(jìn)行匹配或查找。
2、解決方案
如果想要匹配的只是簡(jiǎn)單的文字,那么通常只需要用基本的字符串方法就可以了,比如str.find()、str.endswith()、str.startswith()或類似函數(shù)。
示例:
text='mark ,帥哥,18,183 帥,mark'
print(text=='mark')
print(text.startswith('mark'))
print(text.startswith('mark'))
print(text.find('帥哥'))
結(jié)果:
False
True
True
6
如果更為復(fù)雜的匹配則需要使用正則表達(dá)式以及re模塊。為了說(shuō)明使用正則表達(dá)式的基本流程,假設(shè)我們想匹配以數(shù)字形式構(gòu)成的日期,比如"11/27/2018"。示例如下:
import re
text1='11/27/2018'
text2='Nov 27, 2018'
if re.match(r'\d+/\d+/\d+',text1):
print('符合模型:數(shù)字/數(shù)字/數(shù)字')
else:
print('不符合模型:數(shù)字/數(shù)字/數(shù)字')
if re.match(r'\d+/\d+/\d+',text2):
print('符合模型:數(shù)字/數(shù)字/數(shù)字')
else:
print('不符合模型:數(shù)字/數(shù)字/數(shù)字')
運(yùn)行結(jié)果:
符合模型:數(shù)字/數(shù)字/數(shù)字
不符合模型:數(shù)字/數(shù)字/數(shù)字
如果打算針對(duì)同一模型做多次匹配,那么通常會(huì)先將正則表達(dá)式模式預(yù)編譯成一個(gè)模式對(duì)象。
例如:
import re
text1='11/27/2018'
text2='Nov 27, 2018'
datepat=re.compile(r'\d+/\d+/\d+')
if datepat.match(text1):
print('符合模型:數(shù)字/數(shù)字/數(shù)字')
else:
print('不符合模型:數(shù)字/數(shù)字/數(shù)字')
if datepat.match(text2):
print('符合模型:數(shù)字/數(shù)字/數(shù)字')
else:
print('不符合模型:數(shù)字/數(shù)字/數(shù)字')
結(jié)果:
符合模型:數(shù)字/數(shù)字/數(shù)字
不符合模型:數(shù)字/數(shù)字/數(shù)字
match()方法總是嘗試在字符串的開(kāi)頭找到匹配項(xiàng)。如果想針對(duì)整個(gè)文本搜索出所有的匹配項(xiàng),那么就應(yīng)該使用findall()方法,例如:
import re text='今天是 11/27/2018,昨天是11/26/2018' datepat=re.compile(r'\d+/\d+/\d+') print(datepat.findall(text))
運(yùn)行結(jié)果:
['11/27/2018', '11/26/2018']
當(dāng)定義正則表達(dá)式時(shí),我們常會(huì)將部分模式用括號(hào)包起來(lái)的方式引入捕獲組,捕獲組通常簡(jiǎn)化后續(xù)對(duì)匹配文本的處理,因?yàn)槊總€(gè)組的內(nèi)容都可以單獨(dú)提取出來(lái)。findall()方法搜索整個(gè)文本并找出所有的匹配項(xiàng)然后將它們以列表的形式返回。如果想以迭代的方式找出匹配項(xiàng),可以使用finditer()方法。
例如:
import re
#加入捕獲組
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
m=datepat.match('11/27/2018')
print(m.group(0))
print(m.group(1))
print(m.group(2))
print(m.group(3))
print(m.groups())
month,day,year=m.groups()
print(month)
print(day)
print(year)
print('*'*20)
text='今天是 11/27/2018,昨天是11/26/2018'
for month,day,year in datepat.findall(text):
print('{}-{}-{}'.format(year,month,day))
print('*'*20)
for m in datepat.finditer(text):
print(m.groups())
結(jié)果:
11/27/2018
11
27
2018
('11', '27', '2018')
11
27
2018
********************
2018-11-27
2018-11-26
********************
('11', '27', '2018')
('11', '26', '2018')
3、分析
本節(jié)主要介紹了re模塊對(duì)文本匹配和搜索的基本功能,首先用re.compile()對(duì)模式進(jìn)行編譯,然后使用想match()、findall()、finditer()這樣的方法做匹配和搜索。
當(dāng)指定模式時(shí)我們通常會(huì)使用原始字符串,例如:
r'(\d+)/(\d+)/(\d+)'
這樣的字符串不會(huì)對(duì)反斜字符轉(zhuǎn)義,這在正則表達(dá)式中非常有用。否則,我們需要用雙反斜杠線來(lái)標(biāo)識(shí)一個(gè)單獨(dú)的'',例如:
'(\\d+)/(\\d+)/(\\d+)'
請(qǐng)注意match()方法只會(huì)檢查字符的開(kāi)頭,有可能出現(xiàn)的匹配的結(jié)果并不是你想要的,例如:
import re
#加入捕獲組
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)')
m=datepat.match('11/27/2018xxxx')
print(m)
結(jié)果:
<re.Match object; span=(0, 10), match='11/27/2018'>
如果想要精確匹配,可以加一個(gè)結(jié)束標(biāo)記:$
import re
#加入捕獲組
datepat=re.compile(r'(\d+)+/(\d+)+/(\d+)$')
m1=datepat.match('11/27/2018xxxx')
m2=datepat.match('11/27/2018')
print(m1)
print(m2)
結(jié)果:
None
<re.Match object; span=(0, 10), match='11/27/2018'>
如果只是執(zhí)行簡(jiǎn)單的文本匹配和搜索操作,可以省略編譯步驟。
如果打算執(zhí)行很多匹配或查找操作的話,通常需要先將模式編譯然后重復(fù)使用。模塊級(jí)的函數(shù)會(huì)對(duì)最近編譯過(guò)的模式做緩存處理,并且比較省步驟。
總結(jié)
以上所述是小編給大家介紹的正則表達(dá)式之文本模式的匹配和查找,希望對(duì)大家有所幫助,如果大家有任何疑問(wèn)請(qǐng)給我留言,小編會(huì)及時(shí)回復(fù)大家的。在此也非常感謝大家對(duì)我們網(wǎng)站的支持!
如果你覺(jué)得本文對(duì)你有幫助,歡迎轉(zhuǎn)載,煩請(qǐng)注明出處,謝謝!
上一篇:python 正則表達(dá)式獲取字符串中所有的日期和時(shí)間
欄 目:正則表達(dá)式
下一篇:淺談?wù)齽t表達(dá)式中的分組和引用實(shí)現(xiàn)方法
本文標(biāo)題:正則表達(dá)式之文本模式的匹配和查找
本文地址:http://m.jygsgssxh.com/a1/zhengzebiaodashi/11127.html
您可能感興趣的文章
- 01-11正則表達(dá)式實(shí)現(xiàn)添加、刪除、替換三種功能
- 01-11python 用正則表達(dá)式篩選文本信息的實(shí)例
- 01-11正則表達(dá)式之匹配數(shù)字范圍
- 01-11python爬蟲(chóng)正則表達(dá)式之處理?yè)Q行符
- 01-11正則表達(dá)式匹配路由的實(shí)現(xiàn)代碼
- 01-11正則表達(dá)式截取身份證號(hào)碼加密的方法
- 01-11js正則表達(dá)式 匹配兩個(gè)特定字符間的內(nèi)容示例
- 01-11MySQL使用正則表達(dá)式進(jìn)行查詢操作經(jīng)典實(shí)例總結(jié)
- 01-11python正則表達(dá)式之對(duì)號(hào)入座篇
- 01-11詳解正則表達(dá)式實(shí)現(xiàn)二代身份證號(hào)碼驗(yàn)證


閱讀排行
- 1C語(yǔ)言 while語(yǔ)句的用法詳解
- 2java 實(shí)現(xiàn)簡(jiǎn)單圣誕樹(shù)的示例代碼(圣誕
- 3利用C語(yǔ)言實(shí)現(xiàn)“百馬百擔(dān)”問(wèn)題方法
- 4C語(yǔ)言中計(jì)算正弦的相關(guān)函數(shù)總結(jié)
- 5c語(yǔ)言計(jì)算三角形面積代碼
- 6什么是 WSH(腳本宿主)的詳細(xì)解釋
- 7C++ 中隨機(jī)函數(shù)random函數(shù)的使用方法
- 8正則表達(dá)式匹配各種特殊字符
- 9C語(yǔ)言十進(jìn)制轉(zhuǎn)二進(jìn)制代碼實(shí)例
- 10C語(yǔ)言查找數(shù)組里數(shù)字重復(fù)次數(shù)的方法
本欄相關(guān)
- 01-11正則表達(dá)式實(shí)現(xiàn)添加、刪除、替換三
- 01-11正則表達(dá)式之匹配數(shù)字范圍
- 01-11python 用正則表達(dá)式篩選文本信息的實(shí)
- 01-11正則表達(dá)式匹配路由的實(shí)現(xiàn)代碼
- 01-11python爬蟲(chóng)正則表達(dá)式之處理?yè)Q行符
- 01-11js正則表達(dá)式 匹配兩個(gè)特定字符間的
- 01-11正則表達(dá)式截取身份證號(hào)碼加密的方
- 01-11python正則表達(dá)式之對(duì)號(hào)入座篇
- 01-11MySQL使用正則表達(dá)式進(jìn)行查詢操作經(jīng)典
- 01-11詳解正則表達(dá)式實(shí)現(xiàn)二代身份證號(hào)碼
隨機(jī)閱讀
- 08-05織夢(mèng)dedecms什么時(shí)候用欄目交叉功能?
- 01-10SublimeText編譯C開(kāi)發(fā)環(huán)境設(shè)置
- 08-05dedecms(織夢(mèng))副欄目數(shù)量限制代碼修改
- 04-02jquery與jsp,用jquery
- 01-10delphi制作wav文件的方法
- 01-10使用C語(yǔ)言求解撲克牌的順子及n個(gè)骰子
- 01-10C#中split用法實(shí)例總結(jié)
- 08-05DEDE織夢(mèng)data目錄下的sessions文件夾有什
- 01-11Mac OSX 打開(kāi)原生自帶讀寫(xiě)NTFS功能(圖文
- 01-11ajax實(shí)現(xiàn)頁(yè)面的局部加載


