龙空技术网

使用python的正则表达式的匹配规则P来匹配HTML标签及内容

厚积薄发爱python 190

前言:

今天小伙伴们对“html p”大约比较重视,同学们都想要剖析一些“html p”的相关内容。那么小编也在网上网罗了一些有关“html p””的相关知识,希望看官们能喜欢,朋友们一起来学习一下吧!

注意事项:P为大写

代码如下所示:

import re #必须导入内置的正则表达式re模块str='<html><p1><b>zhangsan</b></p1></html>' #设置字符串为html3个标签以及标签内部内容,并赋值给strpattern1=re.compile(r'<(?P<name1>\w+)><(?P<name2>\w+)><(?P<name3>\w+)>(.+)</(?P=name3)></(?P=name2)></(?P=name1)>')#上面这行是设置html3个标签以及标签内部内容的正则表达式匹配规则result1=re.match(pattern1,str) #代表从头开始在字符串str中按照匹配规则pattern1进行匹配,并将匹配结果赋值给result1print("result1:",result1) #打印匹配的结果result1的值print("result1.span():",result1.span()) #打印匹配的结果result1所在的起始位置和结束位置print("result1.group():",result1.group()) #按照分组原则打印匹配的结果result1的分组值

代码运行结果如下:

result1: <re.Match object; span=(0, 37), match='<html><p1><b>zhangsan</b></p1></html>'>

result1.span(): (0, 37)

result1.group(): <html><p1><b>zhangsan</b></p1></html>

图片示例如下:

标签: #html p #html标记的正则表达式 #javahtml标签正则表达式 #python正则匹配文件内容