龙空技术网

第三期:不同类型标签如何用不同批量标注规则标注(上)

小包公说合同 73

前言:

如今咱们对“正则去掉所有标签的方法”大概比较关心,看官们都想要学习一些“正则去掉所有标签的方法”的相关资讯。那么小编在网络上搜集了一些关于“正则去掉所有标签的方法””的相关文章,希望朋友们能喜欢,看官们快快来学习一下吧!

小包公法律实证课堂继续上课啦!

上一期我们介绍了数据标注的四种方式,也收到了友友们的积极反馈。接下来我们就不同标签类型,如何用不同的批量标注规则标注一一进行讲解。友友们可以根据研究需求,对不同类型的标签,选择适合的批量标注规则标注数据。如果在使用小包公法律实证分析平台的过程中,遇到无法解决的问题,可以及时反馈给小包,同时也欢迎各位友友们提出自己宝贵的意见,小包都会认真查看哟。

本期让我们结合示例视频,先对一般标签、分类标签、数量标签,如何用关键词抽取(智推)、关键词抽取(支持正则表达式)这两种批量标注规则抽取标注进行介绍讲解。

一、一般标签如何用不同的批量标注规则抽取标注

一般标签在选择关键词抽取(智推)时,需要不断添加划词原文,使得标注数据更加全面完善,适用于无规则书写基础的研究人员使用。选择关键词抽取(支持正则表达式)时,需要观察文书,总结文书表述并自己书写规则,适合有正则表达式基础的研究人员使用。

视频加载中...

二、分类标签如何用不同的批量标注规则抽取标注

分类标签标注时,除具有和一般标签的共性外,由于标签属性较特殊,需要根据研究需求自定义标签分类。标签分类支持手动编辑、导出excel格式导入,还可以通过对划词原文进行“抽取文本”操作,“抽取文本”内容会自动添加成为标签分类名称。如标签分类已有分类名称,对划词原文操作“抽取文本”时,“抽取文本”内容还支持勾选为某个已有分类的近义词。

注意:分类标签生成的正则表达式承担“定位句”功能,分类名称和近义词承担“抽取”功能,会在定位句范围内抽取。所以定位句命中的范围需要大于标签分类名称、近义词命中的范围,这样才能实现抽取,否则会出现无法成功标注的情况。

视频加载中...

三、数量标签如何用不同的批量标注规则抽取标注

数量标签用于标注研究数值变量,需要自定义计量单位名称、单位多种表述、转换比例等。在不定义计量单位时,会抽取匹配文本中的所有数值;当定义计量单位后,会抽取匹配文本中符合计量单位表述的数值。

视频加载中...

标签: #正则去掉所有标签的方法