龙空技术网

模糊字符串匹配:FuzzyWuzzy

Python部落 981

前言:

现时我们对“python模糊匹配字符串在往前筛选最近的另一个关键词”大约比较关切,姐妹们都想要了解一些“python模糊匹配字符串在往前筛选最近的另一个关键词”的相关内容。那么小编在网上汇集了一些关于“python模糊匹配字符串在往前筛选最近的另一个关键词””的相关资讯,希望朋友们能喜欢,我们一起来了解一下吧!

FuzzyWuzzy

模糊字符串匹配,它使用Levenshtein Distance来计算简单易用的包中序列之间的差异。

前置条件

Python 2.7 or higher

difflib

python-Levenshtein(可选的,在字符串匹配中提供4-10倍的加速,不过在某些情况下可能导致不同的结果)

测试

pycodestyle

hypothesis

pytest

安装

使用PIP经由PyPI安装

或者用如下命令安装

使用PIP经由Github安装

添加你的requirementrequirements.txt文件(然后运行 pip install -r requirements.txt)

经由Git手动安装

用法

简单匹配率

部分匹配率

符号排序后匹配率

符号集合匹配率

Process

你也可以给extractOne方法传额外的参数,使它使用一个特定的积分器(scorer).一个典型的用法是匹配文件路径:

已知移植

FuzzyWuzzy也被移植到了其他语言!以下是我们知道的一些移植:

Java: xpresso"s fuzzywuzzy implementation

Java: fuzzywuzzy (java port)

Rust: fuzzyrusty (Rust port)

JavaScript: fuzzball.js (JavaScript port)

C++: Tmplt/fuzzywuzzy

C#: fuzzysharp (.Net port)

Go: go-fuzzywuzz (Go port)

英文原文:

译者:恩 泽

标签: #python模糊匹配字符串在往前筛选最近的另一个关键词 #python匹配网页 #字符串模糊查询 #字符串模糊匹配算法 #快速中文字符串模糊匹配算法