龙空技术网

如何用Python识别「文本字符」属于哪个国家?

赚小钱钱养家糊口 131

前言:

现时兄弟们对“python判断中文字符”大概比较关心,你们都需要学习一些“python判断中文字符”的相关内容。那么小编也在网上网罗了一些对于“python判断中文字符””的相关知识,希望同学们能喜欢,各位老铁们一起来学习一下吧!

前几天,在粉丝群碰到这样一个需求。

人生苦短,快学Python!

今天就带你来解决这个问题。

这里使用的是langid库,但是必须提前安装。

pip install langid

langid库中,有一个classify()方法,它可以帮助我们识别不同国家的文本,最终返回一个元组,第一个参数,是该语言最可能的国家;第二个参数,是置信度,表示有多大把握。

我们直接上案例,为大家做一个演示。下面有5个字符串,分别是不同国家关于"你好"的发音。

import langidstr1 = '你好'str2 = 'hello'str3 = '안녕하세요'str4 = 'こんにちは'str5 = 'Добрый день'langid.classify(str1)langid.classify(str2)langid.classify(str3)langid.classify(str4)langid.classify(str5)

结果如下:

有了这个库,在做某个项目时,我们就可以筛选掉其它不需要的语种,是不是巴适得板。

内容源自网络 * END * 如侵请联系删除

标签: #python判断中文字符