前言:
现时兄弟们对“python判断中文字符”大概比较关心,你们都需要学习一些“python判断中文字符”的相关内容。那么小编也在网上网罗了一些对于“python判断中文字符””的相关知识,希望同学们能喜欢,各位老铁们一起来学习一下吧!前几天,在粉丝群碰到这样一个需求。
人生苦短,快学Python!
今天就带你来解决这个问题。
这里使用的是langid库,但是必须提前安装。
pip install langid
在langid库中,有一个classify()方法,它可以帮助我们识别不同国家的文本,最终返回一个元组,第一个参数,是该语言最可能的国家;第二个参数,是置信度,表示有多大把握。
我们直接上案例,为大家做一个演示。下面有5个字符串,分别是不同国家关于"你好"的发音。
import langidstr1 = '你好'str2 = 'hello'str3 = '안녕하세요'str4 = 'こんにちは'str5 = 'Добрый день'langid.classify(str1)langid.classify(str2)langid.classify(str3)langid.classify(str4)langid.classify(str5)
结果如下:
有了这个库,在做某个项目时,我们就可以筛选掉其它不需要的语种,是不是巴适得板。
内容源自网络 * END * 如侵请联系删除
版权声明:
本站文章均来自互联网搜集,如有侵犯您的权益,请联系我们删除,谢谢。
标签: #python判断中文字符