如何用Python识别「文本字符」属于哪个国家？

赚小钱钱养家糊口 05-06 145

前言：

现时兄弟们对“python判断中文字符”大概比较关心，你们都需要学习一些“python判断中文字符”的相关内容。那么小编也在网上网罗了一些对于“python判断中文字符””的相关知识，希望同学们能喜欢，各位老铁们一起来学习一下吧！

前几天，在粉丝群碰到这样一个需求。

人生苦短，快学Python！

今天就带你来解决这个问题。

这里使用的是langid库，但是必须提前安装。

pip install langid

在langid库中，有一个classify()方法，它可以帮助我们识别不同国家的文本，最终返回一个元组，第一个参数，是该语言最可能的国家；第二个参数，是置信度，表示有多大把握。

我们直接上案例，为大家做一个演示。下面有5个字符串，分别是不同国家关于"你好"的发音。

import langidstr1 = '你好'str2 = 'hello'str3 = '안녕하세요'str4 = 'こんにちは'str5 = 'Добрый день'langid.classify(str1)langid.classify(str2)langid.classify(str3)langid.classify(str4)langid.classify(str5)

结果如下：

有了这个库，在做某个项目时，我们就可以筛选掉其它不需要的语种，是不是巴适得板。

内容源自网络 * END * 如侵请联系删除

本文地址：http://www.longkongtuishu.com/cabedAGsKAFYCCw.html

标签： #python判断中文字符