龙空技术网

很实用的一篇基础知识文:Python3解决读取中文文件txt编码的问题

程序员陈平安 510

前言:

眼前朋友们对“python读取文件中文乱码”大约比较关切,姐妹们都需要学习一些“python读取文件中文乱码”的相关内容。那么小编同时在网摘上搜集了一些对于“python读取文件中文乱码””的相关内容,希望同学们能喜欢,大家一起来学习一下吧!

今天为大家分享一篇Python3 解决读取中文文件txt编码的问题,具有很好的参考价值,希望对大家有所帮助。

问题描述

尝试用Python写一个Wordcloud的时候,出现了编码问题。

照着网上某些博客的说法添添改改后,结果是变成了“UnicodeDecodeError: ‘utf-8' codec can't decode byte…”这个错误。

捣鼓了一天啊,TXT(此处为本人现下内心表情)。最后,干脆写个最简单的文件读取,竟然还是报错。于是就考虑是不是txt的编码问题,因为读取的txt文件是在Mac上面新建的纯文本文件,一时没找到在哪里查看编码,最后拷贝到Windows系统上,查看了txt文件的编码,竟然是ASCII,不是我最爱的utf-8,Mac你辜负了我对你的一番信任啊!

解决方法

将txt文件的编码格式改为utf-8即可

此外,在打开文件的时候,要加上第三个参数encoding=‘utf8'(没有横杠)。

嗨喽:正在学习python的小伙伴或者打算学习的,可以私信小编“07”领取资料!

下面附上第一次成功显示的词云的源码(参考网上他人的,注释很详细)

以上这篇Python3 解决读取中文文件txt编码的问题就是小编分享给大家的全部内容了,希望能给大家一个参考

最后多说一句,小编是一名python开发工程师,这里有我自己整理了一套最新的python系统学习教程,包括从基础的python脚本到web开发、爬虫、数据分析、数据可视化、机器学习等。想要这些资料的可以关注小编,并在后台私信小编:“07”即可领取。

标签: #python读取文件中文乱码