龙空技术网

轻松学python,帮你解决文件乱码问题

一拳要你猪命 68

前言:

今天大家对“python网页乱码”大体比较关怀,同学们都想要分析一些“python网页乱码”的相关文章。那么小编也在网摘上网罗了一些关于“python网页乱码””的相关资讯,希望小伙伴们能喜欢,兄弟们快快来学习一下吧!

#你是否经历过这样的场景

临时需要处理一件急活儿

打开关键的文件

结果发现全是乱码

完全打乱了工作节奏

#不慌,这里就有一份指南!

其实,出现乱码

是因为编码不一致

导致计算机在“交流”时

出现“乱读”的情况

只要我们在编辑器里设置好

轻松几步就能解决乱码

往下翻看,解锁答案

那些事01

#编码的概念

什么是编码呢?简而言之就是把我们能看懂的数据转化成计算机可以读懂的数据。

最初的计算机编码方式是英文,也就是最初的ASCII码。

ASCII码是计算机刚刚起步的时候用的编码方式,一直沿用至今。虽然可以表示的字符特别少,但简单易用。

后来计算机全球方面的普及,ASCII 码只能将英文文件转化成计算机能看懂的数据的问题就暴露了出来。

于是各个国家和地区也都开始根据本土语言开发出了各种编码。

但随着世界各国联系越来越紧密,计算机通讯用得越加频繁,不同国家编码格式对彼此之间的交流造成了很大的障碍。

后来就有了统一编码的出现。

那些事02

#统一编码的诞生

国际组织ISO(国际标准化组织简称)对各国编码进行了汇总,就是Unicode字符集。

它不是某一种具体的编码,而是UTF-8,UTF-16,UTF-32三种编码的统称。

因为我们中国的电脑一般默认是UTF-16的编码,所以日常说的Unicode编码主要是UTF-16。

本国电脑互相交流时,用本国编码字节长度更小,相同的计算机存储空间里下能"说"更多内容。

在Unicode还没开发出来时,写出来的文本和开发出来的程序全是用本国编码。这些文件全部改成Unicode编码是一个非常大的工作量。

计算机也主要是基于这点原因,到目前还没统一使用Unicode编码。

而且计算机在“交流”时也很容易出现“乱读”的编码问题。

那些事03

#编码问题的出现

这种乱码大家在电脑打开别人发来的文件时或多或少都遇到过一两次吧。

这是编码问题的直观体现。

编码问题产生的原因总结出来就是4个字 —— 鸡同鸭讲。

你的电脑读写文本的编码也许跟别人发来的文件编码不一致,而用UTF-8编码打开一个GBK编码写出的文件,必定是会出现"乱读"的情况。

想要解决出现乱码的问题,只需要简单几步就可以完成:

1.设定编码格式

打开VS Code,点击编码设置,选择UTF-8即可。

2.彻底解决乱码问题

打开设置,找到文件选项。

在Auto Guess Encoding上打钩,即可每次打开文件根据文件本身的编码自动选择编码来打开!

#THE END

避免乱码问题

轻松学习编程

标签: #python网页乱码 #python写文件乱码