1. 编程学习网 > 编程教程 > Python教程 > python字符编码与注释

python字符编码与注释

字符编码与注释
写字符编码也称字集码,通俗来说就是是把现实中各种字符,如字母、数字、符号等通过一定的规则转换成计算机可以处理并存储的二进制数。
常见的字符编码如下表所示:

编码名称 制定时间 作用范围
ASCII 1967年 可以显示现代英语和其他西欧语言
GB2312 1980年 简体中文字符集,可兼容ASCII
Unicode 1991年 包含世界上所有字符,国际标准字符集
GBK 1995年 GB2312的扩展
UTF-8 1992年 针对Unicode的可变长度字符编码

 1.ASCII

学过C语言的同学不会陌生,ASCII码是最早的一套基于拉丁字母的单字符编码,也是其他字符编码的基础。ASCII码一共是255个字符编码,其中前127个是一些大小写字符,数字以及特殊符号,后128个是之后拓展的。其中的每个字符都对应唯一的一个编码,如大写字母A的编码是65,小写a的编码是97,在python中想要获得单个字符的编码方式是使用ord()函数,反之将数字编码转换为字符可以使用chr()函数如:

2.GB2312和GBK

ASCII码不能表示中文,对于中国的汉字来说想在计算机中存储是很困难的,因此中国制定了GB2312编码,于1980年发布,1981年5月1日开始实施,其中共收入6763个汉字和682个非汉字图形字符,解决了计算机存储汉字的难题。在此基础上,国家在1995年发布了兼容GB2312的GBK编码,共收录了21003个汉字(包括繁体),还支持国际标准ISO/IEC10646-1和国家标准GB13000-1中的全部中日韩汉字。

3.Unicode和UTF-8

世界上的编码方式很多,不只我们这里介绍的几种,如果编码方式和我们想要使用的文本文件不兼容,那么就会出现乱码的形式。所以需要一种能将世界上所有符号都集合起来的字符集,这就是Unicode,目前的Unicode已经发展成一个很大的集合,可以容纳上百万的符号。而UTF-8就是计算机中使用范围很广的一种Unicode实现方式,UTF-8最大的优点是,它在表示某一个符号时可以使用1到4个字节,然后根据不同的符号变化字节的长度。

4.注释

我们在写程序时,及时地添加一些程序语句的说明是一个很好的习惯,因为随着我们学习的深入,写的程序越来越复杂,或许,你在写程序时思路很明了,但是时隔一段时间再回头来看自己之前的程序就会有地方看不到懂,而且我们在工作和学习中难免要去阅读别人代码,不同的人写代码时思路或许是不一样的,所以如果没有任何注释,我们不一定能读懂别人的代码,同样别人也不一定能读懂你的代码。
在Python中可以用‘#’来写单行注释,用一对的三个单引号 或者三个双引号 来表示多行注释,编译器在执行时遇到注释符号,会自动跳过。如:


本文由IT教学网整理发布,转载请注明出处:http://www.itjx.com/jiaocheng/Python/2020/0113/502.html

联系我们

在线咨询:点击这里给我发消息

咨询电话:400-998-2681

工作时间:7*24小时无休