首先 简单说一下历史,ascii码最开始是美国人搞出来的,用来干什么呢?我们知道,计算机只知道0和1,如果我们要计算机识别除了01之外的字符,例如 'a',我们要先告诉计算机‘1100001’就是'a'。跟摩斯密码一样,敲几下三长两短就是代表sos(开玩笑)。所谓的字符编码,就是跟计算机打交 道,跟计算机约定一连串的0101到底代表了什么字符。
ascii编码是鼻祖了,不过由于ascii只有8bits,而且实际上用到的是7位,所以能表示的只有128个字符(00000000~01111111)。这128个字符包括了可打印的普通字符,也包括了不可打印的命令字符。看下表。
这128个字符,对于美国人来说,应该是足够了。但对于一些使用非英文字符的国家地区,例如拉丁文,发文,俄文,中文,这就绝对不够。
所以后来就有人搞了扩展的ascii,也有人搞了新的字符编码,在原来的8位基础上扩展到16位,32位。我们常见的ISOxxxx,GB2312,GBK,BIG 5,unicode....都是后来发展起来的。
虽然这 些字符编码有些之间是不兼容,例如就中文而言,gb2312是不兼容unicode的,就是说,同一个汉字,底层约定的二进制是不一样的。网页上的乱码就 是出于此。但是这些后来发展的字符编码都向下兼容了ascii。这就是为什么utf-8(unicode)和gbk/gb2312显示英文是不会有乱码, 而显示中文会容易乱码。因为他们都兼容ascii,所以52个字母的显示都是按ascii标准。但ascii是没中文的,所以unicode,gbk都按 各自标准解释了。
从简单入手,我们先来看ascii标准的编码。弄清楚PHP里面的二进制,十进制,八进制,十六进制,字符的表示与转化。
先来说一下一些表示法:
Dec:十进制
Hex:十六进制
Oct:八进制
Bin:二进制
所以数字16表示为:16D = 01H = 018O = 1000 0000B
上面这些都是一些表示法而已。方便给人看的。
=================================================================================================
现在有一个需求,在程序中输入一个十六进制数, 让计算机显示对应的ascii字符。例如就41H就对应A。
方法一:
用 转义字符:转义字符里提供\xdd和\ddd, \xdd表示十六进制,\ddd表示八进制
所以我们可以:
- <?php
- echo "\x41"; //十六进制,\x开头
- echo "\101"; //八进制,随便几位
- ?>
注意:转义字符只提供了十六进制和八进制转换到字符,没有提供二进制、十进制转换到字符。所以要用另外一种方法。
方法二:
用php里面的 chr()函数。这个函数参数很简单,就是ascii码对应的十进制,十六进制,八进制。
十进制:直接写整数
八进制: 第一位肯定是0,后面随便几位
十六进制:0xdd
二进制: 字符串
注意:一定要记清楚十六进制是0xdd
- <?php
- echo chr(65); //十进制,由于都输数,所以没必要加双引号了
- echo chr(0x41); //十六进制
- echo chr(0101); //八进制,三位,最高位补零
- echo chr('01000001'); //二进制,注意,这里的二进制一定要看做字符串,加引号!上面三个都不用加
- ?>
方法三
用php里面的 printf/sprintf()函数格式化输出
- <?php
- printf("%c", 0x41); //第二个参数一定不能用单/双引号
- printf("%c", 0101); //第二个参数一定不能用单/双引号
- printf("%c", 65); //第二个参数一定不能用单/双引号
- printf("%c", '01000001');
- ?>
第二个参数格式基本跟chr()的一样,8进制,10进制,16进制都不加引号,二进制就要加引号。8进制首位为0,16进制首位为0x。
====================================================================================
现在是根据一个字符提取ascii表中的对应值
方法一:
ord()函数
- <?php
- echo ord('A');
- ?>
输出结果是65。因而这个函数只能从字符转化到 十进制。
注意:这个方法只提取第一个字符。如果是一个字符串,那就没办法处理后面的字符了。
方法二:
bin2hex()函数:将字符[串]转换为 16进制
- <?php
- echo bin2hex('A');
- ?>
输出结果是41。
注意,这个41只是字面数值,没有16进制的意义。
这个函数不能用一个二进制‘01101...’直接转到16进制,只能由字符串转到16进制,真怪
这个函数可以处理字符串
printf/sprintf()函数
.....发现都不行
所以,只能先用ord()转化为十进制,再转为二进制,八进制。(以后再看看pack这个函数)
====================================================================================
各种进制 的转换:
bindec():二进制转十进制
- <?php
- echo bindec(1100); //输出12,可以加引号,也可以不加
- ?>
decbin():十进制转二进制,一样用
dechex() :十进制转16进制
hexdec():16进制转10进制(参数直接写值,不用写0x)
octdec():八进制转10进制
decoct():10进制转8进制
base_convert(要转换的数,原进制,目标进制):任意进制转换
<?php
echo base_convert(123, 6, 2);
?>
注意:上面的这些转换函数,由于都是数学处理函数,所以参数都不需要是字符串形式(不需要加引号),直接写数值就行了。