【PHP入门到精通】:Ch05:字符串处理

Ch05: 字符串简介

5.1 字串说明

字符串是指由>=0个字符构成的一串字符,所以叫字符串。这里所说的字符主要包括以下几种类型:

数字类型:如1, 2, 3, 4等。

字母类型:如果a, b, c, d等。

特殊字符:如#, $, %, ^, &等。

不可见字符:如\n, \r, \t等。

其中不可见字符是比较特殊的一组字符,它用来控制字符串格式化输出,在浏览器上不可见,只能看到字符串输出的结果。

不可见字符示例:

echo fruit\rpear\napple\tbanana

==>

fruit pear apple banana

提示:运行结果在浏览器上不可见,或者说是非预期结果。需要在IE浏览器中选择"查看"/"源文件"命令来查看字符串的输出结果

5.2 单引号 与 双引号

双引号中的内容是要经过PHP语法分析器解析,任何变量在双引号中都会被转换(替换)成它的值进行输出显示;

单引号中的内容是"所见即所得"的,无论有没有变量,都会被当作普通字符进行原样输出。

在进行SQL查询之前,所有字串都必须加单引号,以避免可能的注入漏洞和SQL错误。

注意:

1) 理论上讲,单引号要快一些,但是如果需要打印一个变量的值,则必须使用双引号。

2) 有效的HTML常常包括许多用双引号括住的属性,所以当利用PHP打印HTML时,使用单引号最容易。

$name='JACK'

双引号调用变量$name: my name is JACK

单引号调用变量\$name: my name is $name

5.2 字符串连接符

句点就是字符串连接符,它可以把多个字符串连接成一个字符串。

但句点无法实现大量简单字串的连接,PHP允许程序员在双引号中直接包含字串变量。 也就是上一节里面使用过的包含变量的双引号,两者呈现效果相同,下面示例是显示效果(但源码书写方式有别)

我的网址: www.shopbao.com

我的网址: www.shopbao.com

5.3 转义/还原字串数据:

addslashes(): 在指定的预定义字符前添加"\",用于为存储在数据库的字串以及查询语句准备合适的字串。

stripslashes(): 是addslashes()的反函数,用于还原转义的字符,也叫反转义。

以单引号为定界符的php字串,支持2个转义:\\, \'

以双引号为定界符的php字串,支持8个转义:\\, \", \r, \n, \t, \$, \[0-7]{1,3}, \x[0-9A-Fa-f]{1,2}

addslashes()支持4个转义:转义引号问题:\\, \', \", NULL

前面2个指出了我们在定义字串时需要注意的特殊字符,后面1个则是某一函数(这里是addslashes)自身所规定的特殊字符, 不要混淆了。

实际上,不论是单引号还是双引号,包含在里面的双引号或单引号子串都会被转义。

为避免引发addslashes()双层转义结果出错,我们建议:

1) 单引号内使用双引号子串,双引号内使用单引号子串就OK。

2) 单引号内,编码"\"和"\\"都会显示"\",且字串长度都为1。

而在双引号内,"\"常用来跟后面的3个字符一起来组合8进制或16进制数(或ASCII码);如果要正常输出"\",编码时必须使用"\\";这一特点要注意一下。

3) 带有转义字符的字串的长度,要以转换后的字符长度为准。

转义字符测试:

单引号之引号测试:

显示字串='单引号'包含 "双引号" 子串.

转义字串=\'单引号\'包含 \"双引号\" 子串.

还原字串='单引号'包含 "双引号" 子串.

双引号之引号测试:

显示字串="双引号"包含'单引号'子串.

转义字串=\"双引号\"包含\'单引号\'子串.

还原字串="双引号"包含'单引号'子串.

单引号之反斜杠测试:

显示字串=1个反斜杠:\; 2个反斜杠:\

转义字串=1个反斜杠:\\; 2个反斜杠:\\

还原字串=1个反斜杠:\; 2个反斜杠:\

双引号之反斜杠测试:

显示字串=1个反斜杠:\; 2个反斜杠:\

转义字串=1个反斜杠:\\; 2个反斜杠:\\

还原字串=1个反斜杠:\; 2个反斜杠:\

单引号之NULL测试:

显示字串=\0

转义字串=\\0

还原字串=\0

双引号之NULL测试:

显示字串=

转义字串=\0

还原字串=

单引号之特殊字符测试:

显示字串=I 'm Jack, have $\5023 on me, "yeah". @_@:\t_\102

转义字串=I \'m Jack, have $\\5023 on me, \"yeah\". @_@:\\t_\\102

还原字串=I 'm Jack, have $\5023 on me, "yeah". @_@:\t_\102

双引号之特殊字符测试:

显示字串=I'm Jack, have $B3(P23) on me, "yeah". _B

转义字串=I\'m Jack, have $B3(P23) on me, \"yeah\". _B

还原字串=I'm Jack, have $B3(P23) on me, "yeah". _B

5.4 字符串操作

string trim(string str [, string charlist]);

去除字串左右两边的空格或指定字串,返回去掉成功后的字串,但不会改变原有字串

string ltrim(string str [, string charlist]);

去除字串左边的空格或指定字串,返回去掉成功后的字串,但不会改变原有字串

string rtrim(string str [, string charlist]);

去除字串右边的空格或指定字串,返回去掉成功后的字串,但不会改变原有字串

int strlen(string str);

获取指定字串str的长度

string substr(string str, int start, [, int length]);

截取字串。 int strcmp(string str1, string str2);

比较字串(以字节方式,大小写敏感),如果相等返回0,如果前者大返回值>0,如果前者小返回值<0

int strcasecmp(string str1, string str2);

比较字串(以字节方式,大小写不敏感)。 int strnatcmp(string str1, string str2);

比较字串(以自然排序法方式) int strncmp(string str1, string str2, int len);

比较字串中的前n个字符。

string strstr(string haystack, string needle);

检索字串。

string strchr(string haystack, string needle);

检索字串。

int substr_count(string haystack, string needle);

获取子串在字串在出现的次数。

mixed str_replace(mixed search, mixed replace, mixed subject [, int &count]);

替换字串中的子串。

string substr_replace(string str, string repl, int start [, int length]);

替换字串中指定位置处的子串。

string number_format(float number [, int num_decimal_places [, string dec_seperator, string thousands_seperator]]);

对数字进行字串格式化。 array explode(string seperator, string str [, int limit]);

分割字串。

string implode(string glue, array places);

合成字串。

注意:

1) [l|r]trim默认过滤字符包括:\r, \n, \t, \0, \x0B, " "(space),当然你也可以在这个基础上,在charlist参数中提供要过滤的自定义字符。

2) strlen函数,汉字占2字符,数字、英文、小数点、下划线和空格占1个字符。

3) substr函数:采用下标截取法,即第1个字符时start定为0;若start<0,从字串末尾倒数第start个字符处开始截取; 若length<0,表示取到倒数第length个字符。

4) substr函数:截取含有中文字符的字串时,如果start为奇数会引起子串乱码,所以不建议用substr截取中文字串。解决中文子串乱码的最好办法是用substr()编写一个自定义函数。

5) number_format函数:参数个数可以是1、2、4,但不能是3。

1个参数格式化到小数点,且每一千时以","隔开;

2个参数格式化到小数点后第num_decimal_places位,且每一千以","隔开;

4个参数格式化到小数点后第num_decimal_places位,用dec_seperator替代".",用thousands_seperator替代千位隔位符(",");

6) explode函数:

字串分割。

如果separator为空字串,函数返回false;如果separator在str中找不到,函数返回包含str单个元素的数组。

如果limit>0,返回数组包含最多limit个元素,而最后的元素将包含string的剩余部分;

如果limit<0,返回除了最后的-limit个元素外的所有元素。

7) implode函数:是个和explode()相对的函数,一个用于合成,一个用于分隔。

str=1234567890

substr(str, 1)=234567890

substr(str, 1, 4)=2345

substr(str, -4, 4)=7890

substr(str, 0, -4)=123456

substr(str, -4, 3)=789

substr(str, -4, -3)=7

str1=B10

str2=B2

str3=b2

strcasecmp(str1, str2)=-1

strnatcasecmp(str1, str2)=1

strcmp(str2, str2)=0

strcmp(str2, str3)=-1

strstr("Hello world!","world")=world!

strstr("Hello world!", "zz")=