深入了解C语言中的字符串和内存函数

1. 前言

大家好,我是努力学习游泳的鱼。今天我们来学习一些常用的库函数。有了这些库函数,我们可以更加方便地操作字符串和内存,从而提升我们的编码效率。话不多说,我们开始吧!

注:以下大部分函数对应的头文件都是string.h。

2. 求字符串长度

2.1 strlen

size_t strlen ( const char * str );

strlen函数可以求字符串的长度。使用时只需把字符串的起始位置的地址作为参数传递给strlen。该函数会从起始位置一直往后数字符,直到遇到\0。最终返回的是\0之前字符的个数。

参数指向的字符串必须以\0结束。否则求出来的是随机值。

返回类型是size_t,是无符号类型。

接下来使用三种方式来模拟实现strlen。

// 1. 使用计数器
size_t my_strlen(const char* str)
{
        int count = 0;
        assert(str != NULL);
        while (*str != '\0')
        {
                count++;
                str++;
        }
        return count;
}

// 2. 递归
size_t my_strlen(const char* str)
{
        assert(str != NULL);
        if (*str == '\0')
                return 0;
        else
                return 1 + my_strlen(str + 1);
}

// 3. 指针-指针
size_t my_strlen(const char* str)
{
        assert(str != NULL);
        char* begin = str;
        // 找\0
        while (*str != '\0')
        {
                str++;
        }
        return str - begin;
}

3. 长度不受限制的字符串函数

3.1 strcpy

char* strcpy(char * destination, const char * source );
  • strcpy函数会把源字符串拷贝到目标空间中去。
  • 源字符串必须以\0结束。
  • 会将源字符串中的\0拷贝到目标空间。
  • 目标空间必须足够大,以确保可以存放源字符串。
  • 目标空间必须可变。
  • strcpy返回的是目标空间的起始地址。

接下来我们来模拟实现strcpy函数。

char* my_strcpy(char* dest, const char* src)
{
    char* ret = dest;
    assert(dest && src);
    while (*dest++ = *src++)
    {
        ;
    }
    return ret;
}

3.2 strcat

char * strcat ( char * destination, const char * source );
  • strcat会把源字符串追加到目标字符串后面。
  • 源字符串必须以\0结束。
  • 会把源字符串的\0拷贝到目标空间中去。
  • 目标空间必须足够大,以确保可以存放源字符串。
  • 目标空间必须可变。
  • strcat返回的是目标空间的起始地址。
  • 不能自己给自己追加,因为当源字符串和目标空间重合时,会覆盖掉源字符串后面的\0。

有没有发现,其中很多点和strcpy很像?

接下来我们来模拟实现strcat。只需要两步:

  • 找到目标空间的\0。
  • 从目标空间的\0开始,把源字符串拷贝到目标空间中去。
char* my_strcat(char* dest, const char* src)
{
        assert(dest && src);
        char* ret = dest;

        // 找目标空间的\0
        while (*dest)
        {
                dest++;
        }
        // 从目标空间的\0开始,向后拷贝
        while (*dest++ = *src++)
        {
                ;
        }

        return ret;
}

3.3 strcmp

int strcmp ( const char * str1, const char * str2 );
  • strcmp函数比较的不是字符串的长度,而是比较字符串中对应位置上的字符的大小,如果相同,就比较下一对儿,直到不同或者都遇到\0。
  • 若str1<str2,则返回值为负数;若str1>str2,则返回值为正数;若str1=str2,则返回值为0。

接下来我们来模拟实现strcmp。

int my_strcmp(const char* str1, const char* str2)
{
        assert(str1 && str2);

        while (*str1 == *str2)
        {
                if (*str1 == '\0')
                {
                        return 0; // 相等
                }

                str1++;
                str2++;
        }
        // 不相等
        if (*str1 > *str2)
        {
                return 1;
        }
        else
        {
                return -1;
        }
}

4. 长度受限制的字符串函数

4.1 strncpy

char * strncpy ( char * destination, const char * source, size_t num );
  • 拷贝num个字符从源字符串到目标空间。
  • 如果源字符串的长度小于num,则拷贝完源字符串后,在目标的后面追加0,直到num个。

下面是strncpy的模拟实现。

char* my_strncpy(char* dest, const char* src, size_t count)
{
        assert(dest && src);
        char* start = dest;

        while (count && (*dest++ = *src++) != '\0')
        {
                count--;
        }

        if (count)
        {
                while (--count)
                {
                        *dest++ = '\0';
                }
        }

        return start;
}

4.2 strncat

char * strncat ( char * destination, const char * source, size_t num );
  • 在目标空间后最多追加num个字符。
  • 如果num大于源字符串的长度,则num直接看作源字符串的长度。
  • 一定会在最后追加\0。

模拟实现如下:

char* my_strncat(char* front, const char* back, size_t count)
{
        assert(front && back);
        char* start = front;

        // 找front中的\0
        while (*front)
        {
                front++;
        }
        // 拷贝
        while (count--)
        {
                if ((*front++ = *back++) == '\0')
                {
                        return start;
                }
        }

        *front = '\0';
        return start;
}

4.3 strncmp

int strncmp ( const char * str1, const char * str2, size_t num );

只比较前num个字符。

以下是模拟实现:

int my_strncpy(const char* s1, const char* s2, size_t count)
{
        assert(s1 && s2);

        while (1)
        {
                if (count == 0)
                {
                        return 0;
                }
                else if (*s1 > *s2)
                {
                        return 1;
                }
                else if (*s1 < *s2)
                {
                        return -1;
                }
                else
                {
                        if (*s1 == '\0')
                        {
                                return 0;
                        }
                        s1++;
                        s2++;
                        count--;
                }
        }
}

5. 字符串查找

5.1 strstr

char * strstr ( const char *str1, const char * str2);

在str1中查找str2,如果找到了,就返回第一次出现的起始位置;如果找不到,就返回空指针NULL。

最简单的实现方式是直接暴力查找。

char* my_strstr(const char* str1, const char* str2)
{
        assert(str1 && str2);

        const char* s1 = str1;
        const char* s2 = str2;
        const char* cur = str1;

        while (*cur)
        {
                s1 = cur;
                s2 = str2;

                while (*s1 && *s2 && *s1 == *s2)
                {
                        s1++;
                        s2++;
                }
                if (*s2 == '\0')
                {
                        // 找到了
                        return (char*)cur;
                }

                cur++;
        }

        // 找不到
        return NULL;
}

5.2 strtok

char * strtok ( char * str, const char * sep );
  • strtok用于分割字符串。
  • sep是一个字符串,定义了用作分隔符的字符集合。
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok函数找到str中的下一个标记,并将其用\0结尾,返回一个指向这个标记的指针。(注:strtok函数会改变该字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok函数的第一个参数不为NULL,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第一个参数为NULL,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回NULL指针。

使用举例:

#include <stdio.h>
#include <string.h>

int main()
{
        char arr[] = "abc@def.123@456";
        char buf[30] = { 0 }; // 使用strtok,一般要做备份
        strcpy(buf, arr);
        const char* sep = "@."; // 分隔符的集合

        char* str = NULL;
        for (str = strtok(buf, sep); str != NULL; str = strtok(NULL, sep))
        {
                printf("%s\n", str);
        }

        return 0;
}

6. 错误信息报告

6.1 strerror

char * strerror ( int errnum );

会返回错误码对应的错误信息。

有一个全局变量errno,会记录库函数在调用失败后的错误码。使用时需要引用头文件errno.h。

使用举例:

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <limits.h>
#include <errno.h>

int main()
{
        int* p = (int*)malloc(INT_MAX);
        if (p == NULL)
        {
                printf("%s\n", strerror(errno));
        }

        return 0;
}

7. 字符操作函数

以下函数对应的头文件是ctype.h。

7.1 字符分类函数

函数如果它的参数复合下列条件就返回真
iscntrl任何控制字符
isspace任何空白字符
isdigit十进制数字
isxdigit十六进制数字
islower小写字母
isupper大写字母
isalpha大小写字母
isalnum大小写字母或数字
ispunct标点符号
isgraph图形字符
isprint可打印字符

7.2 字符转换函数

转小写:

int tolower( int c );

转大写

int toupper( int c );

8. 内存操作函数

8.1 memcpy

void * memcpy ( void * destination, const void * source, size_t num );

函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。

这个函数在遇到'\0'的时候并不会停下来。

如果source和destination有任何的重叠,复制的结果都是未定义的。

模拟实现如下:

void* my_memcpy(void* dest, const void* src, size_t count)
{
        assert(dest && src);
        void* ret = dest;

        while (count--)
        {
                *(char*)dest = *(char*)src;
                dest = (char*)dest + 1;
                src = (char*)src + 1;
        }

        return ret;
}

8.2 memmove

void * memmove ( void * destination, const void * source, size_t num );

和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。

如果源空间和目标空间出现重叠,就得使用memmove函数处理。

模拟实现如下:

void* my_memmove(void* dest, const void* src, size_t count)
{
        assert(dest && src);
        void* ret = dest;

        if (dest < src)
        {
                // 前->后
                while (count--)
                {
                        *(char*)dest = *(char*)src;
                        dest = (char*)dest + 1;
                        src = (char*)src + 1;
                }
        }
        else
        {
                // 后->前
                while (count--)
                {
                        *((char*)dest + count) = *((char*)src + count);
                }
        }

        return ret;
}

8.3 memcmp

int memcmp ( const void * ptr1,
             const void * ptr2,
             size_t num );

比较从ptr1和ptr2指针开始的num个字节。

返回值和strcmp类似,根据大小关系返回正数、负数或者0。

模拟实现如下:

int my_memcmp(const void* ptr1, const void* ptr2, size_t num)
{
        assert(ptr1 && ptr2);

        while (num--)
        {
                if (*(char*)ptr1 > *(char*)ptr2)
                {
                        return 1;
                }
                else if (*(char*)ptr1 < *(char*)ptr2)
                {
                        return -1;
                }
                ptr1 = (char*)ptr1 + 1;
                ptr2 = (char*)ptr2 + 1;
        }

        return 0;
}

以上就是深入了解C语言中的字符串和内存函数的详细内容,更多关于C语言字符串 内存函数的资料请关注其它相关文章!

原文地址:https://blog.csdn.net/xiang_bolin/article/details/127638620