深入了解C语言中的字符串和内存函数

来自:网络
时间:2023-01-01
阅读:
目录

1. 前言

大家好,我是努力学习游泳的鱼。今天我们来学习一些常用的库函数。有了这些库函数,我们可以更加方便地操作字符串和内存,从而提升我们的编码效率。话不多说,我们开始吧!

注:以下大部分函数对应的头文件都是string.h。

2. 求字符串长度

2.1 strlen

size_t strlen ( const char * str );

strlen函数可以求字符串的长度。使用时只需把字符串的起始位置的地址作为参数传递给strlen。该函数会从起始位置一直往后数字符,直到遇到\0。最终返回的是\0之前字符的个数。

参数指向的字符串必须以\0结束。否则求出来的是随机值。

返回类型是size_t,是无符号类型。

接下来使用三种方式来模拟实现strlen。

// 1. 使用计数器
size_t my_strlen(const char* str)
{
	int count = 0;
	assert(str != NULL);
	while (*str != '\0')
	{
		count++;
		str++;
	}
	return count;
}

// 2. 递归
size_t my_strlen(const char* str)
{
	assert(str != NULL);
	if (*str == '\0')
		return 0;
	else
		return 1 + my_strlen(str + 1);
}

// 3. 指针-指针
size_t my_strlen(const char* str)
{
	assert(str != NULL);
	char* begin = str;
	// 找\0
	while (*str != '\0')
	{
		str++;
	}
	return str - begin;
}

3. 长度不受限制的字符串函数

3.1 strcpy

char* strcpy(char * destination, const char * source );
  • strcpy函数会把源字符串拷贝到目标空间中去。
  • 源字符串必须以\0结束。
  • 会将源字符串中的\0拷贝到目标空间。
  • 目标空间必须足够大,以确保可以存放源字符串。
  • 目标空间必须可变。
  • strcpy返回的是目标空间的起始地址。

接下来我们来模拟实现strcpy函数。

char* my_strcpy(char* dest, const char* src)
{
    char* ret = dest;
    assert(dest && src);
    while (*dest++ = *src++)
    {
        ;
    }
    return ret;
}

3.2 strcat

char * strcat ( char * destination, const char * source );
  • strcat会把源字符串追加到目标字符串后面。
  • 源字符串必须以\0结束。
  • 会把源字符串的\0拷贝到目标空间中去。
  • 目标空间必须足够大,以确保可以存放源字符串。
  • 目标空间必须可变。
  • strcat返回的是目标空间的起始地址。
  • 不能自己给自己追加,因为当源字符串和目标空间重合时,会覆盖掉源字符串后面的\0。

有没有发现,其中很多点和strcpy很像?

接下来我们来模拟实现strcat。只需要两步:

  • 找到目标空间的\0。
  • 从目标空间的\0开始,把源字符串拷贝到目标空间中去。
char* my_strcat(char* dest, const char* src)
{
	assert(dest && src);
	char* ret = dest;

	// 找目标空间的\0
	while (*dest)
	{
		dest++;
	}
	// 从目标空间的\0开始,向后拷贝
	while (*dest++ = *src++)
	{
		;
	}

	return ret;
}

3.3 strcmp

int strcmp ( const char * str1, const char * str2 );
  • strcmp函数比较的不是字符串的长度,而是比较字符串中对应位置上的字符的大小,如果相同,就比较下一对儿,直到不同或者都遇到\0。
  • 若str1<str2,则返回值为负数;若str1>str2,则返回值为正数;若str1=str2,则返回值为0。

接下来我们来模拟实现strcmp。

int my_strcmp(const char* str1, const char* str2)
{
	assert(str1 && str2);

	while (*str1 == *str2)
	{
		if (*str1 == '\0')
		{
			return 0; // 相等
		}

		str1++;
		str2++;
	}
	// 不相等
	if (*str1 > *str2)
	{
		return 1;
	}
	else
	{
		return -1;
	}
}

4. 长度受限制的字符串函数

4.1 strncpy

char * strncpy ( char * destination, const char * source, size_t num );
  • 拷贝num个字符从源字符串到目标空间。
  • 如果源字符串的长度小于num,则拷贝完源字符串后,在目标的后面追加0,直到num个。

下面是strncpy的模拟实现。

char* my_strncpy(char* dest, const char* src, size_t count)
{
	assert(dest && src);
	char* start = dest;

	while (count && (*dest++ = *src++) != '\0')
	{
		count--;
	}

	if (count)
	{
		while (--count)
		{
			*dest++ = '\0';
		}
	}

	return start;
}

4.2 strncat

char * strncat ( char * destination, const char * source, size_t num );
  • 在目标空间后最多追加num个字符。
  • 如果num大于源字符串的长度,则num直接看作源字符串的长度。
  • 一定会在最后追加\0。

模拟实现如下:

char* my_strncat(char* front, const char* back, size_t count)
{
	assert(front && back);
	char* start = front;

	// 找front中的\0
	while (*front)
	{
		front++;
	}
	// 拷贝
	while (count--)
	{
		if ((*front++ = *back++) == '\0')
		{
			return start;
		}
	}

	*front = '\0';
	return start;
}

4.3 strncmp

int strncmp ( const char * str1, const char * str2, size_t num );

只比较前num个字符。

以下是模拟实现:

int my_strncpy(const char* s1, const char* s2, size_t count)
{
	assert(s1 && s2);

	while (1)
	{
		if (count == 0)
		{
			return 0;
		}
		else if (*s1 > *s2)
		{
			return 1;
		}
		else if (*s1 < *s2)
		{
			return -1;
		}
		else
		{
			if (*s1 == '\0')
			{
				return 0;
			}
			s1++;
			s2++;
			count--;
		}
	}
}

5. 字符串查找

5.1 strstr

char * strstr ( const char *str1, const char * str2);

在str1中查找str2,如果找到了,就返回第一次出现的起始位置;如果找不到,就返回空指针NULL。

最简单的实现方式是直接暴力查找。

char* my_strstr(const char* str1, const char* str2)
{
	assert(str1 && str2);

	const char* s1 = str1;
	const char* s2 = str2;
	const char* cur = str1;

	while (*cur)
	{
		s1 = cur;
		s2 = str2;

		while (*s1 && *s2 && *s1 == *s2)
		{
			s1++;
			s2++;
		}
		if (*s2 == '\0')
		{
			// 找到了
			return (char*)cur;
		}

		cur++;
	}

	// 找不到
	return NULL;
}

5.2 strtok

char * strtok ( char * str, const char * sep );
  • strtok用于分割字符串。
  • sep是一个字符串,定义了用作分隔符的字符集合。
  • 第一个参数指定一个字符串,它包含了0个或者多个由sep字符串中一个或者多个分隔符分割的标记。
  • strtok函数找到str中的下一个标记,并将其用\0结尾,返回一个指向这个标记的指针。(注:strtok函数会改变该字符串,所以在使用strtok函数切分的字符串一般都是临时拷贝的内容并且可修改。)
  • strtok函数的第一个参数不为NULL,函数将找到str中第一个标记,strtok函数将保存它在字符串中的位置。
  • strtok函数的第一个参数为NULL,函数将在同一个字符串中被保存的位置开始,查找下一个标记。
  • 如果字符串中不存在更多的标记,则返回NULL指针。

使用举例:

#include <stdio.h>
#include <string.h>

int main()
{
	char arr[] = "abc@def.123@456";
	char buf[30] = { 0 }; // 使用strtok,一般要做备份
	strcpy(buf, arr);
	const char* sep = "@."; // 分隔符的集合

	char* str = NULL;
	for (str = strtok(buf, sep); str != NULL; str = strtok(NULL, sep))
	{
		printf("%s\n", str);
	}

	return 0;
}

6. 错误信息报告

6.1 strerror

char * strerror ( int errnum );

会返回错误码对应的错误信息。

有一个全局变量errno,会记录库函数在调用失败后的错误码。使用时需要引用头文件errno.h。

使用举例:

#include <stdio.h>
#include <string.h>
#include <stdlib.h>
#include <limits.h>
#include <errno.h>

int main()
{
	int* p = (int*)malloc(INT_MAX);
	if (p == NULL)
	{
		printf("%s\n", strerror(errno));
	}

	return 0;
}

7. 字符操作函数

以下函数对应的头文件是ctype.h。

7.1 字符分类函数

函数如果它的参数复合下列条件就返回真
iscntrl任何控制字符
isspace任何空白字符
isdigit十进制数字
isxdigit十六进制数字
islower小写字母
isupper大写字母
isalpha大小写字母
isalnum大小写字母或数字
ispunct标点符号
isgraph图形字符
isprint 可打印字符

7.2 字符转换函数

转小写:

int tolower( int c );

转大写

int toupper( int c );

8. 内存操作函数

8.1 memcpy

void * memcpy ( void * destination, const void * source, size_t num );

函数memcpy从source的位置开始向后复制num个字节的数据到destination的内存位置。

这个函数在遇到'\0'的时候并不会停下来。

如果source和destination有任何的重叠,复制的结果都是未定义的。

模拟实现如下:

void* my_memcpy(void* dest, const void* src, size_t count)
{
	assert(dest && src);
	void* ret = dest;

	while (count--)
	{
		*(char*)dest = *(char*)src;
		dest = (char*)dest + 1;
		src = (char*)src + 1;
	}

	return ret;
}

8.2 memmove

void * memmove ( void * destination, const void * source, size_t num );

和memcpy的差别就是memmove函数处理的源内存块和目标内存块是可以重叠的。

如果源空间和目标空间出现重叠,就得使用memmove函数处理。

模拟实现如下:

void* my_memmove(void* dest, const void* src, size_t count)
{
	assert(dest && src);
	void* ret = dest;

	if (dest < src)
	{
		// 前->后
		while (count--)
		{
			*(char*)dest = *(char*)src;
			dest = (char*)dest + 1;
			src = (char*)src + 1;
		}
	}
	else
	{
		// 后->前
		while (count--)
		{
			*((char*)dest + count) = *((char*)src + count);
		}
	}

	return ret;
}

8.3 memcmp

int memcmp ( const void * ptr1,
             const void * ptr2,
             size_t num );

比较从ptr1和ptr2指针开始的num个字节。

返回值和strcmp类似,根据大小关系返回正数、负数或者0。

模拟实现如下:

int my_memcmp(const void* ptr1, const void* ptr2, size_t num)
{
	assert(ptr1 && ptr2);

	while (num--)
	{
		if (*(char*)ptr1 > *(char*)ptr2)
		{
			return 1;
		}
		else if (*(char*)ptr1 < *(char*)ptr2)
		{
			return -1;
		}
		ptr1 = (char*)ptr1 + 1;
		ptr2 = (char*)ptr2 + 1;
	}

	return 0;
}

以上就是深入了解C语言中的字符串和内存函数的详细内容,更多关于C语言字符串 内存函数的资料请关注其它相关文章!

返回顶部
顶部