C語言的字符函數(shù)和字符串函數(shù)詳解
0. 前言
C語言中對字符和字符串的處理很是頻繁,但是C語言本身是沒有字符串類型的,字符串通暢放在
常量字符串和字符數(shù)組中。
字符串常量適用于那些對它不做修改的字符串函數(shù)。
1.函數(shù)介紹及部分函數(shù)模擬實現(xiàn)
1.1 strlen

- 字符串以
'\0'作為結(jié)束標志,strlen函數(shù)返回的是在字符串中'\0'前面出現(xiàn)的字符個數(shù)(不包含'\0')。 - 參數(shù)指向的字符串必須要以
'\0'結(jié)束。 - 注意函數(shù)的返回值為
size_t,是無符號的(易錯)。
模擬實現(xiàn)
三種方式:
方式1:
int my_strlen(const char *str)
{
int count = 0;
while(*str)
{
conut++;
str++;
}
return count;
}
方式2:
//不能創(chuàng)建臨時變量計數(shù)器,下面用遞歸的方式
int my_strlen(const char *str)
{
if(*str == '\0')
return 0;
else
return 1+my_strlen(str1);
}

方式3:
//指針-指針
int my_strlen(const char *str)
{
char *p = str;
while(*p != '\0')
{
p++;
}
return p-str;
}
1.2 strcpy

- 將源指向的C字符串復制到目標指向的數(shù)組中,包括終止的空字符(并在該點停止)。
- 源字符串必須以
'\0'結(jié)束。 - 會將源字符串中的
'\0'拷貝到目標空間。 - 目標空間必須足夠大,以確保能存放源字符串。
- 目標空間必須可變。
模擬實現(xiàn)
//1.參數(shù)順序
//2.函數(shù)的功能,停止條件
//3.assert
//4.const修飾指針
//5.函數(shù)返回值
//6.題目出自《高質(zhì)量C/C++編程》最后的試題部分
char *my_strcpy(char *dest, const char *src)
{
char *ret = dest//記錄目標空間的起始地址
asset(dest && src)//dest,src不能為NULL
while((*dest++ = *src++))
{
;
}
return ret;
}
1.3 strcat

- 將源字符串的副本追加到目標字符串。 destination中的終止空字符被source的第一個字符覆蓋,并且在destination中由這兩個字符串聯(lián)而成的新字符串的末尾包含一個空字符。
- 源字符串必須以
'\0'結(jié)束。 - 目標空間必須足夠大,能容納下源字符串的內(nèi)容。
- 目標空間必須可修改。
- 字符串自己給自己追加,如何?
模擬實現(xiàn)
char *my_strcat(char *dest, const char *src)
{
char *ret = dest;
assert(dest && src);
//找到目標空間的'\0'
while(*dest)
{
dest++;
}
//追加內(nèi)容
while((*dest++ = *src++))
{
;
}
return ret;
}
注意:

1.4 strcmp

- 這個函數(shù)開始比較每個字符串的第一個字符。 如果它們相等,則繼續(xù)比較后面的字符,直到字符不同或到達一個結(jié)束的空字符為止。
- 標準規(guī)定:
- 第一個字符串大于第二個字符串,則返回大于0的數(shù)字
- 第一個字符串等于第二個字符串,則返回0
- 第一個字符串小于第二個字符串,則返回小于0的數(shù)字
那么如何判斷兩個字符串?
模擬實現(xiàn)
int my_strcmp(char *str1, const char *str2)
{
assert(str1 && str2);
while(*str1 == *str2)
{
if(*str1 == '\0')
return 0;
str1++;
str2++;
}
return *str1-*str2;
}
1.5 strncpy

- 首先將源字符串的num個字符復制到目標字符串中。 如果在復制num個字符之前找到源C字符串的結(jié)尾(以
'\0'為標志),則目標字符串將用零填充,直到將num個字符寫入到目標字符串中為止。 - 拷貝num個字符從源字符串到目標空間。
- 如果源字符串的長度小于num,則拷貝完源字符串之后,在目標的后邊追加0,直到num個。
1.6 strncat

- 首先將源字符串的num個字符添加到目標字符串,并加上一個結(jié)束的空字符。
- 如果源字符串中的C字符串長度小于num,則只復制到
'\0'字符結(jié)束之前的內(nèi)容。
/* strncat example */
#include <stdio.h>
#include <string.h>
int main ()
{
char str1[20];
char str2[20];
strcpy (str1,"To be ");
strcpy (str2,"or not to be");
strncat (str1, str2, 6);
puts (str1);
return 0;
}
output:
To be or not
1.7strncmp

比較到出現(xiàn)兩個字符不一樣或者一個字符串結(jié)束或者num個字符全部比較完。
* strncmp example */
#include <stdio.h>
#include <string.h>
int main ()
{
char str[][5] = { "R2D2" , "C3PO" , "R2A6" };
int n;
puts ("Looking for R2 astromech droids...");
for (n=0 ; n<3 ; n++)
if (strncmp (str[n],"R2xx",2) == 0)
{
printf ("found %s\n",str[n]);
}
return 0;
}
output:
Looking for R2 astromech droids...
found R2D2
found R2A6
1.8 strstr

返回一個指向str1中首次出現(xiàn)str2的指針,如果str2不是str1的一部分,則返回一個空指針。
/* strstr example */
#include <stdio.h>
#include <string.h>
int main ()
{
char str[] ="This is a simple string";
char * pch;
pch = strstr (str,"simple");
if (pch != NULL)
strncpy (pch,"sample",6);
puts (str);
return 0;
}
output:
This is a sample string
這個例子在str中搜索“simple”子字符串并替換“sample”。
模擬實現(xiàn)
先捋一捋思路:
讓cur指針記錄從主串開始匹配的位置,讓s1,s2指針分別去遍歷主串和子串,如果s1 等于 s2且s1和s2都沒有走完主串和子串,則s1++,s2++。如果s1 不等于s2,則cur++,s1回到cur處,s2回到起始位置即substr處。如果s2走到子串’\0’處,則表示找到了子串,返回cur。如果cur走到主串’\0’處,則表示主串不包含子串,返回NULL指針特殊處理:如果子串是空字符串,則返回str

char *my_strstr(const str, const substr)
{
const char *s1 = str;
const char *s2 = substr;
const char *cur = str;
assert(str && substr);
if(*substr == '\0')
return str;
while(*cur)
{
s1 = cur;
s2 = substr;
while(*s1 && *s2 && *s1==*s2)
{
s1++;
s2++;
}
if(*s1=='\0')
return cur;
cur++;
}
return NULL
}
1.9 strtok

- sep參數(shù)是個字符串,定義了用作分隔符的字符集合
- 第一個參數(shù)指定一個字符串,它包含了0個或者多個由sep字符串中一個或者多個分隔符分割的標記。
- strtok函數(shù)找到str中的下一個標記,并將其用 \0 結(jié)尾,返回一個指向這個標記的指針。(注:strtok函數(shù)會改變被操作的字符串,所以在使用strtok函數(shù)切分的字符串一般都是臨時拷貝的內(nèi)容并且可修改。)
- strtok函數(shù)的第一個參數(shù)不為 NULL ,函數(shù)將找到str中第一個標記,strtok函數(shù)將保存它在字符串中的位置。
- strtok函數(shù)的第一個參數(shù)為 NULL ,函數(shù)將在同一個字符串中被保存的位置開始,查找下一個標記。
- 如果字符串中不存在更多的標記,則返回 NULL 指針。
/* strtok example */
#include <stdio.h>
#include <string.h>
int main ()
{
char str[] ="- This, a sample string.";
char * pch;
printf ("Splitting string \"%s\" into tokens:\n",str);
pch = strtok (str," ,.-");
while (pch != NULL)
{
printf ("%s\n",pch);
pch = strtok (NULL, " ,.-");
}
return 0;
}
output:
Splitting string "- This, a sample string." into tokens:
This
a
sample
string
1.10 strerror

返回錯誤碼,所對應的錯誤信息
/* strerror example : error list */
#include <stdio.h>
#include <string.h>
#include <errno.h>
int main ()
{
FILE * pFile;
pFile = fopen ("unexist.ent","r");
if (pFile == NULL)
printf ("Error opening file unexist.ent: %s\n",strerror(errno));
return 0;
}
Possible output:
Error opening file unexist.ent: No such file or directory
| 函數(shù) | 如果他的參數(shù)符合下列條件就返回真 |
|---|---|
| iscntrl | 任何控制字符 |
| isspace | 空白字符:空格‘ ’,換頁‘\f’,換行’\n’,回車‘\r’,制表符’\t’或者垂直制表符’\v’ |
| isdigit | 十進制數(shù)字 0~9 |
| isxdigit | 十六進制數(shù)字,包括所有十進制數(shù)字,小寫字母a-f,大寫字母A-F |
| islower | 小寫字母a~z |
| isupper | 大寫字母A~Z |
| isalpha | 字母a-z或A~Z |
| isalnum | 字母或者數(shù)字,a-z,A-Z,0~9 |
| ispunct | 標點符號,任何不屬于數(shù)字或者字母的圖形字符(可打?。?/td> |
| isgraph | 任何圖形字符 |
| isprint | 任何可打印字符,包括圖形字符和空白字符 |
字符轉(zhuǎn)換:
int tolower (int c); int toupper (int c);
/* isupper example */
#include <stdio.h>
#include <ctype.h>
int main ()
{
int i=0;
char str[]="Test String.\n";
char c;
while (str[i])
{
c=str[i];
if (isupper(c))
c=tolower(c);
putchar (c);
i++;
}
return 0;
}
Output:
test string.
1.11 memcpy

- 函數(shù)memcpy從source的位置開始向后復制num個字節(jié)的數(shù)據(jù)到destination的內(nèi)存位置。
- 如果源空間和目標空間出現(xiàn)重疊,就得使用memmove函數(shù)處理。
- 如果source和destination有任何的重疊,復制的結(jié)果都是未定義的。
模擬實現(xiàn)
void *my_memcpy(void *dest, void *src, size_t num)
{
assert(dest && src);
void *ret = dest;
while(num--)
{
*(char *)dest= *(char *)src;
dest=(char *)dest + 1;
src=(char *)src + 1:
}
return ret;
}

那如果我們想把arr3數(shù)組中的1,3,4,5拷貝到arr3數(shù)組的3,4,5,6,7的位置,會出現(xiàn)什么結(jié)果?

這是為什么?

這是因為source空間和destination空間出現(xiàn)重疊,這時就得使用memmove函數(shù)來處理。
1.12 memmove

- 和memcpy的差別就是memmove函數(shù)處理的源內(nèi)存塊和目標內(nèi)存塊是可以重疊的。
- 如果源空間和目標空間出現(xiàn)重疊,就得使用memmove函數(shù)處理。
模擬實現(xiàn)
捋一捋思路:

void *my_memmove(void *dest, const void *src, size_t num)
{
void *ret = dest;
assert(dest && src);
if(dest < src)
{
while(num--)
{
*(char *)dest = *(char *)src;
dest = *(char *)dest + 1;
src = *(char *)src +1;
}
else
{
while(num--)
{
*((char *)dest+num) = *((char *)src+num);
}
}
return ret;
}
1.13 memcmp

比較從ptr1和ptr2指針開始的num個字節(jié)
/* memcmp example */
#include <stdio.h>
#include <string.h>
int main ()
{
char buffer1[] = "DWgaOtP12df0";
char buffer2[] = "DWGAOTP12DF0";
int n;
n=memcmp ( buffer1, buffer2, sizeof(buffer1) );
if (n>0) printf ("'%s' is greater than '%s'.\n",buffer1,buffer2);
else if (n<0) printf ("'%s' is less than '%s'.\n",buffer1,buffer2);
else printf ("'%s' is the same as '%s'.\n",buffer1,buffer2);
return 0;
}
Output:
'DWgaOtP12df0' is greater than 'DWGAOTP12DF0'.
DWgAOtp12Df0大于DWgAOtp12Df0,因為兩個單詞中的第一個不匹配字符分別是’g’和’g’,而’g’(103)計算結(jié)果大于’g’(71)。
總結(jié)
本篇文章就到這里了,希望能夠給你帶來幫助,也希望您能夠多多關注腳本之家的更多內(nèi)容!
相關文章
C++算法之海量數(shù)據(jù)處理方法的總結(jié)分析
本篇文章是對海量數(shù)據(jù)處理方法進行了詳細的總結(jié)與分析,需要的朋友參考下2013-05-05

