返回> 网站首页 

正则表达式 sscanf

yoours2009-10-20 12:52:53 阅读 1216

简介一边听听音乐,一边写写文章。

名称:  sscanf() - 从一个字符串中读进与指定格式相符的数据.
语法:  int sscanf( string str, string fmt, mixed var1, mixed var2 ... );

整数 sscanf( 字符串 str, 字符串 fmt, 混合 var1, 混合 var2 ... );
用法:  以指定的格式 fmt 去解读字符串 str. fmt 中除了 %d 和 %s 以外, 亦可包含其他的字符串作为格式. 每一个 %d 或 %s 都对应一个参数, 按顺序为 var1, var2 ... %d 读入一个整数到参数中, 而 %s 读入一个字符串. * 亦可用于格式中, (即 %*d 和 %*s) 加了星号 (*) 表示跳过此数据不读入. (也就是不把此数据读入参数中) LPC 的 sscanf() 与 C 的 sscanf() 虽然相似, 但仍有不同之处. LPC 的 sscanf() 不需要 (也不可) 提供变量的内存位址给 sscanf(), 只需要给予变量的名字. 另一个不同点是, LPC 的 sscanf() 对于: sscanf( str, "%s %s", str1, str2 ); 的语法, 将会把 str 中的第一个英文单字 (即第一个空白字符以前的内容) 读入 str1, 后面其余的内容读入 str2.
sscanf() 会返回符合格式的 %d 和 %s 总数.

一个文本文件,每行是一条记录,每条记录中包含多个字段,每个字段之间以某种定界符分开,举例如下:

Notebook,IBM,ThinkPad X32,6,12000
(各字段以逗号分隔,内容依次是:物品名称,生产厂家,型号,数量,价格)

如果要对这样的一行记录进行处理,提取出各个字段,怎么做比较好呢?

以前的做法是在一个循环中用strtok函数每次取一个字段,然后将内容保存到一个字符串数组中。
用C的标准库函数sscanf,处理这样的数据,只需一行就可以了。

    float price;
    int   quantity;
    char  category[21], name[21];
    char  vendor[21], sku[21];
    char  buf[201];

    fp = fopen(filename, "r");
    fgets(buf, 200, fp);
    sscanf(buf,
      "%20[^#]#%20[^#]#%f#%i#%20[^#]#%20[^\n]",
      name, sku, &price, &quantity, category, vendor);

下面简单做些解说:
    %20[^#]#   最多读入20个字符,直到遇见定界符#,但不包含定界符
    %f#        读入一个浮点数,直到遇见定界符#
    %i#        读入一个整数,直到遇见定界符#
    %20[^\n]   最多读入20个字符,忽略行尾的回车符

是不是很简洁明了呢?

    char log[]="<14>2002-11-11 12:12:12 11.22.33.44 3 3 aaaa aaaaaa";
    //char log[]="<1>2002-11-11 12:12:12 11.22.33.44 3 aaaa aaaaaa";

    char test[]="<1111> 22";
    char log2[200];

    char str1[20];
    char str2[20];
    char str3[20];
    char str4[20];
    char str5[20];
    char str6[20];
    char str7[20];
    int a1,a2,a3,a4,a5,a6;
    sscanf(log,"<%d>%s %s %s %d %d %s",&a1,str2,str3,str4,&a5,&a6,str7);
    sscanf(test,"<%d> %d",&a5,&a6);
    sscanf(log,"<%[^>]>%[^ ] %[^ ] %[^ ] %[^ ] %[^ ] %[^$]",str1,str2,str3,str4,str5,str6,str7);
微信小程序扫码登陆

文章评论

1216人参与,0条评论