以文本方式查看主题

-  计算机科学论坛  (http://bbs.xml.org.cn/index.asp)
--  『 C/C++编程思想 』  (http://bbs.xml.org.cn/list.asp?boardid=61)
----  visual c++对大型数据文件的读取  (http://bbs.xml.org.cn/dispbbs.asp?boardid=61&rootid=&id=55324)


--  作者:卷积内核
--  发布时间:11/14/2007 11:34:00 AM

--  visual c++对大型数据文件的读取
笔者前不久曾遇到一个问题,解决之后的经验愿与大家分享。问题是这样的,有一批数据文件,数据格式如下:

日期,开盘,最高,最低,收盘,成交量,成交金额

1996年5月13日,636.96,636.96,636.96,636.96,0,0,

1996年5月14日,641.61,641.61,641.61,641.61,0,0,

1996年5月15日,637.83,637.83,637.83,637.83,0,0,

.............

  要求将数据填写到四张表中,以便作相应的分析。笔者开始用CFile和CStdioFile类的方法读取件。Cfile类提供了基于二进制流的文件操作,功能类似于C语言中的fread()和fwrite()函数。CStdioFile提供了基于字符串流的文件操作,功能类似于C语言中fgets()和fputs()函数。但是笔者发现,使用这两个类进行文件操作时,对于一次文件读写的数据量的大小必须限制在65535字节以内。究其原因是在VC中访问大于65535字节的缓冲区需要Huge型指针,而在CFile和CStdioFile类中,使用的是Far型的指针。由于Far型指针不具有跨段寻址的能力,因此限制了一次文件读写的长度小于65535字节。如果传递给CFile和CStdioFile两个类的成员函数的数据缓冲区的大小大于65535字节的时候,VC就会产生ASSERT错误。

  针对文件格式特点,笔者改用CArchive类进行读取如下:

CFile SourceFile;//数据文件

CString SourceData;//定义一临时变量保存一条记录

SourceFile.Open(.......);

CArchive ar(&SourceFile,CArchive::load);

while(NULL!=ar.ReadString(SourceData))//循环读取文件,直到文件结束

{

if(SourceData=="日期,开盘,最高,最低,收盘,成交量,成交金额"||SourceData=="")

continue;//跳过文件头部的提示信息

  //分析并填充//

}

  在进行分析时,笔者采取了逐步分析并修改的办法,过程如下:

int nYear;

CString Year= SourceData.Left(SourceData.Find("年"));//截取年前面的字符串

nYear=atoi(Year);//类型转换

SourceData=SourceData.Righ(SourceData.GetLength()-SourceData.Find("年")-2);//将年以及前面的字符删除。

  重复上面分析过程,直到记录末尾。

  通过上述方法,笔者成功地将文件读取并分析填充。


W 3 C h i n a ( since 2003 ) 旗 下 站 点
苏ICP备05006046号《全国人大常委会关于维护互联网安全的决定》《计算机信息网络国际联网安全保护管理办法》
31.250ms