1、csv文件简介
CSV全称Comma Separated values,是一种用来存储数据的纯文本文件格式,通常用于电子表格或数据库软件。这样你就发现了,csv其实就是纯文本文件,可以使用记事本打开。但是因为他一般表示的是表,所以windows下默认的是用excel打开的。
他的规则如下:
开头是不留空,以行为单位。
可含或不含列名,含列名则居文件第一行。(这一点在插入时需要注意判断,如果第一行是列名,那么需要把第一行数据抛弃)
一行数据不垮行,无空行。
以半角符号[,]作分隔符,列为空也要表达其存在。
列内容如存在[,],则用双引号[””]将该字段内容包含起来。
列内容如存在[”],双引号[””]将该字段内容包含起来,并且在内容中用两个双引号表示一双引号[””]。
文件读写时引号,逗号操作规则互逆。
内码格式不限,可为ASCII、Unicode或者其他。
2、插入数据库操作
将csv文件插入数据库是一个常见的需求,最简单的做法就是直接读取csv文件,然后一行一行读出来后用split(“,”)分割之后插到数据库中。当然这种方法虽然看起来简单,但是有写问题很难解决。比如列内容中有[,]的问题,这种情况如果用这种方法的话很难判断。所以一般情况下不能推荐使用这种方法来插入数据。
今天我介绍的方法是用Microsoft ActiveX Data Objects 来做:
(1)引入Microsoft ActiveX Data Objects
右击“引用”——COM选项卡——Microsoft ActiveX Data Objects,我的电脑是6.0版本的,实际使用中版本间差距不大,代码都可以通用。
(2)代码部分:
///
///将csv文件导入到数据库中///
/// 导入的文件名
/// 文件的存储路径
public void test(string strCSVFile, stringstrPathToTextFile)
{
Connection adoCSVConnection= null;
Recordset adoCSVRecordSet= null;try{
adoCSVConnection= newConnection();
adoCSVRecordSet= newRecordset();
adoCSVConnection.Open(string.Format(“Provider=Microsoft.Jet.OLEDB.4.0;Data Source={0};Extended Properties=\”text;HDR=YES;FMT=Delimited\””, strPathToTextFile));
adoCSVRecordSet.Open(string.Format(“SELECT * FROM {0}”, strCSVFile), adoCSVConnection);while (!adoCSVRecordSet.EOF)
{for (int i = 0; i < adoCSVRecordSet.Fields.Count; i++)
{var strsource =adoCSVRecordSet.Fields[i].Value;
//到这里你懂的了吧…^_^
}
adoCSVRecordSet.MoveNext();}
}catch(Exception ex)
{
}finally{if (adoCSVRecordSet != null)
{
adoCSVRecordSet.Close();
}if (adoCSVConnection != null)
{
adoCSVConnection.Close();
}
}
}
这种方法其实是将csv文件作为一种数据库来操作,你可以看到有连接字符串”Provider=Microsoft.Jet.OLEDB.4.0;Data Source={0};Extended Properties=\”text;HDR=YES;FMT=Delimited\””。
将csv文件插入到数据库中还有很多因素要考虑,比如对于大批量的数据需要用到多线程,以及对于mvc中无法使用webform中的委托回调函数来获得数据更改ui线程。这些问题以后有时间再写出来。