m****e 发帖数: 1197 | 1 用的是OFFICE 2007.
我用SAVE AS,选择后缀名CSV,存的时候,提示我什么格式问题,问我要不要存,我选
择YES,就能存成CSV了。
但是,把CSV用NOTEPAD打开(或者重新SAVE成TXT)会发现,这个CSV文件不像标准的
CSV文件,下面有很多空行,还有其他问题,不是个纯文本文件。
请问,如何CONVERT才能做好?另外,用以前的OFFICE版本时,CONVERT后,CSV打开来
的时候,貌似个EXCEL文件,但是没有任何格式,就好象纯TXT在EXCEL界面里。而现在
的CSV文件用EXCEL打开后,还像个EXCEL文件,仍然有格式。
谢谢。 |
|
m****e 发帖数: 1197 | 2 用的是OFFICE 2007.
我用SAVE AS,选择后缀名CSV,存的时候,提示我什么格式问题,问我要不要存,我选
择YES,就能存成CSV了。
但是,把CSV用NOTEPAD打开(或者重新SAVE成TXT)会发现,这个CSV文件不像标准的
CSV文件,下面有很多空行,还有其他问题,不是个纯文本文件。
请问,如何CONVERT才能做好?另外,用以前的OFFICE版本时,CONVERT后,CSV打开来
的时候,貌似个EXCEL文件,但是没有任何格式,就好象纯TXT在EXCEL界面里。而现在
的CSV文件用EXCEL打开后,还像个EXCEL文件,仍然有格式。
谢谢。 |
|
t***q 发帖数: 418 | 3 包子,能否在Python 里生成一个csv 文件,并将它放在一个server 的directory 下
?google了一下,应该是用 stringio , 但是好像,还要有一个application ,将目标
convert 为 csv file ,还有就是,最直白的,在Python 里有没有一个办法,生成一个
目标,如a,这个目标本身就是一个 csv 文件,但是我疑惑的是a如果不带后缀csv 的话
,好像又不是一个csv file ,但是Python 里好像没有一个目标是以csv 为后缀的,是
这样吗?该怎么办呢?多谢,有包子。 |
|
w****a 发帖数: 155 | 4 我现在有两个文件,A.csv 和 B.csv 它们之间存在一些重叠的列。我现在需要产生两
个新文件。 第一个文件是它们之间的交集。第二个文件是B文件除去交集剩余的部分。
在R中怎样实现呢。A.csv 和 B.csv 的样子是这样的。
A.csv
atheism sport baseball alt
1 0 0 1
1 0 0 1
0 1 1 0
1 0 0 1
0 1 1 0
0 1 1 0
0 1 1 0
B.csv
sport baseball alt rec
0 0 1 0
0 0 1 0
1 1 0 1
0 0 1 0
1 1 0 1
1 1 0 1
1 1 0 1
它们的交集应该是
sport baseball alt
0 0 1
0 0 1
1 1 ... 阅读全帖 |
|
m*****n 发帖数: 3575 | 5 > abc = data.frame( letters, LETTERS )
> s = c(rep(1,7), rep(2,7), rep(3,6), rep(4,6) )
> alist = split(abc, s)
以上把小写26个字母和大写26个字母分成四段
以下写了第一段之后再试图写第二段
> write.csv(alist[[1]], "alist.csv")
> write.csv( alist[[2]], "alist.csv", append=TRUE)
Warning message:
In write.csv(alist[[2]], "alist.csv", append = TRUE) :
attempt to set 'append' ignored
“append”参数都用不了吗? |
|
W*****r 发帖数: 193 | 6 用各个csv的id合并起来
简单的的我知道怎么做
比如
proc import datafile="D:file1.csv"
out=new1 dbms=csv replace; getnames=yes;
run;
proc print data=new1;
run;
proc import datafile="D:file2.csv"
out=new2 dbms=csv replace; getnames=yes;
run;
proc print data=new2;
run;
data dn;
merge new1 new2;
by id;
run;
文件“dn”含new1 和 new2的所有variables, 使用公用的id
问题是,如果csv files很多怎么办?比如100+?
可不可以用proc sql + Macro做出来?
怎么做?
多谢。 |
|
d*******1 发帖数: 854 | 7 比如你的SAS文件叫test.
data test;
a=1;b=1; output;
a=2;b=2; output;
run;
用下面的code, SAS-> CSV-> SAS-> 加# -〉CSV
proc export data=test
outfile='c:\test.csv' replace;
run;
data testx;
infile 'c:\test.csv' truncover;
input raw $1-100;
run;
data testx;
set testx;
if _n_=1 then raw='#'||trim(left(tranwrd(raw,',',',#')));
run;
data _null_;
set testx;
file 'c:\testx.csv' dlm='09'x;
put raw;
run; |
|
W*****r 发帖数: 193 | 8 有点没看明白
比如5个csv files(文件名叫dr1.csv, dr2.csv,...,dr5.csv) 在 d:\filename\文件夹下
下面的code应该怎么改?
%macro multimp(dir=,out=);
* Make sure output ds does not exist ;
proc delete data=&out; run;
* Read list of filenames and generate PROC IMPORT and PROC APPEND for each one ;
filename code temp ;
data _null_ ;
infile "dir ""&dir\btlt4-*.csv"" /b" pipe truncover;
input filename $256.;
file code ;
put 'proc import datafile="&dir\' filename +(-1) '" out=onefile replace;'
/ 'run;'
/ 'proc append d... 阅读全帖 |
|
w****k 发帖数: 6244 | 9 import csv
with open('out.csv', 'wb') as f:
writer = csv.writer(f, delimiter=',',quotechar='"',quoting=csv.QUOTE_
ALL)
for item in dic.get("mem"):
writer.writerow([item.get('id'), item.get('host')])
|
|
s*****n 发帖数: 839 | 10 谢谢回复。
我解决了上面的问题。
用下面的程序就可以:
>>> import csv
>>> r=csv.reader(open("C:/Documents/Project/Python code/practice1/csv/
ATXRNSA.csv"))
>>> line1=r.__next__()
>>> line1 |
|
x***y 发帖数: 72 | 11 code 见下。excel file 值是 235693.328673913, 用了format,显示为235,693
。转成csv后为"235,693",请问,如何在csv中存为没有格式的数字?
--------------------------------------------
Dim strExcelFileName
Dim strCSVFileName
Rem strExcelFileName = WScript.Arguments.Item(0) 'file name to parses
strExcelFileName = "test.xlsx"
Rem get path where script is running
Set fso = CreateObject ("Scripting.FileSystemObject") 'use this to find
current path
strScript = Wscript.ScriptFullName
strScriptPath = fso.GetAbsolutePathName(strScript & ".."... 阅读全帖 |
|
E********9 发帖数: 7 | 12 请教大家一个问题:
I'd like to import several .csv file to SAS, but how come I can't use
statement like
MIXED=YES;
USEDATE=YES;
SCANTIME=YES;
in the proc import procedure?
Here is my code:
proc import datafile="---.csv" out=sasuser.trial dbms=csv replace;
delimiter=",";
getnames=yes;
MIXED=YES;
USEDATE=YES;
SCANTIME=YES;
run;
I'm working on UNIX, so didn't try converting csv files to excel before
importing them. Without the statements mentioned above, I have a lot of
error mes |
|
d**********r 发帖数: 24123 | 13 每个CSV文件大约20个变量, 50 条记录。需要全部读入SAS Dataset
那种方式更快?
Import CSV 后,Proc Append? Set? Datasets append?
还是先合并所有的CSV到一个超大的CSV文件再import? |
|
O*****y 发帖数: 222 | 14 a <- read.csv("A.csv", header=TRUE)
b <- read.csv("B.csv", header=TRUE)
new1 <- cbind(a, b[, setdiff(colnames(b), colnames(a))])
new2 <- b[, setdiff(colnames(b), colnames(a))] |
|
|
s*****n 发帖数: 839 | 16 本来我的程序能顺利运行的,后来电脑重装,就装了Python3.2,然后下面的程序就开始
报错了。一开始是找不到next() function, 这个问题已解决。后来是说没有把文件读
成text.我就搞不明白该怎么改了。
程序在这里:
>>> import csv
>>> filename="C:/QWI_2011Q3.csv"
>>> reader=csv.reader(open(filename,'rb'),delimiter=",")
>>> reader.next()
I changed reader.next() to reader.__next__() |
|
w**j 发帖数: 174 | 17 Dear all,
How to change the format of csv file.
I saved a excel file as csv file. In the cell, it can's show the first 0 of
zip code. I change the format to text, but I can't save the format. After I
closed the csv file, it changed back.
Your help is highly appreciated. |
|
b*******e 发帖数: 57 | 18 How to bulk insert .csv data into sybase database?
For example, data is C:\test.csv,
sybase database name is testdb, table is testtbl.
How to write a SQL to bulk insert csv to this testtbl?
Anyone has any experience with that? |
|
t***q 发帖数: 418 | 19 import os
import os.path
import StringIO
import csv
import datetime
dir = r"C:Python27"
if not os.path.exists(dir):
os.mkdir(dir)
my_list=[[1,2,3],[4,5,6]]
datestr=datetime.date.today().strftime("%y%m%d")
filename="good1_codes_{}".format(datestr)
with open(os.path.join(dir, filename+'.csv'), "w") as f:
csvfile=StringIO.StringIO()
csvwriter=csv.writer(csvfile)
for l in my_list:
csvwriter.writerow(l)
for a in csvfile.getvalue():
f.writelines(a)
以上程序,可以做这件事。试过了。 |
|
o******6 发帖数: 538 | 20 PROC IMPORT
datafile='K:\DATA ENTRY\P\Interviews\check.csv'
out=Pcheck
dbms=csv
replace;
getnames=yes;
datarow=2;
run;
那个dataset比较大,有4,5百个VARIABLE,而且很多VARIABLE是用来要SCORE的,
DATASET本身就需要CLEAN,已经花了我一些时间写MACRO来CLEAN和SCORE,比如有很多
DATE的VARIABLE,而DATE存的时候有些是8/ 9/2007,可是现在有个问题,我在SCORE的
时候发现有些VARIABLE被IMPORT后变成CHARACTER了,而且被TRUNCATE了,应该2位数的
变1位数了,上次EXCEL发现问题后CHANGE了WINDOWS REGISTRY WORK了,问题是我现在
还不知道怎么解决IMPORT CSV的问题,我不想用INFILE写,太花时间了,而且CODE又得
有变动,有没有人知道怎么解决这个问题呀,主要那个DATASET有好多DATA是MISSING,
应该也是 |
|
s****m 发帖数: 57 | 21 我想实现如下的功能:
在同一个data步里同时创建10个数据集:
data dataset1 dataset2 ... dataset10;
然后将这个10个数据集保存为10个csv文件。或者不创建sas数据集,直接输出成csv文件也行。
希望用sas代码实现,也就是运行完data步之后能够在指定的路径下生成这10个csv文件。
谢谢。 |
|
O*****y 发帖数: 222 | 22 csv files are basically text files. read.table, scan, read.csv all can read
in data from csv files.
显示256列。多于256列的都遮住了。同学说是用read.table硬读,我试了一下不行。不
用加什么options吗?象SAS里用lrecl=1000000(anyway一个比较大的数)?多谢答复! |
|
s**********y 发帖数: 38 | 23 A <-read.matrix("D:\Course\matrix.csv", header = t, sep = ",")
我想把存在D:\Course\matrix.csv的 matrix 读到 R, 为什么R
Error: could not find function "read.matrix"
In addition: Warning messages:
1: '\P' is an unrecognized escape in a character string
2: '\p' is an unrecognized escape in a character string
3: '\m' is an unrecognized escape in a character string
4: unrecognized escapes removed from "D:\Course\matrix.csv"
请问要怎样修改程序? |
|
D*********2 发帖数: 535 | 24 read.matrix是哪个包下的?try read.csv
还有你windows下?杠画反了吧,try
D:/Course/matrix.csv
or
D:\\Course\\matrix.csv |
|
g******d 发帖数: 231 | 25 我用了下面的code把 .csv 文件import到SAS里。file有很多columns, 而且都带有小数
位。
PROC IMPORT OUT=work.getit
FILE="C:\source.csv"
DBMS=csv REPLACE;
GETNAMES=YES;
DATAROW=2;
RUN;
import之后出现了一个状况:有一个column不能import成功。
在log file中其他的column的import过程显示:informat varname best32. -->
format varname best12. (input varname)。
但是这个column的显示是informat varname $1. --> format varname $1. (input
varname $ ). 但是明明source file中,该column就是numeric的。
请大虾指教。这是怎么回事,有办法修正吗?
十分感谢! |
|
x**********0 发帖数: 163 | 26 I want to import multiple csv file
acc1990
acc1991
..
acc2010
I write a SAS macro like this
%MACRO importAcc (first=1990, last=2010);
%local year;
%do year=&first %to &last;
proc import datafile="C:\Users\acc&year..csv"
out=acc&year
dbms=csv
replace;
getnames=yes;
run;
%end;
%MEND importAcc;
%importAcc
But it is wrong and give back nothing, Can anybody help me with this? Thanks |
|
|
s****h 发帖数: 3979 | 28 I have text/csv files and want to upload them into Cloudera cluster, and use
them in Spark.
What's the best way to upload and convert text/csv file into PARQUET format?
Two load, use either file manager in Hue or SFTP?
To convert, I can think of 3 ways:
A.
In HIVE, create external table based on the original file,
then create new external table in PARQUET format ?
B.
In Spark, wse Scala code to convert ? Conversion speed might be a concern.
https://developer.ibm.com/hadoop/blog/2015/12/03/parque... 阅读全帖 |
|
a**e 发帖数: 5794 | 29 去年微软停止了MS Money的开发之后,我一直在找合适的工具,结果都
不太理想。
只好自己写一个程序来把QIF转成CSV。配合Kenny小DD的Excel文件使用,
效果更佳。
可以在下面url下载。
http://sourceforge.net/projects/qif/
**************************************
1. Objective
This program converts Quicken Interchange Format (QIF) to Comma-Separated
Values (CSV).
After Microsoft Money was discontinued in June 2009, I tried to find a tool
or solution to deal with its legacy data. I found something, but they are
not good enough.
2. Files
- readme.txt
- qif.class program.
- qi |
|
l******9 发帖数: 579 | 30 【 以下文字转载自 Database 讨论区 】
发信人: light009 (light009), 信区: Database
标 题: Truncation error import csv file to SQL table
发信站: BBS 未名空间站 (Wed Apr 29 15:28:46 2015, 美东)
I would like to import a .csv file into a SQL Server 2008R2 database table
on Win 7.
It has one column and one row.
File1:
name
runeocnu 430274 sjunosnv djduenvop 934m ljfonm3
I got error:
Error 0xc02020a1: Data Flow Task 1: Data conversion failed. The data
conversion for column "NAME" returned status value 4 and status text "Text
w... 阅读全帖 |
|
c***i 发帖数: 83 | 31 The error is:
Please select a Comma Separated Value (e.g. csv/xls/txt) file to upload.
But it's a Comma Separated Value csv file.
Anyone use TaxACT to file tax and has the same problem? Thank you! |
|
c***i 发帖数: 83 | 32 The error is:
Please select a Comma Separated Value (e.g. csv/xls/txt) file to upload.
But it's a Comma Separated Value csv file.
Anyone use TaxACT to file tax and has the same problem? Thank you! |
|
c***i 发帖数: 83 | 33 The error is:
Please select a Comma Separated Value (e.g. csv/xls/txt) file to upload.
But it's a Comma Separated Value csv file.
Anyone use TaxACT to file tax and has the same problem? Thank you! |
|
e****e 发帖数: 3450 | 34 【 以下文字转载自 SanFrancisco 讨论区 】
发信人: evolve (深居简出), 信区: SanFrancisco
标 题: turbotax and csv file import
发信站: BBS 未名空间站 (Sat Apr 11 20:54:39 2009), 转信
schwab不提供txf file,只提供CSV file,直接Import finacial institution不成功,
你们怎么操作的?谢谢 |
|
l********a 发帖数: 1154 | 35 py3k和py2.x的文档来看就一个差别:
py3k:
"...If csvfile is a file object, it should be opened with newline=''.[1]"
[1] If newline='' is not specified, newlines embedded inside quoted fields
will not be interpreted correctly, and on platforms that use \r\n linendings
on write an extra \r will be added. It should always be safe to specify
newline='', since the csv module does its own (universal) newline handling.
py2.x:
"...If csvfile is a file object, it must be opened with the ‘b’ flag on
platforms where tha... 阅读全帖 |
|
u******p 发帖数: 13 | 36 proc import out=_sas_input
data="foo.csv"
dbms=csv;
getnamese=yes;
datarow=2; /*with field name*/
run; |
|
C***o 发帖数: 284 | 37 csv文件里面的数据是这样
id,name, sex
1, Wang, M
2, Li, F
读进表中希望是这样的格式
id, field, value
1, name, Wang
1, sex, M
2, name, Li
2, sex, F
我知道当然可以先处理csv文件,把它变成相应的格式再load,或者直接load进去再处
理表。
但我想直接用load一次完成,有没有办法? |
|
C***o 发帖数: 284 | 38 csv文件里面的数据是这样
id,name, sex
1, Wang, M
2, Li, F
读进表中希望是这样的格式
id, field, value
1, name, Wang
1, sex, M
2, name, Li
2, sex, F
我知道当然可以先处理csv文件,把它变成相应的格式再load,或者直接load进去再处
理表。
但我想直接用load一次完成,有没有办法? |
|
l***s 发帖数: 1405 | 39 csv 文件第一行是header,比如日期,身高,体重,工作时间,等等
然后下面就是具体的数据
当然第一列是日期,比如09/05/12
我要对这个csv 文件进行操作,比如算平均工资,或者按照日期排序,等等
我用stringtokenizer已经把这个file导进一个double array,type是string,请问如
果我要按照日期排序,是不是要把第一列先转成date format?
然后如果要算比如平均工作时间,是不是可以就用string来算,还是得把那些数据转成
比如double?
刚刚学Java,谢谢~~ |
|
y***i 发帖数: 34 | 40 anyone had this problem before?
I tried to read "," delimited CSV file in EXCEL 2007 using VBA, but
Workbooks.OpenText Filename:=curFilepath + "\Settlement.csv", DataType:=
xlDelimited, comma:=True
it converted "Jan-09" to Jan 09, 2008. Actually, it should be Jan-2009.
Microsoft said it is a problem in EXCEL 2002.users have to change register
file.
Any expert knows how to fix it in code, not in register file?
Thanks a lot! |
|
t***q 发帖数: 418 | 41 网上搜了搜code,好像用stringio.stringio ,还有package Google.appengine.api,或
django ,但Google.appengine.api,试过,总有error,django 又不能正确安装,怎么办
?大家有没有用过的好的code 分享,还有boss要求csv file name 需有格式, file-
year month day.csv .多谢大家帮助,有包子。 |
|
|
l******9 发帖数: 579 | 43 【 以下文字转载自 Database 讨论区 】
发信人: light009 (light009), 信区: Database
标 题: Truncation error import csv file to SQL table
发信站: BBS 未名空间站 (Wed Apr 29 15:28:46 2015, 美东)
I would like to import a .csv file into a SQL Server 2008R2 database table
on Win 7.
It has one column and one row.
File1:
name
runeocnu 430274 sjunosnv djduenvop 934m ljfonm3
I got error:
Error 0xc02020a1: Data Flow Task 1: Data conversion failed. The data
conversion for column "NAME" returned status value 4 and status text "Text
w... 阅读全帖 |
|
s******d 发帖数: 303 | 44 我的数据有大约 150G, 是csv 形式的。我需要共里面取一些数据,但是如果先infile
这个大 data, 好像不太可能。
想问问版上的高人,有没有什么办法,直接从一个巨大的csv file 读取我想要得 记录
。我看了一下proc sql, 发现还是得 from .sasdataset.
先谢谢啦。 |
|
b*******g 发帖数: 513 | 45 Or try this:
filename cc "path.\xx.csv";
PROC EXPORT DATA=dataset1 OUTFILE=cc DBMS=CSV REPLACE;
run;
文件也行。
件。 |
|
E********9 发帖数: 7 | 46 Thank you for your reply.
Below is the log I got:
proc import datafile="---.csv" out=sasuser.trial dbms=csv replace;
NOTE: The previous statement has been deleted.
NOTE: The previous statement has been deleted.
3 delimiter=",";
4 getnames=yes;
5 MIXED=YES;
-----
180
6 USEDATE=YES;
-------
180
7 SCANTIME=YES;
--------
180
ERROR 180-322: Statement is not valid or it is used out of proper order.
8 run;
I |
|
S***e 发帖数: 108 | 47 MIXED=yes|no,USEDATE=yes|no,SCANTIME=yes|no are options for reading excel
files, not for csv files.
If you want to use those options in SAS, you'd better convert your csv file
to excel file first. |
|
b*******g 发帖数: 513 | 48 怎样在R里读入一个列数超过256列的csv,excel文件?大家知道csv,excel文件最多显示256列。多于256列的都遮住了。同学说是用read.table硬读,我试了一下不行。不用加什么options吗?象SAS里用lrecl=1000000(anyway一个比较大的数)?多谢答复! |
|