read.csv - 在 read.csv 中,无效的多字节字符串

我正试图导入一个日文csv,这个代码:


url <- 'http://www.mof.go.jp/international_policy/reference/itn_transactions_in_securities/week.csv'
x <- read.csv(url, header=FALSE, stringsAsFactors=FALSE)

返回以下错误:

误差在type.convert (数据[[i]] as.is =as.is [i]DEC =分解na.strings =字符( 0L )):在'<91> 0<8B>ý<82> ё Γ<E0> <无效多字节字符串8f> <94> <94> <84> <94> <83> <8c> _<96>

时间:

Encoding设置字符串的编码,

在尝试"UTF-8"后,这对我有效:


x <- read.csv(url, header=FALSE, stringsAsFactors=FALSE, fileEncoding="latin1")

无论哪种方式,仍然有很多清理工作要做。


x <- read.csv(url, header=FALSE, stringsAsFactors=FALSE,
 fileEncoding="latin1", skip=16)
# get started with the clean-up
x[,1] <- gsub("u0081|`","", x[,1]) # get rid of odd characters
x[,-1] <- as.data.frame(lapply(x[,-1], # convert to numbers
 function(d) type.convert(gsub(d, pattern=",", replace=""))))

系统区域设置不兼容,请尝试设置系统区域,设置Sys.setlocale("LC_ALL","C"),

对于那些使用 Rattle与此问题便是我解决这个问题如下:

  1. 请首先确认要退出铃铛这样你在R 命令提示符
  2. > library (rattle)( 如果不这样做的话)
  3. > crv$csv.encoding="latin1"
  4. > rattle()
  5. 你现在应该能够继续下去。 ie,导入csv >执行>模型>执行等等。

作用了我,希望,帮助了露营队员

...