在r caret包中的train功能的模型输出中有巨大的尺寸

我正在使用r caret包中的train()函数训练bagFDA模型,并将模型输出保存为.Rdata文件。 输入文件大约有300k个记录,包含26个变量,但输出.Rdata的大小为3G。 我只需运行以下命令:在窗口系统下运行modelout < - train(x,y,method =“bagFDA”)save(file =“myout.Rdata”,modelout)。 问题:(1)为什么myout.Rdata是如此之大? (2)如何缩小文件的大小?

提前致谢!

JT


在trainControl中为starters设置了returnData = FALSE,所以你不要在模型中创建额外的数据副本。 我的理解是,您正在使用bagFDA创建一些引导程序,从本质上创建相同数量的数据副本。 降低B参数,默认为50,应该缩小它也看看这篇文章:

为什么插页训练占用这么多的记忆?

链接地址: http://www.djcxy.com/p/6537.html

上一篇: huge size in model output from train function in r caret package

下一篇: should .RData files be used to store functions?