ddply创建列表的联合

我有一个数据框,其中包含一个customerid和一个列表。 我想合并那些与同一客户有关的列表。

library(plyr)
subsets <- list(c("a", "d", "e"), c("a", "b", "c", "e"))
customerids <- c(1,1)
transactions <- data.frame(customerid = customerids,subset =I(subsets))
> transactions
  customerid     subset
1          1    a, d, e
2          1 a, b, c, e

如果我想用ddply合并子集,我会得到一个扩展结果

> ddply(transactions, .(customerid), summarise, subset=Reduce(union,subset))
  customerid subset
1          1   a
2          1   d
3          1   e
4          1   b
5          1   c

而我会预期所有的结果在1排。


你可以做这样的事情:

ddply(transactions, .(customerid), function(x) 
            data.frame(subset=I(list(unlist(x$subset)))))

编辑:我不确定我是否按照你的意见。 但是,如果您只想在每个customerid subset唯一值,那么:

ddply(transactions, .(customerid), function(x) 
            data.frame(subset=I(list(unique(unlist(x$subset))))))
链接地址: http://www.djcxy.com/p/72887.html

上一篇: ddply for creating the union of lists

下一篇: Qt QNetworkReply is always empty