在java中的svd问题

我经历了jama和小马(我用java编码)。 他们都期望我使用数组,使得行数多于coloumns的数量。

但在潜在语义分析(LSA)的情况下,我有5本书,总共有1000个单词。 当我使用术语文档矩阵时,我得到一个5 * 1000的矩阵。

由于这不起作用,我不得不调换矩阵。 在转置我使用1000 * 5。 用1000 * 5当我执行svd时,我得到一个5 * 5的S矩阵。 为了执行降维,5 * 5矩阵看起来很小。

可以做什么?


您使用的文本片段大小太大。 文档(列)应该代表一页或几页文本,也许是最大的一章。 我也看过使用段落大小。

链接地址: http://www.djcxy.com/p/49099.html

上一篇: Problems with svd in java

下一篇: Latent Semantic Analysis concepts