发明名称 利用文档聚类的多文档概括
摘要 本发明涉及利用文档聚类的多文档概括。用于通过产生作为文档聚类的混合体的文档模型概括多文档的系统和方法,每个文档又具有句子混合体,其中所述模型同时表示概括信息和文档聚类结构;以及确定损失函数,用于评估所述模型和优化所述模型。
申请公布号 CN101676897A 申请公布日期 2010.03.24
申请号 CN200910149778.8 申请日期 2009.05.27
申请人 美国日本电气实验室公司 发明人 S·朱;D·王;Y·赤;Y·龚
分类号 G06F17/27(2006.01)I;G06F17/30(2006.01)I 主分类号 G06F17/27(2006.01)I
代理机构 中国专利代理(香港)有限公司 代理人 王 岳;李家麟
主权项 1.一种用于概括文档的方法,包括:a.生成作为文档聚类混合体的文档模型,每个文档又具有句子的混合体,其中所述模型同时表示概括信息和文档聚类结构;以及b.确定损失函数,用于评估所述模型和优化所述模型。
地址 美国新泽西州