发明名称 一种特征抽取方法和装置
摘要 本发明公开了一种特征抽取方法和装置,应用于一电子设备中,所述方法包括:所述电子设备接收来自服务器所采集的用户‑项目历史行为统计数据;将所述统计数据存储在存储模块中;对所述用户‑项目历史行为统计数据进行非负用户行为特征抽取,获得特征抽取数据;将所述特征抽取数据存储在所述存储模块中,解决了现有技术中存在不能抽取出能够保证对已知数据的良好还原性和非负性,不能够良好地表征用户行为规律的用户行为特征的技术问题,实现了能抽取出能够保证对已知数据的良好还原性和非负性,能够良好地表征用户行为规律的用户行为特征的技术效果。
申请公布号 CN103700011B 申请公布日期 2016.11.23
申请号 CN201410013846.9 申请日期 2014.01.13
申请人 重庆大学;成都国科海博信息技术股份有限公司 发明人 罗辛;夏云霓;陈鹏;吴磊
分类号 G06Q30/02(2012.01)I;G06F17/30(2006.01)I 主分类号 G06Q30/02(2012.01)I
代理机构 成都行之专利代理事务所(普通合伙) 51220 代理人 梁田
主权项 一种特征抽取方法,应用于一电子设备中,其特征在于,所述方法包括:所述电子设备接收来自服务器所采集的用户‑项目历史行为统计数据;将所述统计数据存储在存储模块中;对所述用户‑项目历史行为统计数据进行非负用户行为特征抽取,获得特征抽取数据;将所述特征抽取数据存储在所述存储模块中;对所述统计数据进行特征抽取,具体为:对所述统计数据进行处理稀疏矩阵的非负用户行为特征抽取;对所述用户‑项目历史行为统计数据进行非负用户行为特征抽取,获得特征抽取数据,具体包括:对特征抽取过程所需要的参数进行初始化获得第一参数;基于所述统计数据和所述第一参数,训练构造特征数据;通过迭代训练所述特征数据,获得特征抽取数据;其中,所述训练构造特征数据具体包括:首先构造累积绝对误差ε,ε以公式(1)表示:<img file="FDA0001041147140000011.GIF" wi="1110" he="159" />R<sub>K</sub>表示用户‑项目历史行为统计矩阵中的已知数据集合;r<sub>u,i</sub>表示用户‑项目历史行为统计矩阵中第u行,第i列的元素值,代表用户u在项目i上的历史行为统计数据;p<sub>u</sub>表示用户特征矩阵P的第u行行向量,代表用户u的行为特征向量;q<sub>i</sub>表示项目特征矩阵Q的第i行行向量,代表已知全部用户对于项目i进行操作的历史行为特征;p<sub>u</sub>.q<sub>i</sub>表示向量p<sub>u</sub>和q<sub>i</sub>间的内积,||P||<sub>F</sub>和||Q||<sub>F</sub>分别表示用户特征矩阵P和项目特征矩阵Q的Frobenius范数,λ<sub>P</sub>和λ<sub>Q</sub>为:Tikhonov规约因子;然后,对用户特征矩阵P和项目特征矩阵Q进行迭代训练,使其满足累积绝对误差ε相对于用户特征矩阵P和项目特征矩阵Q在用户‑项目历史行为统计矩阵中的已知数据集合R<sub>K</sub>上最小,表示为公式(2):<img file="FDA0001041147140000012.GIF" wi="1614" he="213" />其中<img file="FDA0001041147140000021.GIF" wi="526" he="164" />和<img file="FDA0001041147140000022.GIF" wi="203" he="150" />分别为p<sub>u</sub>.q<sub>i</sub>、<img file="FDA0001041147140000023.GIF" wi="203" he="107" />和<img file="FDA0001041147140000024.GIF" wi="204" he="110" />的单元素依赖的数学展开形式,f为特征空间维数,同时,训练过程中还需满足用户特征矩阵P和项目特征矩阵Q的非负性,表示为公式(3):<img file="FDA0001041147140000025.GIF" wi="1942" he="303" />最后,使用单元素依赖的非负用户特征迭代训练过程,在用户‑项目历史行为统计矩阵中的已知数据集合R<sub>K</sub>中的已知数据上对用户特征矩阵P和项目特征矩阵Q进行迭代训练,表示为公式(4):<img file="FDA0001041147140000026.GIF" wi="1950" he="359" />其中,I<sub>u</sub>表示具备用户u的历史行为统计数据的项目集合,U<sub>i</sub>表示具备项目i的历史行为统计数据的用户集合。
地址 404100 重庆市沙坪坝区正街174号