主权项 |
一种用于电子化文章之商品评价用词发掘方法,其步骤为:先以数笔通用测试资料挑选出数笔含有口碑的文章,并取出数笔正负口碑用词及数笔口碑叙述句后,再依据正负口碑用词与口碑叙述句进行设定对文字进行标注的规则后,则使用条件随机域进行学习,并进行对输入的文字进行标注的动作训练,以演算法学习先前标注时所运用的知识后,模仿先前对文字进行的标注,以建立出一通用预测模型;之后,再依据通用预测模型将数笔产业领域测试资料进行预测,并判断及发掘用于产业领域之新的正负口碑用词;再将既有的正负口碑用词与新的正负口碑用词进行累计后,将累计之正负口碑用词于数笔含有口碑的文章中取出数笔新的口碑叙述句后,再依据累计之正负口碑用词与新的口碑叙述句进行设定对文字进行标注的规则后,则使用条件随机域进行学习,并进行对输入的文字进行标注的动作训练,以演算法学习先前标注时所运用的知识后,模仿先前对文字进行的标注,以建立出一新的预测模型;以及最后,再依据新的预测模型将数笔产业领域测试资料进行再次预测,并再次进行判断及发掘新的正负口碑用词与新的口碑叙述句,之后,重覆进行新的预测模型建立与新的正负口碑用词及新的口碑叙述句发掘,并于没有发掘到新的正负口碑用词后,则结束发掘程序,其中结束发掘程后,则将全部累计之正负口碑用词导入一通用词汇资料库中,以做为共用的词汇使用。
|