发明名称 语意情緖分类系统
摘要 本发明系一种语意情绪分类系统,主要包括一与领域无关且表达特定语意的情绪规则资料库建立程序及一情绪分类模组;其系经由归纳情绪心理学中能引发情绪的基本因素,并以语意标签为中心,运用资料探勘之自动规则生成技术,将语句化为向量空间并训练出一情绪分类模组将语句表达的情绪分类,本发明可在原有之人机沟通介面上增加情绪沟通维度;藉由对使用者情绪反应的探知,辅助其在其余沟通介面上之不足,同时可取代电脑系统惯常之僵化反应介面,以利更自然之沟通介面设计。
申请公布号 TWI269192 申请公布日期 2006.12.21
申请号 TW092121943 申请日期 2003.08.11
申请人 国立成功大学 发明人 吴宗宪;林宇中;庄则敬
分类号 G06F17/21(2006.01) 主分类号 G06F17/21(2006.01)
代理机构 代理人 欧奉璋 台北市信义区松山路439号3楼
主权项 1.一种语意情緖分类系统,其系先建立一语意标签系统,而该语意标签之建立系包含有一基本规则收集、一语意标签定义及一语意标签定义准则,并藉由一延伸式标签语言(XML eXtensible Markup Language)来记录所有得到不同的语意标签定义,以供电脑自动标注语意标签;一语意特征转换系统,系用以将语意标签中所得之情緖特征词转换为一向量;以及一支持向量机模组训练系统,系藉由一可适合资料稀少时的分类模组,由输入之情緖向量训练得到分类模组。2.依申请专利范围第1项所述之语意情緖分类系统,其中,该基本规则收集主要着重的两种情緖语意,分别是快乐与不快乐。3.依申请专利范围第1项所述之语意情緖分类系统,其中,该语意标签定义包括有:一特定语意标签,该特定语意标签系表达特定语意的语意词、一否定语意标签,该否定语意标签系具有否定意味的语意词及一转折辅助语意标签,该转折辅助语意标签系具有语气转折的语意词。4.依申请专利范围第1项所述之语意情緖分类系统,其中,该语意标签定义准则系配合知网(Hownet)中的概念定义、知网中的概念连结、知网中的主要特征阶层、词性、词位、特定关键词及词汇间组成样式而组成的族群。5.依申请专利范围第1项所述之语意情緖分类系统,其中,该语意特征转换系统系包含有:一自动语意标签标记、一语意记录撷取、情緖规则探勘及一特征转换所构成。6.依申请专利范围第5项所述之语意情緖分类系统,其中,该自动语意标签标记,其系将文句中具有表达某一特别语意的词标注上标签,而该自动语意标签标记之自动标记能力主要系来自上述语意标签的定义。7.依申请专利范围第5项所述之语意情緖分类系统,其中,该语意记录撷取,其系将特定语意标签的内容以及语意标签的词外其它具有候选词性的词转换为一笔语意记录。8.依申请专利范围第5项所述之语意情緖分类系统,其中,该情緖规则探勘,其系将同领域中之共同情緖情况撷取出,并以规则的形式表现,可利用来将每一笔语意记录转换为一向量表示。9.依申请专利范围第5项所述之语意情緖分类系统,其中,该特征转换,系将语意记录与情緖规则中的主要特征词部分作检查后加以转换。10.依申请专利范围第1项所述之语意情緖分类系统,其中,将该全部的语意记录转换为向量表示后,可得一个原始矩阵WMxN,而该列M为全部语意记录笔数,行N为情緖规则数。11.依申请专利范围第1项所述之语意情緖分类系统,其中,该支持向量机模组训练系统系包含有:一奇异値分解、一支持向量机模组训练及一分类模组训缘所构成并在该支持向量机模组训练之前,系运用奇异値分解将原始的向量空间转换至另一维度间正交的向量空间上。12.依申请专利范围第11项所述之语意情緖分类系统,其中,该奇异値分解系令原矩阵为WMxN,则W经过奇异値分解后为WMN=WMR.WRR.VTRN,其中U为(MR)的左奇异矩阵;S为(RR)由奇异値组成的对角矩阵;V为(NR)的右奇异矩阵;R min(M,N)为所决定的新的向量空间的维度。13.依申请专利范围第11项所述之语意情緖分类系统,其中,该支持向量机模组训练系经由定义一个决策函数(Deeision funetionD(x))来找到一条分隔线,而该决策函数(Decision funetion D(x))的定义如下:D(x)=(w.x)+w0,其中 ,因此该决策函数(Decision funetion D(x))可改写如: ,若资料无法在所在的维度下明确的分类,则会将资料转换至高维度之后再做分类,转换公式如下::Rn→Rm,m≧n为简化内积运算,系定义kernel function(核心函式)加快运算的速度,kernel function定义如下:k(x,y)=(x).(xj)而常用的kernel function有下列几种:Simple dot:k(x,y)=x.yVovk's polynomial:k(x,y)=(x.y+1)pRadial basis function:k(x,y)=exp(-∥x-y∥2/22)Sigmoid kernel:k(x,y)=tanh(k(x.y)-)。14.依申请专利范围第1项所述之语意情緖分类系统,其中,该分类模组,其系经过向量空间的转换后,即可由这些在语意特征空间上的点来训练分类模组,可得到三种情緖分类的分类模组,分别是不快乐、快乐与无情緖。图式简单说明:第1图,系本发明之语意情緖分类系统训练架构示意图。第2图,系本发明之语意情緖分类系统测试架构示意图。第3图,系知网的记录形式示意图。第4A、4B及4C图,系知网的附加属性示意图。第5A、5B及5C图,系本发明之特定语意标签示意图。第6图,系本发明之否定语意标签示意图。第7图,系本发明之转折辅助语意标签示意图。第8图,系本发明之自动语意标签标注程序示意图。第9A及9B图,系本发明之语意记录撷取程序示意图。第10图,系本发明之Apriori algorithm示意图。第11图,系本发明之Adaptation of Apriori algorithm示意图。第12图,系本发明之奇异値分解示意图。第13图,系本发明之支持向量机分类示意图。第14图,系本发明之语意情緖分类系统示意图。第15图,系本发明之语意情緖分类模组训练系统示意图。第16图,系本发明之核心函式为dot product之分类正确率与对应参数关系示意图。
地址 台南市东区大学路1号