一种非结构化大数据流的内容语义挖掘方法,申请号CN201610041935.3-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	一种非结构化大数据流的内容语义挖掘方法
摘要	本发明公开了一种非结构化大数据流的内容语义挖掘方法，包括S1：提取大数据流中的文本链接、标签属性和语义倾向关键词，并对应定义文本结点、标记结点、内容结点；S2：构建包含各文本结点的文本结点集合，包含各标记结点的标记结点集合，计算并输出文本结点到标记结点之间的权值、以及任意标记结点到其他所有标记结点之间的权值；S3：根据文本结点集合、标记结点集合、文本结点到标记结点之间的权值、任意标记结点到其他所有标记结点之间的权值，对各内容结点进行语义分类并构建不同的内容结点分类集合；S4：根据文本结点集合、内容结点分类集合，对文本结点进行加权的小世界网络聚类计算，获得文本结点聚类集合。
申请公布号	CN105740329A	申请公布日期	2016.07.06
申请号	CN201610041935.3	申请日期	2016.01.21
申请人	浙江万里学院	发明人	张少中
分类号	G06F17/30(2006.01)I	主分类号	G06F17/30(2006.01)I
代理机构	宁波市鄞州甬致专利代理事务所(普通合伙) 33228	代理人	代忠炯
主权项	一种非结构化大数据流的内容语义挖掘方法，其特征在于，包括以下步骤：步骤S1：提供一大数据流，提取所述大数据流中的文本链接、标签属性和语义倾向关键词，定义各所述文本链接为文本结点，各所述标签属性为标记结点，各所述语义倾向关键词为内容结点；步骤S2：构建包含各所述文本结点的文本结点集合，以及包含各所述标记结点的标记结点集合，计算并输出所述文本结点到所述标记结点之间的权值、以及任意所述标记结点到其他所有标记结点之间的权值；步骤S3：根据所述文本结点集合、标记结点集合、文本结点到标记结点之间的权值、任意标记结点到其他所有标记结点之间的权值，对各所述内容结点进行语义分类并构建不同的内容结点分类集合；步骤S4：根据所述文本结点集合、内容结点分类集合，对文本结点进行加权的小世界网络聚类计算，获得文本结点聚类集合。
地址	315100 浙江省宁波市鄞州区钱湖南路8号

您可能感兴趣的专利

UNICAST DELIVERY OF MULTIMEDIA CONTENT

MEDICAL GUIDEWIRE

IMPROVED CARBONATE POLYMER BLENDS WITH REDUCED GLOSS

HINGED ANCHORS FOR WIRELESS PACING ELECTRODES

METHOD OF PRINTING MARKS ON AN OPTICAL ARTICLE

FILTER AND ASSOCIATED METHOD

DEPOSITION SYSTEM FOR THIN FILM FORMATION

2-S-BENZYL SUBSTITUTED PYRIMIDINES AS CRTH2 ANTAGONISTS

METHOD AND APPARATUS FOR ENHANCED TELECOMMUNICATION INTERFACE

ENHANCED TELECOMMUNICATION SIGNAL INSERTION SYSTEMS AND METHODS

SEMICONDUCTOR MEMORY DEVICE AND ITS CONTROL METHOD

WINDING DEVICE WITH LIFTING ARMS FOR THE WINDING SPINDLES

ANTI EXTRACTION DEVICE, INSERTION DEVICE, INSERTION ASSEMBLY AND METHOD

ABDOMINAL MUSCLE EXERCISE APPARATUS AND METHOD

TREATMENT FLUID WITH NON-SYMMETRICAL PEROXIDE BREAKER AND METHOD

PRELIMINARY NEIGHBOR CELL SUITABILITY CHECK

A METHOD FOR CLASSIFYING A TRANSPONDER AND/OR SIGNALS ORIGINATING FROM A TRANSPONDER AND READER

APPARATUS AND METHOD

GARMENT LABEL PRINTING METHOD