口语会话中句子边界识别方法,申请号CN03147553.1-传众专利搜索

首页产品黄页商标征信

会员服务注册登录

法人/股东/高管

发明名称	口语会话中句子边界识别方法
摘要	口语会话中句子边界识别方法，包括：获得口语语料库；对口语语料库进行替代处理；统计n-gram模型的n元同现频率；估计n元正向依存概率和n元逆向依存概率，其中，所述依存概率采用Modified Kneser-Ney Smoothing数据平滑算法估计；获得n元正、逆向依存概率数据库；设定Maximum Entropy模型的特征函数；循环计算特征函数参数，其中，采用Generalized Iterative Scaling算法计算特征函数参数；获得特征函数参数数据库；所述切分过程包括步骤：用基于正向n-gram模型的切分方法对文本进行切分；用基于逆向n-gram模型的切分方法对文本进行切分；抽取切分点的上下文，用Maximum Entropy模型的特征函数的参数对正、逆向切分结果进行加权综合。本发明不受语言的限制，通过更换训练语料库，可以运用于任何一种语言的句子边界切分。
申请公布号	CN1271550C	申请公布日期	2006.08.23
申请号	CN03147553.1	申请日期	2003.07.22
申请人	中国科学院自动化研究所	发明人	宗成庆;刘丁
分类号	G06F17/30(2006.01);G06F17/00(2006.01)	主分类号	G06F17/30(2006.01)
代理机构	中科专利商标代理有限责任公司	代理人	戎志敏
主权项	1.一种口语会话中句子边界识别方法，包括步骤：获得口语语料库；对口语语料库进行替代处理；统计n-gram模型的n元同现频率；估计n元正向依存概率和n元逆向依存概率，其中，所述依存概率采用Modified Kneser-Ney Smoothing数据平滑算法估计；获得n元正、逆向依存概率数据库；设定Maximum Entropy模型的特征函数；循环计算特征函数参数，其中，采用Generalized Iterative Scaling算法计算特征函数参数；获得特征函数参数数据库；用基于正向n-gram模型的切分方法对文本进行切分；用基于逆向n-gram模型的切分方法对文本进行切分；抽取切分点的上下文，用Maximum Entropy模型的特征函数的参数对正、逆向切分结果进行加权综合。
地址	100080北京市海淀区中关村南一条1号

您可能感兴趣的专利

ADHESIVE TRANSDERMAL FORMULATIONS OF DICLOFENAC SODIUM

CRYSTALLIZATION OF AMINO ACIDS USING ULTRASONIC AGITATION

NOVEL 5-THIO-SS-D-XYLOPYRANOSIDE DERIVATIVES, PREPARATION METHOD THEREOF, PHARMACEUTICAL COMPOSITIONS CONTAINING SAME AND THE THERAPEUTIC USE THEREOF

DISK BRAKE FOR A VEHICLE BRAKING SYSTEM

NEW DELTA-HYDROXY-GAMMA-LACTONES FEATURING DETERRENT PROPERTIES AND METHOD FOR THEIR PRODUCTION

LIQUID DISTRIBUTOR IN MASS TRANSFER COLUMN AND METHOD OF INSTALLATION AND USE

METALLIC BEVERAGE CAN END WITH IMPROVED CHUCK WALL AND COUNTERSINK

LINE DESIGN AND PROPULSION SYSTEM FOR A DIRECTIONALLY STABLE, SEAGOING BOAT WITH RUDDER PROPELLER DRIVE SYSTEM

FILLING DEVICE COMPRISING LATERAL FILLING WINDOWS

BEVERAGE BREWING SYSTEM AND METHOD FOR BREWING A BEVERAGE

STABILIZED BRIVUDINE TOPICAL FORMULATIONS

REFLECTING ELEMENT

CONTAINER, PARTICULARLY FOR KEEPING SMALL ARMS

INTERLOCK MECHANISM

METHOD FOR MEASURING THERMAL CONDUCTIVITY AND APPARATUS DESIGNED TO MEASURE THERMAL CONDUCTIVITY

METHOD FOR PREPARATION OF CYCLOHEXANONE OXIME

METHOD FOR PRODUCTION OF SOUR CREAM

MOBILE TELEPHONE