发明名称 一种在线课程的搜索方法
摘要 本发明涉及一种在线课程的搜索方法,属于网络信息智能处理领域,该方法包括:依照课程结构遍历课程内容,提取出每个课程内容单元的概述文档;对不同类型节点的概述文档分别建立索引文件,并将索引文件分类存储;根据用户查询的类型,选择索引文件进行检索,检索出相关的概述文档;根据中检索出的概述文档的相关度和类型,对课程进行评分;根据计算出的课程得分对课程进行排序,根据排序先后依次生成课程搜索结果。本发明可针对在线课程中包含不同类型的内容优化搜索效果与效率,满足不同用户针对具体类型内容搜索的需求。
申请公布号 CN104572918A 申请公布日期 2015.04.29
申请号 CN201410834625.8 申请日期 2014.12.26
申请人 清华大学 发明人 薛宇飞;陈翱;孙茂松
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京清亦华知识产权代理事务所(普通合伙) 11201 代理人 廖元秋
主权项 一种在线课程的搜索方法,应用在大规模在线教育课程平台上,其特征在于,该方法包括以下步骤:1)依照课程结构遍历课程内容,提取出每个课程内容单元的概述文档;具体为:将课程按内容划分成多个单元,每个单元中包含单一类型的内容,如习题、字幕、讲义等,根据课程内容单元的组织结构,依一定次序不重复地遍历每一个课程单元,读取每一个课程单元的内容;将每个课程单元的内容去除格式等信息,仅保留文字内容,生成该单元的概述文档,得到具有相同结构的概述文档;2)对不同类型节点的概述文档分别建立索引文件,并将索引文件分类存储;具体为:将概述文档中需要供用户检索的内容生成用于检索的索引文件,并在索引文件中记录概述文档对应的单元在课程中的位置信息,将索引文件按照相应节点的类型分类存储;3)根据用户查询的类型,选择索引文件进行检索,检索出相关的概述文档;具体为:用户在提交查询时,指定查询的内容类型和查询的范围,根据用户的查询选择对应类型及范围的索引文件进行检索,并返回对应的概述文档及概述文档与用户查询的相关度;若用户查询的范围是一门课程或一门课程的一部分,则转步骤6),否则继续步骤4)4)根据步骤3)中检索出的概述文档的相关度和类型,对课程进行评分;具体为:定义一门课程C的得分为:<maths num="0001" id="cmaths0001"><math><![CDATA[<mrow><mi>score</mi><mrow><mo>(</mo><mi>C</mi><mo>)</mo></mrow><mo>=</mo><munder><mi>&Sigma;</mi><mrow><mi>i</mi><mo>&Element;</mo><mi>C</mi></mrow></munder><mi>F</mi><mrow><mo>(</mo><msub><mi>g</mi><mi>i</mi></msub><mo>,</mo><msub><mi>r</mi><mrow><mi>i</mi><mo>,</mo><mi>q</mi></mrow></msub><mo>)</mo></mrow></mrow>]]></math><img file="FDA0000645162280000011.GIF" wi="477" he="137" /></maths>其中,i是课程C中的一个单元的概述文档,q是用户提交的查询词,g<sub>i</sub>表示概述文档i在课程中的重要程度,r<sub>i,q</sub>表示概述文档i与查询词q的相关程度;g<sub>i</sub>通过i对应的节点在课程结构中的位置、节点内容类型、节点被用户查看的次数计算;5)根据计算出的课程得分对课程进行排序,根据排序先后依次生成课程搜索结果;具体为:根据计算出的课程得分,由高到低对课程进行排序;对于每一门课,根据从该门课程中检索出的概述文档复现课程搜索结果摘要,将搜索到的课程及课程中相关的单元展示给用户;6)对检索到的概述文档排序并生成搜索结果;具体为:将检索到的概述文档进行排序,按该顺序将检索到的概述文档对应的课程单元展示给用户。
地址 100084 北京市海淀区清华园1号