发明名称 一种基于Kincet和语音的人机交互方法
摘要 本发明公开了一种基于Kincet和语音的人机交互方法,包括以下步骤:1)采用Kinect传感器获取场景中各物体的在kinect坐标系K准确空间位置和姿态信息,完成目标检测与识别;2)将Kinect分别采集的深度图像和RGB经过融合处理后得到三维点云数据;3)空间点云物体识别:对三维点云数据进行处理得到语义描述文件;4)对物体坐标系O进行坐标变换得到坐标系R下的三维场景语义地图描述文件;5)接收用户语音输入,对输入信号进行处理,得到文本信息;6)将文本信息和XML语义地图输入智能推理机,推理机产生执行指令并输出对用户的答复和引导信息的文本信息。
申请公布号 CN106055244A 申请公布日期 2016.10.26
申请号 CN201610306998.7 申请日期 2016.05.10
申请人 武汉科技大学 发明人 闵华松;齐诗萌;李潇;林云汉;吴凡
分类号 G06F3/0487(2013.01)I 主分类号 G06F3/0487(2013.01)I
代理机构 湖北武汉永嘉专利代理有限公司 42102 代理人 胡琳萍
主权项 一种基于Kincet和语音的人机交互方法,其特征在于,包括以下步骤:1)采用Kinect传感器获取场景中各物体的在坐标系K准确空间位置和姿态信息,完成目标检测与识别;所述坐标系K为以kinect几何中心为原点,以垂直于镜头向外的方向为Z轴正方向,以Kincet三个镜头的圆心的连线为X轴,过建立坐标系;2)将Kinect分别采集的深度图像和RGB经过融合处理后得到三维点云数据;3)空间点云物体识别:对三维点云数据进行处理得到语义描述文件;4)对物体坐标系O进行坐标变换得到坐标系R下的三维场景语义地图描述文件;5)接收用户语音输入,对输入信号进行处理,得到文本信息;6)将文本信息和XML语义地图输入智能推理机,推理机产生执行指令并输出对用户的答复和引导信息的文本信息。
地址 430081 湖北省武汉市青山区和平大道947号