发明名称 |
使用多种类型的输入对人进行标识 |
摘要 |
公开了以自动化方式检测人或说话者的系统和方法。可标识包括多于一种类型的输入(如音频输入和视频输入)的特征池,该特征池可与学算法一起使用来生成标识人或说话者的分类器。可评估所得到的分类器以检测人或说话者。 |
申请公布号 |
CN101473207B |
申请公布日期 |
2013.03.27 |
申请号 |
CN200780022873.0 |
申请日期 |
2007.02.13 |
申请人 |
微软公司 |
发明人 |
C·张;P·A·沃拉;P·尹;R·G·柯特勒;X·孙;Y·瑞 |
分类号 |
G06K9/46(2006.01)I;G06K9/62(2006.01)I;G10L25/78(2013.01)I;H04N7/14(2006.01)I;H04N7/15(2006.01)I;H04N21/422(2011.01)I;H04N21/4223(2011.01)I;H04N21/439(2011.01)I;H04N21/44(2011.01)I;H04N21/442(2011.01)I;H04N21/4788(2011.01)I |
主分类号 |
G06K9/46(2006.01)I |
代理机构 |
上海专利商标事务所有限公司 31100 |
代理人 |
顾嘉运 |
主权项 |
一种用于使用多种类型输入来标识人的方法,包括:标识包括至少一个来自视频输入的特征以及至少一个来自音频输入的特征的特征池(310);以及使用学习算法生成用于人的检测的分类器(315),其中所述分类器的节点是使用所述特征池来选择的。 |
地址 |
美国华盛顿州 |