发明名称 在映射缩减过程中汇合表
摘要 可以用来在映射缩减过程中汇合表的系统和技术。在一些实现方式中,在大的业务数据表(例如,具有十亿个事务记录或者更多)将与大的客户数据表(例如,具有数亿个客户记录)汇合时,则可以在映射缩减过程之前组织这两个表以加速表汇合。例如,可以基于相同关键字将业务数据和客户数据二者分别哈希分割成业务数据碎片和客户数据碎片。在这两组中的碎片数目相互具有整体关系:例如,从而使得有用于每个客户数据碎片的两个业务数据碎片,或者反之亦然。
申请公布号 CN103620601B 申请公布日期 2017.04.12
申请号 CN201280031211.0 申请日期 2012.03.28
申请人 谷歌公司 发明人 B·查托帕迪亚;林亮
分类号 G06F17/30(2006.01)I 主分类号 G06F17/30(2006.01)I
代理机构 北京市金杜律师事务所 11256 代理人 酆迅;辛鸣
主权项 一种用于执行映射缩减过程的计算机实施的方法,所述方法包括:接收具有第一数据的第一表;在接收所述第一表之时,基于所述第一数据中的第一关键字的范围将所述第一数据按范围分割成范围分割;基于第二关键字将所述范围分割中的每个范围分割内的所述第一数据哈希分割成第一数目的哈希分割;接收具有第二数据的第二表;在接收所述第二表之时,基于所述第二关键字将所述第二数据哈希分割成第二数目的哈希分割,其中所述第一数目和所述第二数目之一是另一个的整数倍;以及针对所述第一数目的哈希分割中的每个哈希分割:基于所述第一数目和所述第二数目从所述第二数目的哈希分割标识至少一个对应哈希分割;向存储器中加载标识的所述对应哈希分割的至少部分;以及汇合所述第一数目的哈希分割中的针对的哈希分割和标识的所述对应哈希分割;以及使用汇合的哈希分割来生成对所述映射缩减查询的响应。
地址 美国加利福尼亚州