发明名称 一种多核多线程环境下NUMA感知的同步方法
摘要 本发明公开了一种多核多线程环境下NUMA感知的同步方法,属于并行计算领域。本发明提出的方法是:线程将同步请求结点插入链表并在局部锁上自旋,如果局部锁被释放并且请求已被执行则返回,否则该线程作为combiner线程,设置宿主NUMA节点,执行请求的回溯位置,然后开始执行自己以及其他线程的同步请求,执行完毕后从当前位置向前遍历寻找来自宿主NUMA节点内的线程,若找到则将其作为新的combiner线程并通知该线程回溯位置,否则将当前位置的下一个线程作为combiner线程。在多线程竞争访问共享资源,并且共享资源访问模式较为分散的情况下,多个NUMA节点之间的跨节点通信和远程内存访问的开销较大。本发明有效降低了该开销,提高了多线程应用程序在多核系统上的运行效率。
申请公布号 CN104834505B 申请公布日期 2017.04.26
申请号 CN201510240609.0 申请日期 2015.05.13
申请人 华中科技大学 发明人 吴松;金海;张俊
分类号 G06F9/38(2006.01)I 主分类号 G06F9/38(2006.01)I
代理机构 华中科技大学专利中心 42201 代理人 曹葆青
主权项 一种多核多线程环境下NUMA感知的同步方法,其特征在于包括如下步骤:(1)设置参数步骤:线程设置自己的同步请求结点的相关参数,将线程的NUMA节点编号设置为空,线程的下一结点指针next设置为空,局部锁状态变量lock设置为true,同步请求执行标记completed设置为false;然后获取同步请求链表尾指针PT;(2)插入同步请求结点步骤,包括如下子步骤:(2.1)使用原子操作SWAP将同步请求链表尾指针PT指向本线程当前的同步请求结点,SWAP返回操作前同步请求链表尾指针并将其赋值给指针变量current;(2.2)计算出指针变量current所指向的结点所在的NUMA节点的编号;(2.3)将指针变量current所指向结点的next指针指向刚刚插入的那个结点;(3)负载判别步骤:线程在指针变量current指向的结点的局部锁上面自旋,同时判别当前等待访问临界区的线程数目是否大于计算机内的处理器核的数目,是则调用linux库函数sched_yield(),暂时放弃处理器的使用权,该库函数执行返回后继续自旋;否则线程就继续自旋;一旦局部锁被释放则自旋结束进入步骤(4);(4)执行判别步骤:判别当前线程的同步请求是否已经被执行,是则转入步骤(9),否则进入步骤(5);(5)设置节点编号步骤:判别标志宿主NUMA节点的编号是否被设置过,是则不作处理,转步骤(6);否则设置其值为当前线程所在的NUMA节点的编号,转步骤(6);(6)设置回溯位置步骤:设置指针变量p来存储指针变量current值;判别指针变量p指向的结点线程的回溯位置是否非空,是则将指针变量p指向所述回溯位置,然后将指针变量p原来的回溯位置设置为空,进入步骤(7);否则不作处理,转步骤(7);(7)遍历并服务同步请求链表步骤,此时将当前线程作为combiner线程,包括如下子步骤:(7.1)从指针变量p所指向的结点开始遍历同步请求链表,如果同步请求链表中指针变量p指向的结点的指针next非空,且标志当前线程所服务的同步请求的数量的局部计数器的值未超过计数上限值M,则进入(7.2);否则转步骤(8);M为当前线程数目的3‑10倍;(7.2)根据指针变量p指向的结点的next,将next值用指针变量tmp_next暂存;(7.3)将局部计数器的值加1;(7.4)为指针变量p指向的结点线程执行其同步请求,将该结点线程同步请求执行标记completed设置为true;(7.5)将指针变量p指向的结点线程的局部锁lock设置为false,释放该局部锁lock;(7.6)将指针变量tmp_next赋给指针变量p,转向步骤(7.1);(8)选择下一个combiner线程,包括以下子步骤:(8.1)判别指针变量p指向结点是否为尾结点,是则将尾结点的lock设置为false,然后转向步骤(9);否转子步骤(8.2);(8.2)判别指针变量p指向的结点的NUMA节点编号是否为宿主NUMA编号,是则将指针变量p指向的结点线程的lock设置为false,此时该线程作为combiner线程,然后进入步骤(9);否则转子步骤(8.3);(8.3)将指针变量p的值赋值给指针变量p1,从指针变量p指向的结点开始,沿着其next指针向下遍历各个结点,判别是否找到某结点的NUMA节点编号为宿主NUMA节点编号,是则进入子步骤(8.4);否则转入子步骤(8.6);(8.4)将指针变量p指向的结点线程的回溯位置设置为p1;(8.5)将指针变量p指向的结点线程的局部锁lock设置为false,转入步骤(9);(8.6)将指针变量p1指向的结点线程的局部锁lock设置为false,转入步骤(9);(9)结束步骤:当前线程的任务完成,返回同步请求的执行结果。
地址 430074 湖北省武汉市洪山区珞喻路1037号