摘要 |
본 개시물은 파이프라인 기반 애플리케이션들의 효율적인 프로세싱을 허용하기 위해 병렬 프로세싱 유닛들을 가진 범용 그래픽스 프로세싱 유닛 (GPGPU) 의 아키텍처를 확장하는 기법들을 설명한다. 그 기법들은 프로세싱 파이프라인의 스테이지들로서 동작하는 병렬 프로세싱 유닛들에 접속된 로컬 메모리 버퍼들을, 그 병렬 프로세싱 유닛들 간의 전송을 위한 데이터를 보유하도록 구성하는 것을 포함한다. 로컬 메모리 버퍼들은 병렬 프로세싱 유닛들 간에 온-칩, 저전력, 직접 데이터 전송을 허용한다. 로컬 메모리 버퍼들은 병렬 프로세싱 유닛들 간의 데이터의 전송을 가능하게 하기 위해 하드웨어 기반 데이터 플로우 제어 메커니즘들을 포함할 수도 있다. 이렇게 하여, 데이터는 사실상 병렬 프로세싱 유닛들을 일련의 파이프라인 스테이지들로 변환하여, 로컬 메모리 버퍼들을 통해 프로세싱 파이프라인에서 하나의 병렬 프로세싱 유닛으로부터 다음 병렬 프로세싱 유닛으로 직접 전달될 수도 있다. |