llvm-project/clang/test/CodeGenCUDA/kernel-args.cu

// RUN: %clang_cc1 -triple amdgcn-amd-amdhsa -fcuda-is-device \
// RUN:     -emit-llvm %s -o - | FileCheck -check-prefix=AMDGCN %s
// RUN: %clang_cc1 -triple nvptx64-nvidia-cuda- -fcuda-is-device \
// RUN:     -emit-llvm %s -o - | FileCheck -check-prefix=NVPTX %s
#include "Inputs/cuda.h"

struct A {
  int a[32];
};

// AMDGCN: define amdgpu_kernel void @_Z6kernel1A(%struct.A %x.coerce)
// NVPTX: define void @_Z6kernel1A(%struct.A* byval align 4 %x)
__global__ void kernel(A x) {
}

class Kernel {
public:
  // AMDGCN: define amdgpu_kernel void @_ZN6Kernel12memberKernelE1A(%struct.A %x.coerce)
  // NVPTX: define void @_ZN6Kernel12memberKernelE1A(%struct.A* byval align 4 %x)
  static __global__ void memberKernel(A x){}
  template<typename T> static __global__ void templateMemberKernel(T x) {}
};


template <typename T>
__global__ void templateKernel(T x) {}

void launch(void*);

void test() {
  Kernel K;
  // AMDGCN: define amdgpu_kernel void @_Z14templateKernelI1AEvT_(%struct.A %x.coerce)
  // NVPTX: define void @_Z14templateKernelI1AEvT_(%struct.A* byval align 4 %x)
  launch((void*)templateKernel<A>);

  // AMDGCN: define amdgpu_kernel void @_ZN6Kernel20templateMemberKernelI1AEEvT_(%struct.A %x.coerce)
  // NVPTX: define void @_ZN6Kernel20templateMemberKernelI1AEEvT_(%struct.A* byval align 4 %x)
  launch((void*)Kernel::templateMemberKernel<A>);
}
[CUDA][HIP] Set kernel calling convention before arrange function Currently clang set kernel calling convention for CUDA/HIP after arranging function, which causes incorrect kernel function type since it depends on calling convention. This patch moves setting kernel convention before arranging function. Differential Revision: https://reviews.llvm.org/D47733 llvm-svn: 334457 2018-06-12 08:16:33 +08:00			`// RUN: %clang_cc1 -triple amdgcn-amd-amdhsa -fcuda-is-device \`
			`// RUN: -emit-llvm %s -o - \| FileCheck -check-prefix=AMDGCN %s`
			`// RUN: %clang_cc1 -triple nvptx64-nvidia-cuda- -fcuda-is-device \`
			`// RUN: -emit-llvm %s -o - \| FileCheck -check-prefix=NVPTX %s`
			`#include "Inputs/cuda.h"`

			`struct A {`
			`int a[32];`
			`};`

			`// AMDGCN: define amdgpu_kernel void @_Z6kernel1A(%struct.A %x.coerce)`
			`// NVPTX: define void @_Z6kernel1A(%struct.A* byval align 4 %x)`
			`__global__ void kernel(A x) {`
			`}`

			`class Kernel {`
			`public:`
			`// AMDGCN: define amdgpu_kernel void @_ZN6Kernel12memberKernelE1A(%struct.A %x.coerce)`
			`// NVPTX: define void @_ZN6Kernel12memberKernelE1A(%struct.A* byval align 4 %x)`
			`static __global__ void memberKernel(A x){}`
			`template<typename T> static __global__ void templateMemberKernel(T x) {}`
			`};`


			`template <typename T>`
			`__global__ void templateKernel(T x) {}`

			`void launch(void*);`

			`void test() {`
			`Kernel K;`
			`// AMDGCN: define amdgpu_kernel void @_Z14templateKernelI1AEvT_(%struct.A %x.coerce)`
			`// NVPTX: define void @_Z14templateKernelI1AEvT_(%struct.A* byval align 4 %x)`
			`launch((void*)templateKernel<A>);`

			`// AMDGCN: define amdgpu_kernel void @_ZN6Kernel20templateMemberKernelI1AEEvT_(%struct.A %x.coerce)`
			`// NVPTX: define void @_ZN6Kernel20templateMemberKernelI1AEEvT_(%struct.A* byval align 4 %x)`
			`launch((void*)Kernel::templateMemberKernel<A>);`
			`}`