llvm-project/llvm/test/CodeGen/AMDGPU/llvm.log2.ll

;RUN: llc < %s -march=r600 -mcpu=redwood | FileCheck -allow-deprecated-dag-overlap %s --check-prefix=EG --check-prefix=FUNC
;RUN: llc < %s -march=r600 -mcpu=cayman | FileCheck -allow-deprecated-dag-overlap %s --check-prefix=CM --check-prefix=FUNC
;RUN: llc < %s -march=amdgcn -mcpu=tahiti | FileCheck -allow-deprecated-dag-overlap %s --check-prefix=SI --check-prefix=FUNC
;RUN: llc < %s -march=amdgcn -mcpu=tonga | FileCheck -allow-deprecated-dag-overlap %s --check-prefix=SI --check-prefix=FUNC

;FUNC-LABEL: {{^}}test:
;EG: LOG_IEEE
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}
;SI: v_log_f32

define amdgpu_kernel void @test(float addrspace(1)* %out, float %in) {
entry:
   %0 = call float @llvm.log2.f32(float %in)
   store float %0, float addrspace(1)* %out
   ret void
}

;FUNC-LABEL: {{^}}testv2:
;EG: LOG_IEEE
;EG: LOG_IEEE
; FIXME: We should be able to merge these packets together on Cayman so we
; have a maximum of 4 instructions.
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}
;SI: v_log_f32
;SI: v_log_f32

define amdgpu_kernel void @testv2(<2 x float> addrspace(1)* %out, <2 x float> %in) {
entry:
  %0 = call <2 x float> @llvm.log2.v2f32(<2 x float> %in)
  store <2 x float> %0, <2 x float> addrspace(1)* %out
  ret void
}

;FUNC-LABEL: {{^}}testv4:
;EG: LOG_IEEE
;EG: LOG_IEEE
;EG: LOG_IEEE
;EG: LOG_IEEE
; FIXME: We should be able to merge these packets together on Cayman so we
; have a maximum of 4 instructions.
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}
;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}
;SI: v_log_f32
;SI: v_log_f32
;SI: v_log_f32
;SI: v_log_f32
define amdgpu_kernel void @testv4(<4 x float> addrspace(1)* %out, <4 x float> %in) {
entry:
  %0 = call <4 x float> @llvm.log2.v4f32(<4 x float> %in)
  store <4 x float> %0, <4 x float> addrspace(1)* %out
  ret void
}

declare float @llvm.log2.f32(float) readnone
declare <2 x float> @llvm.log2.v2f32(<2 x float>) readnone
declare <4 x float> @llvm.log2.v4f32(<4 x float>) readnone
[FileCheck] Add -allow-deprecated-dag-overlap to failing llvm tests See https://reviews.llvm.org/D47106 for details. Reviewed By: probinson Differential Revision: https://reviews.llvm.org/D47171 This commit drops that patch's changes to: llvm/test/CodeGen/NVPTX/f16x2-instructions.ll llvm/test/CodeGen/NVPTX/param-load-store.ll For some reason, the dos line endings there prevent me from commiting via the monorepo. A follow-up commit (not via the monorepo) will finish the patch. llvm-svn: 336843 2018-07-12 04:25:49 +08:00			`;RUN: llc < %s -march=r600 -mcpu=redwood \| FileCheck -allow-deprecated-dag-overlap %s --check-prefix=EG --check-prefix=FUNC`
			`;RUN: llc < %s -march=r600 -mcpu=cayman \| FileCheck -allow-deprecated-dag-overlap %s --check-prefix=CM --check-prefix=FUNC`
			`;RUN: llc < %s -march=amdgcn -mcpu=tahiti \| FileCheck -allow-deprecated-dag-overlap %s --check-prefix=SI --check-prefix=FUNC`
			`;RUN: llc < %s -march=amdgcn -mcpu=tonga \| FileCheck -allow-deprecated-dag-overlap %s --check-prefix=SI --check-prefix=FUNC`
R600: Expand vector flog2 llvm-svn: 211376 2014-06-21 01:06:07 +08:00
R600: Call EmitFunctionHeader() in the AsmPrinter to populate the ELF symbol table llvm-svn: 218776 2014-10-02 01:15:17 +08:00			`;FUNC-LABEL: {{^}}test:`
R600/SI: Remove the -CHECK suffix from all FileCheck prefixes in LIT tests llvm-svn: 228040 2015-02-04 05:53:27 +08:00			`;EG: LOG_IEEE`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}`
			`;SI: v_log_f32`
R600: Expand vector flog2 llvm-svn: 211376 2014-06-21 01:06:07 +08:00
AMDGPU: Mark all unspecified CC functions in tests as amdgpu_kernel Currently the default C calling convention functions are treated the same as compute kernels. Make this explicit so the default calling convention can be changed to a non-kernel. Converted with perl -pi -e 's/define void/define amdgpu_kernel void/' on the relevant test directories (and undoing in one place that actually wanted a non-kernel). llvm-svn: 298444 2017-03-22 05:39:51 +08:00			`define amdgpu_kernel void @test(float addrspace(1)* %out, float %in) {`
R600: Expand vector flog2 llvm-svn: 211376 2014-06-21 01:06:07 +08:00			`entry:`
			`%0 = call float @llvm.log2.f32(float %in)`
			`store float %0, float addrspace(1)* %out`
			`ret void`
			`}`

R600: Call EmitFunctionHeader() in the AsmPrinter to populate the ELF symbol table llvm-svn: 218776 2014-10-02 01:15:17 +08:00			`;FUNC-LABEL: {{^}}testv2:`
R600/SI: Remove the -CHECK suffix from all FileCheck prefixes in LIT tests llvm-svn: 228040 2015-02-04 05:53:27 +08:00			`;EG: LOG_IEEE`
			`;EG: LOG_IEEE`
R600: Expand vector flog2 llvm-svn: 211376 2014-06-21 01:06:07 +08:00			`; FIXME: We should be able to merge these packets together on Cayman so we`
			`; have a maximum of 4 instructions.`
R600/SI: Remove the -CHECK suffix from all FileCheck prefixes in LIT tests llvm-svn: 228040 2015-02-04 05:53:27 +08:00			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}`
			`;SI: v_log_f32`
			`;SI: v_log_f32`
R600: Expand vector flog2 llvm-svn: 211376 2014-06-21 01:06:07 +08:00
AMDGPU: Mark all unspecified CC functions in tests as amdgpu_kernel Currently the default C calling convention functions are treated the same as compute kernels. Make this explicit so the default calling convention can be changed to a non-kernel. Converted with perl -pi -e 's/define void/define amdgpu_kernel void/' on the relevant test directories (and undoing in one place that actually wanted a non-kernel). llvm-svn: 298444 2017-03-22 05:39:51 +08:00			`define amdgpu_kernel void @testv2(<2 x float> addrspace(1)* %out, <2 x float> %in) {`
R600: Expand vector flog2 llvm-svn: 211376 2014-06-21 01:06:07 +08:00			`entry:`
			`%0 = call <2 x float> @llvm.log2.v2f32(<2 x float> %in)`
			`store <2 x float> %0, <2 x float> addrspace(1)* %out`
			`ret void`
			`}`

R600: Call EmitFunctionHeader() in the AsmPrinter to populate the ELF symbol table llvm-svn: 218776 2014-10-02 01:15:17 +08:00			`;FUNC-LABEL: {{^}}testv4:`
R600/SI: Remove the -CHECK suffix from all FileCheck prefixes in LIT tests llvm-svn: 228040 2015-02-04 05:53:27 +08:00			`;EG: LOG_IEEE`
			`;EG: LOG_IEEE`
			`;EG: LOG_IEEE`
			`;EG: LOG_IEEE`
R600: Expand vector flog2 llvm-svn: 211376 2014-06-21 01:06:07 +08:00			`; FIXME: We should be able to merge these packets together on Cayman so we`
			`; have a maximum of 4 instructions.`
R600/SI: Remove the -CHECK suffix from all FileCheck prefixes in LIT tests llvm-svn: 228040 2015-02-04 05:53:27 +08:00			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}} (MASKED)`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}`
			`;CM-DAG: LOG_IEEE T{{[0-9]+\.[XYZW]}}`
			`;SI: v_log_f32`
			`;SI: v_log_f32`
			`;SI: v_log_f32`
			`;SI: v_log_f32`
AMDGPU: Mark all unspecified CC functions in tests as amdgpu_kernel Currently the default C calling convention functions are treated the same as compute kernels. Make this explicit so the default calling convention can be changed to a non-kernel. Converted with perl -pi -e 's/define void/define amdgpu_kernel void/' on the relevant test directories (and undoing in one place that actually wanted a non-kernel). llvm-svn: 298444 2017-03-22 05:39:51 +08:00			`define amdgpu_kernel void @testv4(<4 x float> addrspace(1)* %out, <4 x float> %in) {`
R600: Expand vector flog2 llvm-svn: 211376 2014-06-21 01:06:07 +08:00			`entry:`
			`%0 = call <4 x float> @llvm.log2.v4f32(<4 x float> %in)`
			`store <4 x float> %0, <4 x float> addrspace(1)* %out`
			`ret void`
			`}`

			`declare float @llvm.log2.f32(float) readnone`
			`declare <2 x float> @llvm.log2.v2f32(<2 x float>) readnone`
			`declare <4 x float> @llvm.log2.v4f32(<4 x float>) readnone`