forked from OSchip/llvm-project
217 lines
6.4 KiB
LLVM
217 lines
6.4 KiB
LLVM
|
; Like frame-05.ll, but with i64s rather than i32s. Internally this
|
||
|
; uses a different register class, but the set of saved and restored
|
||
|
; registers should be the same.
|
||
|
;
|
||
|
; RUN: llc < %s -mtriple=s390x-linux-gnu | FileCheck %s
|
||
|
|
||
|
; This function should require all GPRs, but no other spill slots. The caller
|
||
|
; allocates room for the GPR save slots, so we shouldn't need to allocate any
|
||
|
; extra space.
|
||
|
;
|
||
|
; Use a different address for the final store, so that we can check that
|
||
|
; %r15 isn't referenced again until after that.
|
||
|
define void @f1(i64 *%ptr) {
|
||
|
; CHECK: f1:
|
||
|
; CHECK: stmg %r6, %r15, 48(%r15)
|
||
|
; CHECK-NOT: %r15
|
||
|
; CHECK: .cfi_offset %r6, -112
|
||
|
; CHECK: .cfi_offset %r7, -104
|
||
|
; CHECK: .cfi_offset %r8, -96
|
||
|
; CHECK: .cfi_offset %r9, -88
|
||
|
; CHECK: .cfi_offset %r10, -80
|
||
|
; CHECK: .cfi_offset %r11, -72
|
||
|
; CHECK: .cfi_offset %r12, -64
|
||
|
; CHECK: .cfi_offset %r13, -56
|
||
|
; CHECK: .cfi_offset %r14, -48
|
||
|
; CHECK: .cfi_offset %r15, -40
|
||
|
; ...main function body...
|
||
|
; CHECK-NOT: %r15
|
||
|
; CHECK: stg {{.*}}, 8(%r2)
|
||
|
; CHECK: lmg %r6, %r15, 48(%r15)
|
||
|
; CHECK: br %r14
|
||
|
%l0 = load volatile i64 *%ptr
|
||
|
%l1 = load volatile i64 *%ptr
|
||
|
%l3 = load volatile i64 *%ptr
|
||
|
%l4 = load volatile i64 *%ptr
|
||
|
%l5 = load volatile i64 *%ptr
|
||
|
%l6 = load volatile i64 *%ptr
|
||
|
%l7 = load volatile i64 *%ptr
|
||
|
%l8 = load volatile i64 *%ptr
|
||
|
%l9 = load volatile i64 *%ptr
|
||
|
%l10 = load volatile i64 *%ptr
|
||
|
%l11 = load volatile i64 *%ptr
|
||
|
%l12 = load volatile i64 *%ptr
|
||
|
%l13 = load volatile i64 *%ptr
|
||
|
%l14 = load volatile i64 *%ptr
|
||
|
%add0 = add i64 %l0, %l0
|
||
|
%add1 = add i64 %l1, %add0
|
||
|
%add3 = add i64 %l3, %add1
|
||
|
%add4 = add i64 %l4, %add3
|
||
|
%add5 = add i64 %l5, %add4
|
||
|
%add6 = add i64 %l6, %add5
|
||
|
%add7 = add i64 %l7, %add6
|
||
|
%add8 = add i64 %l8, %add7
|
||
|
%add9 = add i64 %l9, %add8
|
||
|
%add10 = add i64 %l10, %add9
|
||
|
%add11 = add i64 %l11, %add10
|
||
|
%add12 = add i64 %l12, %add11
|
||
|
%add13 = add i64 %l13, %add12
|
||
|
%add14 = add i64 %l14, %add13
|
||
|
store volatile i64 %add0, i64 *%ptr
|
||
|
store volatile i64 %add1, i64 *%ptr
|
||
|
store volatile i64 %add3, i64 *%ptr
|
||
|
store volatile i64 %add4, i64 *%ptr
|
||
|
store volatile i64 %add5, i64 *%ptr
|
||
|
store volatile i64 %add6, i64 *%ptr
|
||
|
store volatile i64 %add7, i64 *%ptr
|
||
|
store volatile i64 %add8, i64 *%ptr
|
||
|
store volatile i64 %add9, i64 *%ptr
|
||
|
store volatile i64 %add10, i64 *%ptr
|
||
|
store volatile i64 %add11, i64 *%ptr
|
||
|
store volatile i64 %add12, i64 *%ptr
|
||
|
store volatile i64 %add13, i64 *%ptr
|
||
|
%final = getelementptr i64 *%ptr, i64 1
|
||
|
store volatile i64 %add14, i64 *%final
|
||
|
ret void
|
||
|
}
|
||
|
|
||
|
; Like f1, but requires one fewer GPR. We allocate the call-saved GPRs
|
||
|
; from %r14 down, so that the STMG/LMG sequences aren't any longer than
|
||
|
; they need to be.
|
||
|
define void @f2(i64 *%ptr) {
|
||
|
; CHECK: f2:
|
||
|
; CHECK: stmg %r7, %r15, 56(%r15)
|
||
|
; CHECK-NOT: %r15
|
||
|
; CHECK: .cfi_offset %r7, -104
|
||
|
; CHECK: .cfi_offset %r8, -96
|
||
|
; CHECK: .cfi_offset %r9, -88
|
||
|
; CHECK: .cfi_offset %r10, -80
|
||
|
; CHECK: .cfi_offset %r11, -72
|
||
|
; CHECK: .cfi_offset %r12, -64
|
||
|
; CHECK: .cfi_offset %r13, -56
|
||
|
; CHECK: .cfi_offset %r14, -48
|
||
|
; CHECK: .cfi_offset %r15, -40
|
||
|
; ...main function body...
|
||
|
; CHECK-NOT: %r15
|
||
|
; CHECK-NOT: %r6
|
||
|
; CHECK: stg {{.*}}, 8(%r2)
|
||
|
; CHECK: lmg %r7, %r15, 56(%r15)
|
||
|
; CHECK: br %r14
|
||
|
%l0 = load volatile i64 *%ptr
|
||
|
%l1 = load volatile i64 *%ptr
|
||
|
%l3 = load volatile i64 *%ptr
|
||
|
%l4 = load volatile i64 *%ptr
|
||
|
%l5 = load volatile i64 *%ptr
|
||
|
%l7 = load volatile i64 *%ptr
|
||
|
%l8 = load volatile i64 *%ptr
|
||
|
%l9 = load volatile i64 *%ptr
|
||
|
%l10 = load volatile i64 *%ptr
|
||
|
%l11 = load volatile i64 *%ptr
|
||
|
%l12 = load volatile i64 *%ptr
|
||
|
%l13 = load volatile i64 *%ptr
|
||
|
%l14 = load volatile i64 *%ptr
|
||
|
%add0 = add i64 %l0, %l0
|
||
|
%add1 = add i64 %l1, %add0
|
||
|
%add3 = add i64 %l3, %add1
|
||
|
%add4 = add i64 %l4, %add3
|
||
|
%add5 = add i64 %l5, %add4
|
||
|
%add7 = add i64 %l7, %add5
|
||
|
%add8 = add i64 %l8, %add7
|
||
|
%add9 = add i64 %l9, %add8
|
||
|
%add10 = add i64 %l10, %add9
|
||
|
%add11 = add i64 %l11, %add10
|
||
|
%add12 = add i64 %l12, %add11
|
||
|
%add13 = add i64 %l13, %add12
|
||
|
%add14 = add i64 %l14, %add13
|
||
|
store volatile i64 %add0, i64 *%ptr
|
||
|
store volatile i64 %add1, i64 *%ptr
|
||
|
store volatile i64 %add3, i64 *%ptr
|
||
|
store volatile i64 %add4, i64 *%ptr
|
||
|
store volatile i64 %add5, i64 *%ptr
|
||
|
store volatile i64 %add7, i64 *%ptr
|
||
|
store volatile i64 %add8, i64 *%ptr
|
||
|
store volatile i64 %add9, i64 *%ptr
|
||
|
store volatile i64 %add10, i64 *%ptr
|
||
|
store volatile i64 %add11, i64 *%ptr
|
||
|
store volatile i64 %add12, i64 *%ptr
|
||
|
store volatile i64 %add13, i64 *%ptr
|
||
|
%final = getelementptr i64 *%ptr, i64 1
|
||
|
store volatile i64 %add14, i64 *%final
|
||
|
ret void
|
||
|
}
|
||
|
|
||
|
; Like f1, but only needs one call-saved GPR, which ought to be %r14.
|
||
|
define void @f3(i64 *%ptr) {
|
||
|
; CHECK: f3:
|
||
|
; CHECK: stmg %r14, %r15, 112(%r15)
|
||
|
; CHECK-NOT: %r15
|
||
|
; CHECK: .cfi_offset %r14, -48
|
||
|
; CHECK: .cfi_offset %r15, -40
|
||
|
; ...main function body...
|
||
|
; CHECK-NOT: %r15
|
||
|
; CHECK-NOT: %r6
|
||
|
; CHECK-NOT: %r7
|
||
|
; CHECK-NOT: %r8
|
||
|
; CHECK-NOT: %r9
|
||
|
; CHECK-NOT: %r10
|
||
|
; CHECK-NOT: %r11
|
||
|
; CHECK-NOT: %r12
|
||
|
; CHECK-NOT: %r13
|
||
|
; CHECK: stg {{.*}}, 8(%r2)
|
||
|
; CHECK: lmg %r14, %r15, 112(%r15)
|
||
|
; CHECK: br %r14
|
||
|
%l0 = load volatile i64 *%ptr
|
||
|
%l1 = load volatile i64 *%ptr
|
||
|
%l3 = load volatile i64 *%ptr
|
||
|
%l4 = load volatile i64 *%ptr
|
||
|
%l5 = load volatile i64 *%ptr
|
||
|
%l14 = load volatile i64 *%ptr
|
||
|
%add0 = add i64 %l0, %l0
|
||
|
%add1 = add i64 %l1, %add0
|
||
|
%add3 = add i64 %l3, %add1
|
||
|
%add4 = add i64 %l4, %add3
|
||
|
%add5 = add i64 %l5, %add4
|
||
|
%add14 = add i64 %l14, %add5
|
||
|
store volatile i64 %add0, i64 *%ptr
|
||
|
store volatile i64 %add1, i64 *%ptr
|
||
|
store volatile i64 %add3, i64 *%ptr
|
||
|
store volatile i64 %add4, i64 *%ptr
|
||
|
store volatile i64 %add5, i64 *%ptr
|
||
|
%final = getelementptr i64 *%ptr, i64 1
|
||
|
store volatile i64 %add14, i64 *%final
|
||
|
ret void
|
||
|
}
|
||
|
|
||
|
; This function should use all call-clobbered GPRs but no call-saved ones.
|
||
|
; It shouldn't need to touch the stack at all.
|
||
|
define void @f4(i64 *%ptr) {
|
||
|
; CHECK: f4:
|
||
|
; CHECK-NOT: %r15
|
||
|
; CHECK-NOT: %r6
|
||
|
; CHECK-NOT: %r7
|
||
|
; CHECK-NOT: %r8
|
||
|
; CHECK-NOT: %r9
|
||
|
; CHECK-NOT: %r10
|
||
|
; CHECK-NOT: %r11
|
||
|
; CHECK-NOT: %r12
|
||
|
; CHECK-NOT: %r13
|
||
|
; CHECK: br %r14
|
||
|
%l0 = load volatile i64 *%ptr
|
||
|
%l1 = load volatile i64 *%ptr
|
||
|
%l3 = load volatile i64 *%ptr
|
||
|
%l4 = load volatile i64 *%ptr
|
||
|
%l5 = load volatile i64 *%ptr
|
||
|
%add0 = add i64 %l0, %l0
|
||
|
%add1 = add i64 %l1, %add0
|
||
|
%add3 = add i64 %l3, %add1
|
||
|
%add4 = add i64 %l4, %add3
|
||
|
%add5 = add i64 %l5, %add4
|
||
|
store volatile i64 %add0, i64 *%ptr
|
||
|
store volatile i64 %add1, i64 *%ptr
|
||
|
store volatile i64 %add3, i64 *%ptr
|
||
|
store volatile i64 %add4, i64 *%ptr
|
||
|
%final = getelementptr i64 *%ptr, i64 1
|
||
|
store volatile i64 %add5, i64 *%final
|
||
|
ret void
|
||
|
}
|