llvm-project/llvm/test/CodeGen/Hexagon/aggr-licm.ll

227 lines
6.4 KiB
LLVM

; RUN: llc -march=hexagon < %s -enable-misched=false | FileCheck %s
; Test that LICM doesn't hoist an instruction incorrectly
; when register aliases are not processed. In this case, LICM hoists
; a register assignment of 0, but the register is defined as
; double register (with two and instructions) already.
; CHECK: [[REG0:r([0-9]+)]] = and
; CHECK: [[REG1:r([0-9]+)]] = and
; CHECK-NOT: [[REG0]] =
; CHECK-NOT: [[REG1]] =
; CHECK: .LBB
; Function Attrs: nounwind readnone
define i64 @f0(i64 %a0) #0 {
b0:
%v0 = lshr i64 %a0, 1
%v1 = and i64 %v0, 6148914691236517205
%v2 = and i64 %a0, 6148914691236517205
br label %b1
b1: ; preds = %b1, %b0
%v3 = phi i64 [ %v2, %b0 ], [ %v197, %b1 ]
%v4 = phi i64 [ %v1, %b0 ], [ %v196, %b1 ]
%v5 = phi i64 [ 0, %b0 ], [ %v195, %b1 ]
%v6 = phi i32 [ 0, %b0 ], [ %v198, %b1 ]
%v7 = and i64 %v3, 1
%v8 = zext i32 %v6 to i64
%v9 = shl i64 %v7, %v8
%v10 = and i64 %v4, 1
%v11 = add nuw nsw i32 %v6, 32
%v12 = zext i32 %v11 to i64
%v13 = shl i64 %v10, %v12
%v14 = or i64 %v13, %v5
%v15 = or i64 %v14, %v9
%v16 = lshr i64 %v4, 2
%v17 = lshr i64 %v3, 2
%v18 = add nuw nsw i32 %v6, 1
%v19 = and i64 %v17, 1
%v20 = zext i32 %v18 to i64
%v21 = shl i64 %v19, %v20
%v22 = and i64 %v16, 1
%v23 = add nsw i32 %v6, 33
%v24 = zext i32 %v23 to i64
%v25 = shl i64 %v22, %v24
%v26 = or i64 %v25, %v15
%v27 = or i64 %v26, %v21
%v28 = lshr i64 %v4, 4
%v29 = lshr i64 %v3, 4
%v30 = add nsw i32 %v6, 2
%v31 = and i64 %v29, 1
%v32 = zext i32 %v30 to i64
%v33 = shl i64 %v31, %v32
%v34 = and i64 %v28, 1
%v35 = add nsw i32 %v6, 34
%v36 = zext i32 %v35 to i64
%v37 = shl i64 %v34, %v36
%v38 = or i64 %v37, %v27
%v39 = or i64 %v38, %v33
%v40 = lshr i64 %v4, 6
%v41 = lshr i64 %v3, 6
%v42 = add nsw i32 %v6, 3
%v43 = and i64 %v41, 1
%v44 = zext i32 %v42 to i64
%v45 = shl i64 %v43, %v44
%v46 = and i64 %v40, 1
%v47 = add nsw i32 %v6, 35
%v48 = zext i32 %v47 to i64
%v49 = shl i64 %v46, %v48
%v50 = or i64 %v49, %v39
%v51 = or i64 %v50, %v45
%v52 = lshr i64 %v4, 8
%v53 = lshr i64 %v3, 8
%v54 = add nsw i32 %v6, 4
%v55 = and i64 %v53, 1
%v56 = zext i32 %v54 to i64
%v57 = shl i64 %v55, %v56
%v58 = and i64 %v52, 1
%v59 = add nsw i32 %v6, 36
%v60 = zext i32 %v59 to i64
%v61 = shl i64 %v58, %v60
%v62 = or i64 %v61, %v51
%v63 = or i64 %v62, %v57
%v64 = lshr i64 %v4, 10
%v65 = lshr i64 %v3, 10
%v66 = add nsw i32 %v6, 5
%v67 = and i64 %v65, 1
%v68 = zext i32 %v66 to i64
%v69 = shl i64 %v67, %v68
%v70 = and i64 %v64, 1
%v71 = add nsw i32 %v6, 37
%v72 = zext i32 %v71 to i64
%v73 = shl i64 %v70, %v72
%v74 = or i64 %v73, %v63
%v75 = or i64 %v74, %v69
%v76 = lshr i64 %v4, 12
%v77 = lshr i64 %v3, 12
%v78 = add nsw i32 %v6, 6
%v79 = and i64 %v77, 1
%v80 = zext i32 %v78 to i64
%v81 = shl i64 %v79, %v80
%v82 = and i64 %v76, 1
%v83 = add nsw i32 %v6, 38
%v84 = zext i32 %v83 to i64
%v85 = shl i64 %v82, %v84
%v86 = or i64 %v85, %v75
%v87 = or i64 %v86, %v81
%v88 = lshr i64 %v4, 14
%v89 = lshr i64 %v3, 14
%v90 = add nsw i32 %v6, 7
%v91 = and i64 %v89, 1
%v92 = zext i32 %v90 to i64
%v93 = shl i64 %v91, %v92
%v94 = and i64 %v88, 1
%v95 = add nsw i32 %v6, 39
%v96 = zext i32 %v95 to i64
%v97 = shl i64 %v94, %v96
%v98 = or i64 %v97, %v87
%v99 = or i64 %v98, %v93
%v100 = lshr i64 %v4, 16
%v101 = lshr i64 %v3, 16
%v102 = add nsw i32 %v6, 8
%v103 = and i64 %v101, 1
%v104 = zext i32 %v102 to i64
%v105 = shl i64 %v103, %v104
%v106 = and i64 %v100, 1
%v107 = add nsw i32 %v6, 40
%v108 = zext i32 %v107 to i64
%v109 = shl i64 %v106, %v108
%v110 = or i64 %v109, %v99
%v111 = or i64 %v110, %v105
%v112 = lshr i64 %v4, 18
%v113 = lshr i64 %v3, 18
%v114 = add nsw i32 %v6, 9
%v115 = and i64 %v113, 1
%v116 = zext i32 %v114 to i64
%v117 = shl i64 %v115, %v116
%v118 = and i64 %v112, 1
%v119 = add nsw i32 %v6, 41
%v120 = zext i32 %v119 to i64
%v121 = shl i64 %v118, %v120
%v122 = or i64 %v121, %v111
%v123 = or i64 %v122, %v117
%v124 = lshr i64 %v4, 20
%v125 = lshr i64 %v3, 20
%v126 = add nsw i32 %v6, 10
%v127 = and i64 %v125, 1
%v128 = zext i32 %v126 to i64
%v129 = shl i64 %v127, %v128
%v130 = and i64 %v124, 1
%v131 = add nsw i32 %v6, 42
%v132 = zext i32 %v131 to i64
%v133 = shl i64 %v130, %v132
%v134 = or i64 %v133, %v123
%v135 = or i64 %v134, %v129
%v136 = lshr i64 %v4, 22
%v137 = lshr i64 %v3, 22
%v138 = add nsw i32 %v6, 11
%v139 = and i64 %v137, 1
%v140 = zext i32 %v138 to i64
%v141 = shl i64 %v139, %v140
%v142 = and i64 %v136, 1
%v143 = add nsw i32 %v6, 43
%v144 = zext i32 %v143 to i64
%v145 = shl i64 %v142, %v144
%v146 = or i64 %v145, %v135
%v147 = or i64 %v146, %v141
%v148 = lshr i64 %v4, 24
%v149 = lshr i64 %v3, 24
%v150 = add nsw i32 %v6, 12
%v151 = and i64 %v149, 1
%v152 = zext i32 %v150 to i64
%v153 = shl i64 %v151, %v152
%v154 = and i64 %v148, 1
%v155 = add nsw i32 %v6, 44
%v156 = zext i32 %v155 to i64
%v157 = shl i64 %v154, %v156
%v158 = or i64 %v157, %v147
%v159 = or i64 %v158, %v153
%v160 = lshr i64 %v4, 26
%v161 = lshr i64 %v3, 26
%v162 = add nsw i32 %v6, 13
%v163 = and i64 %v161, 1
%v164 = zext i32 %v162 to i64
%v165 = shl i64 %v163, %v164
%v166 = and i64 %v160, 1
%v167 = add nsw i32 %v6, 45
%v168 = zext i32 %v167 to i64
%v169 = shl i64 %v166, %v168
%v170 = or i64 %v169, %v159
%v171 = or i64 %v170, %v165
%v172 = lshr i64 %v4, 28
%v173 = lshr i64 %v3, 28
%v174 = add nsw i32 %v6, 14
%v175 = and i64 %v173, 1
%v176 = zext i32 %v174 to i64
%v177 = shl i64 %v175, %v176
%v178 = and i64 %v172, 1
%v179 = add nsw i32 %v6, 46
%v180 = zext i32 %v179 to i64
%v181 = shl i64 %v178, %v180
%v182 = or i64 %v181, %v171
%v183 = or i64 %v182, %v177
%v184 = lshr i64 %v4, 30
%v185 = lshr i64 %v3, 30
%v186 = add nsw i32 %v6, 15
%v187 = and i64 %v185, 1
%v188 = zext i32 %v186 to i64
%v189 = shl i64 %v187, %v188
%v190 = and i64 %v184, 1
%v191 = add nsw i32 %v6, 47
%v192 = zext i32 %v191 to i64
%v193 = shl i64 %v190, %v192
%v194 = or i64 %v193, %v183
%v195 = or i64 %v194, %v189
%v196 = lshr i64 %v4, 32
%v197 = lshr i64 %v3, 32
%v198 = add nsw i32 %v6, 16
%v199 = icmp eq i32 %v198, 32
br i1 %v199, label %b2, label %b1
b2: ; preds = %b1
ret i64 %v195
}
attributes #0 = { nounwind readnone "target-cpu"="hexagonv60" }