From cff73a211802895f4d525ffc37cf53f4b7df1f15 Mon Sep 17 00:00:00 2001 From: Krzysztof Parzyszek Date: Wed, 9 May 2018 21:10:41 +0000 Subject: [PATCH] [Hexagon] Add patterns for vector shift-and-accumulate llvm-svn: 331918 --- llvm/lib/Target/Hexagon/HexagonPatternsHVX.td | 5 + .../CodeGen/Hexagon/autohvx/shift-128b.ll | 320 ++---------------- .../test/CodeGen/Hexagon/autohvx/shift-64b.ll | 177 ++-------- 3 files changed, 70 insertions(+), 432 deletions(-) diff --git a/llvm/lib/Target/Hexagon/HexagonPatternsHVX.td b/llvm/lib/Target/Hexagon/HexagonPatternsHVX.td index 9c313abee8b8..3bde002bc279 100644 --- a/llvm/lib/Target/Hexagon/HexagonPatternsHVX.td +++ b/llvm/lib/Target/Hexagon/HexagonPatternsHVX.td @@ -348,6 +348,11 @@ let Predicates = [UseHVX] in { def: Pat<(HexagonVLSR HVI16:$Vs, I32:$Rt), (V6_vlsrh HvxVR:$Vs, I32:$Rt)>; def: Pat<(HexagonVLSR HVI32:$Vs, I32:$Rt), (V6_vlsrw HvxVR:$Vs, I32:$Rt)>; + def: Pat<(add HVI32:$Vx, (HexagonVASL HVI32:$Vu, I32:$Rt)), + (V6_vaslw_acc HvxVR:$Vx, HvxVR:$Vu, I32:$Rt)>; + def: Pat<(add HVI32:$Vx, (HexagonVASR HVI32:$Vu, I32:$Rt)), + (V6_vasrw_acc HvxVR:$Vx, HvxVR:$Vu, I32:$Rt)>; + def: Pat<(shl HVI16:$Vs, HVI16:$Vt), (V6_vaslhv HvxVR:$Vs, HvxVR:$Vt)>; def: Pat<(shl HVI32:$Vs, HVI32:$Vt), (V6_vaslwv HvxVR:$Vs, HvxVR:$Vt)>; def: Pat<(sra HVI16:$Vs, HVI16:$Vt), (V6_vasrhv HvxVR:$Vs, HvxVR:$Vt)>; diff --git a/llvm/test/CodeGen/Hexagon/autohvx/shift-128b.ll b/llvm/test/CodeGen/Hexagon/autohvx/shift-128b.ll index 2bf1ba903a4a..d1eab2249770 100644 --- a/llvm/test/CodeGen/Hexagon/autohvx/shift-128b.ll +++ b/llvm/test/CodeGen/Hexagon/autohvx/shift-128b.ll @@ -4,70 +4,8 @@ ; CHECK: v0.h = vasl(v0.h,r0) define <64 x i16> @test0000(<64 x i16> %a0, i16 %a1) #0 { %b0 = insertelement <64 x i16> zeroinitializer, i16 %a1, i32 0 - %b1 = insertelement <64 x i16> %b0, i16 %a1, i32 1 - %b2 = insertelement <64 x i16> %b1, i16 %a1, i32 2 - %b3 = insertelement <64 x i16> %b2, i16 %a1, i32 3 - %b4 = insertelement <64 x i16> %b3, i16 %a1, i32 4 - %b5 = insertelement <64 x i16> %b4, i16 %a1, i32 5 - %b6 = insertelement <64 x i16> %b5, i16 %a1, i32 6 - %b7 = insertelement <64 x i16> %b6, i16 %a1, i32 7 - %b8 = insertelement <64 x i16> %b7, i16 %a1, i32 8 - %b9 = insertelement <64 x i16> %b8, i16 %a1, i32 9 - %b10 = insertelement <64 x i16> %b9, i16 %a1, i32 10 - %b11 = insertelement <64 x i16> %b10, i16 %a1, i32 11 - %b12 = insertelement <64 x i16> %b11, i16 %a1, i32 12 - %b13 = insertelement <64 x i16> %b12, i16 %a1, i32 13 - %b14 = insertelement <64 x i16> %b13, i16 %a1, i32 14 - %b15 = insertelement <64 x i16> %b14, i16 %a1, i32 15 - %b16 = insertelement <64 x i16> %b15, i16 %a1, i32 16 - %b17 = insertelement <64 x i16> %b16, i16 %a1, i32 17 - %b18 = insertelement <64 x i16> %b17, i16 %a1, i32 18 - %b19 = insertelement <64 x i16> %b18, i16 %a1, i32 19 - %b20 = insertelement <64 x i16> %b19, i16 %a1, i32 20 - %b21 = insertelement <64 x i16> %b20, i16 %a1, i32 21 - %b22 = insertelement <64 x i16> %b21, i16 %a1, i32 22 - %b23 = insertelement <64 x i16> %b22, i16 %a1, i32 23 - %b24 = insertelement <64 x i16> %b23, i16 %a1, i32 24 - %b25 = insertelement <64 x i16> %b24, i16 %a1, i32 25 - %b26 = insertelement <64 x i16> %b25, i16 %a1, i32 26 - %b27 = insertelement <64 x i16> %b26, i16 %a1, i32 27 - %b28 = insertelement <64 x i16> %b27, i16 %a1, i32 28 - %b29 = insertelement <64 x i16> %b28, i16 %a1, i32 29 - %b30 = insertelement <64 x i16> %b29, i16 %a1, i32 30 - %b31 = insertelement <64 x i16> %b30, i16 %a1, i32 31 - %b32 = insertelement <64 x i16> %b31, i16 %a1, i32 32 - %b33 = insertelement <64 x i16> %b32, i16 %a1, i32 33 - %b34 = insertelement <64 x i16> %b33, i16 %a1, i32 34 - %b35 = insertelement <64 x i16> %b34, i16 %a1, i32 35 - %b36 = insertelement <64 x i16> %b35, i16 %a1, i32 36 - %b37 = insertelement <64 x i16> %b36, i16 %a1, i32 37 - %b38 = insertelement <64 x i16> %b37, i16 %a1, i32 38 - %b39 = insertelement <64 x i16> %b38, i16 %a1, i32 39 - %b40 = insertelement <64 x i16> %b39, i16 %a1, i32 40 - %b41 = insertelement <64 x i16> %b40, i16 %a1, i32 41 - %b42 = insertelement <64 x i16> %b41, i16 %a1, i32 42 - %b43 = insertelement <64 x i16> %b42, i16 %a1, i32 43 - %b44 = insertelement <64 x i16> %b43, i16 %a1, i32 44 - %b45 = insertelement <64 x i16> %b44, i16 %a1, i32 45 - %b46 = insertelement <64 x i16> %b45, i16 %a1, i32 46 - %b47 = insertelement <64 x i16> %b46, i16 %a1, i32 47 - %b48 = insertelement <64 x i16> %b47, i16 %a1, i32 48 - %b49 = insertelement <64 x i16> %b48, i16 %a1, i32 49 - %b50 = insertelement <64 x i16> %b49, i16 %a1, i32 50 - %b51 = insertelement <64 x i16> %b50, i16 %a1, i32 51 - %b52 = insertelement <64 x i16> %b51, i16 %a1, i32 52 - %b53 = insertelement <64 x i16> %b52, i16 %a1, i32 53 - %b54 = insertelement <64 x i16> %b53, i16 %a1, i32 54 - %b55 = insertelement <64 x i16> %b54, i16 %a1, i32 55 - %b56 = insertelement <64 x i16> %b55, i16 %a1, i32 56 - %b57 = insertelement <64 x i16> %b56, i16 %a1, i32 57 - %b58 = insertelement <64 x i16> %b57, i16 %a1, i32 58 - %b59 = insertelement <64 x i16> %b58, i16 %a1, i32 59 - %b60 = insertelement <64 x i16> %b59, i16 %a1, i32 60 - %b61 = insertelement <64 x i16> %b60, i16 %a1, i32 61 - %b62 = insertelement <64 x i16> %b61, i16 %a1, i32 62 - %b63 = insertelement <64 x i16> %b62, i16 %a1, i32 63 - %v0 = shl <64 x i16> %a0, %b63 + %b1 = shufflevector <64 x i16> %b0, <64 x i16> undef, <64 x i32> zeroinitializer + %v0 = shl <64 x i16> %a0, %b1 ret <64 x i16> %v0 } @@ -75,70 +13,8 @@ define <64 x i16> @test0000(<64 x i16> %a0, i16 %a1) #0 { ; CHECK: v0.h = vasr(v0.h,r0) define <64 x i16> @test0001(<64 x i16> %a0, i16 %a1) #0 { %b0 = insertelement <64 x i16> zeroinitializer, i16 %a1, i32 0 - %b1 = insertelement <64 x i16> %b0, i16 %a1, i32 1 - %b2 = insertelement <64 x i16> %b1, i16 %a1, i32 2 - %b3 = insertelement <64 x i16> %b2, i16 %a1, i32 3 - %b4 = insertelement <64 x i16> %b3, i16 %a1, i32 4 - %b5 = insertelement <64 x i16> %b4, i16 %a1, i32 5 - %b6 = insertelement <64 x i16> %b5, i16 %a1, i32 6 - %b7 = insertelement <64 x i16> %b6, i16 %a1, i32 7 - %b8 = insertelement <64 x i16> %b7, i16 %a1, i32 8 - %b9 = insertelement <64 x i16> %b8, i16 %a1, i32 9 - %b10 = insertelement <64 x i16> %b9, i16 %a1, i32 10 - %b11 = insertelement <64 x i16> %b10, i16 %a1, i32 11 - %b12 = insertelement <64 x i16> %b11, i16 %a1, i32 12 - %b13 = insertelement <64 x i16> %b12, i16 %a1, i32 13 - %b14 = insertelement <64 x i16> %b13, i16 %a1, i32 14 - %b15 = insertelement <64 x i16> %b14, i16 %a1, i32 15 - %b16 = insertelement <64 x i16> %b15, i16 %a1, i32 16 - %b17 = insertelement <64 x i16> %b16, i16 %a1, i32 17 - %b18 = insertelement <64 x i16> %b17, i16 %a1, i32 18 - %b19 = insertelement <64 x i16> %b18, i16 %a1, i32 19 - %b20 = insertelement <64 x i16> %b19, i16 %a1, i32 20 - %b21 = insertelement <64 x i16> %b20, i16 %a1, i32 21 - %b22 = insertelement <64 x i16> %b21, i16 %a1, i32 22 - %b23 = insertelement <64 x i16> %b22, i16 %a1, i32 23 - %b24 = insertelement <64 x i16> %b23, i16 %a1, i32 24 - %b25 = insertelement <64 x i16> %b24, i16 %a1, i32 25 - %b26 = insertelement <64 x i16> %b25, i16 %a1, i32 26 - %b27 = insertelement <64 x i16> %b26, i16 %a1, i32 27 - %b28 = insertelement <64 x i16> %b27, i16 %a1, i32 28 - %b29 = insertelement <64 x i16> %b28, i16 %a1, i32 29 - %b30 = insertelement <64 x i16> %b29, i16 %a1, i32 30 - %b31 = insertelement <64 x i16> %b30, i16 %a1, i32 31 - %b32 = insertelement <64 x i16> %b31, i16 %a1, i32 32 - %b33 = insertelement <64 x i16> %b32, i16 %a1, i32 33 - %b34 = insertelement <64 x i16> %b33, i16 %a1, i32 34 - %b35 = insertelement <64 x i16> %b34, i16 %a1, i32 35 - %b36 = insertelement <64 x i16> %b35, i16 %a1, i32 36 - %b37 = insertelement <64 x i16> %b36, i16 %a1, i32 37 - %b38 = insertelement <64 x i16> %b37, i16 %a1, i32 38 - %b39 = insertelement <64 x i16> %b38, i16 %a1, i32 39 - %b40 = insertelement <64 x i16> %b39, i16 %a1, i32 40 - %b41 = insertelement <64 x i16> %b40, i16 %a1, i32 41 - %b42 = insertelement <64 x i16> %b41, i16 %a1, i32 42 - %b43 = insertelement <64 x i16> %b42, i16 %a1, i32 43 - %b44 = insertelement <64 x i16> %b43, i16 %a1, i32 44 - %b45 = insertelement <64 x i16> %b44, i16 %a1, i32 45 - %b46 = insertelement <64 x i16> %b45, i16 %a1, i32 46 - %b47 = insertelement <64 x i16> %b46, i16 %a1, i32 47 - %b48 = insertelement <64 x i16> %b47, i16 %a1, i32 48 - %b49 = insertelement <64 x i16> %b48, i16 %a1, i32 49 - %b50 = insertelement <64 x i16> %b49, i16 %a1, i32 50 - %b51 = insertelement <64 x i16> %b50, i16 %a1, i32 51 - %b52 = insertelement <64 x i16> %b51, i16 %a1, i32 52 - %b53 = insertelement <64 x i16> %b52, i16 %a1, i32 53 - %b54 = insertelement <64 x i16> %b53, i16 %a1, i32 54 - %b55 = insertelement <64 x i16> %b54, i16 %a1, i32 55 - %b56 = insertelement <64 x i16> %b55, i16 %a1, i32 56 - %b57 = insertelement <64 x i16> %b56, i16 %a1, i32 57 - %b58 = insertelement <64 x i16> %b57, i16 %a1, i32 58 - %b59 = insertelement <64 x i16> %b58, i16 %a1, i32 59 - %b60 = insertelement <64 x i16> %b59, i16 %a1, i32 60 - %b61 = insertelement <64 x i16> %b60, i16 %a1, i32 61 - %b62 = insertelement <64 x i16> %b61, i16 %a1, i32 62 - %b63 = insertelement <64 x i16> %b62, i16 %a1, i32 63 - %v0 = ashr <64 x i16> %a0, %b63 + %b1 = shufflevector <64 x i16> %b0, <64 x i16> undef, <64 x i32> zeroinitializer + %v0 = ashr <64 x i16> %a0, %b1 ret <64 x i16> %v0 } @@ -146,70 +22,8 @@ define <64 x i16> @test0001(<64 x i16> %a0, i16 %a1) #0 { ; CHECK: v0.uh = vlsr(v0.uh,r0) define <64 x i16> @test0002(<64 x i16> %a0, i16 %a1) #0 { %b0 = insertelement <64 x i16> zeroinitializer, i16 %a1, i32 0 - %b1 = insertelement <64 x i16> %b0, i16 %a1, i32 1 - %b2 = insertelement <64 x i16> %b1, i16 %a1, i32 2 - %b3 = insertelement <64 x i16> %b2, i16 %a1, i32 3 - %b4 = insertelement <64 x i16> %b3, i16 %a1, i32 4 - %b5 = insertelement <64 x i16> %b4, i16 %a1, i32 5 - %b6 = insertelement <64 x i16> %b5, i16 %a1, i32 6 - %b7 = insertelement <64 x i16> %b6, i16 %a1, i32 7 - %b8 = insertelement <64 x i16> %b7, i16 %a1, i32 8 - %b9 = insertelement <64 x i16> %b8, i16 %a1, i32 9 - %b10 = insertelement <64 x i16> %b9, i16 %a1, i32 10 - %b11 = insertelement <64 x i16> %b10, i16 %a1, i32 11 - %b12 = insertelement <64 x i16> %b11, i16 %a1, i32 12 - %b13 = insertelement <64 x i16> %b12, i16 %a1, i32 13 - %b14 = insertelement <64 x i16> %b13, i16 %a1, i32 14 - %b15 = insertelement <64 x i16> %b14, i16 %a1, i32 15 - %b16 = insertelement <64 x i16> %b15, i16 %a1, i32 16 - %b17 = insertelement <64 x i16> %b16, i16 %a1, i32 17 - %b18 = insertelement <64 x i16> %b17, i16 %a1, i32 18 - %b19 = insertelement <64 x i16> %b18, i16 %a1, i32 19 - %b20 = insertelement <64 x i16> %b19, i16 %a1, i32 20 - %b21 = insertelement <64 x i16> %b20, i16 %a1, i32 21 - %b22 = insertelement <64 x i16> %b21, i16 %a1, i32 22 - %b23 = insertelement <64 x i16> %b22, i16 %a1, i32 23 - %b24 = insertelement <64 x i16> %b23, i16 %a1, i32 24 - %b25 = insertelement <64 x i16> %b24, i16 %a1, i32 25 - %b26 = insertelement <64 x i16> %b25, i16 %a1, i32 26 - %b27 = insertelement <64 x i16> %b26, i16 %a1, i32 27 - %b28 = insertelement <64 x i16> %b27, i16 %a1, i32 28 - %b29 = insertelement <64 x i16> %b28, i16 %a1, i32 29 - %b30 = insertelement <64 x i16> %b29, i16 %a1, i32 30 - %b31 = insertelement <64 x i16> %b30, i16 %a1, i32 31 - %b32 = insertelement <64 x i16> %b31, i16 %a1, i32 32 - %b33 = insertelement <64 x i16> %b32, i16 %a1, i32 33 - %b34 = insertelement <64 x i16> %b33, i16 %a1, i32 34 - %b35 = insertelement <64 x i16> %b34, i16 %a1, i32 35 - %b36 = insertelement <64 x i16> %b35, i16 %a1, i32 36 - %b37 = insertelement <64 x i16> %b36, i16 %a1, i32 37 - %b38 = insertelement <64 x i16> %b37, i16 %a1, i32 38 - %b39 = insertelement <64 x i16> %b38, i16 %a1, i32 39 - %b40 = insertelement <64 x i16> %b39, i16 %a1, i32 40 - %b41 = insertelement <64 x i16> %b40, i16 %a1, i32 41 - %b42 = insertelement <64 x i16> %b41, i16 %a1, i32 42 - %b43 = insertelement <64 x i16> %b42, i16 %a1, i32 43 - %b44 = insertelement <64 x i16> %b43, i16 %a1, i32 44 - %b45 = insertelement <64 x i16> %b44, i16 %a1, i32 45 - %b46 = insertelement <64 x i16> %b45, i16 %a1, i32 46 - %b47 = insertelement <64 x i16> %b46, i16 %a1, i32 47 - %b48 = insertelement <64 x i16> %b47, i16 %a1, i32 48 - %b49 = insertelement <64 x i16> %b48, i16 %a1, i32 49 - %b50 = insertelement <64 x i16> %b49, i16 %a1, i32 50 - %b51 = insertelement <64 x i16> %b50, i16 %a1, i32 51 - %b52 = insertelement <64 x i16> %b51, i16 %a1, i32 52 - %b53 = insertelement <64 x i16> %b52, i16 %a1, i32 53 - %b54 = insertelement <64 x i16> %b53, i16 %a1, i32 54 - %b55 = insertelement <64 x i16> %b54, i16 %a1, i32 55 - %b56 = insertelement <64 x i16> %b55, i16 %a1, i32 56 - %b57 = insertelement <64 x i16> %b56, i16 %a1, i32 57 - %b58 = insertelement <64 x i16> %b57, i16 %a1, i32 58 - %b59 = insertelement <64 x i16> %b58, i16 %a1, i32 59 - %b60 = insertelement <64 x i16> %b59, i16 %a1, i32 60 - %b61 = insertelement <64 x i16> %b60, i16 %a1, i32 61 - %b62 = insertelement <64 x i16> %b61, i16 %a1, i32 62 - %b63 = insertelement <64 x i16> %b62, i16 %a1, i32 63 - %v0 = lshr <64 x i16> %a0, %b63 + %b1 = shufflevector <64 x i16> %b0, <64 x i16> undef, <64 x i32> zeroinitializer + %v0 = lshr <64 x i16> %a0, %b1 ret <64 x i16> %v0 } @@ -217,38 +31,8 @@ define <64 x i16> @test0002(<64 x i16> %a0, i16 %a1) #0 { ; CHECK: v0.w = vasl(v0.w,r0) define <32 x i32> @test0010(<32 x i32> %a0, i32 %a1) #0 { %b0 = insertelement <32 x i32> zeroinitializer, i32 %a1, i32 0 - %b1 = insertelement <32 x i32> %b0, i32 %a1, i32 1 - %b2 = insertelement <32 x i32> %b1, i32 %a1, i32 2 - %b3 = insertelement <32 x i32> %b2, i32 %a1, i32 3 - %b4 = insertelement <32 x i32> %b3, i32 %a1, i32 4 - %b5 = insertelement <32 x i32> %b4, i32 %a1, i32 5 - %b6 = insertelement <32 x i32> %b5, i32 %a1, i32 6 - %b7 = insertelement <32 x i32> %b6, i32 %a1, i32 7 - %b8 = insertelement <32 x i32> %b7, i32 %a1, i32 8 - %b9 = insertelement <32 x i32> %b8, i32 %a1, i32 9 - %b10 = insertelement <32 x i32> %b9, i32 %a1, i32 10 - %b11 = insertelement <32 x i32> %b10, i32 %a1, i32 11 - %b12 = insertelement <32 x i32> %b11, i32 %a1, i32 12 - %b13 = insertelement <32 x i32> %b12, i32 %a1, i32 13 - %b14 = insertelement <32 x i32> %b13, i32 %a1, i32 14 - %b15 = insertelement <32 x i32> %b14, i32 %a1, i32 15 - %b16 = insertelement <32 x i32> %b15, i32 %a1, i32 16 - %b17 = insertelement <32 x i32> %b16, i32 %a1, i32 17 - %b18 = insertelement <32 x i32> %b17, i32 %a1, i32 18 - %b19 = insertelement <32 x i32> %b18, i32 %a1, i32 19 - %b20 = insertelement <32 x i32> %b19, i32 %a1, i32 20 - %b21 = insertelement <32 x i32> %b20, i32 %a1, i32 21 - %b22 = insertelement <32 x i32> %b21, i32 %a1, i32 22 - %b23 = insertelement <32 x i32> %b22, i32 %a1, i32 23 - %b24 = insertelement <32 x i32> %b23, i32 %a1, i32 24 - %b25 = insertelement <32 x i32> %b24, i32 %a1, i32 25 - %b26 = insertelement <32 x i32> %b25, i32 %a1, i32 26 - %b27 = insertelement <32 x i32> %b26, i32 %a1, i32 27 - %b28 = insertelement <32 x i32> %b27, i32 %a1, i32 28 - %b29 = insertelement <32 x i32> %b28, i32 %a1, i32 29 - %b30 = insertelement <32 x i32> %b29, i32 %a1, i32 30 - %b31 = insertelement <32 x i32> %b30, i32 %a1, i32 31 - %v0 = shl <32 x i32> %a0, %b31 + %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer + %v0 = shl <32 x i32> %a0, %b1 ret <32 x i32> %v0 } @@ -256,38 +40,8 @@ define <32 x i32> @test0010(<32 x i32> %a0, i32 %a1) #0 { ; CHECK: v0.w = vasr(v0.w,r0) define <32 x i32> @test0011(<32 x i32> %a0, i32 %a1) #0 { %b0 = insertelement <32 x i32> zeroinitializer, i32 %a1, i32 0 - %b1 = insertelement <32 x i32> %b0, i32 %a1, i32 1 - %b2 = insertelement <32 x i32> %b1, i32 %a1, i32 2 - %b3 = insertelement <32 x i32> %b2, i32 %a1, i32 3 - %b4 = insertelement <32 x i32> %b3, i32 %a1, i32 4 - %b5 = insertelement <32 x i32> %b4, i32 %a1, i32 5 - %b6 = insertelement <32 x i32> %b5, i32 %a1, i32 6 - %b7 = insertelement <32 x i32> %b6, i32 %a1, i32 7 - %b8 = insertelement <32 x i32> %b7, i32 %a1, i32 8 - %b9 = insertelement <32 x i32> %b8, i32 %a1, i32 9 - %b10 = insertelement <32 x i32> %b9, i32 %a1, i32 10 - %b11 = insertelement <32 x i32> %b10, i32 %a1, i32 11 - %b12 = insertelement <32 x i32> %b11, i32 %a1, i32 12 - %b13 = insertelement <32 x i32> %b12, i32 %a1, i32 13 - %b14 = insertelement <32 x i32> %b13, i32 %a1, i32 14 - %b15 = insertelement <32 x i32> %b14, i32 %a1, i32 15 - %b16 = insertelement <32 x i32> %b15, i32 %a1, i32 16 - %b17 = insertelement <32 x i32> %b16, i32 %a1, i32 17 - %b18 = insertelement <32 x i32> %b17, i32 %a1, i32 18 - %b19 = insertelement <32 x i32> %b18, i32 %a1, i32 19 - %b20 = insertelement <32 x i32> %b19, i32 %a1, i32 20 - %b21 = insertelement <32 x i32> %b20, i32 %a1, i32 21 - %b22 = insertelement <32 x i32> %b21, i32 %a1, i32 22 - %b23 = insertelement <32 x i32> %b22, i32 %a1, i32 23 - %b24 = insertelement <32 x i32> %b23, i32 %a1, i32 24 - %b25 = insertelement <32 x i32> %b24, i32 %a1, i32 25 - %b26 = insertelement <32 x i32> %b25, i32 %a1, i32 26 - %b27 = insertelement <32 x i32> %b26, i32 %a1, i32 27 - %b28 = insertelement <32 x i32> %b27, i32 %a1, i32 28 - %b29 = insertelement <32 x i32> %b28, i32 %a1, i32 29 - %b30 = insertelement <32 x i32> %b29, i32 %a1, i32 30 - %b31 = insertelement <32 x i32> %b30, i32 %a1, i32 31 - %v0 = ashr <32 x i32> %a0, %b31 + %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer + %v0 = ashr <32 x i32> %a0, %b1 ret <32 x i32> %v0 } @@ -295,41 +49,31 @@ define <32 x i32> @test0011(<32 x i32> %a0, i32 %a1) #0 { ; CHECK: v0.uw = vlsr(v0.uw,r0) define <32 x i32> @test0012(<32 x i32> %a0, i32 %a1) #0 { %b0 = insertelement <32 x i32> zeroinitializer, i32 %a1, i32 0 - %b1 = insertelement <32 x i32> %b0, i32 %a1, i32 1 - %b2 = insertelement <32 x i32> %b1, i32 %a1, i32 2 - %b3 = insertelement <32 x i32> %b2, i32 %a1, i32 3 - %b4 = insertelement <32 x i32> %b3, i32 %a1, i32 4 - %b5 = insertelement <32 x i32> %b4, i32 %a1, i32 5 - %b6 = insertelement <32 x i32> %b5, i32 %a1, i32 6 - %b7 = insertelement <32 x i32> %b6, i32 %a1, i32 7 - %b8 = insertelement <32 x i32> %b7, i32 %a1, i32 8 - %b9 = insertelement <32 x i32> %b8, i32 %a1, i32 9 - %b10 = insertelement <32 x i32> %b9, i32 %a1, i32 10 - %b11 = insertelement <32 x i32> %b10, i32 %a1, i32 11 - %b12 = insertelement <32 x i32> %b11, i32 %a1, i32 12 - %b13 = insertelement <32 x i32> %b12, i32 %a1, i32 13 - %b14 = insertelement <32 x i32> %b13, i32 %a1, i32 14 - %b15 = insertelement <32 x i32> %b14, i32 %a1, i32 15 - %b16 = insertelement <32 x i32> %b15, i32 %a1, i32 16 - %b17 = insertelement <32 x i32> %b16, i32 %a1, i32 17 - %b18 = insertelement <32 x i32> %b17, i32 %a1, i32 18 - %b19 = insertelement <32 x i32> %b18, i32 %a1, i32 19 - %b20 = insertelement <32 x i32> %b19, i32 %a1, i32 20 - %b21 = insertelement <32 x i32> %b20, i32 %a1, i32 21 - %b22 = insertelement <32 x i32> %b21, i32 %a1, i32 22 - %b23 = insertelement <32 x i32> %b22, i32 %a1, i32 23 - %b24 = insertelement <32 x i32> %b23, i32 %a1, i32 24 - %b25 = insertelement <32 x i32> %b24, i32 %a1, i32 25 - %b26 = insertelement <32 x i32> %b25, i32 %a1, i32 26 - %b27 = insertelement <32 x i32> %b26, i32 %a1, i32 27 - %b28 = insertelement <32 x i32> %b27, i32 %a1, i32 28 - %b29 = insertelement <32 x i32> %b28, i32 %a1, i32 29 - %b30 = insertelement <32 x i32> %b29, i32 %a1, i32 30 - %b31 = insertelement <32 x i32> %b30, i32 %a1, i32 31 - %v0 = lshr <32 x i32> %a0, %b31 + %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer + %v0 = lshr <32 x i32> %a0, %b1 ret <32 x i32> %v0 } +; CHECK-LABEL: test0013: +; CHECK: v0.w += vasl(v1.w,r0) +define <32 x i32> @test0013(<32 x i32> %a0, <32 x i32> %a1, i32 %a2) #0 { + %b0 = insertelement <32 x i32> zeroinitializer, i32 %a2, i32 0 + %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer + %v0 = shl <32 x i32> %a1, %b1 + %v1 = add <32 x i32> %a0, %v0 + ret <32 x i32> %v1 +} + +; CHECK-LABEL: test0014: +; CHECK: v0.w += vasr(v1.w,r0) +define <32 x i32> @test0014(<32 x i32> %a0, <32 x i32> %a1, i32 %a2) #0 { + %b0 = insertelement <32 x i32> zeroinitializer, i32 %a2, i32 0 + %b1 = shufflevector <32 x i32> %b0, <32 x i32> undef, <32 x i32> zeroinitializer + %v0 = ashr <32 x i32> %a1, %b1 + %v1 = add <32 x i32> %a0, %v0 + ret <32 x i32> %v1 +} + ; CHECK-LABEL: test0020: ; CHECK: v0.h = vasl(v0.h,v1.h) define <64 x i16> @test0020(<64 x i16> %a0, <64 x i16> %a1) #0 { diff --git a/llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll b/llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll index a43a854aac7b..678a97cbf6e4 100644 --- a/llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll +++ b/llvm/test/CodeGen/Hexagon/autohvx/shift-64b.ll @@ -4,38 +4,9 @@ ; CHECK: v0.h = vasl(v0.h,r0) define <32 x i16> @test0000(<32 x i16> %a0, i16 %a1) #0 { %b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0 - %b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1 - %b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2 - %b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3 - %b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4 - %b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5 - %b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6 - %b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7 - %b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8 - %b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9 - %b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10 - %b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11 - %b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12 - %b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13 - %b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14 - %b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15 - %b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16 - %b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17 - %b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18 - %b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19 - %b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20 - %b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21 - %b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22 - %b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23 - %b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24 - %b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25 - %b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26 - %b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27 - %b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28 - %b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29 - %b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30 - %b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31 - %v0 = shl <32 x i16> %a0, %b31 + %b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer + + %v0 = shl <32 x i16> %a0, %b1 ret <32 x i16> %v0 } @@ -43,38 +14,8 @@ define <32 x i16> @test0000(<32 x i16> %a0, i16 %a1) #0 { ; CHECK: v0.h = vasr(v0.h,r0) define <32 x i16> @test0001(<32 x i16> %a0, i16 %a1) #0 { %b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0 - %b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1 - %b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2 - %b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3 - %b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4 - %b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5 - %b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6 - %b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7 - %b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8 - %b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9 - %b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10 - %b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11 - %b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12 - %b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13 - %b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14 - %b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15 - %b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16 - %b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17 - %b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18 - %b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19 - %b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20 - %b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21 - %b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22 - %b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23 - %b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24 - %b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25 - %b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26 - %b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27 - %b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28 - %b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29 - %b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30 - %b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31 - %v0 = ashr <32 x i16> %a0, %b31 + %b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer + %v0 = ashr <32 x i16> %a0, %b1 ret <32 x i16> %v0 } @@ -82,38 +23,8 @@ define <32 x i16> @test0001(<32 x i16> %a0, i16 %a1) #0 { ; CHECK: v0.uh = vlsr(v0.uh,r0) define <32 x i16> @test0002(<32 x i16> %a0, i16 %a1) #0 { %b0 = insertelement <32 x i16> zeroinitializer, i16 %a1, i32 0 - %b1 = insertelement <32 x i16> %b0, i16 %a1, i32 1 - %b2 = insertelement <32 x i16> %b1, i16 %a1, i32 2 - %b3 = insertelement <32 x i16> %b2, i16 %a1, i32 3 - %b4 = insertelement <32 x i16> %b3, i16 %a1, i32 4 - %b5 = insertelement <32 x i16> %b4, i16 %a1, i32 5 - %b6 = insertelement <32 x i16> %b5, i16 %a1, i32 6 - %b7 = insertelement <32 x i16> %b6, i16 %a1, i32 7 - %b8 = insertelement <32 x i16> %b7, i16 %a1, i32 8 - %b9 = insertelement <32 x i16> %b8, i16 %a1, i32 9 - %b10 = insertelement <32 x i16> %b9, i16 %a1, i32 10 - %b11 = insertelement <32 x i16> %b10, i16 %a1, i32 11 - %b12 = insertelement <32 x i16> %b11, i16 %a1, i32 12 - %b13 = insertelement <32 x i16> %b12, i16 %a1, i32 13 - %b14 = insertelement <32 x i16> %b13, i16 %a1, i32 14 - %b15 = insertelement <32 x i16> %b14, i16 %a1, i32 15 - %b16 = insertelement <32 x i16> %b15, i16 %a1, i32 16 - %b17 = insertelement <32 x i16> %b16, i16 %a1, i32 17 - %b18 = insertelement <32 x i16> %b17, i16 %a1, i32 18 - %b19 = insertelement <32 x i16> %b18, i16 %a1, i32 19 - %b20 = insertelement <32 x i16> %b19, i16 %a1, i32 20 - %b21 = insertelement <32 x i16> %b20, i16 %a1, i32 21 - %b22 = insertelement <32 x i16> %b21, i16 %a1, i32 22 - %b23 = insertelement <32 x i16> %b22, i16 %a1, i32 23 - %b24 = insertelement <32 x i16> %b23, i16 %a1, i32 24 - %b25 = insertelement <32 x i16> %b24, i16 %a1, i32 25 - %b26 = insertelement <32 x i16> %b25, i16 %a1, i32 26 - %b27 = insertelement <32 x i16> %b26, i16 %a1, i32 27 - %b28 = insertelement <32 x i16> %b27, i16 %a1, i32 28 - %b29 = insertelement <32 x i16> %b28, i16 %a1, i32 29 - %b30 = insertelement <32 x i16> %b29, i16 %a1, i32 30 - %b31 = insertelement <32 x i16> %b30, i16 %a1, i32 31 - %v0 = lshr <32 x i16> %a0, %b31 + %b1 = shufflevector <32 x i16> %b0, <32 x i16> undef, <32 x i32> zeroinitializer + %v0 = lshr <32 x i16> %a0, %b1 ret <32 x i16> %v0 } @@ -121,22 +32,8 @@ define <32 x i16> @test0002(<32 x i16> %a0, i16 %a1) #0 { ; CHECK: v0.w = vasl(v0.w,r0) define <16 x i32> @test0010(<16 x i32> %a0, i32 %a1) #0 { %b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0 - %b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1 - %b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2 - %b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3 - %b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4 - %b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5 - %b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6 - %b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7 - %b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8 - %b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9 - %b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10 - %b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11 - %b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12 - %b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13 - %b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14 - %b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15 - %v0 = shl <16 x i32> %a0, %b15 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = shl <16 x i32> %a0, %b1 ret <16 x i32> %v0 } @@ -144,22 +41,8 @@ define <16 x i32> @test0010(<16 x i32> %a0, i32 %a1) #0 { ; CHECK: v0.w = vasr(v0.w,r0) define <16 x i32> @test0011(<16 x i32> %a0, i32 %a1) #0 { %b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0 - %b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1 - %b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2 - %b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3 - %b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4 - %b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5 - %b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6 - %b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7 - %b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8 - %b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9 - %b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10 - %b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11 - %b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12 - %b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13 - %b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14 - %b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15 - %v0 = ashr <16 x i32> %a0, %b15 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = ashr <16 x i32> %a0, %b1 ret <16 x i32> %v0 } @@ -167,25 +50,31 @@ define <16 x i32> @test0011(<16 x i32> %a0, i32 %a1) #0 { ; CHECK: v0.uw = vlsr(v0.uw,r0) define <16 x i32> @test0012(<16 x i32> %a0, i32 %a1) #0 { %b0 = insertelement <16 x i32> zeroinitializer, i32 %a1, i32 0 - %b1 = insertelement <16 x i32> %b0, i32 %a1, i32 1 - %b2 = insertelement <16 x i32> %b1, i32 %a1, i32 2 - %b3 = insertelement <16 x i32> %b2, i32 %a1, i32 3 - %b4 = insertelement <16 x i32> %b3, i32 %a1, i32 4 - %b5 = insertelement <16 x i32> %b4, i32 %a1, i32 5 - %b6 = insertelement <16 x i32> %b5, i32 %a1, i32 6 - %b7 = insertelement <16 x i32> %b6, i32 %a1, i32 7 - %b8 = insertelement <16 x i32> %b7, i32 %a1, i32 8 - %b9 = insertelement <16 x i32> %b8, i32 %a1, i32 9 - %b10 = insertelement <16 x i32> %b9, i32 %a1, i32 10 - %b11 = insertelement <16 x i32> %b10, i32 %a1, i32 11 - %b12 = insertelement <16 x i32> %b11, i32 %a1, i32 12 - %b13 = insertelement <16 x i32> %b12, i32 %a1, i32 13 - %b14 = insertelement <16 x i32> %b13, i32 %a1, i32 14 - %b15 = insertelement <16 x i32> %b14, i32 %a1, i32 15 - %v0 = lshr <16 x i32> %a0, %b15 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = lshr <16 x i32> %a0, %b1 ret <16 x i32> %v0 } +; CHECK-LABEL: test0013: +; CHECK: v0.w += vasl(v1.w,r0) +define <16 x i32> @test0013(<16 x i32> %a0, <16 x i32> %a1, i32 %a2) #0 { + %b0 = insertelement <16 x i32> zeroinitializer, i32 %a2, i32 0 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = shl <16 x i32> %a1, %b1 + %v1 = add <16 x i32> %a0, %v0 + ret <16 x i32> %v1 +} + +; CHECK-LABEL: test0014: +; CHECK: v0.w += vasr(v1.w,r0) +define <16 x i32> @test0014(<16 x i32> %a0, <16 x i32> %a1, i32 %a2) #0 { + %b0 = insertelement <16 x i32> zeroinitializer, i32 %a2, i32 0 + %b1 = shufflevector <16 x i32> %b0, <16 x i32> undef, <16 x i32> zeroinitializer + %v0 = ashr <16 x i32> %a1, %b1 + %v1 = add <16 x i32> %a0, %v0 + ret <16 x i32> %v1 +} + ; CHECK-LABEL: test0020: ; CHECK: v0.h = vasl(v0.h,v1.h) define <32 x i16> @test0020(<32 x i16> %a0, <32 x i16> %a1) #0 {