fix int8 depth wise kernel
This commit is contained in:
parent
e847569108
commit
133698cdd7
|
@ -90,36 +90,36 @@ ConvDwInt8Center:
|
|||
LoopKw16:
|
||||
mov x22, x21
|
||||
ld1 {v25.4h}, [x17], #8
|
||||
ld1 {v16.4h}, [x22], x13
|
||||
ld1 {v17.4h}, [x22], x13
|
||||
ld1 {v16.4h}, [x22], x11
|
||||
ld1 {v17.4h}, [x22], x11
|
||||
smlal v0.4s, v16.4h, v25.4h
|
||||
smlal v1.4s, v17.4h, v25.4h
|
||||
ld1 {v18.4h}, [x22], x13
|
||||
ld1 {v19.4h}, [x22], x13
|
||||
ld1 {v18.4h}, [x22], x11
|
||||
ld1 {v19.4h}, [x22], x11
|
||||
smlal v2.4s, v18.4h, v25.4h
|
||||
smlal v3.4s, v19.4h, v25.4h
|
||||
ld1 {v20.4h}, [x22], x13
|
||||
ld1 {v21.4h}, [x22], x13
|
||||
ld1 {v20.4h}, [x22], x11
|
||||
ld1 {v21.4h}, [x22], x11
|
||||
smlal v4.4s, v20.4h, v25.4h
|
||||
smlal v5.4s, v21.4h, v25.4h
|
||||
ld1 {v22.4h}, [x22], x13
|
||||
ld1 {v23.4h}, [x22], x13
|
||||
ld1 {v22.4h}, [x22], x11
|
||||
ld1 {v23.4h}, [x22], x11
|
||||
smlal v6.4s, v22.4h, v25.4h
|
||||
smlal v7.4s, v23.4h, v25.4h
|
||||
ld1 {v16.4h}, [x22], x13
|
||||
ld1 {v17.4h}, [x22], x13
|
||||
ld1 {v16.4h}, [x22], x11
|
||||
ld1 {v17.4h}, [x22], x11
|
||||
smlal v8.4s, v16.4h, v25.4h
|
||||
smlal v9.4s, v17.4h, v25.4h
|
||||
ld1 {v18.4h}, [x22], x13
|
||||
ld1 {v19.4h}, [x22], x13
|
||||
ld1 {v18.4h}, [x22], x11
|
||||
ld1 {v19.4h}, [x22], x11
|
||||
smlal v10.4s, v18.4h, v25.4h
|
||||
smlal v11.4s, v19.4h, v25.4h
|
||||
ld1 {v20.4h}, [x22], x13
|
||||
ld1 {v21.4h}, [x22], x13
|
||||
ld1 {v20.4h}, [x22], x11
|
||||
ld1 {v21.4h}, [x22], x11
|
||||
smlal v12.4s, v20.4h, v25.4h
|
||||
smlal v13.4s, v21.4h, v25.4h
|
||||
ld1 {v22.4h}, [x22], x13
|
||||
ld1 {v23.4h}, [x22], x13
|
||||
ld1 {v22.4h}, [x22], x11
|
||||
ld1 {v23.4h}, [x22], x11
|
||||
smlal v14.4s, v22.4h, v25.4h
|
||||
smlal v15.4s, v23.4h, v25.4h
|
||||
subs x18, x18, #1
|
||||
|
@ -420,20 +420,20 @@ ConvDwInt8Center:
|
|||
LoopKw8:
|
||||
mov x22, x21
|
||||
ld1 {v25.4h}, [x17], #8
|
||||
ld1 {v16.4h}, [x22], x13
|
||||
ld1 {v17.4h}, [x22], x13
|
||||
ld1 {v16.4h}, [x22], x11
|
||||
ld1 {v17.4h}, [x22], x11
|
||||
smlal v0.4s, v16.4h, v25.4h
|
||||
smlal v1.4s, v17.4h, v25.4h
|
||||
ld1 {v18.4h}, [x22], x13
|
||||
ld1 {v19.4h}, [x22], x13
|
||||
ld1 {v18.4h}, [x22], x11
|
||||
ld1 {v19.4h}, [x22], x11
|
||||
smlal v2.4s, v18.4h, v25.4h
|
||||
smlal v3.4s, v19.4h, v25.4h
|
||||
ld1 {v20.4h}, [x22], x13
|
||||
ld1 {v21.4h}, [x22], x13
|
||||
ld1 {v20.4h}, [x22], x11
|
||||
ld1 {v21.4h}, [x22], x11
|
||||
smlal v4.4s, v20.4h, v25.4h
|
||||
smlal v5.4s, v21.4h, v25.4h
|
||||
ld1 {v22.4h}, [x22], x13
|
||||
ld1 {v23.4h}, [x22], x13
|
||||
ld1 {v22.4h}, [x22], x11
|
||||
ld1 {v23.4h}, [x22], x11
|
||||
smlal v6.4s, v22.4h, v25.4h
|
||||
smlal v7.4s, v23.4h, v25.4h
|
||||
subs x18, x18, #1
|
||||
|
|
Loading…
Reference in New Issue