NEON指令读取3x3参数 #940

XiaochaoGONG · 2019-04-24T09:37:04Z

Hi，
请教下，vld1q_f32这个指令会读取4个f32类型的值，对于这个3x3的Kernel是怎么处理的？

Lines 66 to 68 in e2e8e1b

    
           float32x4_t _k00 = vld1q_f32(k0); 
        
           float32x4_t _k03 = vld1q_f32(k0+3); 
        
           float32x4_t _k06 = vld1q_f32(k0+6);

感觉在计算乘加时有点问题。

The text was updated successfully, but these errors were encountered:

5for3to1 · 2019-05-17T03:27:24Z

卷积核权重读取时读的是向量，卷积输入也是向量，但在计算的时候，是卷积核权重向量中的一个标量乘上卷积输入中的向量，不是直接向量乘向量。

nihui · 2019-08-02T08:14:26Z

https://github.com/Tencent/ncnn/wiki/armv7-neon-intrinsics-%E5%92%8C%E5%86%85%E5%B5%8C%E6%B1%87%E7%BC%96%E6%B7%B7%E7%94%A8
3x3这里是q寄存器单路使用

nihui closed this as completed Aug 2, 2019

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

NEON指令读取3x3参数 #940

NEON指令读取3x3参数 #940

XiaochaoGONG commented Apr 24, 2019

5for3to1 commented May 17, 2019

nihui commented Aug 2, 2019

NEON指令读取3x3参数 #940

NEON指令读取3x3参数 #940

Comments

XiaochaoGONG commented Apr 24, 2019

5for3to1 commented May 17, 2019

nihui commented Aug 2, 2019