[PATCH 3/8] aarch64: Use memcpy to copy vector tables in vtbl[34] intrinsics

Jonathan Wright via Gcc-patches Fri, 23 Jul 2021 01:30:01 -0700

Hi,

This patch uses __builtin_memcpy to copy vector structures instead of
building a new opaque structure one vector at a time in each of the
vtbl[34] Neon intrinsics in arm_neon.h. This simplifies the header file
and also improves code generation - superfluous move instructions
were emitted for every register extraction/set in this additional
structure.


Regression tested and bootstrapped on aarch64-none-linux-gnu - no
issues.

Ok for master?

Thanks,
Jonathan

---

gcc/ChangeLog:

2021-07-08  Jonathan Wright  <[email protected]>

        * config/aarch64/arm_neon.h (vtbl3_s8): Use __builtin_memcpy
        instead of constructing __builtin_aarch64_simd_oi one vector
        at a time.
        (vtbl3_u8): Likewise.
        (vtbl3_p8): Likewise.
        (vtbl4_s8): Likewise.
        (vtbl4_u8): Likewise.
        (vtbl4_p8): Likewise.

rb14673.patch
Description: rb14673.patch

[PATCH 3/8] aarch64: Use memcpy to copy vector tables in vtbl[34] intrinsics

Reply via email to