[1/3] Update s_sincosf.c and x86-64 s_sincosf-fma.c

  Include <s_sincosf.h> in s_sincosf.c, instead of "s_sincosf.h", to allow
x86-64 s_sincosf.h with vectorized sincosf_poly.  Update __sincosf_table
to allow vectorized load in vectorized sincosf_poly.  On Broadwell,
bench-sincosf shows:

       Before         After      Improvement
max    160.273        114.198        40%
min    6.25           5.625          11%
mean   13.0325        10.6462        22%

Vectorized sincosf_poly shows

       Before         After      Improvement
max    138.653        114.198        21%
min    5.004          5.625          -11%
mean   11.5934        10.6462        9%

	* sysdeps/ieee754/flt-32/s_sincosf.c: Include <s_sincosf.h>
	instead of "s_sincosf.h".
	* sysdeps/ieee754/flt-32/s_sincosf.h (sincos_t): Rearranged to
	support vectorized load.
	(sincosf_poly): Don't define if HAVE_SINCOSF_POLY is defined.
	Updated for vectorized load.
	(sinf_poly): Updated for vectorized load.
	* sysdeps/ieee754/flt-32/s_sincosf_data.c (__sincosf_table):
	Rearranged to allow vectorized load.
	* sysdeps/x86_64/fpu/s_sincosf.h: New file.
	* sysdeps/x86_64/fpu/multiarch/s_sincosf-fma.c: Just include
	<sysdeps/ieee754/flt-32/s_sincosf.c>.
---
 sysdeps/ieee754/flt-32/s_sincosf.c           |   2 +-
 sysdeps/ieee754/flt-32/s_sincosf.h           |  38 ++-
 sysdeps/ieee754/flt-32/s_sincosf_data.c      |  18 +-
 sysdeps/x86_64/fpu/multiarch/s_sincosf-fma.c | 271 +------------------
 sysdeps/x86_64/fpu/s_sincosf.h               |  57 ++++
 5 files changed, 93 insertions(+), 293 deletions(-)
 create mode 100644 sysdeps/x86_64/fpu/s_sincosf.h

[1/3] Update s_sincosf.c and x86-64 s_sincosf-fma.c

Commit Message

Comments

Patch