[v2] Add math-inline benchmark

  On Thu, Jul 16, 2015 at 12:15:19PM +0100, Wilco Dijkstra wrote:
> Add a benchmark for isinf/isnan/isnormal/isfinite/fpclassify. This new version adds explicit tests
> for the GCC built-ins and uses json format as suggested and no longer includes any string headers.
> The test uses 2 arrays with 1024 doubles, one with 99% finite FP numbers (10% zeroes, 10% negative)
> and 1% inf/NaN, the other with 50% inf, and 50% Nan. 
> 
> Results shows that using the GCC built-ins in math.h gives huge speedups due to avoiding explict
> calls, PLT indirection to execute a function with 3-4 instructions - around 7x on AArch64 and 2.8x
> on x64. The GCC builtins have better performance than the existing math_private inlines for __isnan,
> __finite and __isinf_ns, so these should be removed.
>
No, this benchmark is invalid for following two reasons.

1) It doesn't measure real workload at all. Constructing large constant
could be costy and by inlining this benchmark ignores cost. 
2) Results on x64 don't measure inlines but inferior version as they use
assembly to change double into integer.

As I and Joseph told you multiple times to measure these and I send
benchmarks to demonstrate its effects. So I fixed your benchmark and now
it clearly shows that in all cases math_private inlines are better than
builtins on x64 (Now its x64 only due EXTRACT_WORDS64, you need to sync that with math-private). 
Even remainder is slower.

So at least on x64 we should publish math_private inlines instead using
slow builtins.

I also added better finite,isnormal inlines, these should have same
speed as isnan. Main improvement is multiplication by 2 instead anding
with constant to mask sign bit.

I tried to save bit of space by using 32bit constants
instead 64bit (foo_new2) but it doesn't help.

  "math-inlines": {
   "__isnan_t": {
    "inf/nan": {
     "duration": 1.48695e+07,
     "iterations": 500,
     "mean": 29738
    }
   },
   "__isnan_inl_t": {
    "inf/nan": {
     "duration": 1.12726e+07,
     "iterations": 500,
     "mean": 22545
    }
   },
   "__isnan_builtin_t": {
    "inf/nan": {
     "duration": 1.06417e+07,
     "iterations": 500,
     "mean": 21283
    }
   },
   "isnan_t": {
    "inf/nan": {
     "duration": 1.47359e+07,
     "iterations": 500,
     "mean": 29471
    }
   },
   "isnan_new_t": {
    "inf/nan": {
     "duration": 1.0537e+07,
     "iterations": 500,
     "mean": 21073
    }
   },
   "__isinf_t": {
    "inf/nan": {
     "duration": 1.68862e+07,
     "iterations": 500,
     "mean": 33772
    }
   },
   "__isinf_inl_t": {
    "inf/nan": {
     "duration": 1.14818e+07,
     "iterations": 500,
     "mean": 22963
    }
   },
   "__isinf_ns_t": {
    "inf/nan": {
     "duration": 1.18318e+07,
     "iterations": 500,
     "mean": 23663
    }
   },
   "__isinf_ns_builtin_t": {
    "inf/nan": {
     "duration": 1.20574e+07,
     "iterations": 500,
     "mean": 24114
    }
   },
   "__isinf_builtin_t": {
    "inf/nan": {
     "duration": 1.22987e+07,
     "iterations": 500,
     "mean": 24597
    }
   },
   "isinf_t": {
    "inf/nan": {
     "duration": 1.68442e+07,
     "iterations": 500,
     "mean": 33688
    }
   },
   "isinf_new_t": {
    "inf/nan": {
     "duration": 1.26923e+07,
     "iterations": 500,
     "mean": 25384
    }
   },
   "isinf_new2_t": {
    "inf/nan": {
     "duration": 1.21769e+07,
     "iterations": 500,
     "mean": 24353
    }
   },
   "__finite_t": {
    "inf/nan": {
     "duration": 6.00459e+06,
     "iterations": 500,
     "mean": 12009
    }
   },
   "__finite_inl_t": {
    "inf/nan": {
     "duration": 3.45365e+06,
     "iterations": 500,
     "mean": 6907
    }
   },
   "__isfinite_builtin_t": {
    "inf/nan": {
     "duration": 3.41982e+06,
     "iterations": 500,
     "mean": 6839
    }
   },
   "isfinite_t": {
    "inf/nan": {
     "duration": 5.98703e+06,
     "iterations": 500,
     "mean": 11974
    }
   },
   "finite_new_t": {
    "inf/nan": {
     "duration": 3.41983e+06,
     "iterations": 500,
     "mean": 6839
    }
   },
   "finite_new2_t": {
    "inf/nan": {
     "duration": 3.4199e+06,
     "iterations": 500,
     "mean": 6839
    }
   },
   "__isnormal_inl_t": {
    "inf/nan": {
     "duration": 7.75655e+06,
     "iterations": 500,
     "mean": 15513
    }
   },
   "__isnormal_inl2_t": {
    "inf/nan": {
     "duration": 7.71059e+06,
     "iterations": 500,
     "mean": 15421
    }
   },
   "__isnormal_builtin_t": {
    "inf/nan": {
     "duration": 2.99474e+06,
     "iterations": 500,
     "mean": 5989
    }
   },
   "isnormal_t": {
    "inf/nan": {
     "duration": 7.69216e+06,
     "iterations": 500,
     "mean": 15384
    }
   },
   "isnormal_new_t": {
    "inf/nan": {
     "duration": 3.42363e+06,
     "iterations": 500,
     "mean": 6847
    }
   },
   "isnormal_new2_t": {
    "inf/nan": {
     "duration": 3.01772e+06,
     "iterations": 500,
     "mean": 6035
    }
   },
   "__fpclassify_test1_t": {
    "inf/nan": {
     "duration": 2.31874e+07,
     "iterations": 500,
     "mean": 46374
    }
   },
   "__fpclassify_test2_t": {
    "inf/nan": {
     "duration": 1.78065e+07,
     "iterations": 500,
     "mean": 35613
    }
   },
   "__fpclassify_t": {
    "inf/nan": {
     "duration": 5.13234e+06,
     "iterations": 500,
     "mean": 10264
    }
   },
   "fpclassify_t": {
    "inf/nan": {
     "duration": 5.20095e+06,
     "iterations": 500,
     "mean": 10401
    }
   },
   "remainder_test1_t": {
    "inf/nan": {
     "duration": 2.65477e+07,
     "iterations": 500,
     "mean": 53095
    }
   },
   "remainder_test2_t": {
    "inf/nan": {
     "duration": 2.80853e+07,
     "iterations": 500,
     "mean": 56170
    }
   },
   "__isnan_t": {
    "normal": {
     "duration": 6.50742e+06,
     "iterations": 500,
     "mean": 13014
    }
   },
   "__isnan_inl_t": {
    "normal": {
     "duration": 3.49208e+06,
     "iterations": 500,
     "mean": 6984
    }
   },
   "__isnan_builtin_t": {
    "normal": {
     "duration": 2.65462e+06,
     "iterations": 500,
     "mean": 5309
    }
   },
   "isnan_t": {
    "normal": {
     "duration": 6.47484e+06,
     "iterations": 500,
     "mean": 12949
    }
   },
   "isnan_new_t": {
    "normal": {
     "duration": 2.6487e+06,
     "iterations": 500,
     "mean": 5297
    }
   },
   "__isinf_t": {
    "normal": {
     "duration": 6.50518e+06,
     "iterations": 500,
     "mean": 13010
    }
   },
   "__isinf_inl_t": {
    "normal": {
     "duration": 3.15952e+06,
     "iterations": 500,
     "mean": 6319
    }
   },
   "__isinf_ns_t": {
    "normal": {
     "duration": 3.51585e+06,
     "iterations": 500,
     "mean": 7031
    }
   },
   "__isinf_ns_builtin_t": {
    "normal": {
     "duration": 3.51377e+06,
     "iterations": 500,
     "mean": 7027
    }
   },
   "__isinf_builtin_t": {
    "normal": {
     "duration": 4.36361e+06,
     "iterations": 500,
     "mean": 8727
    }
   },
   "isinf_t": {
    "normal": {
     "duration": 6.51039e+06,
     "iterations": 500,
     "mean": 13020
    }
   },
   "isinf_new_t": {
    "normal": {
     "duration": 3.09707e+06,
     "iterations": 500,
     "mean": 6194
    }
   },
   "isinf_new2_t": {
    "normal": {
     "duration": 3.11053e+06,
     "iterations": 500,
     "mean": 6221
    }
   },
   "__finite_t": {
    "normal": {
     "duration": 3.68569e+07,
     "iterations": 500,
     "mean": 73713
    }
   },
   "__finite_inl_t": {
    "normal": {
     "duration": 3.42074e+07,
     "iterations": 500,
     "mean": 68414
    }
   },
   "__isfinite_builtin_t": {
    "normal": {
     "duration": 3.43805e+07,
     "iterations": 500,
     "mean": 68760
    }
   },
   "isfinite_t": {
    "normal": {
     "duration": 3.67975e+07,
     "iterations": 500,
     "mean": 73595
    }
   },
   "finite_new_t": {
    "normal": {
     "duration": 3.40305e+07,
     "iterations": 500,
     "mean": 68061
    }
   },
   "finite_new2_t": {
    "normal": {
     "duration": 3.40128e+07,
     "iterations": 500,
     "mean": 68025
    }
   },
   "__isnormal_inl_t": {
    "normal": {
     "duration": 3.87965e+07,
     "iterations": 500,
     "mean": 77592
    }
   },
   "__isnormal_inl2_t": {
    "normal": {
     "duration": 3.87941e+07,
     "iterations": 500,
     "mean": 77588
    }
   },
   "__isnormal_builtin_t": {
    "normal": {
     "duration": 3.61693e+07,
     "iterations": 500,
     "mean": 72338
    }
   },
   "isnormal_t": {
    "normal": {
     "duration": 3.87878e+07,
     "iterations": 500,
     "mean": 77575
    }
   },
   "isnormal_new_t": {
    "normal": {
     "duration": 3.45548e+07,
     "iterations": 500,
     "mean": 69109
    }
   },
   "isnormal_new2_t": {
    "normal": {
     "duration": 3.41735e+07,
     "iterations": 500,
     "mean": 68347
    }
   },
   "__fpclassify_test1_t": {
    "normal": {
     "duration": 8.74787e+06,
     "iterations": 500,
     "mean": 17495
    }
   },
   "__fpclassify_test2_t": {
    "normal": {
     "duration": 3.17414e+06,
     "iterations": 500,
     "mean": 6348
    }
   },
   "__fpclassify_t": {
    "normal": {
     "duration": 6.0656e+06,
     "iterations": 500,
     "mean": 12131
    }
   },
   "fpclassify_t": {
    "normal": {
     "duration": 6.07758e+06,
     "iterations": 500,
     "mean": 12155
    }
   },
   "remainder_test1_t": {
    "normal": {
     "duration": 2.54391e+07,
     "iterations": 500,
     "mean": 50878
    }
   },
   "remainder_test2_t": {
    "normal": {
     "duration": 2.65189e+07,
     "iterations": 500,
     "mean": 53037
    }
   }
  }

[v2] Add math-inline benchmark

Commit Message

Comments

Patch