Message ID | 20221117163809.1009526-15-andrea.corallo@arm.com |
---|---|
State | Committed |
Commit | 31df339a50c30712c1e071d2b18f304b148a3165 |
Headers |
Return-Path: <gcc-patches-bounces+patchwork=sourceware.org@gcc.gnu.org> X-Original-To: patchwork@sourceware.org Delivered-To: patchwork@sourceware.org Received: from server2.sourceware.org (localhost [IPv6:::1]) by sourceware.org (Postfix) with ESMTP id 80DCA3AA9C2D for <patchwork@sourceware.org>; Thu, 17 Nov 2022 16:50:37 +0000 (GMT) DKIM-Filter: OpenDKIM Filter v2.11.0 sourceware.org 80DCA3AA9C2D DKIM-Signature: v=1; a=rsa-sha256; c=relaxed/relaxed; d=gcc.gnu.org; s=default; t=1668703837; bh=ZoeohK4/tfJ3+I3v8Q6fsLjxLTqUX9MnOkawW02RTQU=; h=To:CC:Subject:Date:In-Reply-To:References:List-Id: List-Unsubscribe:List-Archive:List-Post:List-Help:List-Subscribe: From:Reply-To:From; b=m35b9tkBjAdO/9ogbHZxZtuZyjBjci5Vzlf885WApIySIo3kLGz7YwXb+YdBAi0ts FhtCr3hutN73hzcSjA2LGZFO+YwzKSqjc4lOfDOpab6f6FvNjKS0coKXbWGJOBfPJO d6IjzKdeS64Rcjt+909CqPA4oksKwuWezQLh13cY= X-Original-To: gcc-patches@gcc.gnu.org Delivered-To: gcc-patches@gcc.gnu.org Received: from EUR04-HE1-obe.outbound.protection.outlook.com (mail-eopbgr70082.outbound.protection.outlook.com [40.107.7.82]) by sourceware.org (Postfix) with ESMTPS id C7F8B3AA982E for <gcc-patches@gcc.gnu.org>; Thu, 17 Nov 2022 16:39:27 +0000 (GMT) DMARC-Filter: OpenDMARC Filter v1.4.1 sourceware.org C7F8B3AA982E Received: from DB8PR04CA0026.eurprd04.prod.outlook.com (2603:10a6:10:110::36) by AS8PR08MB6007.eurprd08.prod.outlook.com (2603:10a6:20b:29e::15) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.5834.9; Thu, 17 Nov 2022 16:38:59 +0000 Received: from DBAEUR03FT042.eop-EUR03.prod.protection.outlook.com (2603:10a6:10:110:cafe::1) by DB8PR04CA0026.outlook.office365.com (2603:10a6:10:110::36) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.5813.14 via Frontend Transport; Thu, 17 Nov 2022 16:38:59 +0000 X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 63.35.35.123) smtp.mailfrom=arm.com; dkim=pass (signature was verified) header.d=armh.onmicrosoft.com;dmarc=pass action=none header.from=arm.com; Received-SPF: Pass (protection.outlook.com: domain of arm.com designates 63.35.35.123 as permitted sender) receiver=protection.outlook.com; client-ip=63.35.35.123; helo=64aa7808-outbound-1.mta.getcheckrecipient.com; pr=C Received: from 64aa7808-outbound-1.mta.getcheckrecipient.com (63.35.35.123) by DBAEUR03FT042.mail.protection.outlook.com (100.127.142.143) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.5834.8 via Frontend Transport; Thu, 17 Nov 2022 16:38:59 +0000 Received: ("Tessian outbound 58faf9791229:v130"); Thu, 17 Nov 2022 16:38:59 +0000 X-CheckRecipientChecked: true X-CR-MTA-CID: 7a7a9980f16079f1 X-CR-MTA-TID: 64aa7808 Received: from 83182e97f801.1 by 64aa7808-outbound-1.mta.getcheckrecipient.com id FB84C884-97A7-4F8A-BF11-964A94C1E5BE.1; Thu, 17 Nov 2022 16:38:50 +0000 Received: from EUR03-VI1-obe.outbound.protection.outlook.com by 64aa7808-outbound-1.mta.getcheckrecipient.com with ESMTPS id 83182e97f801.1 (version=TLSv1.2 cipher=ECDHE-RSA-AES256-GCM-SHA384); Thu, 17 Nov 2022 16:38:50 +0000 ARC-Seal: i=1; a=rsa-sha256; s=arcselector9901; d=microsoft.com; cv=none; b=E6Q2easg3+k055h48/DdbiG+eNxcaUTps68mvPRvEdX2FPCN6SNHew6TxMPd7q2hot27kD8HqEInM6YbNpTDAS+s4kOAKrmleL9C6uvovoYQEgbAzNL/NNkVmqsbd63pW1HbNnfOkzpj+TiN+21/SmX2Ok7ArDQXMj265/ajwgZQqwRGj8f7pBmyMCMWb+PZSXeWckX1j3hopYrVWLjritkW3dEt3wPg236ZrzIRGiCguczr+5LF4CsshHpLMjR63ovTFU1EdUPbdEiHBBn4z5X2RGDFZ2FjmjcTHxDxTtMeGm76v71MoNmIPCBGQe0561u2PLcaGvLpniLyWDKjQA== ARC-Message-Signature: i=1; a=rsa-sha256; c=relaxed/relaxed; d=microsoft.com; s=arcselector9901; h=From:Date:Subject:Message-ID:Content-Type:MIME-Version:X-MS-Exchange-AntiSpam-MessageData-ChunkCount:X-MS-Exchange-AntiSpam-MessageData-0:X-MS-Exchange-AntiSpam-MessageData-1; bh=ZoeohK4/tfJ3+I3v8Q6fsLjxLTqUX9MnOkawW02RTQU=; b=ayW/0iOL3ZUx74JaSctqsKtcYjYrcNWwfHPibP8bcNEEUT8PFYW1uKWp/xLCnhE+R2Y2WdOHgRI484RyfyirTdJG8rzbBhHQdeRR/YdJ/eCGsccDmIwEpAh4qB6huL7FSFArqh9TSw/bgLrdhTOxkMfsa7K2eDV9tASTog0/Z3i7zSa/psH9jbdcKaYVpVXe7HuYasYGa3Toiz/3tlCjNZlw4nY7KvwTV1TDDaFVFYXHSz9Z+0TKpATJBusKdYFYi0KMlTjkX/RsV0FHUm7XIbinYB3nkCimPyCAr3LWvtzwmvTusIdTpVR0C/oTJGqk5O6vdSdTHgmZMsUlezOHWw== ARC-Authentication-Results: i=1; mx.microsoft.com 1; spf=pass (sender ip is 40.67.248.234) smtp.rcpttodomain=gcc.gnu.org smtp.mailfrom=arm.com; dmarc=pass (p=none sp=none pct=100) action=none header.from=arm.com; dkim=none (message not signed); arc=none Received: from DB6PR0802CA0047.eurprd08.prod.outlook.com (2603:10a6:4:a3::33) by DU0PR08MB9512.eurprd08.prod.outlook.com (2603:10a6:10:44c::6) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.5834.8; Thu, 17 Nov 2022 16:38:23 +0000 Received: from DBAEUR03FT019.eop-EUR03.prod.protection.outlook.com (2603:10a6:4:a3:cafe::6b) by DB6PR0802CA0047.outlook.office365.com (2603:10a6:4:a3::33) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_256_GCM_SHA384) id 15.20.5813.18 via Frontend Transport; Thu, 17 Nov 2022 16:38:23 +0000 X-MS-Exchange-Authentication-Results: spf=pass (sender IP is 40.67.248.234) smtp.mailfrom=arm.com; dkim=none (message not signed) header.d=none;dmarc=pass action=none header.from=arm.com; Received-SPF: Pass (protection.outlook.com: domain of arm.com designates 40.67.248.234 as permitted sender) receiver=protection.outlook.com; client-ip=40.67.248.234; helo=nebula.arm.com; pr=C Received: from nebula.arm.com (40.67.248.234) by DBAEUR03FT019.mail.protection.outlook.com (100.127.142.129) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.20.5834.8 via Frontend Transport; Thu, 17 Nov 2022 16:38:22 +0000 Received: from AZ-NEU-EX02.Emea.Arm.com (10.251.26.5) by AZ-NEU-EX04.Arm.com (10.251.24.32) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.1.2507.16; Thu, 17 Nov 2022 16:38:22 +0000 Received: from AZ-NEU-EX04.Arm.com (10.251.24.32) by AZ-NEU-EX02.Emea.Arm.com (10.251.26.5) with Microsoft SMTP Server (version=TLS1_2, cipher=TLS_ECDHE_RSA_WITH_AES_128_GCM_SHA256) id 15.1.2507.16; Thu, 17 Nov 2022 16:38:21 +0000 Received: from e124257.nice.arm.com (10.34.105.24) by mail.arm.com (10.251.24.32) with Microsoft SMTP Server id 15.1.2507.16 via Frontend Transport; Thu, 17 Nov 2022 16:38:21 +0000 To: <gcc-patches@gcc.gnu.org> CC: <kyrylo.tkachov@arm.com>, <Richard.Earnshaw@arm.com>, "Stam Markianos-Wright" <stam.markianos-wright@arm.com> Subject: [PATCH 14/35] arm: propagate fixed overloading of MVE intrinsic scalar parameters Date: Thu, 17 Nov 2022 17:37:48 +0100 Message-ID: <20221117163809.1009526-15-andrea.corallo@arm.com> X-Mailer: git-send-email 2.25.1 In-Reply-To: <20221117163809.1009526-1-andrea.corallo@arm.com> References: <20221117163809.1009526-1-andrea.corallo@arm.com> MIME-Version: 1.0 Content-Transfer-Encoding: 8bit Content-Type: text/plain X-EOPAttributedMessage: 1 X-MS-TrafficTypeDiagnostic: DBAEUR03FT019:EE_|DU0PR08MB9512:EE_|DBAEUR03FT042:EE_|AS8PR08MB6007:EE_ X-MS-Office365-Filtering-Correlation-Id: 74cebd36-abb0-4b62-3049-08dac8ba3a1d x-checkrecipientrouted: true NoDisclaimer: true X-MS-Exchange-SenderADCheck: 1 X-MS-Exchange-AntiSpam-Relay: 0 X-Microsoft-Antispam-Untrusted: BCL:0; X-Microsoft-Antispam-Message-Info-Original: OdNHAUV72D4Xi/91xM7ohPbABI6F2/m6nTLVJChbTWAq+1WBCGs3ufhMXnQZ3iI7AEs79Ma+xPfIEvJ9EBEKe6qjzdKqlP0v7B9AYwGt4zMJnKVH685Yq6Cbqdr4U33BrZsNp6DF7PduFyiOyLmk4XTsYEHEouz1L5zUb2ve7MV9QifRydhmH4YdwgETPY9+qCyD7Zyi3bFn4zZI3MKNWsWZ/kjMI3YO55yibDu1H8WA/HSkry/5SrGUhlyQaSsmVDdCx6GrukS9X1hXOY2OcnoagPc67/jva89XOs3cMCiGRHQhn9RSh+U03vcg9LBMXk0eAx/JXDG+m3HkTA2yc9Q29+ACO5+HpVcvEaGi0Nnc1C+UPRO/JxvXQoOgaXgkgToBpGbLtVJxlpa+CysIEdnmTCv2GumN41YMOxL50eZjURj357N2SjsvvLpNC80XvllqfaStpgSjNtVFsRlsh1jZh2VxuTJ6SKt+uQ3qfFS8nnF6kY2kz7RNDq+h++T28MjEhVhuA41UWHlVXRZMtPml0pDUm0T/AnqQ2CFrks3uaIyXr0mHWOLONgy4Ddz7G6sjx/7wrfdSWeWcwLWiI3AnmzPUX/FyqKqTiTytSBY86eiG25+hD7ng2VaHH+1mfPo4taIhNaZOqNxPeNKJhzlw3hbKnYmcGuFuZMrLvY8O2I0+LPHtBU/B4srIyLXuu9d9AJ2L9o1uTCcEy4EmCKh1ohXImtFHNfLu1mCv+K0= X-Forefront-Antispam-Report-Untrusted: CIP:40.67.248.234; CTRY:IE; LANG:en; SCL:1; SRV:; IPV:NLI; SFV:NSPM; H:nebula.arm.com; PTR:InfoDomainNonexistent; CAT:NONE; SFS:(13230022)(4636009)(396003)(346002)(136003)(376002)(39860400002)(451199015)(36840700001)(46966006)(40470700004)(5660300002)(8936002)(6916009)(4326008)(70206006)(54906003)(316002)(44832011)(70586007)(41300700001)(8676002)(30864003)(36756003)(40460700003)(2616005)(47076005)(336012)(426003)(186003)(7696005)(6666004)(26005)(1076003)(2906002)(82310400005)(36860700001)(40480700001)(82740400003)(478600001)(86362001)(81166007)(83380400001)(356005)(36900700001)(559001)(579004); DIR:OUT; SFP:1101; X-MS-Exchange-Transport-CrossTenantHeadersStamped: DU0PR08MB9512 X-MS-Exchange-Transport-CrossTenantHeadersStripped: DBAEUR03FT042.eop-EUR03.prod.protection.outlook.com X-MS-PublicTrafficType: Email X-MS-Office365-Filtering-Correlation-Id-Prvs: f75b7f4b-be99-4e42-6871-08dac8ba249e X-Microsoft-Antispam: BCL:0; X-Microsoft-Antispam-Message-Info: rXurC0NwRf5dWc6FB+SAvi+V7ZxPxm5puJQY2Ui/bZo1Of44YDicfZ4HODzewXNghbiHumIjFKiC3T0i3tp0dx+2JO2x8enM2dFYFP/boyXxw6YInOT7/jjj1SK2TqHxJY/ipOmJpFR3WLPPjOfqaeVprqvu7fE21k4E3uY4jhZuQv/8j4ICSkGAxH/5VGdoyghSKjgxopmwhU6v6R5ZyGS7K3k6AttrhNuZ9rcJvrYiCLD609Q8t43cl5kqsjk5PemEUTmmtVGkscx6UM8dFnt71qjeNMc3BfWA60i+k4d//DNCjDL7Twwm7ms22qkQ/C5dzgyQmCzMqfBNFRHKP+IwJjx47LaGRqKIwKk6bKVubPk2ElCQYZq8RHTkYYbJ/w9gY0x/A5//12ZPu82krjK9VEYHQcH6UXxXV+ggq/hb4dgRqNSYRuXR/7wrBRCPWs/L3F/z7/6RHRTlvCDfQhmfOD0AqUDONAxGA5LloD548bKknI3/ZaHydCOhPVyuEzbk97O3xtDbj45gBhEGUiptYvyJhyzs3fWFvKLkk6lRb89U2Dr2izvKJqQvCdz5+1xbuVabuNbn7fhj8Cy5bbrkGvuUhdDlYdnsWTLbo2doMaM921LY2scU1W071WqSgOxnonacZYwiZPfP6lOhPTf0WrxvLJ5sqwvFsAsjjlKvDQazu+AXkAAIgmD8mECbljYhciT8iRFtGDv5R3Y+xQ== X-Forefront-Antispam-Report: CIP:63.35.35.123; CTRY:IE; LANG:en; SCL:1; SRV:; IPV:CAL; SFV:NSPM; H:64aa7808-outbound-1.mta.getcheckrecipient.com; PTR:ec2-63-35-35-123.eu-west-1.compute.amazonaws.com; CAT:NONE; SFS:(13230022)(4636009)(136003)(376002)(39860400002)(346002)(396003)(451199015)(46966006)(40470700004)(36840700001)(36756003)(26005)(2616005)(86362001)(81166007)(36860700001)(82740400003)(82310400005)(336012)(40460700003)(83380400001)(426003)(30864003)(186003)(47076005)(1076003)(2906002)(44832011)(8936002)(5660300002)(7696005)(40480700001)(6666004)(478600001)(41300700001)(70206006)(6916009)(54906003)(70586007)(316002)(8676002)(4326008)(559001)(579004); DIR:OUT; SFP:1101; X-OriginatorOrg: arm.com X-MS-Exchange-CrossTenant-OriginalArrivalTime: 17 Nov 2022 16:38:59.0810 (UTC) X-MS-Exchange-CrossTenant-Network-Message-Id: 74cebd36-abb0-4b62-3049-08dac8ba3a1d X-MS-Exchange-CrossTenant-Id: f34e5979-57d9-4aaa-ad4d-b122a662184d X-MS-Exchange-CrossTenant-OriginalAttributedTenantConnectingIp: TenantId=f34e5979-57d9-4aaa-ad4d-b122a662184d; Ip=[63.35.35.123]; Helo=[64aa7808-outbound-1.mta.getcheckrecipient.com] X-MS-Exchange-CrossTenant-AuthSource: DBAEUR03FT042.eop-EUR03.prod.protection.outlook.com X-MS-Exchange-CrossTenant-AuthAs: Anonymous X-MS-Exchange-CrossTenant-FromEntityHeader: HybridOnPrem X-MS-Exchange-Transport-CrossTenantHeadersStamped: AS8PR08MB6007 X-Spam-Status: No, score=-12.0 required=5.0 tests=BAYES_00, DKIM_SIGNED, DKIM_VALID, FORGED_SPF_HELO, GIT_PATCH_0, KAM_DMARC_NONE, RCVD_IN_DNSWL_NONE, RCVD_IN_MSPIKE_H2, SPF_HELO_PASS, SPF_NONE, TXREP, UNPARSEABLE_RELAY autolearn=ham autolearn_force=no version=3.4.6 X-Spam-Checker-Version: SpamAssassin 3.4.6 (2021-04-09) on server2.sourceware.org X-BeenThere: gcc-patches@gcc.gnu.org X-Mailman-Version: 2.1.29 Precedence: list List-Id: Gcc-patches mailing list <gcc-patches.gcc.gnu.org> List-Unsubscribe: <https://gcc.gnu.org/mailman/options/gcc-patches>, <mailto:gcc-patches-request@gcc.gnu.org?subject=unsubscribe> List-Archive: <https://gcc.gnu.org/pipermail/gcc-patches/> List-Post: <mailto:gcc-patches@gcc.gnu.org> List-Help: <mailto:gcc-patches-request@gcc.gnu.org?subject=help> List-Subscribe: <https://gcc.gnu.org/mailman/listinfo/gcc-patches>, <mailto:gcc-patches-request@gcc.gnu.org?subject=subscribe> From: Andrea Corallo via Gcc-patches <gcc-patches@gcc.gnu.org> Reply-To: Andrea Corallo <andrea.corallo@arm.com> Errors-To: gcc-patches-bounces+patchwork=sourceware.org@gcc.gnu.org Sender: "Gcc-patches" <gcc-patches-bounces+patchwork=sourceware.org@gcc.gnu.org> |
Series |
arm: rework MVE testsuite and rework backend where necessary (1st chunk)
|
|
Commit Message
Andrea Corallo
Nov. 17, 2022, 4:37 p.m. UTC
From: Stam Markianos-Wright <stam.markianos-wright@arm.com>
This is a mechanical patch that propagates the change proposed in
my previous patch for vaddq[_m]_n
across all other polymorphic MVE intrinsic overloads of scalar types.
The find and Replace patterns used were:
s/__ARM_mve_coerce\(__p(\d+), [u]?int(8|16|32|64)_t\)
/__ARM_mve_coerce3(p$1, int)/g
s/__ARM_mve_coerce2\(__p(\d+), double\)
/__ARM_mve_coerce2(p$1, double)/g
gcc/ChangeLog:
* config/arm/arm_mve.h (__arm_vaddq): Fix Overloading.
(__arm_vmulq): Likewise.
(__arm_vcmpeqq): Likewise.
(__arm_vcmpneq): Likewise.
(__arm_vmaxnmavq): Likewise.
(__arm_vmaxnmvq): Likewise.
(__arm_vminnmavq): Likewise.
(__arm_vsubq): Likewise.
(__arm_vminnmvq): Likewise.
(__arm_vrshlq): Likewise.
(__arm_vqsubq): Likewise.
(__arm_vqdmulltq): Likewise.
(__arm_vqdmullbq): Likewise.
(__arm_vqdmulhq): Likewise.
(__arm_vqaddq): Likewise.
(__arm_vhaddq): Likewise.
(__arm_vhsubq): Likewise.
(__arm_vqdmlashq): Likewise.
(__arm_vqrdmlahq): Likewise.
(__arm_vmlasq): Likewise.
(__arm_vqdmlahq): Likewise.
(__arm_vmaxnmavq_p): Likewise.
(__arm_vmaxnmvq_p): Likewise.
(__arm_vminnmavq_p): Likewise.
(__arm_vminnmvq_p): Likewise.
(__arm_vfmasq_m): Likewise.
(__arm_vsetq_lane): Likewise.
(__arm_vcmpneq_m): Likewise.
(__arm_vhaddq_x): Likewise.
(__arm_vhsubq_x): Likewise.
(__arm_vqrdmlashq_m): Likewise.
(__arm_vqdmlashq_m): Likewise.
(__arm_vmlaldavaxq_p): Likewise.
(__arm_vmlasq_m): Likewise.
(__arm_vqdmulhq_m): Likewise.
(__arm_vqdmulltq_m): Likewise.
(__arm_viwdupq_m): Likewise.
(__arm_viwdupq_u16): Likewise.
(__arm_viwdupq_u32): Likewise.
(__arm_viwdupq_u8): Likewise.
(__arm_vdwdupq_m): Likewise.
(__arm_vdwdupq_u16): Likewise.
(__arm_vdwdupq_u32): Likewise.
(__arm_vdwdupq_u8): Likewise.
(__arm_vaddlvaq): Likewise.
(__arm_vaddlvaq_p): Likewise.
(__arm_vaddvaq): Likewise.
(__arm_vaddvaq_p): Likewise.
(__arm_vcmphiq_m): Likewise.
(__arm_vmladavaq_p): Likewise.
(__arm_vmladavaxq): Likewise.
(__arm_vmlaldavaxq): Likewise.
(__arm_vrmlaldavhaq_p): Likewise.
---
gcc/config/arm/arm_mve.h | 1106 +++++++++++++++++++-------------------
1 file changed, 553 insertions(+), 553 deletions(-)
Comments
> -----Original Message----- > From: Andrea Corallo <andrea.corallo@arm.com> > Sent: Thursday, November 17, 2022 4:38 PM > To: gcc-patches@gcc.gnu.org > Cc: Kyrylo Tkachov <Kyrylo.Tkachov@arm.com>; Richard Earnshaw > <Richard.Earnshaw@arm.com>; Stam Markianos-Wright <Stam.Markianos- > Wright@arm.com> > Subject: [PATCH 14/35] arm: propagate fixed overloading of MVE intrinsic > scalar parameters > > From: Stam Markianos-Wright <stam.markianos-wright@arm.com> > > This is a mechanical patch that propagates the change proposed in > my previous patch for vaddq[_m]_n > across all other polymorphic MVE intrinsic overloads of scalar types. > > The find and Replace patterns used were: > > s/__ARM_mve_coerce\(__p(\d+), [u]?int(8|16|32|64)_t\) > /__ARM_mve_coerce3(p$1, int)/g > > s/__ARM_mve_coerce2\(__p(\d+), double\) > /__ARM_mve_coerce2(p$1, double)/g > > gcc/ChangeLog: > > * config/arm/arm_mve.h (__arm_vaddq): Fix Overloading. > (__arm_vmulq): Likewise. > (__arm_vcmpeqq): Likewise. > (__arm_vcmpneq): Likewise. > (__arm_vmaxnmavq): Likewise. > (__arm_vmaxnmvq): Likewise. > (__arm_vminnmavq): Likewise. > (__arm_vsubq): Likewise. > (__arm_vminnmvq): Likewise. > (__arm_vrshlq): Likewise. > (__arm_vqsubq): Likewise. > (__arm_vqdmulltq): Likewise. > (__arm_vqdmullbq): Likewise. > (__arm_vqdmulhq): Likewise. > (__arm_vqaddq): Likewise. > (__arm_vhaddq): Likewise. > (__arm_vhsubq): Likewise. > (__arm_vqdmlashq): Likewise. > (__arm_vqrdmlahq): Likewise. > (__arm_vmlasq): Likewise. > (__arm_vqdmlahq): Likewise. > (__arm_vmaxnmavq_p): Likewise. > (__arm_vmaxnmvq_p): Likewise. > (__arm_vminnmavq_p): Likewise. > (__arm_vminnmvq_p): Likewise. > (__arm_vfmasq_m): Likewise. > (__arm_vsetq_lane): Likewise. > (__arm_vcmpneq_m): Likewise. > (__arm_vhaddq_x): Likewise. > (__arm_vhsubq_x): Likewise. > (__arm_vqrdmlashq_m): Likewise. > (__arm_vqdmlashq_m): Likewise. > (__arm_vmlaldavaxq_p): Likewise. > (__arm_vmlasq_m): Likewise. > (__arm_vqdmulhq_m): Likewise. > (__arm_vqdmulltq_m): Likewise. > (__arm_viwdupq_m): Likewise. > (__arm_viwdupq_u16): Likewise. > (__arm_viwdupq_u32): Likewise. > (__arm_viwdupq_u8): Likewise. > (__arm_vdwdupq_m): Likewise. > (__arm_vdwdupq_u16): Likewise. > (__arm_vdwdupq_u32): Likewise. > (__arm_vdwdupq_u8): Likewise. > (__arm_vaddlvaq): Likewise. > (__arm_vaddlvaq_p): Likewise. > (__arm_vaddvaq): Likewise. > (__arm_vaddvaq_p): Likewise. > (__arm_vcmphiq_m): Likewise. > (__arm_vmladavaq_p): Likewise. > (__arm_vmladavaxq): Likewise. > (__arm_vmlaldavaxq): Likewise. > (__arm_vrmlaldavhaq_p): Likewise. IMO this should have been squashed with the previous patch. Is all this covered by the tests that we have (or that you're improving in this series)? Ok if so. Thanks, Kyrill > --- > gcc/config/arm/arm_mve.h | 1106 +++++++++++++++++++------------------- > 1 file changed, 553 insertions(+), 553 deletions(-) > > diff --git a/gcc/config/arm/arm_mve.h b/gcc/config/arm/arm_mve.h > index 951dc25374b..fd1876b57a0 100644 > --- a/gcc/config/arm/arm_mve.h > +++ b/gcc/config/arm/arm_mve.h > @@ -35881,8 +35881,8 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double)));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > > #define __arm_vandq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -35927,14 +35927,14 @@ extern void *__ARM_undef; > #define __arm_vmulq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vmulq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vmulq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vmulq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -35959,14 +35959,14 @@ extern void *__ARM_undef; > #define __arm_vcmpeqq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpeqq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpeqq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpeqq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -35997,16 +35997,16 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpeqq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpeqq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpeqq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t), p2), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpeqq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpeqq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double), p2));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2));}) > > #define __arm_vcmpgtq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36014,13 +36014,13 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgtq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgtq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgtq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpgtq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpgtq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double)));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > > #define __arm_vcmpleq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36030,11 +36030,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpleq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpleq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpleq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > > #define __arm_vcmpltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36042,25 +36042,25 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpltq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpltq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpltq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double)));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > > #define __arm_vcmpneq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpneq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpneq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpneq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36115,8 +36115,8 @@ extern void *__ARM_undef; > #define __arm_vmaxnmavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmavq_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmavq_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmavq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmavq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > > #define __arm_vmaxnmq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36127,14 +36127,14 @@ extern void *__ARM_undef; > #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > > #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > > #define __arm_vminnmaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36145,8 +36145,8 @@ extern void *__ARM_undef; > #define __arm_vminnmavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmavq_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmavq_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmavq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmavq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > > #define __arm_vbrsrq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -36168,14 +36168,14 @@ extern void *__ARM_undef; > #define __arm_vsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36188,8 +36188,8 @@ extern void *__ARM_undef; > #define __arm_vminnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmvq_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmvq_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmvq_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t)), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmvq_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t)));}) > > #define __arm_vshlq_r(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -36244,12 +36244,12 @@ extern void *__ARM_undef; > #define __arm_vrshlq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vrshlq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vrshlq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vrshlq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36280,12 +36280,12 @@ extern void *__ARM_undef; > #define __arm_vqsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36336,12 +36336,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqrshlq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqrshlq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqrshlq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, int32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vqrdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36349,9 +36349,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqrdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqrdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqrdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vmlaldavxq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36384,8 +36384,8 @@ extern void *__ARM_undef; > #define __arm_vqdmulltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmulltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmulltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) > > @@ -36398,17 +36398,17 @@ extern void *__ARM_undef; > #define __arm_vqdmullbq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmullbq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmullbq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) > > #define __arm_vqdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) > @@ -36416,12 +36416,12 @@ extern void *__ARM_undef; > #define __arm_vqaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36454,12 +36454,12 @@ extern void *__ARM_undef; > #define __arm_vhaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36484,12 +36484,12 @@ extern void *__ARM_undef; > #define __arm_vhsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -36632,12 +36632,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, uint8_t)), > \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t)), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int)));}) > > #define __arm_vsriq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36716,44 +36716,44 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > > #define __arm_vqdmlashq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > > #define __arm_vqrdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > > #define __arm_vmlasq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t)), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t)), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int)));}) > > #define __arm_vqdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > > #define __arm_vqrdmladhxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36943,11 +36943,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgtq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgtq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgtq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double), p2), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpgtq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpgtq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > > @@ -36959,11 +36959,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpleq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpleq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpleq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2));}) > > #define __arm_vcmpltq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36973,11 +36973,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpltq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpltq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpltq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2));}) > > #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -36990,14 +36990,14 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpneq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpneq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpneq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2));}) > > #define __arm_vcvtbq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -37051,8 +37051,8 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double)), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double)), \ > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double)), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double)), \ > int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vfmaq_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t)), \ > int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_float32x4_t]: __arm_vfmaq_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t)));}) > > @@ -37067,8 +37067,8 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double)), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double)));}) > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double)), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double)));}) > > #define __arm_vmaxnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -37091,14 +37091,14 @@ extern void *__ARM_undef; > #define __arm_vmaxnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > > #define __arm_vmaxnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > > #define __arm_vminnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -37109,14 +37109,14 @@ extern void *__ARM_undef; > #define __arm_vminnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmavq_p_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmavq_p_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmavq_p_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmavq_p_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > > #define __arm_vminnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmvq_p_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmvq_p_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vminnmvq_p_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vminnmvq_p_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > > #define __arm_vrndnq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -37178,13 +37178,13 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgeq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgeq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgeq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpgeq_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t)), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpgeq_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t)), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double)), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double)));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double)), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double)));}) > > #define __arm_vrshrnbq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -37285,11 +37285,11 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgeq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgeq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgeq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(__p1, double), p2), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(__p1, double), p2), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce2(p1, double), p2), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce2(p1, double), p2), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vcmpgeq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vcmpgeq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > > @@ -37324,8 +37324,8 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double), p3));}) > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > > #define __arm_vandq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -37466,15 +37466,15 @@ extern void *__ARM_undef; > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vfmaq_m_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_float32x4_t]: __arm_vfmaq_m_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double), p3));}) > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > > #define __arm_vfmasq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double), p3));}) > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vfmasq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > > #define __arm_vfmsq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -37509,14 +37509,14 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vmulq_m_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vmulq_m_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_float32x4_t]: __arm_vmulq_m_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), > p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vmulq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vmulq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vmulq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vmulq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > > #define __arm_vornq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -37543,14 +37543,14 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vsubq_m_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_float16x8_t]: __arm_vsubq_m_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_float32x4_t]: __arm_vsubq_m_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), > p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > - int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vsubq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double), p3), \ > - int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vsubq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ > mve_type_fp_n]: __arm_vsubq_m_n_f16 (__ARM_mve_coerce(__p0, > float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > + int > (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ > mve_type_fp_n]: __arm_vsubq_m_n_f32 (__ARM_mve_coerce(__p0, > float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > > #define __arm_vorrq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -38023,19 +38023,19 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8_t), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16_t), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32_t), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vaddq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vaddq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vaddq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vaddq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vaddq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vaddq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double), p3), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vaddq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double), p3));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vaddq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vaddq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > > #define __arm_vandq_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > @@ -38158,19 +38158,19 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vmulq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vmulq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vmulq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8_t), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16_t), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32_t), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vmulq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vmulq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vmulq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vmulq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vmulq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vmulq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double), p3), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vmulq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double), p3));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vmulq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vmulq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > > #define __arm_vnegq_x(p1,p2) ({ __typeof(p1) __p1 = (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > @@ -38258,8 +38258,8 @@ extern void *__ARM_undef; > _Generic( (int > (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ > int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: > __arm_vsubq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce(__p2, float16x8_t), p3), \ > int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: > __arm_vsubq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce(__p2, float32x4_t), p3), \ > - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vsubq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(__p2, double), p3), \ > - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vsubq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(__p2, double), p3));}) > + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: > __arm_vsubq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), > __ARM_mve_coerce2(p2, double), p3), \ > + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: > __arm_vsubq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), > __ARM_mve_coerce2(p2, double), p3));}) > > #define __arm_vcmulq_rot90_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > @@ -38283,16 +38283,16 @@ extern void *__ARM_undef; > #define __arm_vsetq_lane(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vsetq_lane_s8 (__ARM_mve_coerce(__p0, int8_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vsetq_lane_s16 (__ARM_mve_coerce(__p0, int16_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vsetq_lane_s32 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: > __arm_vsetq_lane_s64 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int64x2_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vsetq_lane_u8 (__ARM_mve_coerce(__p0, uint8_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vsetq_lane_u16 (__ARM_mve_coerce(__p0, uint16_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vsetq_lane_u32 (__ARM_mve_coerce(__p0, uint32_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: > __arm_vsetq_lane_u64 (__ARM_mve_coerce(__p0, uint64_t), > __ARM_mve_coerce(__p1, uint64x2_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vsetq_lane_f16 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vsetq_lane_f32 (__ARM_mve_coerce2(__p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vsetq_lane_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vsetq_lane_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vsetq_lane_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: > __arm_vsetq_lane_s64 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int64x2_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vsetq_lane_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vsetq_lane_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vsetq_lane_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: > __arm_vsetq_lane_u64 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint64x2_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: > __arm_vsetq_lane_f16 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float16x8_t), p2), \ > + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: > __arm_vsetq_lane_f32 (__ARM_mve_coerce2(p0, double), > __ARM_mve_coerce(__p1, float32x4_t), p2));}) > > #else /* MVE Integer. */ > > @@ -38410,12 +38410,12 @@ extern void *__ARM_undef; > #define __arm_vcmpneq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpneq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpneq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpneq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38442,12 +38442,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vsubq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vsubq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vsubq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vshlq_r(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -38461,12 +38461,12 @@ extern void *__ARM_undef; > #define __arm_vrshlq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vrshlq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vrshlq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vrshlq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38497,12 +38497,12 @@ extern void *__ARM_undef; > #define __arm_vqsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38571,12 +38571,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqrshlq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqrshlq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqrshlq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, int32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vqrdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -38584,16 +38584,16 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqrdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqrdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqrdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vqdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) > @@ -38601,12 +38601,12 @@ extern void *__ARM_undef; > #define __arm_vqaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vqaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38637,12 +38637,12 @@ extern void *__ARM_undef; > #define __arm_vmulq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vmulq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vmulq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vmulq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38717,12 +38717,12 @@ extern void *__ARM_undef; > #define __arm_vhsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38747,12 +38747,12 @@ extern void *__ARM_undef; > #define __arm_vhaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > @@ -38858,12 +38858,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpeqq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpeqq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpeqq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vqmovntq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -38944,16 +38944,16 @@ extern void *__ARM_undef; > #define __arm_vqdmulltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmulltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmulltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) > > #define __arm_vqdmullbq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vqdmullbq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vqdmullbq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)));}) > > @@ -38963,9 +38963,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgeq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgeq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgeq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vcmpgtq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -38973,9 +38973,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgtq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgtq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgtq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vcmpleq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -38983,9 +38983,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpleq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpleq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpleq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vcmpltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -38993,20 +38993,20 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpltq_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t)), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t)), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t)));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpneq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t), p2), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpneq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpneq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpneq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > @@ -39031,12 +39031,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpeqq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpeqq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpeqq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > > #define __arm_vbicq_m_n(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -39146,25 +39146,25 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > > #define __arm_vqdmlashq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > > #define __arm_vqrdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > > #define __arm_vqrdmladhxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -39227,9 +39227,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgeq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgeq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgeq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > > > #define __arm_vcmpgtq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > @@ -39238,9 +39238,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpgtq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpgtq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpgtq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > > #define __arm_vcmpleq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -39248,9 +39248,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpleq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpleq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpleq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > > #define __arm_vcmpltq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -39258,9 +39258,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vcmpltq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vcmpltq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vcmpltq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > > #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -39271,12 +39271,12 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpneq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpneq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpneq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8_t), p2), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16_t), p2), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32_t), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t), p2));}) > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > > #define __arm_vdupq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -39299,23 +39299,23 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, uint8_t)), > \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t)), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int)));}) > > #define __arm_vmlasq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t)), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t)), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int)));}) > > #define __arm_vnegq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -39340,9 +39340,9 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t)), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t)));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int)), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int)));}) > > #define __arm_vqdmlsdhq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -39505,12 +39505,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), > p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vsubq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vsubq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vsubq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -39610,12 +39610,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > > #define __arm_vornq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -39660,12 +39660,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), > p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vmulq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vmulq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vmulq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -40002,15 +40002,15 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8_t), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16_t), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32_t), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vaddq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vaddq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vaddq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3));}) > > #define __arm_vcaddq_rot270_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > @@ -40104,15 +40104,15 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vmulq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vmulq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vmulq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8_t), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16_t), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32_t), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vmulq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vmulq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vmulq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3));}) > > #define __arm_vnegq_x(p1,p2) ({ __typeof(p1) __p1 = (p1); \ > _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ > @@ -40234,14 +40234,14 @@ extern void *__ARM_undef; > #define __arm_vsetq_lane(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vsetq_lane_s8 (__ARM_mve_coerce(__p0, int8_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vsetq_lane_s16 (__ARM_mve_coerce(__p0, int16_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vsetq_lane_s32 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: > __arm_vsetq_lane_s64 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int64x2_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vsetq_lane_u8 (__ARM_mve_coerce(__p0, uint8_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vsetq_lane_u16 (__ARM_mve_coerce(__p0, uint16_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vsetq_lane_u32 (__ARM_mve_coerce(__p0, uint32_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: > __arm_vsetq_lane_u64 (__ARM_mve_coerce(__p0, uint64_t), > __ARM_mve_coerce(__p1, uint64x2_t), p2));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vsetq_lane_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vsetq_lane_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vsetq_lane_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: > __arm_vsetq_lane_s64 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int64x2_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vsetq_lane_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vsetq_lane_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vsetq_lane_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: > __arm_vsetq_lane_u64 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint64x2_t), p2));}) > > #endif /* MVE Integer. */ > > @@ -40421,12 +40421,12 @@ extern void *__ARM_undef; > #define __arm_vhaddq_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8_t), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16_t), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u8( __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u16( __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u32( __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u8( __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u16( __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhaddq_x_n_u32( __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > @@ -40451,12 +40451,12 @@ extern void *__ARM_undef; > #define __arm_vhsubq_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ > - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8_t), p3), \ > - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16_t), p3), \ > - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32_t), p3), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vhsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: > __arm_vhsubq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), > __ARM_mve_coerce(__p2, int8x16_t), p3), \ > int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: > __arm_vhsubq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), > __ARM_mve_coerce(__p2, int16x8_t), p3), \ > int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: > __arm_vhsubq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), > __ARM_mve_coerce(__p2, int32x4_t), p3), \ > @@ -40576,25 +40576,25 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > > #define __arm_vqrdmlashq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > > #define __arm_vqdmlashq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > > #define __arm_vqrshlq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -40695,12 +40695,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vqsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vqsubq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqsubq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqsubq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -40715,9 +40715,9 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vqrdmulhq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqrdmulhq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqrdmulhq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqrdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > > #define __arm_vqrdmlsdhxq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -40843,17 +40843,17 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaq_p_s16 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaq_p_s32 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmlaldavaq_p_u16 (__ARM_mve_coerce(__p0, > uint64_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmlaldavaq_p_u32 (__ARM_mve_coerce(__p0, > uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmlaldavaq_p_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmlaldavaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > > #define __arm_vmlaldavaxq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaxq_p_s16 (__ARM_mve_coerce(__p0, > int64_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaxq_p_s32 (__ARM_mve_coerce(__p0, > int64_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaxq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaxq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3));}) > > #define __arm_vmlsldavaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -40992,12 +40992,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vhaddq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vhaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vhaddq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vhaddq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vhaddq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -41031,12 +41031,12 @@ extern void *__ARM_undef; > int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_uint8x16_t]: __arm_vhsubq_m_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8x16_t), p3), \ > int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_uint16x8_t]: __arm_vhsubq_m_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16x8_t), p3), \ > int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_uint32x4_t]: __arm_vhsubq_m_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vhsubq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vhsubq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3));}) > > #define __arm_vmaxq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -41064,23 +41064,23 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), > p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlaq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlaq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3));}) > > #define __arm_vmlasq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), > p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vmlasq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vmlasq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3));}) > > #define __arm_vmulhq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -41126,12 +41126,12 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > - int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce(__p2, uint8_t), p3), \ > - int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce(__p2, uint16_t), p3), \ > - int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce(__p2, uint32_t), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqaddq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u8 (__ARM_mve_coerce(__p0, > uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u16 (__ARM_mve_coerce(__p0, > uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), > __ARM_mve_coerce3(p2, int), p3), \ > + int > (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m > ve_type_int_n]: __arm_vqaddq_m_n_u32 (__ARM_mve_coerce(__p0, > uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), > __ARM_mve_coerce3(p2, int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vqaddq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqaddq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqaddq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > @@ -41143,17 +41143,17 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3));}) > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > > #define __arm_vqdmulhq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8_t), p3), \ > - int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > + int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > int > (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve > _type_int8x16_t]: __arm_vqdmulhq_m_s8 (__ARM_mve_coerce(__p0, > int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t), p3), \ > int > (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqdmulhq_m_s16 (__ARM_mve_coerce(__p0, > int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqdmulhq_m_s32 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3));}) > @@ -41164,15 +41164,15 @@ extern void *__ARM_undef; > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqdmullbq_m_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqdmullbq_m_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmullbq_m_n_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmullbq_m_n_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3));}) > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmullbq_m_n_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmullbq_m_n_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3));}) > > #define __arm_vqdmulltq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmulltq_m_n_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16_t), p3), \ > - int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmulltq_m_n_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32_t), p3), \ > + int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int_n]: __arm_vqdmulltq_m_n_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, > int), p3), \ > + int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int_n]: __arm_vqdmulltq_m_n_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, > int), p3), \ > int > (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve > _type_int16x8_t]: __arm_vqdmulltq_m_s16 (__ARM_mve_coerce(__p0, > int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > int > (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve > _type_int32x4_t]: __arm_vqdmulltq_m_s32 (__ARM_mve_coerce(__p0, > int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3));}) > > @@ -41238,9 +41238,9 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaxq_p_s8 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaxq_p_s16 (__ARM_mve_coerce(__p0, > int32_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaxq_p_s32 (__ARM_mve_coerce(__p0, > int32_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaxq_p_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaxq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaxq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3));}) > > #define __arm_vmullbq_poly_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -41311,51 +41311,51 @@ extern void *__ARM_undef; > #define __arm_viwdupq_m(p0,p1,p2,p3,p4) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_viwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_viwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_viwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_viwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > > #define __arm_viwdupq_u16(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u16 > (__ARM_mve_coerce(__p0, uint32_t), p1, (const int) p2), \ > + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u16 > (__ARM_mve_coerce3(p0, int), p1, (const int) p2), \ > int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u16 > (__ARM_mve_coerce(__p0, uint32_t *), p1, (const int) p2));}) > > #define __arm_viwdupq_u32(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u32 > (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ > + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u32 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u32 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > > #define __arm_viwdupq_u8(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u8 > (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ > + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u8 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u8 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > > #define __arm_vdwdupq_m(p0,p1,p2,p3,p4) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vdwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2, p3, p4), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vdwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vdwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: > __arm_vdwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) > > #define __arm_vdwdupq_u16(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u16 > (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ > + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u16 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u16 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > > #define __arm_vdwdupq_u32(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u32 > (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ > + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u32 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u32 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > > #define __arm_vdwdupq_u8(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u8 > (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ > + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u8 > (__ARM_mve_coerce3(p0, int), p1, p2), \ > int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u8 > (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) > > #define __arm_vshlcq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > @@ -41392,14 +41392,14 @@ extern void *__ARM_undef; > #define __arm_vaddlvaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddlvaq_s32 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddlvaq_u32 (__ARM_mve_coerce(__p0, uint64_t), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddlvaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddlvaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > > #define __arm_vaddlvaq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddlvaq_p_s32 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddlvaq_p_u32 (__ARM_mve_coerce(__p0, uint64_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddlvaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddlvaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > > #define __arm_vaddlvq(p0) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -41414,22 +41414,22 @@ extern void *__ARM_undef; > #define __arm_vaddvaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vaddvaq_s8 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int8x16_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vaddvaq_s16 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int16x8_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddvaq_s32 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int32x4_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vaddvaq_u8 (__ARM_mve_coerce(__p0, uint32_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vaddvaq_u16 (__ARM_mve_coerce(__p0, uint32_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddvaq_u32 (__ARM_mve_coerce(__p0, uint32_t), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vaddvaq_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vaddvaq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddvaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vaddvaq_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vaddvaq_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddvaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t)));}) > > #define __arm_vaddvaq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vaddvaq_p_s8 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vaddvaq_p_s16 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddvaq_p_s32 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vaddvaq_p_u8 (__ARM_mve_coerce(__p0, uint32_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vaddvaq_p_u16 (__ARM_mve_coerce(__p0, uint32_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddvaq_p_u32 (__ARM_mve_coerce(__p0, uint32_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: > __arm_vaddvaq_p_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: > __arm_vaddvaq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: > __arm_vaddvaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: > __arm_vaddvaq_p_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: > __arm_vaddvaq_p_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: > __arm_vaddvaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > > #define __arm_vaddvq(p0) ({ __typeof(p0) __p0 = (p0); \ > _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ > @@ -41455,9 +41455,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpcsq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpcsq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpcsq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vcmpcsq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -41465,9 +41465,9 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmpcsq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmpcsq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmpcsq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t), p2));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmpcsq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2));}) > > #define __arm_vcmphiq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -41475,16 +41475,16 @@ extern void *__ARM_undef; > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmphiq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t)), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmphiq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t)), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmphiq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t)), \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t)), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t)), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t)));}) > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int)), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int)));}) > > #define __arm_vcmphiq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ > - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8_t), p2), \ > - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16_t), p2), \ > - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32_t), p2), \ > + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce3(p1, int), p2), \ > + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: > __arm_vcmphiq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce3(p1, int), p2), \ > int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: > __arm_vcmphiq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), > __ARM_mve_coerce(__p1, uint8x16_t), p2), \ > int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: > __arm_vcmphiq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), > __ARM_mve_coerce(__p1, uint16x8_t), p2), \ > int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: > __arm_vcmphiq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), > __ARM_mve_coerce(__p1, uint32x4_t), p2));}) > @@ -41581,34 +41581,34 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_s8 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_s16 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_s32 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_u8 (__ARM_mve_coerce(__p0, uint32_t), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_u16 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_u32 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > > #define __arm_vmladavaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t), p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > > #define __arm_vmladavaxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaxq_s8 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaxq_s16 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaxq_s32 (__ARM_mve_coerce(__p0, int32_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaxq_u8 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaxq_u16 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaxq_u32 (__ARM_mve_coerce(__p0, > uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ > e_int8x16_t]: __arm_vmladavaxq_s8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, > int8x16_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmladavaxq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmladavaxq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty > pe_uint8x16_t]: __arm_vmladavaxq_u8 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, > uint8x16_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmladavaxq_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmladavaxq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > > #define __arm_vmladavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -41651,17 +41651,17 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaq_s16 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaq_s32 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmlaldavaq_u16 (__ARM_mve_coerce(__p0, > uint64_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmlaldavaq_u32 (__ARM_mve_coerce(__p0, > uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty > pe_uint16x8_t]: __arm_vmlaldavaq_u16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, > uint16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vmlaldavaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > > #define __arm_vmlaldavaxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaxq_s16 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaxq_s32 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ > e_int16x8_t]: __arm_vmlaldavaxq_s16 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, > int16x8_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vmlaldavaxq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)));}) > > #define __arm_vmlaldavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > @@ -41856,15 +41856,15 @@ extern void *__ARM_undef; > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vrmlaldavhaq_s32 (__ARM_mve_coerce(__p0, int64_t), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vrmlaldavhaq_u32 (__ARM_mve_coerce(__p0, > uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vrmlaldavhaq_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t)), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vrmlaldavhaq_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t)));}) > > #define __arm_vrmlaldavhaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ > __typeof(p1) __p1 = (p1); \ > __typeof(p2) __p2 = (p2); \ > _Generic( (int > (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ > eid(__p2)])0, \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vrmlaldavhaq_p_s32 (__ARM_mve_coerce(__p0, > int64_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, > int32x4_t), p3), \ > - int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vrmlaldavhaq_p_u32 (__ARM_mve_coerce(__p0, > uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ > e_int32x4_t]: __arm_vrmlaldavhaq_p_s32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), > p3), \ > + int > (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty > pe_uint32x4_t]: __arm_vrmlaldavhaq_p_u32 (__ARM_mve_coerce3(p0, int), > __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, > uint32x4_t), p3));}) > > #define __arm_vstrbq_scatter_offset(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); > \ > __typeof(p1) __p1 = (p1); \ > -- > 2.25.1
On 11/18/22 16:51, Kyrylo Tkachov wrote: > >> -----Original Message----- >> From: Andrea Corallo <andrea.corallo@arm.com> >> Sent: Thursday, November 17, 2022 4:38 PM >> To: gcc-patches@gcc.gnu.org >> Cc: Kyrylo Tkachov <Kyrylo.Tkachov@arm.com>; Richard Earnshaw >> <Richard.Earnshaw@arm.com>; Stam Markianos-Wright <Stam.Markianos- >> Wright@arm.com> >> Subject: [PATCH 14/35] arm: propagate fixed overloading of MVE intrinsic >> scalar parameters >> >> From: Stam Markianos-Wright <stam.markianos-wright@arm.com> >> >> This is a mechanical patch that propagates the change proposed in >> my previous patch for vaddq[_m]_n >> across all other polymorphic MVE intrinsic overloads of scalar types. >> >> The find and Replace patterns used were: >> >> s/__ARM_mve_coerce\(__p(\d+), [u]?int(8|16|32|64)_t\) >> /__ARM_mve_coerce3(p$1, int)/g >> >> s/__ARM_mve_coerce2\(__p(\d+), double\) >> /__ARM_mve_coerce2(p$1, double)/g >> >> gcc/ChangeLog: >> >> * config/arm/arm_mve.h (__arm_vaddq): Fix Overloading. >> (__arm_vmulq): Likewise. >> (__arm_vcmpeqq): Likewise. >> (__arm_vcmpneq): Likewise. >> (__arm_vmaxnmavq): Likewise. >> (__arm_vmaxnmvq): Likewise. >> (__arm_vminnmavq): Likewise. >> (__arm_vsubq): Likewise. >> (__arm_vminnmvq): Likewise. >> (__arm_vrshlq): Likewise. >> (__arm_vqsubq): Likewise. >> (__arm_vqdmulltq): Likewise. >> (__arm_vqdmullbq): Likewise. >> (__arm_vqdmulhq): Likewise. >> (__arm_vqaddq): Likewise. >> (__arm_vhaddq): Likewise. >> (__arm_vhsubq): Likewise. >> (__arm_vqdmlashq): Likewise. >> (__arm_vqrdmlahq): Likewise. >> (__arm_vmlasq): Likewise. >> (__arm_vqdmlahq): Likewise. >> (__arm_vmaxnmavq_p): Likewise. >> (__arm_vmaxnmvq_p): Likewise. >> (__arm_vminnmavq_p): Likewise. >> (__arm_vminnmvq_p): Likewise. >> (__arm_vfmasq_m): Likewise. >> (__arm_vsetq_lane): Likewise. >> (__arm_vcmpneq_m): Likewise. >> (__arm_vhaddq_x): Likewise. >> (__arm_vhsubq_x): Likewise. >> (__arm_vqrdmlashq_m): Likewise. >> (__arm_vqdmlashq_m): Likewise. >> (__arm_vmlaldavaxq_p): Likewise. >> (__arm_vmlasq_m): Likewise. >> (__arm_vqdmulhq_m): Likewise. >> (__arm_vqdmulltq_m): Likewise. >> (__arm_viwdupq_m): Likewise. >> (__arm_viwdupq_u16): Likewise. >> (__arm_viwdupq_u32): Likewise. >> (__arm_viwdupq_u8): Likewise. >> (__arm_vdwdupq_m): Likewise. >> (__arm_vdwdupq_u16): Likewise. >> (__arm_vdwdupq_u32): Likewise. >> (__arm_vdwdupq_u8): Likewise. >> (__arm_vaddlvaq): Likewise. >> (__arm_vaddlvaq_p): Likewise. >> (__arm_vaddvaq): Likewise. >> (__arm_vaddvaq_p): Likewise. >> (__arm_vcmphiq_m): Likewise. >> (__arm_vmladavaq_p): Likewise. >> (__arm_vmladavaxq): Likewise. >> (__arm_vmlaldavaxq): Likewise. >> (__arm_vrmlaldavhaq_p): Likewise. > IMO this should have been squashed with the previous patch. > Is all this covered by the tests that we have (or that you're improving in this series)? Thanks for the review! Yes, I just kept them separate because the last one was done manually as a partial revert of what was previously done, whereas the other was all a mechanical find n replace -- but the end result they both get to is the same, tbh... Also, yep, this batch of tests fully covers the intrinsics that were changed with this patch (and the vaddq patch) and we've also added testcases that take immediate `1` for the `_n` variants. > Ok if so. > Thanks, > Kyrill > >> --- >> gcc/config/arm/arm_mve.h | 1106 +++++++++++++++++++------------------- >> 1 file changed, 553 insertions(+), 553 deletions(-) >> >> diff --git a/gcc/config/arm/arm_mve.h b/gcc/config/arm/arm_mve.h >> index 951dc25374b..fd1876b57a0 100644 >> --- a/gcc/config/arm/arm_mve.h >> +++ b/gcc/config/arm/arm_mve.h >> @@ -35881,8 +35881,8 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vandq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -35927,14 +35927,14 @@ extern void *__ARM_undef; >> #define __arm_vmulq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vmulq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vmulq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vmulq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -35959,14 +35959,14 @@ extern void *__ARM_undef; >> #define __arm_vcmpeqq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpeqq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpeqq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpeqq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -35997,16 +35997,16 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpeqq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpeqq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpeqq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpeqq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpeqq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2));}) >> >> #define __arm_vcmpgtq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36014,13 +36014,13 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgtq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgtq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgtq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpgtq_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpgtq_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vcmpleq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36030,11 +36030,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpleq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpleq_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpleq_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vcmpltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36042,25 +36042,25 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpltq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpltq_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpltq_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vcmpneq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpneq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpneq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpneq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36115,8 +36115,8 @@ extern void *__ARM_undef; >> #define __arm_vmaxnmavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmavq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmavq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmavq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmavq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vmaxnmq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36127,14 +36127,14 @@ extern void *__ARM_undef; >> #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vminnmaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36145,8 +36145,8 @@ extern void *__ARM_undef; >> #define __arm_vminnmavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmavq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmavq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmavq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmavq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vbrsrq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -36168,14 +36168,14 @@ extern void *__ARM_undef; >> #define __arm_vsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36188,8 +36188,8 @@ extern void *__ARM_undef; >> #define __arm_vminnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmvq_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmvq_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmvq_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmvq_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t)));}) >> >> #define __arm_vshlq_r(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -36244,12 +36244,12 @@ extern void *__ARM_undef; >> #define __arm_vrshlq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vrshlq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vrshlq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vrshlq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36280,12 +36280,12 @@ extern void *__ARM_undef; >> #define __arm_vqsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36336,12 +36336,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqrshlq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqrshlq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqrshlq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vqrdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36349,9 +36349,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqrdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqrdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqrdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vmlaldavxq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36384,8 +36384,8 @@ extern void *__ARM_undef; >> #define __arm_vqdmulltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmulltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmulltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> >> @@ -36398,17 +36398,17 @@ extern void *__ARM_undef; >> #define __arm_vqdmullbq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmullbq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmullbq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> >> #define __arm_vqdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> @@ -36416,12 +36416,12 @@ extern void *__ARM_undef; >> #define __arm_vqaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36454,12 +36454,12 @@ extern void *__ARM_undef; >> #define __arm_vhaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36484,12 +36484,12 @@ extern void *__ARM_undef; >> #define __arm_vhsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -36632,12 +36632,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, uint8_t)), >> \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t)), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int)));}) >> >> #define __arm_vsriq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36716,44 +36716,44 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqdmlashq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqrdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vmlasq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t)), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t)), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int)));}) >> >> #define __arm_vqdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqrdmladhxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36943,11 +36943,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgtq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgtq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgtq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpgtq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpgtq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> @@ -36959,11 +36959,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpleq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpleq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpleq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2));}) >> >> #define __arm_vcmpltq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36973,11 +36973,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpltq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpltq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpltq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2));}) >> >> #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -36990,14 +36990,14 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpneq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpneq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpneq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2));}) >> >> #define __arm_vcvtbq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37051,8 +37051,8 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double)), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double)), \ >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double)), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double)), \ >> int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_float16x8_t]: __arm_vfmaq_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t)), \ >> int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_float32x4_t]: __arm_vfmaq_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t)));}) >> >> @@ -37067,8 +37067,8 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double)), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double)));}) >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double)), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double)));}) >> >> #define __arm_vmaxnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37091,14 +37091,14 @@ extern void *__ARM_undef; >> #define __arm_vmaxnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #define __arm_vmaxnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #define __arm_vminnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37109,14 +37109,14 @@ extern void *__ARM_undef; >> #define __arm_vminnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmavq_p_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmavq_p_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmavq_p_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmavq_p_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #define __arm_vminnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmvq_p_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmvq_p_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vminnmvq_p_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vminnmvq_p_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #define __arm_vrndnq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37178,13 +37178,13 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgeq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgeq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgeq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpgeq_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t)), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpgeq_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t)), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double)), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double)));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double)), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double)));}) >> >> #define __arm_vrshrnbq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37285,11 +37285,11 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgeq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgeq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgeq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(__p1, double), p2), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce2(p1, double), p2), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vcmpgeq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vcmpgeq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> @@ -37324,8 +37324,8 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vandq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37466,15 +37466,15 @@ extern void *__ARM_undef; >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_float16x8_t]: __arm_vfmaq_m_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_float32x4_t]: __arm_vfmaq_m_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vfmasq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vfmasq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vfmsq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37509,14 +37509,14 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_uint32x4_t]: __arm_vmulq_m_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_float16x8_t]: __arm_vmulq_m_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_float32x4_t]: __arm_vmulq_m_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vmulq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vmulq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vmulq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vmulq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vornq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -37543,14 +37543,14 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_uint32x4_t]: __arm_vsubq_m_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_float16x8_t]: __arm_vsubq_m_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_float32x4_t]: __arm_vsubq_m_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> - int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vsubq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vsubq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_ >> mve_type_fp_n]: __arm_vsubq_m_n_f16 (__ARM_mve_coerce(__p0, >> float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int >> (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_ >> mve_type_fp_n]: __arm_vsubq_m_n_f32 (__ARM_mve_coerce(__p0, >> float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vorrq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38023,19 +38023,19 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vaddq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vaddq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vaddq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vaddq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vaddq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vaddq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vandq_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> @@ -38158,19 +38158,19 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vmulq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vmulq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vmulq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vmulq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vmulq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vmulq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vmulq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vmulq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vmulq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vnegq_x(p1,p2) ({ __typeof(p1) __p1 = (p1); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ >> @@ -38258,8 +38258,8 @@ extern void *__ARM_undef; >> _Generic( (int >> (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ >> int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: >> __arm_vsubq_x_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce(__p2, float16x8_t), p3), \ >> int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: >> __arm_vsubq_x_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce(__p2, float32x4_t), p3), \ >> - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(__p2, double), p3), \ >> - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(__p2, double), p3));}) >> + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_x_n_f16 (__ARM_mve_coerce(__p1, float16x8_t), >> __ARM_mve_coerce2(p2, double), p3), \ >> + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: >> __arm_vsubq_x_n_f32 (__ARM_mve_coerce(__p1, float32x4_t), >> __ARM_mve_coerce2(p2, double), p3));}) >> >> #define __arm_vcmulq_rot90_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> @@ -38283,16 +38283,16 @@ extern void *__ARM_undef; >> #define __arm_vsetq_lane(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vsetq_lane_s8 (__ARM_mve_coerce(__p0, int8_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vsetq_lane_s16 (__ARM_mve_coerce(__p0, int16_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vsetq_lane_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: >> __arm_vsetq_lane_s64 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int64x2_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vsetq_lane_u8 (__ARM_mve_coerce(__p0, uint8_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vsetq_lane_u16 (__ARM_mve_coerce(__p0, uint16_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vsetq_lane_u32 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: >> __arm_vsetq_lane_u64 (__ARM_mve_coerce(__p0, uint64_t), >> __ARM_mve_coerce(__p1, uint64x2_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vsetq_lane_f16 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vsetq_lane_f32 (__ARM_mve_coerce2(__p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vsetq_lane_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vsetq_lane_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vsetq_lane_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: >> __arm_vsetq_lane_s64 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int64x2_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vsetq_lane_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vsetq_lane_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vsetq_lane_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: >> __arm_vsetq_lane_u64 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint64x2_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: >> __arm_vsetq_lane_f16 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float16x8_t), p2), \ >> + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: >> __arm_vsetq_lane_f32 (__ARM_mve_coerce2(p0, double), >> __ARM_mve_coerce(__p1, float32x4_t), p2));}) >> >> #else /* MVE Integer. */ >> >> @@ -38410,12 +38410,12 @@ extern void *__ARM_undef; >> #define __arm_vcmpneq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpneq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpneq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpneq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38442,12 +38442,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vsubq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vsubq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vsubq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vshlq_r(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -38461,12 +38461,12 @@ extern void *__ARM_undef; >> #define __arm_vrshlq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vrshlq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vrshlq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vrshlq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38497,12 +38497,12 @@ extern void *__ARM_undef; >> #define __arm_vqsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38571,12 +38571,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqrshlq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqrshlq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqrshlq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vqrdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38584,16 +38584,16 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqrdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqrdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqrdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vqdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> @@ -38601,12 +38601,12 @@ extern void *__ARM_undef; >> #define __arm_vqaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vqaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38637,12 +38637,12 @@ extern void *__ARM_undef; >> #define __arm_vmulq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vmulq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vmulq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vmulq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38717,12 +38717,12 @@ extern void *__ARM_undef; >> #define __arm_vhsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38747,12 +38747,12 @@ extern void *__ARM_undef; >> #define __arm_vhaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> @@ -38858,12 +38858,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpeqq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpeqq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpeqq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vqmovntq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38944,16 +38944,16 @@ extern void *__ARM_undef; >> #define __arm_vqdmulltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmulltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmulltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> >> #define __arm_vqdmullbq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vqdmullbq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vqdmullbq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)));}) >> >> @@ -38963,9 +38963,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgeq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgeq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgeq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpgtq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38973,9 +38973,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgtq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgtq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgtq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpleq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38983,9 +38983,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpleq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpleq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpleq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -38993,20 +38993,20 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpltq_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t)), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t)), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t)));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpneq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpneq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpneq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpneq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> @@ -39031,12 +39031,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpeqq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpeqq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpeqq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vbicq_m_n(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -39146,25 +39146,25 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqdmlashq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqrdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqrdmladhxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39227,9 +39227,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgeq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgeq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgeq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> >> #define __arm_vcmpgtq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> @@ -39238,9 +39238,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpgtq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpgtq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpgtq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vcmpleq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39248,9 +39248,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpleq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpleq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpleq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vcmpltq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39258,9 +39258,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vcmpltq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vcmpltq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vcmpltq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39271,12 +39271,12 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpneq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpneq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpneq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8_t), p2), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16_t), p2), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2));}) >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vdupq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39299,23 +39299,23 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, uint8_t)), >> \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t)), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int)));}) >> >> #define __arm_vmlasq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t)), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t)), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int)));}) >> >> #define __arm_vnegq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39340,9 +39340,9 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t)), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t)));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int)), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int)));}) >> >> #define __arm_vqdmlsdhq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39505,12 +39505,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vsubq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vsubq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vsubq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -39610,12 +39610,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> >> #define __arm_vornq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -39660,12 +39660,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmulq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmulq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vmulq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vmulq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vmulq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -40002,15 +40002,15 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vaddq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vaddq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vaddq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vaddq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vcaddq_rot270_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> @@ -40104,15 +40104,15 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vmulq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vmulq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vmulq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vmulq_x_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vmulq_x_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vmulq_x_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vmulq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vnegq_x(p1,p2) ({ __typeof(p1) __p1 = (p1); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p1)])0, \ >> @@ -40234,14 +40234,14 @@ extern void *__ARM_undef; >> #define __arm_vsetq_lane(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vsetq_lane_s8 (__ARM_mve_coerce(__p0, int8_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vsetq_lane_s16 (__ARM_mve_coerce(__p0, int16_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vsetq_lane_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: >> __arm_vsetq_lane_s64 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int64x2_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vsetq_lane_u8 (__ARM_mve_coerce(__p0, uint8_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vsetq_lane_u16 (__ARM_mve_coerce(__p0, uint16_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vsetq_lane_u32 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: >> __arm_vsetq_lane_u64 (__ARM_mve_coerce(__p0, uint64_t), >> __ARM_mve_coerce(__p1, uint64x2_t), p2));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vsetq_lane_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vsetq_lane_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vsetq_lane_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int64x2_t]: >> __arm_vsetq_lane_s64 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int64x2_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vsetq_lane_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vsetq_lane_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vsetq_lane_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint64x2_t]: >> __arm_vsetq_lane_u64 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint64x2_t), p2));}) >> >> #endif /* MVE Integer. */ >> >> @@ -40421,12 +40421,12 @@ extern void *__ARM_undef; >> #define __arm_vhaddq_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u8( __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u16( __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u32( __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u8( __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u16( __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhaddq_x_n_u32( __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhaddq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhaddq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhaddq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> @@ -40451,12 +40451,12 @@ extern void *__ARM_undef; >> #define __arm_vhsubq_x(p1,p2,p3) ({ __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ >> - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8_t), p3), \ >> - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16_t), p3), \ >> - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32_t), p3), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u8 (__ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u16 (__ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vhsubq_x_n_u32 (__ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: >> __arm_vhsubq_x_s8 (__ARM_mve_coerce(__p1, int8x16_t), >> __ARM_mve_coerce(__p2, int8x16_t), p3), \ >> int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: >> __arm_vhsubq_x_s16 (__ARM_mve_coerce(__p1, int16x8_t), >> __ARM_mve_coerce(__p2, int16x8_t), p3), \ >> int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: >> __arm_vhsubq_x_s32 (__ARM_mve_coerce(__p1, int32x4_t), >> __ARM_mve_coerce(__p2, int32x4_t), p3), \ >> @@ -40576,25 +40576,25 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqrdmlashq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqdmlashq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlashq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqrshlq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -40695,12 +40695,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vqsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vqsubq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqsubq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqsubq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -40715,9 +40715,9 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vqrdmulhq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqrdmulhq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqrdmulhq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqrdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqrdmlsdhxq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -40843,17 +40843,17 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaq_p_s16 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaq_p_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmlaldavaq_p_u16 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmlaldavaq_p_u32 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmlaldavaq_p_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmlaldavaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> >> #define __arm_vmlaldavaxq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaxq_p_s16 (__ARM_mve_coerce(__p0, >> int64_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaxq_p_s32 (__ARM_mve_coerce(__p0, >> int64_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaxq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaxq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3));}) >> >> #define __arm_vmlsldavaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -40992,12 +40992,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vhaddq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vhaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vhaddq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vhaddq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vhaddq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -41031,12 +41031,12 @@ extern void *__ARM_undef; >> int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_uint8x16_t]: __arm_vhsubq_m_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_uint16x8_t]: __arm_vhsubq_m_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_uint32x4_t]: __arm_vhsubq_m_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vhsubq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vhsubq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vmaxq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41064,23 +41064,23 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlaq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlaq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vmlasq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vmlasq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vmlasq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3));}) >> >> #define __arm_vmulhq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41126,12 +41126,12 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce(__p2, uint8_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce(__p2, uint16_t), p3), \ >> - int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce(__p2, uint32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqaddq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u8 (__ARM_mve_coerce(__p0, >> uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u16 (__ARM_mve_coerce(__p0, >> uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> + int >> (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_m >> ve_type_int_n]: __arm_vqaddq_m_n_u32 (__ARM_mve_coerce(__p0, >> uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), >> __ARM_mve_coerce3(p2, int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vqaddq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqaddq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqaddq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> @@ -41143,17 +41143,17 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmlahq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqdmulhq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmulhq_m_n_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> int >> (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve >> _type_int8x16_t]: __arm_vqdmulhq_m_s8 (__ARM_mve_coerce(__p0, >> int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t), p3), \ >> int >> (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqdmulhq_m_s16 (__ARM_mve_coerce(__p0, >> int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqdmulhq_m_s32 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3));}) >> @@ -41164,15 +41164,15 @@ extern void *__ARM_undef; >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqdmullbq_m_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqdmullbq_m_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmullbq_m_n_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmullbq_m_n_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3));}) >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmullbq_m_n_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmullbq_m_n_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3));}) >> >> #define __arm_vqdmulltq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmulltq_m_n_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmulltq_m_n_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32_t), p3), \ >> + int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int_n]: __arm_vqdmulltq_m_n_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> + int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int_n]: __arm_vqdmulltq_m_n_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, >> int), p3), \ >> int >> (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int16x8_t][__ARM_mve >> _type_int16x8_t]: __arm_vqdmulltq_m_s16 (__ARM_mve_coerce(__p0, >> int32x4_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> int >> (*)[__ARM_mve_type_int64x2_t][__ARM_mve_type_int32x4_t][__ARM_mve >> _type_int32x4_t]: __arm_vqdmulltq_m_s32 (__ARM_mve_coerce(__p0, >> int64x2_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3));}) >> >> @@ -41238,9 +41238,9 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaxq_p_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaxq_p_s16 (__ARM_mve_coerce(__p0, >> int32_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaxq_p_s32 (__ARM_mve_coerce(__p0, >> int32_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaxq_p_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaxq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaxq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3));}) >> >> #define __arm_vmullbq_poly_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41311,51 +41311,51 @@ extern void *__ARM_undef; >> #define __arm_viwdupq_m(p0,p1,p2,p3,p4) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_viwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_viwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_viwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_viwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) >> >> #define __arm_viwdupq_u16(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u16 >> (__ARM_mve_coerce(__p0, uint32_t), p1, (const int) p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u16 >> (__ARM_mve_coerce3(p0, int), p1, (const int) p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u16 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, (const int) p2));}) >> >> #define __arm_viwdupq_u32(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u32 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u32 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u32 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_viwdupq_u8(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u8 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_viwdupq_n_u8 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_viwdupq_wb_u8 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_vdwdupq_m(p0,p1,p2,p3,p4) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vdwdupq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_vdwdupq_m_wb_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_vdwdupq_m_wb_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32_t_ptr]: >> __arm_vdwdupq_m_wb_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t *), p2, p3, p4));}) >> >> #define __arm_vdwdupq_u16(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u16 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u16 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u16 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_vdwdupq_u32(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u32 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u32 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u32 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_vdwdupq_u8(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> - int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u8 >> (__ARM_mve_coerce(__p0, uint32_t), p1, p2), \ >> + int (*)[__ARM_mve_type_int_n]: __arm_vdwdupq_n_u8 >> (__ARM_mve_coerce3(p0, int), p1, p2), \ >> int (*)[__ARM_mve_type_uint32_t_ptr]: __arm_vdwdupq_wb_u8 >> (__ARM_mve_coerce(__p0, uint32_t *), p1, p2));}) >> >> #define __arm_vshlcq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> @@ -41392,14 +41392,14 @@ extern void *__ARM_undef; >> #define __arm_vaddlvaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddlvaq_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddlvaq_u32 (__ARM_mve_coerce(__p0, uint64_t), >> __ARM_mve_coerce(__p1, uint32x4_t)));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddlvaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddlvaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t)));}) >> >> #define __arm_vaddlvaq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddlvaq_p_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddlvaq_p_u32 (__ARM_mve_coerce(__p0, uint64_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddlvaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddlvaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> >> #define __arm_vaddlvq(p0) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -41414,22 +41414,22 @@ extern void *__ARM_undef; >> #define __arm_vaddvaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vaddvaq_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vaddvaq_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddvaq_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vaddvaq_u8 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vaddvaq_u16 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddvaq_u32 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint32x4_t)));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vaddvaq_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vaddvaq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddvaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vaddvaq_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vaddvaq_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddvaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t)));}) >> >> #define __arm_vaddvaq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vaddvaq_p_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vaddvaq_p_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddvaq_p_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vaddvaq_p_u8 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vaddvaq_p_u16 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> - int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddvaq_p_u32 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t]: >> __arm_vaddvaq_p_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t]: >> __arm_vaddvaq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t]: >> __arm_vaddvaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t]: >> __arm_vaddvaq_p_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t]: >> __arm_vaddvaq_p_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> + int (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t]: >> __arm_vaddvaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> >> #define __arm_vaddvq(p0) ({ __typeof(p0) __p0 = (p0); \ >> _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ >> @@ -41455,9 +41455,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpcsq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpcsq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpcsq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmpcsq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41465,9 +41465,9 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmpcsq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmpcsq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmpcsq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmpcsq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2));}) >> >> #define __arm_vcmphiq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41475,16 +41475,16 @@ extern void *__ARM_undef; >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmphiq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t)), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmphiq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t)), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmphiq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t)), \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t)), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t)), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t)));}) >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int)), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int)));}) >> >> #define __arm_vcmphiq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ >> - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8_t), p2), \ >> - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16_t), p2), \ >> - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32_t), p2), \ >> + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: >> __arm_vcmphiq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce3(p1, int), p2), \ >> int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: >> __arm_vcmphiq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), >> __ARM_mve_coerce(__p1, uint8x16_t), p2), \ >> int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: >> __arm_vcmphiq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), >> __ARM_mve_coerce(__p1, uint16x8_t), p2), \ >> int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: >> __arm_vcmphiq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), >> __ARM_mve_coerce(__p1, uint32x4_t), p2));}) >> @@ -41581,34 +41581,34 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_u8 (__ARM_mve_coerce(__p0, uint32_t), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_u16 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_u32 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> >> #define __arm_vmladavaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaq_p_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8x16_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaq_p_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16x8_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaq_p_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaq_p_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t), p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> >> #define __arm_vmladavaxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaxq_s8 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaxq_s16 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaxq_s32 (__ARM_mve_coerce(__p0, int32_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaxq_u8 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaxq_u16 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaxq_u32 (__ARM_mve_coerce(__p0, >> uint32_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int8x16_t][__ARM_mve_typ >> e_int8x16_t]: __arm_vmladavaxq_s8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, >> int8x16_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmladavaxq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmladavaxq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint8x16_t][__ARM_mve_ty >> pe_uint8x16_t]: __arm_vmladavaxq_u8 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, >> uint8x16_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmladavaxq_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmladavaxq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> >> #define __arm_vmladavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41651,17 +41651,17 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaq_s16 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaq_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmlaldavaq_u16 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmlaldavaq_u32 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint16x8_t][__ARM_mve_ty >> pe_uint16x8_t]: __arm_vmlaldavaq_u16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, >> uint16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vmlaldavaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> >> #define __arm_vmlaldavaxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaxq_s16 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaxq_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int16x8_t][__ARM_mve_typ >> e_int16x8_t]: __arm_vmlaldavaxq_s16 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, >> int16x8_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vmlaldavaxq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)));}) >> >> #define __arm_vmlaldavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> @@ -41856,15 +41856,15 @@ extern void *__ARM_undef; >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vrmlaldavhaq_s32 (__ARM_mve_coerce(__p0, int64_t), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vrmlaldavhaq_u32 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vrmlaldavhaq_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t)), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vrmlaldavhaq_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t)));}) >> >> #define __arm_vrmlaldavhaq_p(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ >> __typeof(p1) __p1 = (p1); \ >> __typeof(p2) __p2 = (p2); \ >> _Generic( (int >> (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typ >> eid(__p2)])0, \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vrmlaldavhaq_p_s32 (__ARM_mve_coerce(__p0, >> int64_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, >> int32x4_t), p3), \ >> - int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vrmlaldavhaq_p_u32 (__ARM_mve_coerce(__p0, >> uint64_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_int32x4_t][__ARM_mve_typ >> e_int32x4_t]: __arm_vrmlaldavhaq_p_s32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32x4_t), >> p3), \ >> + int >> (*)[__ARM_mve_type_int_n][__ARM_mve_type_uint32x4_t][__ARM_mve_ty >> pe_uint32x4_t]: __arm_vrmlaldavhaq_p_u32 (__ARM_mve_coerce3(p0, int), >> __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, >> uint32x4_t), p3));}) >> >> #define __arm_vstrbq_scatter_offset(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); >> \ >> __typeof(p1) __p1 = (p1); \ >> -- >> 2.25.1
diff --git a/gcc/config/arm/arm_mve.h b/gcc/config/arm/arm_mve.h index 951dc25374b..fd1876b57a0 100644 --- a/gcc/config/arm/arm_mve.h +++ b/gcc/config/arm/arm_mve.h @@ -35881,8 +35881,8 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double)));}) + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vaddq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vaddq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double)));}) #define __arm_vandq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -35927,14 +35927,14 @@ extern void *__ARM_undef; #define __arm_vmulq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t)), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vmulq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vmulq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vmulq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vmulq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vmulq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vmulq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vmulq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vmulq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vmulq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vmulq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vmulq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ @@ -35959,14 +35959,14 @@ extern void *__ARM_undef; #define __arm_vcmpeqq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t)), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpeqq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpeqq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vcmpeqq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vcmpeqq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpeqq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ @@ -35997,16 +35997,16 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t]: __arm_vcmpeqq_m_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), p2), \ int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t]: __arm_vcmpeqq_m_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), p2), \ int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: __arm_vcmpeqq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), p2), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t), p2), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t), p2), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t), p2), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t), p2), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t), p2), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t), p2), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vcmpeqq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int), p2), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpeqq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), p2), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpeqq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), p2), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double), p2), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double), p2));}) + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpeqq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double), p2), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpeqq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double), p2));}) #define __arm_vcmpgtq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36014,13 +36014,13 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vcmpgtq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vcmpgtq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpgtq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpgtq_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t)), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpgtq_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t)), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double)));}) + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpgtq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpgtq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double)));}) #define __arm_vcmpleq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36030,11 +36030,11 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpleq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpleq_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t)), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpleq_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t)), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double)));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpleq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpleq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpleq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpleq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpleq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double)));}) #define __arm_vcmpltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36042,25 +36042,25 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vcmpltq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vcmpltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpltq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpltq_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t)), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpltq_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t)), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double)));}) + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpltq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpltq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double)));}) #define __arm_vcmpneq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t)), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vcmpneq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpneq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpneq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vcmpneq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vcmpneq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpneq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ @@ -36115,8 +36115,8 @@ extern void *__ARM_undef; #define __arm_vmaxnmavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmavq_f16 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmavq_f32 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmavq_f16 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmavq_f32 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) #define __arm_vmaxnmq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36127,14 +36127,14 @@ extern void *__ARM_undef; #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) #define __arm_vmaxnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmvq_f16 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmvq_f32 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) #define __arm_vminnmaq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36145,8 +36145,8 @@ extern void *__ARM_undef; #define __arm_vminnmavq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vminnmavq_f16 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vminnmavq_f32 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vminnmavq_f16 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vminnmavq_f32 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) #define __arm_vbrsrq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ @@ -36168,14 +36168,14 @@ extern void *__ARM_undef; #define __arm_vsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t)), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vsubq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vsubq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ @@ -36188,8 +36188,8 @@ extern void *__ARM_undef; #define __arm_vminnmvq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vminnmvq_f16 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vminnmvq_f32 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vminnmvq_f16 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float16x8_t)), \ + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vminnmvq_f32 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float32x4_t)));}) #define __arm_vshlq_r(p0,p1) ({ __typeof(p0) __p0 = (p0); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)])0, \ @@ -36244,12 +36244,12 @@ extern void *__ARM_undef; #define __arm_vrshlq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vrshlq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vrshlq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vrshlq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ @@ -36280,12 +36280,12 @@ extern void *__ARM_undef; #define __arm_vqsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vqsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vqsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vqsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vqsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ @@ -36336,12 +36336,12 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int8x16_t]: __arm_vqrshlq_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int16x8_t]: __arm_vqrshlq_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int32x4_t]: __arm_vqrshlq_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, int32_t)));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vqrshlq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)));}) #define __arm_vqrdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36349,9 +36349,9 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vqrdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vqrdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vqrdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqrdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqrdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqrdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)));}) #define __arm_vmlaldavxq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36384,8 +36384,8 @@ extern void *__ARM_undef; #define __arm_vqdmulltq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmulltq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmulltq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vqdmulltq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vqdmulltq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)));}) @@ -36398,17 +36398,17 @@ extern void *__ARM_undef; #define __arm_vqdmullbq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmullbq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmullbq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vqdmullbq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vqdmullbq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)));}) #define __arm_vqdmulhq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqdmulhq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmulhq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmulhq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vqdmulhq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vqdmulhq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vqdmulhq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)));}) @@ -36416,12 +36416,12 @@ extern void *__ARM_undef; #define __arm_vqaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vqaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vqaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vqaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vqaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ @@ -36454,12 +36454,12 @@ extern void *__ARM_undef; #define __arm_vhaddq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vhaddq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vhaddq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vhaddq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vhaddq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ @@ -36484,12 +36484,12 @@ extern void *__ARM_undef; #define __arm_vhsubq(p0,p1) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vhsubq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vhsubq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vhsubq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vhsubq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ @@ -36632,12 +36632,12 @@ extern void *__ARM_undef; __typeof(p1) __p1 = (p1); \ __typeof(p2) __p2 = (p2); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, uint32_t)));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vmlaq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, int)));}) #define __arm_vsriq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36716,44 +36716,44 @@ extern void *__ARM_undef; __typeof(p1) __p1 = (p1); \ __typeof(p2) __p2 = (p2); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqrdmlashq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqrdmlashq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqrdmlashq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)));}) #define __arm_vqdmlashq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ __typeof(p2) __p2 = (p2); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqdmlashq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmlashq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmlashq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)));}) #define __arm_vqrdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ __typeof(p2) __p2 = (p2); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqrdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqrdmlahq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqrdmlahq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)));}) #define __arm_vmlasq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ __typeof(p2) __p2 = (p2); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce(__p2, uint8_t)), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce(__p2, uint16_t)), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce(__p2, uint32_t)));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vmlasq_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, int)));}) #define __arm_vqdmlahq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ __typeof(p2) __p2 = (p2); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce(__p2, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce(__p2, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce(__p2, int32_t)));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vqdmlahq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vqdmlahq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), __ARM_mve_coerce3(p2, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vqdmlahq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), __ARM_mve_coerce3(p2, int)));}) #define __arm_vqrdmladhxq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36943,11 +36943,11 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vcmpgtq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), p2), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vcmpgtq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), p2), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpgtq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), p2), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t), p2), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t), p2), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t), p2), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double), p2), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double), p2), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpgtq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpgtq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double), p2), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpgtq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double), p2), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpgtq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), p2), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpgtq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), p2));}) @@ -36959,11 +36959,11 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpleq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), p2), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpleq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), p2), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpleq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), p2), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t), p2), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t), p2), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t), p2), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double), p2), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double), p2));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpleq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpleq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpleq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpleq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double), p2), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpleq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double), p2));}) #define __arm_vcmpltq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36973,11 +36973,11 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpltq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), p2), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpltq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), p2), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpltq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), p2), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t), p2), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t), p2), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t), p2), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double), p2), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double), p2));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpltq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpltq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpltq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpltq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double), p2), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpltq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double), p2));}) #define __arm_vcmpneq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -36990,14 +36990,14 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t]: __arm_vcmpneq_m_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), p2), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpneq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), p2), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpneq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), p2), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t), p2), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t), p2), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t), p2), \ - int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8_t), p2), \ - int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16_t), p2), \ - int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32_t), p2), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double), p2), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double), p2));}) + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vcmpneq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpneq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double), p2), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpneq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double), p2));}) #define __arm_vcvtbq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -37051,8 +37051,8 @@ extern void *__ARM_undef; __typeof(p1) __p1 = (p1); \ __typeof(p2) __p2 = (p2); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce2(__p2, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), __ARM_mve_coerce2(__p2, double)), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vfmaq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce2(p2, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vfmaq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), __ARM_mve_coerce2(p2, double)), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vfmaq_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce(__p2, float16x8_t)), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vfmaq_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), __ARM_mve_coerce(__p2, float32x4_t)));}) @@ -37067,8 +37067,8 @@ extern void *__ARM_undef; __typeof(p1) __p1 = (p1); \ __typeof(p2) __p2 = (p2); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce2(__p2, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), __ARM_mve_coerce2(__p2, double)));}) + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vfmasq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce2(p2, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vfmasq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), __ARM_mve_coerce2(p2, double)));}) #define __arm_vmaxnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -37091,14 +37091,14 @@ extern void *__ARM_undef; #define __arm_vmaxnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float16x8_t), p2), \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float32x4_t), p2));}) + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmavq_p_f16 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float16x8_t), p2), \ + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmavq_p_f32 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float32x4_t), p2));}) #define __arm_vmaxnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float16x8_t), p2), \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float32x4_t), p2));}) + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vmaxnmvq_p_f16 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float16x8_t), p2), \ + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vmaxnmvq_p_f32 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float32x4_t), p2));}) #define __arm_vminnmaq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -37109,14 +37109,14 @@ extern void *__ARM_undef; #define __arm_vminnmavq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vminnmavq_p_f16 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float16x8_t), p2), \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vminnmavq_p_f32 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float32x4_t), p2));}) + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vminnmavq_p_f16 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float16x8_t), p2), \ + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vminnmavq_p_f32 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float32x4_t), p2));}) #define __arm_vminnmvq_p(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)])0, \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vminnmvq_p_f16 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float16x8_t), p2), \ - int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vminnmvq_p_f32 (__ARM_mve_coerce2(__p0, double), __ARM_mve_coerce(__p1, float32x4_t), p2));}) + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float16x8_t]: __arm_vminnmvq_p_f16 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float16x8_t), p2), \ + int (*)[__ARM_mve_type_fp_n][__ARM_mve_type_float32x4_t]: __arm_vminnmvq_p_f32 (__ARM_mve_coerce2(p0, double), __ARM_mve_coerce(__p1, float32x4_t), p2));}) #define __arm_vrndnq_m(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -37178,13 +37178,13 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vcmpgeq_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t)), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vcmpgeq_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t)), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpgeq_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t)), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t)), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t)), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t)), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int)), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int)), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpgeq_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t)), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpgeq_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t)), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double)), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double)));}) + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpgeq_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double)), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpgeq_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double)));}) #define __arm_vrshrnbq(p0,p1,p2) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -37285,11 +37285,11 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int8x16_t]: __arm_vcmpgeq_m_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8x16_t), p2), \ int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int16x8_t]: __arm_vcmpgeq_m_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16x8_t), p2), \ int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int32x4_t]: __arm_vcmpgeq_m_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32x4_t), p2), \ - int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce(__p1, int8_t), p2), \ - int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce(__p1, int16_t), p2), \ - int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce(__p1, int32_t), p2), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(__p1, double), p2), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(__p1, double), p2), \ + int (*)[__ARM_mve_type_int8x16_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_m_n_s8 (__ARM_mve_coerce(__p0, int8x16_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int16x8_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_m_n_s16 (__ARM_mve_coerce(__p0, int16x8_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_int32x4_t][__ARM_mve_type_int_n]: __arm_vcmpgeq_m_n_s32 (__ARM_mve_coerce(__p0, int32x4_t), __ARM_mve_coerce3(p1, int), p2), \ + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vcmpgeq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce2(p1, double), p2), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vcmpgeq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce2(p1, double), p2), \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vcmpgeq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), p2), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vcmpgeq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), p2));}) @@ -37324,8 +37324,8 @@ extern void *__ARM_undef; int (*)[__ARM_mve_type_uint8x16_t][__ARM_mve_type_uint8x16_t][__ARM_mve_type_int_n]: __arm_vaddq_m_n_u8 (__ARM_mve_coerce(__p0, uint8x16_t), __ARM_mve_coerce(__p1, uint8x16_t), __ARM_mve_coerce3(p2, int), p3), \ int (*)[__ARM_mve_type_uint16x8_t][__ARM_mve_type_uint16x8_t][__ARM_mve_type_int_n]: __arm_vaddq_m_n_u16 (__ARM_mve_coerce(__p0, uint16x8_t), __ARM_mve_coerce(__p1, uint16x8_t), __ARM_mve_coerce3(p2, int), p3), \ int (*)[__ARM_mve_type_uint32x4_t][__ARM_mve_type_uint32x4_t][__ARM_mve_type_int_n]: __arm_vaddq_m_n_u32 (__ARM_mve_coerce(__p0, uint32x4_t), __ARM_mve_coerce(__p1, uint32x4_t), __ARM_mve_coerce3(p2, int), p3), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce2(__p2, double), p3), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), __ARM_mve_coerce2(__p2, double), p3));}) + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vaddq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce2(p2, double), p3), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vaddq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), __ARM_mve_coerce2(p2, double), p3));}) #define __arm_vandq_m(p0,p1,p2,p3) ({ __typeof(p0) __p0 = (p0); \ __typeof(p1) __p1 = (p1); \ @@ -37466,15 +37466,15 @@ extern void *__ARM_undef; _Generic( (int (*)[__ARM_mve_typeid(__p0)][__ARM_mve_typeid(__p1)][__ARM_mve_typeid(__p2)])0, \ int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t]: __arm_vfmaq_m_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce(__p2, float16x8_t), p3), \ int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t]: __arm_vfmaq_m_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), __ARM_mve_coerce(__p2, float32x4_t), p3), \ - int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce2(__p2, double), p3), \ - int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve_coerce(__p0, float32x4_t), __ARM_mve_coerce(__p1, float32x4_t), __ARM_mve_coerce2(__p2, double), p3));}) + int (*)[__ARM_mve_type_float16x8_t][__ARM_mve_type_float16x8_t][__ARM_mve_type_fp_n]: __arm_vfmaq_m_n_f16 (__ARM_mve_coerce(__p0, float16x8_t), __ARM_mve_coerce(__p1, float16x8_t), __ARM_mve_coerce2(p2, double), p3), \ + int (*)[__ARM_mve_type_float32x4_t][__ARM_mve_type_float32x4_t][__ARM_mve_type_fp_n]: __arm_vfmaq_m_n_f32 (__ARM_mve