target/arm: Implement fp16 for Neon fp compare-vs-0
Convert the neon floating-point vector compare-vs-0 insns VCEQ0, VCGT0, VCLE0, VCGE0 and VCLT0 to use a gvec helper, and use this to implement the fp16 case. Signed-off-by: Peter Maydell <peter.maydell@linaro.org> Reviewed-by: Richard Henderson <richard.henderson@linaro.org> Message-id: 20200828183354.27913-33-peter.maydell@linaro.org
This commit is contained in:
parent
cf722d75b3
commit
635187aaa9
@ -617,6 +617,21 @@ DEF_HELPER_FLAGS_4(gvec_frsqrte_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_4(gvec_frsqrte_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_4(gvec_frsqrte_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
|
||||
DEF_HELPER_FLAGS_4(gvec_fcgt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_4(gvec_fcgt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
|
||||
DEF_HELPER_FLAGS_4(gvec_fcge0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_4(gvec_fcge0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
|
||||
DEF_HELPER_FLAGS_4(gvec_fceq0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_4(gvec_fceq0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
|
||||
DEF_HELPER_FLAGS_4(gvec_fcle0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_4(gvec_fcle0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
|
||||
DEF_HELPER_FLAGS_4(gvec_fclt0_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_4(gvec_fclt0_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, i32)
|
||||
|
||||
DEF_HELPER_FLAGS_5(gvec_fadd_h, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_5(gvec_fadd_s, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
|
||||
DEF_HELPER_FLAGS_5(gvec_fadd_d, TCG_CALL_NO_RWG, void, ptr, ptr, ptr, ptr, i32)
|
||||
|
@ -3801,6 +3801,11 @@ DO_2MISC_FP(VCVT_UF, gen_helper_vfp_touizs)
|
||||
|
||||
DO_2MISC_FP_VEC(VRECPE_F, gen_helper_gvec_frecpe_h, gen_helper_gvec_frecpe_s)
|
||||
DO_2MISC_FP_VEC(VRSQRTE_F, gen_helper_gvec_frsqrte_h, gen_helper_gvec_frsqrte_s)
|
||||
DO_2MISC_FP_VEC(VCGT0_F, gen_helper_gvec_fcgt0_h, gen_helper_gvec_fcgt0_s)
|
||||
DO_2MISC_FP_VEC(VCGE0_F, gen_helper_gvec_fcge0_h, gen_helper_gvec_fcge0_s)
|
||||
DO_2MISC_FP_VEC(VCEQ0_F, gen_helper_gvec_fceq0_h, gen_helper_gvec_fceq0_s)
|
||||
DO_2MISC_FP_VEC(VCLT0_F, gen_helper_gvec_fclt0_h, gen_helper_gvec_fclt0_s)
|
||||
DO_2MISC_FP_VEC(VCLE0_F, gen_helper_gvec_fcle0_h, gen_helper_gvec_fcle0_s)
|
||||
|
||||
static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
|
||||
{
|
||||
@ -3810,34 +3815,6 @@ static bool trans_VRINTX(DisasContext *s, arg_2misc *a)
|
||||
return do_2misc_fp(s, a, gen_helper_rints_exact);
|
||||
}
|
||||
|
||||
#define WRAP_FP_CMP0_FWD(WRAPNAME, FUNC) \
|
||||
static void WRAPNAME(TCGv_i32 d, TCGv_i32 m, TCGv_ptr fpst) \
|
||||
{ \
|
||||
TCGv_i32 zero = tcg_const_i32(0); \
|
||||
FUNC(d, m, zero, fpst); \
|
||||
tcg_temp_free_i32(zero); \
|
||||
}
|
||||
#define WRAP_FP_CMP0_REV(WRAPNAME, FUNC) \
|
||||
static void WRAPNAME(TCGv_i32 d, TCGv_i32 m, TCGv_ptr fpst) \
|
||||
{ \
|
||||
TCGv_i32 zero = tcg_const_i32(0); \
|
||||
FUNC(d, zero, m, fpst); \
|
||||
tcg_temp_free_i32(zero); \
|
||||
}
|
||||
|
||||
#define DO_FP_CMP0(INSN, FUNC, REV) \
|
||||
WRAP_FP_CMP0_##REV(gen_##INSN, FUNC) \
|
||||
static bool trans_##INSN(DisasContext *s, arg_2misc *a) \
|
||||
{ \
|
||||
return do_2misc_fp(s, a, gen_##INSN); \
|
||||
}
|
||||
|
||||
DO_FP_CMP0(VCGT0_F, gen_helper_neon_cgt_f32, FWD)
|
||||
DO_FP_CMP0(VCGE0_F, gen_helper_neon_cge_f32, FWD)
|
||||
DO_FP_CMP0(VCEQ0_F, gen_helper_neon_ceq_f32, FWD)
|
||||
DO_FP_CMP0(VCLE0_F, gen_helper_neon_cge_f32, REV)
|
||||
DO_FP_CMP0(VCLT0_F, gen_helper_neon_cgt_f32, REV)
|
||||
|
||||
static bool do_vrint(DisasContext *s, arg_2misc *a, int rmode)
|
||||
{
|
||||
/*
|
||||
|
@ -730,7 +730,32 @@ DO_2OP(gvec_frsqrte_h, helper_rsqrte_f16, float16)
|
||||
DO_2OP(gvec_frsqrte_s, helper_rsqrte_f32, float32)
|
||||
DO_2OP(gvec_frsqrte_d, helper_rsqrte_f64, float64)
|
||||
|
||||
#define WRAP_CMP0_FWD(FN, CMPOP, TYPE) \
|
||||
static TYPE TYPE##_##FN##0(TYPE op, float_status *stat) \
|
||||
{ \
|
||||
return TYPE##_##CMPOP(op, TYPE##_zero, stat); \
|
||||
}
|
||||
|
||||
#define WRAP_CMP0_REV(FN, CMPOP, TYPE) \
|
||||
static TYPE TYPE##_##FN##0(TYPE op, float_status *stat) \
|
||||
{ \
|
||||
return TYPE##_##CMPOP(TYPE##_zero, op, stat); \
|
||||
}
|
||||
|
||||
#define DO_2OP_CMP0(FN, CMPOP, DIRN) \
|
||||
WRAP_CMP0_##DIRN(FN, CMPOP, float16) \
|
||||
WRAP_CMP0_##DIRN(FN, CMPOP, float32) \
|
||||
DO_2OP(gvec_f##FN##0_h, float16_##FN##0, float16) \
|
||||
DO_2OP(gvec_f##FN##0_s, float32_##FN##0, float32)
|
||||
|
||||
DO_2OP_CMP0(cgt, cgt, FWD)
|
||||
DO_2OP_CMP0(cge, cge, FWD)
|
||||
DO_2OP_CMP0(ceq, ceq, FWD)
|
||||
DO_2OP_CMP0(clt, cgt, REV)
|
||||
DO_2OP_CMP0(cle, cge, REV)
|
||||
|
||||
#undef DO_2OP
|
||||
#undef DO_2OP_CMP0
|
||||
|
||||
/* Floating-point trigonometric starting value.
|
||||
* See the ARM ARM pseudocode function FPTrigSMul.
|
||||
|
Loading…
Reference in New Issue
Block a user