51 static void vector_fmul_window_mips(
float *
dst,
const float *src0,
52 const float *src1,
const float *win,
int len)
58 float * dst_i, * dst_j, * dst_i2, * dst_j2;
59 float temp, temp1, temp2, temp3, temp4, temp5, temp6, temp7;
65 for (i = -len, j = len - 1; i < 0; i += 8, j -= 8) {
74 "mul.s %[temp], %[s1], %[wi] \n\t"
75 "mul.s %[temp1], %[s1], %[wj] \n\t"
76 "mul.s %[temp2], %[s11], %[wi1] \n\t"
77 "mul.s %[temp3], %[s11], %[wj1] \n\t"
79 "msub.s %[temp], %[temp], %[s0], %[wj] \n\t"
80 "madd.s %[temp1], %[temp1], %[s0], %[wi] \n\t"
81 "msub.s %[temp2], %[temp2], %[s01], %[wj1] \n\t"
82 "madd.s %[temp3], %[temp3], %[s01], %[wi1] \n\t"
84 "swc1 %[temp], 0(%[dst_i]) \n\t"
85 "swc1 %[temp1], 0(%[dst_j]) \n\t"
86 "swc1 %[temp2], 4(%[dst_i]) \n\t"
87 "swc1 %[temp3], -4(%[dst_j]) \n\t"
89 "mul.s %[temp4], %[s12], %[wi2] \n\t"
90 "mul.s %[temp5], %[s12], %[wj2] \n\t"
91 "mul.s %[temp6], %[s13], %[wi3] \n\t"
92 "mul.s %[temp7], %[s13], %[wj3] \n\t"
94 "msub.s %[temp4], %[temp4], %[s02], %[wj2] \n\t"
95 "madd.s %[temp5], %[temp5], %[s02], %[wi2] \n\t"
96 "msub.s %[temp6], %[temp6], %[s03], %[wj3] \n\t"
97 "madd.s %[temp7], %[temp7], %[s03], %[wi3] \n\t"
99 "swc1 %[temp4], 8(%[dst_i]) \n\t"
100 "swc1 %[temp5], -8(%[dst_j]) \n\t"
101 "swc1 %[temp6], 12(%[dst_i]) \n\t"
102 "swc1 %[temp7], -12(%[dst_j]) \n\t"
103 : [
temp]
"=&f"(
temp), [temp1]
"=&f"(temp1), [temp2]
"=&f"(temp2),
104 [temp3]
"=&f"(temp3), [temp4]
"=&f"(temp4), [temp5]
"=&f"(temp5),
105 [temp6]
"=&f"(temp6), [temp7]
"=&f"(temp7)
106 : [dst_j]
"r"(dst_j), [dst_i]
"r" (dst_i),
107 [
s0]
"f"(src0[i]), [wj]
"f"(win[j]), [
s1]
"f"(src1[j]),
108 [wi]
"f"(win[i]), [s01]
"f"(src0[i + 1]),[wj1]
"f"(win[j - 1]),
109 [s11]
"f"(src1[j - 1]), [wi1]
"f"(win[i + 1]), [s02]
"f"(src0[i + 2]),
110 [wj2]
"f"(win[j - 2]), [s12]
"f"(src1[j - 2]),[wi2]
"f"(win[i + 2]),
111 [s03]
"f"(src0[i + 3]), [wj3]
"f"(win[j - 3]), [s13]
"f"(src1[j - 3]),
117 "mul.s %[temp], %[s1], %[wi] \n\t"
118 "mul.s %[temp1], %[s1], %[wj] \n\t"
119 "mul.s %[temp2], %[s11], %[wi1] \n\t"
120 "mul.s %[temp3], %[s11], %[wj1] \n\t"
122 "msub.s %[temp], %[temp], %[s0], %[wj] \n\t"
123 "madd.s %[temp1], %[temp1], %[s0], %[wi] \n\t"
124 "msub.s %[temp2], %[temp2], %[s01], %[wj1] \n\t"
125 "madd.s %[temp3], %[temp3], %[s01], %[wi1] \n\t"
127 "swc1 %[temp], 0(%[dst_i2]) \n\t"
128 "swc1 %[temp1], 0(%[dst_j2]) \n\t"
129 "swc1 %[temp2], 4(%[dst_i2]) \n\t"
130 "swc1 %[temp3], -4(%[dst_j2]) \n\t"
132 "mul.s %[temp4], %[s12], %[wi2] \n\t"
133 "mul.s %[temp5], %[s12], %[wj2] \n\t"
134 "mul.s %[temp6], %[s13], %[wi3] \n\t"
135 "mul.s %[temp7], %[s13], %[wj3] \n\t"
137 "msub.s %[temp4], %[temp4], %[s02], %[wj2] \n\t"
138 "madd.s %[temp5], %[temp5], %[s02], %[wi2] \n\t"
139 "msub.s %[temp6], %[temp6], %[s03], %[wj3] \n\t"
140 "madd.s %[temp7], %[temp7], %[s03], %[wi3] \n\t"
142 "swc1 %[temp4], 8(%[dst_i2]) \n\t"
143 "swc1 %[temp5], -8(%[dst_j2]) \n\t"
144 "swc1 %[temp6], 12(%[dst_i2]) \n\t"
145 "swc1 %[temp7], -12(%[dst_j2]) \n\t"
147 [temp1]
"=&f"(temp1), [temp2]
"=&f"(temp2), [temp3]
"=&f"(temp3),
148 [temp4]
"=&f"(temp4), [temp5]
"=&f"(temp5), [temp6]
"=&f"(temp6),
149 [temp7]
"=&f" (temp7)
150 : [dst_j2]
"r"(dst_j2), [dst_i2]
"r"(dst_i2),
151 [
s0]
"f"(src0[i + 4]), [wj]
"f"(win[j - 4]), [
s1]
"f"(src1[j - 4]),
152 [wi]
"f"(win[i + 4]), [s01]
"f"(src0[i + 5]),[wj1]
"f"(win[j - 5]),
153 [s11]
"f"(src1[j - 5]), [wi1]
"f"(win[i + 5]), [s02]
"f"(src0[i + 6]),
154 [wj2]
"f"(win[j - 6]), [s12]
"f"(src1[j - 6]),[wi2]
"f"(win[i + 6]),
155 [s03]
"f"(src0[i + 7]), [wj3]
"f"(win[j - 7]), [s13]
"f"(src1[j - 7]),