@@ -66,10 +66,10 @@ gcm_gmult_v8:
6666#endif
6767 vext. 8 q3 , q9 , q9 , # 8
6868
69- . byte 0x86 , 0x0e , 0xa8 , 0xf2 @ pmull q0 , q12 , q3 @ H.lo·Xi.lo
69+ . byte 0x86 , 0x0e , 0xa8 , 0xf2 @ pmull q0 , q12 , q3 @ H.lo·Xi.lo
7070 veor q9 , q9 , q3 @ Karatsuba pre - processing
71- . byte 0x87 , 0x4e , 0xa9 , 0xf2 @ pmull2 q2 , q12 , q3 @ H.hi·Xi.hi
72- . byte 0xa2 , 0x2e , 0xaa , 0xf2 @ pmull q1 , q13 , q9 @ (H.lo + H.hi)·(Xi.lo + Xi.hi)
71+ . byte 0x87 , 0x4e , 0xa9 , 0xf2 @ pmull2 q2 , q12 , q3 @ H.hi·Xi.hi
72+ . byte 0xa2 , 0x2e , 0xaa , 0xf2 @ pmull q1 , q13 , q9 @ (H.lo + H.hi)·(Xi.lo + Xi.hi)
7373
7474 vext. 8 q9 , q0 , q2 , # 8 @ Karatsuba post - processing
7575 veor q10 , q0 , q2
@@ -134,7 +134,7 @@ gcm_ghash_v8:
134134#endif
135135 vext. 8 q7 , q9 , q9 , # 8
136136 veor q3 , q3 , q0 @ I [ i ] ^=Xi
137- . byte 0x8e , 0x8e , 0xa8 , 0xf2 @ pmull q4 , q12 , q7 @ H·Ii + 1
137+ . byte 0x8e , 0x8e , 0xa8 , 0xf2 @ pmull q4 , q12 , q7 @ H·Ii + 1
138138 veor q9 , q9 , q7 @ Karatsuba pre - processing
139139 . byte 0x8f , 0xce , 0xa9 , 0xf2 @ pmull2 q6 , q12 , q7
140140 b .Loop_mod2x_v8
@@ -143,14 +143,14 @@ gcm_ghash_v8:
143143.Loop_mod2x_v8:
144144 vext. 8 q10 , q3 , q3 , # 8
145145 subs r3 , r3 , # 32 @ is there more data?
146- . byte 0x86 , 0x0e , 0xac , 0xf2 @ pmull q0 , q14 , q3 @ H^ 2 .lo·Xi.lo
146+ . byte 0x86 , 0x0e , 0xac , 0xf2 @ pmull q0 , q14 , q3 @ H^ 2 .lo·Xi.lo
147147 movlo r12 , # 0 @ is it time to zero r12 ?
148148
149149 . byte 0xa2 , 0xae , 0xaa , 0xf2 @ pmull q5 , q13 , q9
150150 veor q10 , q10 , q3 @ Karatsuba pre - processing
151- . byte 0x87 , 0x4e , 0xad , 0xf2 @ pmull2 q2 , q14 , q3 @ H^ 2 .hi·Xi.hi
151+ . byte 0x87 , 0x4e , 0xad , 0xf2 @ pmull2 q2 , q14 , q3 @ H^ 2 .hi·Xi.hi
152152 veor q0 , q0 , q4 @ accumulate
153- . byte 0xa5 , 0x2e , 0xab , 0xf2 @ pmull2 q1 , q13 , q10 @ (H^ 2 .lo + H^ 2 .hi)·(Xi.lo + Xi.hi)
153+ . byte 0xa5 , 0x2e , 0xab , 0xf2 @ pmull2 q1 , q13 , q10 @ (H^ 2 .lo + H^ 2 .hi)·(Xi.lo + Xi.hi)
154154 vld1. 64 {q8} ,[ r2 ], r12 @ load [ rotated ] I [ i + 2 ]
155155
156156 veor q2 , q2 , q6
@@ -175,7 +175,7 @@ gcm_ghash_v8:
175175 vext. 8 q7 , q9 , q9 , # 8
176176 vext. 8 q3 , q8 , q8 , # 8
177177 veor q0 , q1 , q10
178- . byte 0x8e , 0x8e , 0xa8 , 0xf2 @ pmull q4 , q12 , q7 @ H·Ii + 1
178+ . byte 0x8e , 0x8e , 0xa8 , 0xf2 @ pmull q4 , q12 , q7 @ H·Ii + 1
179179 veor q3 , q3 , q2 @ accumulate q3 early
180180
181181 vext. 8 q10 , q0 , q0 , # 8 @ 2nd phase of reduction
@@ -196,10 +196,10 @@ gcm_ghash_v8:
196196 veor q3 , q3 , q0 @ inp^=Xi
197197 veor q9 , q8 , q10 @ q9 is rotated inp^Xi
198198
199- . byte 0x86 , 0x0e , 0xa8 , 0xf2 @ pmull q0 , q12 , q3 @ H.lo·Xi.lo
199+ . byte 0x86 , 0x0e , 0xa8 , 0xf2 @ pmull q0 , q12 , q3 @ H.lo·Xi.lo
200200 veor q9 , q9 , q3 @ Karatsuba pre - processing
201- . byte 0x87 , 0x4e , 0xa9 , 0xf2 @ pmull2 q2 , q12 , q3 @ H.hi·Xi.hi
202- . byte 0xa2 , 0x2e , 0xaa , 0xf2 @ pmull q1 , q13 , q9 @ (H.lo + H.hi)·(Xi.lo + Xi.hi)
201+ . byte 0x87 , 0x4e , 0xa9 , 0xf2 @ pmull2 q2 , q12 , q3 @ H.hi·Xi.hi
202+ . byte 0xa2 , 0x2e , 0xaa , 0xf2 @ pmull q1 , q13 , q9 @ (H.lo + H.hi)·(Xi.lo + Xi.hi)
203203
204204 vext. 8 q9 , q0 , q2 , # 8 @ Karatsuba post - processing
205205 veor q10 , q0 , q2
0 commit comments