]> gitweb.factorcode.org Git - factor.git/blob - basis/cpu/x86/assembler/assembler.factor
cpu.x86.assembler: small cleanups
[factor.git] / basis / cpu / x86 / assembler / assembler.factor
1 ! Copyright (C) 2005, 2010 Slava Pestov, Joe Groff.
2 ! See http://factorcode.org/license.txt for BSD license.
3 USING: arrays io.binary kernel combinators
4 combinators.short-circuit math math.bitwise locals namespaces
5 make sequences words system layouts math.order accessors
6 cpu.x86.assembler.operands cpu.x86.assembler.operands.private ;
7 IN: cpu.x86.assembler
8
9 ! A postfix assembler for x86-32 and x86-64.
10
11 <PRIVATE
12
13 : reg-code ( reg -- n ) "register" word-prop 7 bitand ;
14
15 : indirect-base* ( op -- n ) base>> EBP or reg-code ;
16
17 : indirect-index* ( op -- n ) index>> ESP or reg-code ;
18
19 : indirect-scale* ( op -- n ) scale>> 0 or ;
20
21 GENERIC: sib-present? ( op -- ? )
22
23 M: indirect sib-present?
24     {
25         [ base>> { ESP RSP R12 } member? ]
26         [ index>> ]
27         [ scale>> ]
28     } 1|| ;
29
30 M: register sib-present? drop f ;
31
32 GENERIC: r/m ( operand -- n )
33
34 M: indirect r/m
35     dup sib-present?
36     [ drop ESP reg-code ] [ indirect-base* ] if ;
37
38 M: register r/m reg-code ;
39
40 ! Immediate operands
41 UNION: immediate byte integer ;
42
43 GENERIC: fits-in-byte? ( value -- ? )
44
45 M: byte fits-in-byte? drop t ;
46
47 M: integer fits-in-byte? -128 127 between? ;
48
49 GENERIC: modifier ( op -- n )
50
51 M: indirect modifier
52     dup base>> [
53         displacement>> {
54             { [ dup not ] [ BIN: 00 ] }
55             { [ dup fits-in-byte? ] [ BIN: 01 ] }
56             { [ dup immediate? ] [ BIN: 10 ] }
57         } cond nip
58     ] [
59         drop BIN: 00
60     ] if ;
61
62 M: register modifier drop BIN: 11 ;
63
64 GENERIC# n, 1 ( value n -- )
65
66 M: integer n, >le % ;
67 M: byte n, [ value>> ] dip n, ;
68 : 1, ( n -- ) 1 n, ; inline
69 : 4, ( n -- ) 4 n, ; inline
70 : 2, ( n -- ) 2 n, ; inline
71 : cell, ( n -- ) bootstrap-cell n, ; inline
72
73 : mod-r/m, ( reg operand -- )
74     [ 3 shift ] [ [ modifier 6 shift ] [ r/m ] bi ] bi* bitor bitor , ;
75
76 : sib, ( operand -- )
77     dup sib-present? [
78         [ indirect-base* ]
79         [ indirect-index* 3 shift ]
80         [ indirect-scale* 6 shift ] tri bitor bitor ,
81     ] [
82         drop
83     ] if ;
84
85 GENERIC: displacement, ( op -- )
86
87 M: indirect displacement,
88     dup displacement>> dup [
89         swap base>>
90         [ dup fits-in-byte? [ , ] [ 4, ] if ] [ 4, ] if
91     ] [ 2drop ] if ;
92
93 M: register displacement, drop ;
94
95 : addressing ( reg operand -- )
96     [ mod-r/m, ] [ sib, ] [ displacement, ] tri ;
97
98 : rex.w? ( rex.w reg r/m -- ? )
99     {
100         { [ over register-128? ] [ nip operand-64? ] }
101         { [ over not ] [ nip operand-64? ] }
102         [ drop operand-64? ]
103     } cond and ;
104
105 : rex.r ( m op -- n )
106     extended? [ BIN: 00000100 bitor ] when ;
107
108 : rex.b ( m op -- n )
109     [ extended? [ BIN: 00000001 bitor ] when ] keep
110     dup indirect? [ index>> extended? [ BIN: 00000010 bitor ] when ] [ drop ] if ;
111
112 : no-prefix? ( prefix reg r/m -- ? )
113     [ BIN: 01000000 = ]
114     [ extended-8-bit-register? not ]
115     [ extended-8-bit-register? not ] tri*
116     and and ;
117
118 :: rex-prefix ( reg r/m rex.w -- )
119     #! Compile an AMD64 REX prefix.
120     rex.w reg r/m rex.w? BIN: 01001000 BIN: 01000000 ?
121     reg rex.r
122     r/m rex.b
123     dup reg r/m no-prefix? [ drop ] [ , ] if ;
124
125 : 16-prefix ( reg -- )
126     register-16? [ HEX: 66 , ] when ;
127
128 : prefix-1 ( reg rex.w -- )
129     [ drop 16-prefix ] [ [ f ] 2dip rex-prefix ] 2bi ;
130
131 : short-operand ( reg rex.w n -- )
132     #! Some instructions encode their single operand as part of
133     #! the opcode.
134     [ dupd prefix-1 reg-code ] dip + , ;
135
136 : opcode, ( opcode -- ) dup array? [ % ] [ , ] if ;
137
138 : extended-opcode ( opcode -- opcode' )
139     dup array? [ OCT: 17 prefix ] [ OCT: 17 swap 2array ] if ;
140
141 : extended-opcode, ( opcode -- ) extended-opcode opcode, ;
142
143 : opcode-or ( opcode mask -- opcode' )
144     over array?
145     [ [ unclip-last ] dip bitor suffix ] [ bitor ] if ;
146
147 : 1-operand ( operand reg,rex.w,opcode -- )
148     #! The 'reg' is not really a register, but a value for the
149     #! 'reg' field of the mod-r/m byte.
150     first3 [ [ over ] dip prefix-1 ] dip opcode, swap addressing ;
151
152 : immediate-operand-size-bit ( dst imm reg,rex.w,opcode -- imm dst reg,rex.w,opcode )
153     over integer? [ first3 BIN: 1 opcode-or 3array ] when ;
154
155 : immediate-1 ( dst imm reg,rex.w,opcode -- )
156     immediate-operand-size-bit swap [ 1-operand ] dip 1, ;
157
158 : immediate-4 ( dst imm reg,rex.w,opcode -- )
159     immediate-operand-size-bit swap [ 1-operand ] dip 4, ;
160
161 : immediate-fits-in-size-bit ( dst imm reg,rex.w,opcode -- imm dst reg,rex.w,opcode )
162     over integer? [ first3 BIN: 10 opcode-or 3array ] when ;
163
164 : immediate-1/4 ( dst imm reg,rex.w,opcode -- )
165     #! If imm is a byte, compile the opcode and the byte.
166     #! Otherwise, set the 8-bit operand flag in the opcode, and
167     #! compile the cell. The 'reg' is not really a register, but
168     #! a value for the 'reg' field of the mod-r/m byte.
169     over fits-in-byte? [
170         immediate-fits-in-size-bit immediate-1
171     ] [
172         immediate-4
173     ] if ;
174
175 : (2-operand) ( reg operand op -- )
176     [ 2dup t rex-prefix ] dip opcode,
177     [ reg-code ] dip addressing ;
178
179 : direction-bit ( dst src op -- reg operand op' )
180     pick register? pick register? not and
181     [ BIN: 10 opcode-or ] [ swapd ] if ;
182
183 : operand-size-bit ( reg operand op -- reg operand op' )
184     pick register-8? [ BIN: 1 opcode-or ] unless ;
185
186 : 2-operand ( dst src op -- )
187     direction-bit operand-size-bit
188     pick 16-prefix
189     (2-operand) ;
190
191 PRIVATE>
192
193 ! Segment override prefixes
194 : CS ( -- ) HEX: 2e , ;
195 : ES ( -- ) HEX: 26 , ;
196 : SS ( -- ) HEX: 36 , ;
197 : FS ( -- ) HEX: 64 , ;
198 : GS ( -- ) HEX: 65 , ;
199
200 ! Moving stuff
201 GENERIC: PUSH ( op -- )
202 M: register PUSH f HEX: 50 short-operand ;
203 M: immediate PUSH HEX: 68 , 4, ;
204 M: operand PUSH { BIN: 110 f HEX: ff } 1-operand ;
205
206 GENERIC: POP ( op -- )
207 M: register POP f HEX: 58 short-operand ;
208 M: operand POP { BIN: 000 f HEX: 8f } 1-operand ;
209
210 ! MOV where the src is immediate.
211 <PRIVATE
212
213 GENERIC# (MOV-I) 1 ( dst src -- )
214 M: register (MOV-I) [ t HEX: b8 short-operand ] [ cell, ] bi* ;
215 M: operand (MOV-I)
216     { BIN: 000 t HEX: c6 }
217     over byte? [ immediate-1 ] [ immediate-4 ] if ;
218
219 PRIVATE>
220
221 GENERIC: MOV ( dst src -- )
222 M: immediate MOV (MOV-I) ;
223 M: operand MOV HEX: 88 2-operand ;
224
225 : LEA ( dst src -- ) swap HEX: 8d 2-operand ;
226
227 ! Control flow
228 GENERIC: JMP ( op -- )
229 M: integer JMP HEX: e9 , 4, ;
230 M: operand JMP { BIN: 100 t HEX: ff } 1-operand ;
231
232 GENERIC: CALL ( op -- )
233 M: integer CALL HEX: e8 , 4, ;
234 M: operand CALL { BIN: 010 t HEX: ff } 1-operand ;
235
236 <PRIVATE
237
238 GENERIC# JUMPcc 1 ( addr opcode -- )
239 M: integer JUMPcc extended-opcode, 4, ;
240
241 PRIVATE>
242
243 : JO  ( dst -- ) HEX: 80 JUMPcc ;
244 : JNO ( dst -- ) HEX: 81 JUMPcc ;
245 : JB  ( dst -- ) HEX: 82 JUMPcc ;
246 : JAE ( dst -- ) HEX: 83 JUMPcc ;
247 : JE  ( dst -- ) HEX: 84 JUMPcc ; ! aka JZ
248 : JNE ( dst -- ) HEX: 85 JUMPcc ;
249 : JBE ( dst -- ) HEX: 86 JUMPcc ;
250 : JA  ( dst -- ) HEX: 87 JUMPcc ;
251 : JS  ( dst -- ) HEX: 88 JUMPcc ;
252 : JNS ( dst -- ) HEX: 89 JUMPcc ;
253 : JP  ( dst -- ) HEX: 8a JUMPcc ;
254 : JNP ( dst -- ) HEX: 8b JUMPcc ;
255 : JL  ( dst -- ) HEX: 8c JUMPcc ;
256 : JGE ( dst -- ) HEX: 8d JUMPcc ;
257 : JLE ( dst -- ) HEX: 8e JUMPcc ;
258 : JG  ( dst -- ) HEX: 8f JUMPcc ;
259
260 : LEAVE ( -- ) HEX: c9 , ;
261
262 : RET ( n -- )
263     dup zero? [ drop HEX: c3 , ] [ HEX: c2 , 2, ] if ;
264
265 ! Arithmetic
266
267 GENERIC: ADD ( dst src -- )
268 M: immediate ADD { BIN: 000 t HEX: 80 } immediate-1/4 ;
269 M: operand ADD OCT: 000 2-operand ;
270
271 GENERIC: OR ( dst src -- )
272 M: immediate OR { BIN: 001 t HEX: 80 } immediate-1/4 ;
273 M: operand OR OCT: 010 2-operand ;
274
275 GENERIC: ADC ( dst src -- )
276 M: immediate ADC { BIN: 010 t HEX: 80 } immediate-1/4 ;
277 M: operand ADC OCT: 020 2-operand ;
278
279 GENERIC: SBB ( dst src -- )
280 M: immediate SBB { BIN: 011 t HEX: 80 } immediate-1/4 ;
281 M: operand SBB OCT: 030 2-operand ;
282
283 GENERIC: AND ( dst src -- )
284 M: immediate AND { BIN: 100 t HEX: 80 } immediate-1/4 ;
285 M: operand AND OCT: 040 2-operand ;
286
287 GENERIC: SUB ( dst src -- )
288 M: immediate SUB { BIN: 101 t HEX: 80 } immediate-1/4 ;
289 M: operand SUB OCT: 050 2-operand ;
290
291 GENERIC: XOR ( dst src -- )
292 M: immediate XOR { BIN: 110 t HEX: 80 } immediate-1/4 ;
293 M: operand XOR OCT: 060 2-operand ;
294
295 GENERIC: CMP ( dst src -- )
296 M: immediate CMP { BIN: 111 t HEX: 80 } immediate-1/4 ;
297 M: operand CMP OCT: 070 2-operand ;
298
299 GENERIC: TEST ( dst src -- )
300 M: immediate TEST { BIN: 0 t HEX: f7 } immediate-4 ;
301 M: operand TEST OCT: 204 2-operand ;
302
303 : XCHG ( dst src -- ) OCT: 207 2-operand ;
304
305 : BSR ( dst src -- ) { HEX: 0f HEX: bd } (2-operand) ;
306
307 : NOT  ( dst -- ) { BIN: 010 t HEX: f7 } 1-operand ;
308 : NEG  ( dst -- ) { BIN: 011 t HEX: f7 } 1-operand ;
309 : MUL  ( dst -- ) { BIN: 100 t HEX: f7 } 1-operand ;
310 : IMUL ( src -- ) { BIN: 101 t HEX: f7 } 1-operand ;
311 : DIV  ( dst -- ) { BIN: 110 t HEX: f7 } 1-operand ;
312 : IDIV ( src -- ) { BIN: 111 t HEX: f7 } 1-operand ;
313
314 : CDQ ( -- ) HEX: 99 , ;
315 : CQO ( -- ) HEX: 48 , CDQ ;
316
317 <PRIVATE
318
319 :: (SHIFT) ( dst src op -- )
320     src CL eq? [
321         dst { op t HEX: d3 } 1-operand
322     ] [
323         dst src { op t HEX: c0 } immediate-1
324     ] if ; inline
325
326 PRIVATE>
327
328 : ROL ( dst n -- ) BIN: 000 (SHIFT) ;
329 : ROR ( dst n -- ) BIN: 001 (SHIFT) ;
330 : RCL ( dst n -- ) BIN: 010 (SHIFT) ;
331 : RCR ( dst n -- ) BIN: 011 (SHIFT) ;
332 : SHL ( dst n -- ) BIN: 100 (SHIFT) ;
333 : SHR ( dst n -- ) BIN: 101 (SHIFT) ;
334 : SAR ( dst n -- ) BIN: 111 (SHIFT) ;
335
336 : IMUL2 ( dst src -- )
337     swap OCT: 257 extended-opcode (2-operand) ;
338
339 : IMUL3 ( dst src imm -- )
340     dup fits-in-byte? [
341         [ swap HEX: 6a 2-operand ] dip 1,
342     ] [
343         [ swap HEX: 68 2-operand ] dip 4,
344     ] if ;
345
346 : MOVSX ( dst src -- )
347     dup register-32? OCT: 143 OCT: 276 extended-opcode ?
348     over register-16? [ BIN: 1 opcode-or ] when
349     (2-operand) ;
350
351 : MOVZX ( dst src -- )
352     OCT: 266 extended-opcode
353     over register-16? [ BIN: 1 opcode-or ] when
354     (2-operand) ;
355
356 ! Conditional move
357 : MOVcc ( dst src cc -- ) extended-opcode (2-operand) ;
358
359 : CMOVO  ( dst src -- ) HEX: 40 MOVcc ;
360 : CMOVNO ( dst src -- ) HEX: 41 MOVcc ;
361 : CMOVB  ( dst src -- ) HEX: 42 MOVcc ;
362 : CMOVAE ( dst src -- ) HEX: 43 MOVcc ;
363 : CMOVE  ( dst src -- ) HEX: 44 MOVcc ; ! aka CMOVZ
364 : CMOVNE ( dst src -- ) HEX: 45 MOVcc ;
365 : CMOVBE ( dst src -- ) HEX: 46 MOVcc ;
366 : CMOVA  ( dst src -- ) HEX: 47 MOVcc ;
367 : CMOVS  ( dst src -- ) HEX: 48 MOVcc ;
368 : CMOVNS ( dst src -- ) HEX: 49 MOVcc ;
369 : CMOVP  ( dst src -- ) HEX: 4a MOVcc ;
370 : CMOVNP ( dst src -- ) HEX: 4b MOVcc ;
371 : CMOVL  ( dst src -- ) HEX: 4c MOVcc ;
372 : CMOVGE ( dst src -- ) HEX: 4d MOVcc ;
373 : CMOVLE ( dst src -- ) HEX: 4e MOVcc ;
374 : CMOVG  ( dst src -- ) HEX: 4f MOVcc ;
375
376 ! CPU Identification
377
378 : CPUID ( -- ) HEX: a2 extended-opcode, ;
379
380 ! Misc
381
382 : NOP ( -- ) HEX: 90 , ;
383 : PAUSE ( -- ) HEX: f3 , HEX: 90 , ;
384
385 : RDTSC ( -- ) HEX: 0f , HEX: 31 , ;
386 : RDPMC ( -- ) HEX: 0f , HEX: 33 , ;
387
388 ! x87 Floating Point Unit
389
390 : FSTPS ( operand -- ) { BIN: 011 f HEX: d9 } 1-operand ;
391 : FSTPL ( operand -- ) { BIN: 011 f HEX: dd } 1-operand ;
392
393 : FLDS ( operand -- ) { BIN: 000 f HEX: d9 } 1-operand ;
394 : FLDL ( operand -- ) { BIN: 000 f HEX: dd } 1-operand ;
395
396 : FNSTCW ( operand -- ) { BIN: 111 f HEX: d9 } 1-operand ;
397 : FNSTSW ( operand -- ) { BIN: 111 f HEX: dd } 1-operand ;
398 : FLDCW ( operand -- ) { BIN: 101 f HEX: d9 } 1-operand ;
399
400 : FNCLEX ( -- ) HEX: db , HEX: e2 , ;
401 : FNINIT ( -- ) HEX: db , HEX: e3 , ;
402
403 ! SSE multimedia instructions
404
405 <PRIVATE
406
407 : direction-bit-sse ( dst src op1 -- dst' src' op1' )
408     pick register-128? [ swapd BIN: 1 bitor ] unless ;
409
410 : 2-operand-sse ( dst src op1 op2 -- )
411     [ , ] when* direction-bit-sse extended-opcode (2-operand) ;
412
413 : direction-op-sse ( dst src op1s -- dst' src' op1' )
414     pick register-128? [ first ] [ swapd second ] if ;
415
416 : 2-operand-rm-mr-sse ( dst src op1{rm,mr} op2 -- )
417     [ , ] when* direction-op-sse extended-opcode (2-operand) ;
418
419 : 2-operand-rm-sse ( dst src op1 op2 -- )
420     [ , ] when* extended-opcode (2-operand) ;
421
422 : 2-operand-mr-sse ( dst src op1 op2 -- )
423     [ , ] when* extended-opcode swapd (2-operand) ;
424
425 : 2-operand-int/sse ( dst src op1 op2 -- )
426     [ , ] when* extended-opcode (2-operand) ;
427
428 :: 3-operand-rm-sse ( dst src imm op1 op2 -- )
429     dst src op1 op2 2-operand-rm-sse imm , ;
430
431 :: 3-operand-mr-sse ( dst src imm op1 op2 -- )
432     dst src op1 op2 2-operand-mr-sse imm , ;
433
434 :: 3-operand-rm-mr-sse ( dst src imm op1 op2 -- )
435     dst src op1 op2 2-operand-rm-mr-sse imm , ;
436
437 : 2-operand-sse-cmp ( dst src cmp op1 op2 -- )
438     3-operand-rm-sse ; inline
439
440 : 2-operand-sse-shift ( dst imm reg op1 op2 -- )
441     [ , ] when*
442     [ f HEX: 0f ] dip 2array 3array
443     swapd 1-operand , ;
444
445 PRIVATE>
446
447 : MOVUPS     ( dest src -- ) HEX: 10 f       2-operand-sse ;
448 : MOVUPD     ( dest src -- ) HEX: 10 HEX: 66 2-operand-sse ;
449 : MOVSD      ( dest src -- ) HEX: 10 HEX: f2 2-operand-sse ;
450 : MOVSS      ( dest src -- ) HEX: 10 HEX: f3 2-operand-sse ;
451 : MOVLPS     ( dest src -- ) HEX: 12 f       2-operand-sse ;
452 : MOVLPD     ( dest src -- ) HEX: 12 HEX: 66 2-operand-sse ;
453 : MOVDDUP    ( dest src -- ) HEX: 12 HEX: f2 2-operand-rm-sse ;
454 : MOVSLDUP   ( dest src -- ) HEX: 12 HEX: f3 2-operand-rm-sse ;
455 : UNPCKLPS   ( dest src -- ) HEX: 14 f       2-operand-rm-sse ;
456 : UNPCKLPD   ( dest src -- ) HEX: 14 HEX: 66 2-operand-rm-sse ;
457 : UNPCKHPS   ( dest src -- ) HEX: 15 f       2-operand-rm-sse ;
458 : UNPCKHPD   ( dest src -- ) HEX: 15 HEX: 66 2-operand-rm-sse ;
459 : MOVHPS     ( dest src -- ) HEX: 16 f       2-operand-sse ;
460 : MOVHPD     ( dest src -- ) HEX: 16 HEX: 66 2-operand-sse ;
461 : MOVSHDUP   ( dest src -- ) HEX: 16 HEX: f3 2-operand-rm-sse ;
462
463 ALIAS: MOVHLPS MOVLPS
464 ALIAS: MOVLHPS MOVHPS
465
466 : PREFETCHNTA ( mem -- )  { BIN: 000 f { HEX: 0f HEX: 18 } } 1-operand ;
467 : PREFETCHT0  ( mem -- )  { BIN: 001 f { HEX: 0f HEX: 18 } } 1-operand ;
468 : PREFETCHT1  ( mem -- )  { BIN: 010 f { HEX: 0f HEX: 18 } } 1-operand ;
469 : PREFETCHT2  ( mem -- )  { BIN: 011 f { HEX: 0f HEX: 18 } } 1-operand ;
470
471 : MOVAPS     ( dest src -- ) HEX: 28 f       2-operand-sse ;
472 : MOVAPD     ( dest src -- ) HEX: 28 HEX: 66 2-operand-sse ;
473 : CVTSI2SD   ( dest src -- ) HEX: 2a HEX: f2 2-operand-int/sse ;
474 : CVTSI2SS   ( dest src -- ) HEX: 2a HEX: f3 2-operand-int/sse ;
475 : MOVNTPS    ( dest src -- ) HEX: 2b f       2-operand-mr-sse ;
476 : MOVNTPD    ( dest src -- ) HEX: 2b HEX: 66 2-operand-mr-sse ;
477 : CVTTSD2SI  ( dest src -- ) HEX: 2c HEX: f2 2-operand-int/sse ;
478 : CVTTSS2SI  ( dest src -- ) HEX: 2c HEX: f3 2-operand-int/sse ;
479 : CVTSD2SI   ( dest src -- ) HEX: 2d HEX: f2 2-operand-int/sse ;
480 : CVTSS2SI   ( dest src -- ) HEX: 2d HEX: f3 2-operand-int/sse ;
481 : UCOMISS    ( dest src -- ) HEX: 2e f       2-operand-rm-sse ;
482 : UCOMISD    ( dest src -- ) HEX: 2e HEX: 66 2-operand-rm-sse ;
483 : COMISS     ( dest src -- ) HEX: 2f f       2-operand-rm-sse ;
484 : COMISD     ( dest src -- ) HEX: 2f HEX: 66 2-operand-rm-sse ;
485
486 : PSHUFB     ( dest src -- ) { HEX: 38 HEX: 00 } HEX: 66 2-operand-rm-sse ;
487 : PHADDW     ( dest src -- ) { HEX: 38 HEX: 01 } HEX: 66 2-operand-rm-sse ;
488 : PHADDD     ( dest src -- ) { HEX: 38 HEX: 02 } HEX: 66 2-operand-rm-sse ;
489 : PHADDSW    ( dest src -- ) { HEX: 38 HEX: 03 } HEX: 66 2-operand-rm-sse ;
490 : PMADDUBSW  ( dest src -- ) { HEX: 38 HEX: 04 } HEX: 66 2-operand-rm-sse ;
491 : PHSUBW     ( dest src -- ) { HEX: 38 HEX: 05 } HEX: 66 2-operand-rm-sse ;
492 : PHSUBD     ( dest src -- ) { HEX: 38 HEX: 06 } HEX: 66 2-operand-rm-sse ;
493 : PHSUBSW    ( dest src -- ) { HEX: 38 HEX: 07 } HEX: 66 2-operand-rm-sse ;
494 : PSIGNB     ( dest src -- ) { HEX: 38 HEX: 08 } HEX: 66 2-operand-rm-sse ;
495 : PSIGNW     ( dest src -- ) { HEX: 38 HEX: 09 } HEX: 66 2-operand-rm-sse ;
496 : PSIGND     ( dest src -- ) { HEX: 38 HEX: 0a } HEX: 66 2-operand-rm-sse ;
497 : PMULHRSW   ( dest src -- ) { HEX: 38 HEX: 0b } HEX: 66 2-operand-rm-sse ;
498 : PBLENDVB   ( dest src -- ) { HEX: 38 HEX: 10 } HEX: 66 2-operand-rm-sse ;
499 : BLENDVPS   ( dest src -- ) { HEX: 38 HEX: 14 } HEX: 66 2-operand-rm-sse ;
500 : BLENDVPD   ( dest src -- ) { HEX: 38 HEX: 15 } HEX: 66 2-operand-rm-sse ;
501 : PTEST      ( dest src -- ) { HEX: 38 HEX: 17 } HEX: 66 2-operand-rm-sse ;
502 : PABSB      ( dest src -- ) { HEX: 38 HEX: 1c } HEX: 66 2-operand-rm-sse ;
503 : PABSW      ( dest src -- ) { HEX: 38 HEX: 1d } HEX: 66 2-operand-rm-sse ;
504 : PABSD      ( dest src -- ) { HEX: 38 HEX: 1e } HEX: 66 2-operand-rm-sse ;
505 : PMOVSXBW   ( dest src -- ) { HEX: 38 HEX: 20 } HEX: 66 2-operand-rm-sse ;
506 : PMOVSXBD   ( dest src -- ) { HEX: 38 HEX: 21 } HEX: 66 2-operand-rm-sse ;
507 : PMOVSXBQ   ( dest src -- ) { HEX: 38 HEX: 22 } HEX: 66 2-operand-rm-sse ;
508 : PMOVSXWD   ( dest src -- ) { HEX: 38 HEX: 23 } HEX: 66 2-operand-rm-sse ;
509 : PMOVSXWQ   ( dest src -- ) { HEX: 38 HEX: 24 } HEX: 66 2-operand-rm-sse ;
510 : PMOVSXDQ   ( dest src -- ) { HEX: 38 HEX: 25 } HEX: 66 2-operand-rm-sse ;
511 : PMULDQ     ( dest src -- ) { HEX: 38 HEX: 28 } HEX: 66 2-operand-rm-sse ;
512 : PCMPEQQ    ( dest src -- ) { HEX: 38 HEX: 29 } HEX: 66 2-operand-rm-sse ;
513 : MOVNTDQA   ( dest src -- ) { HEX: 38 HEX: 2a } HEX: 66 2-operand-rm-sse ;
514 : PACKUSDW   ( dest src -- ) { HEX: 38 HEX: 2b } HEX: 66 2-operand-rm-sse ;
515 : PMOVZXBW   ( dest src -- ) { HEX: 38 HEX: 30 } HEX: 66 2-operand-rm-sse ;
516 : PMOVZXBD   ( dest src -- ) { HEX: 38 HEX: 31 } HEX: 66 2-operand-rm-sse ;
517 : PMOVZXBQ   ( dest src -- ) { HEX: 38 HEX: 32 } HEX: 66 2-operand-rm-sse ;
518 : PMOVZXWD   ( dest src -- ) { HEX: 38 HEX: 33 } HEX: 66 2-operand-rm-sse ;
519 : PMOVZXWQ   ( dest src -- ) { HEX: 38 HEX: 34 } HEX: 66 2-operand-rm-sse ;
520 : PMOVZXDQ   ( dest src -- ) { HEX: 38 HEX: 35 } HEX: 66 2-operand-rm-sse ;
521 : PCMPGTQ    ( dest src -- ) { HEX: 38 HEX: 37 } HEX: 66 2-operand-rm-sse ;
522 : PMINSB     ( dest src -- ) { HEX: 38 HEX: 38 } HEX: 66 2-operand-rm-sse ;
523 : PMINSD     ( dest src -- ) { HEX: 38 HEX: 39 } HEX: 66 2-operand-rm-sse ;
524 : PMINUW     ( dest src -- ) { HEX: 38 HEX: 3a } HEX: 66 2-operand-rm-sse ;
525 : PMINUD     ( dest src -- ) { HEX: 38 HEX: 3b } HEX: 66 2-operand-rm-sse ;
526 : PMAXSB     ( dest src -- ) { HEX: 38 HEX: 3c } HEX: 66 2-operand-rm-sse ;
527 : PMAXSD     ( dest src -- ) { HEX: 38 HEX: 3d } HEX: 66 2-operand-rm-sse ;
528 : PMAXUW     ( dest src -- ) { HEX: 38 HEX: 3e } HEX: 66 2-operand-rm-sse ;
529 : PMAXUD     ( dest src -- ) { HEX: 38 HEX: 3f } HEX: 66 2-operand-rm-sse ;
530 : PMULLD     ( dest src -- ) { HEX: 38 HEX: 40 } HEX: 66 2-operand-rm-sse ;
531 : PHMINPOSUW ( dest src -- ) { HEX: 38 HEX: 41 } HEX: 66 2-operand-rm-sse ;
532 : CRC32B     ( dest src -- ) { HEX: 38 HEX: f0 } HEX: f2 2-operand-rm-sse ;
533 : CRC32      ( dest src -- ) { HEX: 38 HEX: f1 } HEX: f2 2-operand-rm-sse ;
534
535 : ROUNDPS    ( dest src imm -- ) { HEX: 3a HEX: 08 } HEX: 66 3-operand-rm-sse ;
536 : ROUNDPD    ( dest src imm -- ) { HEX: 3a HEX: 09 } HEX: 66 3-operand-rm-sse ;
537 : ROUNDSS    ( dest src imm -- ) { HEX: 3a HEX: 0a } HEX: 66 3-operand-rm-sse ;
538 : ROUNDSD    ( dest src imm -- ) { HEX: 3a HEX: 0b } HEX: 66 3-operand-rm-sse ;
539 : BLENDPS    ( dest src imm -- ) { HEX: 3a HEX: 0c } HEX: 66 3-operand-rm-sse ;
540 : BLENDPD    ( dest src imm -- ) { HEX: 3a HEX: 0d } HEX: 66 3-operand-rm-sse ;
541 : PBLENDW    ( dest src imm -- ) { HEX: 3a HEX: 0e } HEX: 66 3-operand-rm-sse ;
542 : PALIGNR    ( dest src imm -- ) { HEX: 3a HEX: 0f } HEX: 66 3-operand-rm-sse ;
543
544 : PEXTRB     ( dest src imm -- ) { HEX: 3a HEX: 14 } HEX: 66 3-operand-mr-sse ;
545
546 <PRIVATE
547 : (PEXTRW-sse1) ( dest src imm -- ) HEX: c5 HEX: 66 3-operand-rm-sse ;
548 : (PEXTRW-sse4) ( dest src imm -- ) { HEX: 3a HEX: 15 } HEX: 66 3-operand-mr-sse ;
549 PRIVATE>
550
551 : PEXTRW     ( dest src imm -- ) pick indirect? [ (PEXTRW-sse4) ] [ (PEXTRW-sse1) ] if ;
552 : PEXTRD     ( dest src imm -- ) { HEX: 3a HEX: 16 } HEX: 66 3-operand-mr-sse ;
553 ALIAS: PEXTRQ PEXTRD
554 : EXTRACTPS  ( dest src imm -- ) { HEX: 3a HEX: 17 } HEX: 66 3-operand-mr-sse ;
555
556 : PINSRB     ( dest src imm -- ) { HEX: 3a HEX: 20 } HEX: 66 3-operand-rm-sse ;
557 : INSERTPS   ( dest src imm -- ) { HEX: 3a HEX: 21 } HEX: 66 3-operand-rm-sse ;
558 : PINSRD     ( dest src imm -- ) { HEX: 3a HEX: 22 } HEX: 66 3-operand-rm-sse ;
559 ALIAS: PINSRQ PINSRD
560 : DPPS       ( dest src imm -- ) { HEX: 3a HEX: 40 } HEX: 66 3-operand-rm-sse ;
561 : DPPD       ( dest src imm -- ) { HEX: 3a HEX: 41 } HEX: 66 3-operand-rm-sse ;
562 : MPSADBW    ( dest src imm -- ) { HEX: 3a HEX: 42 } HEX: 66 3-operand-rm-sse ;
563 : PCMPESTRM  ( dest src imm -- ) { HEX: 3a HEX: 60 } HEX: 66 3-operand-rm-sse ;
564 : PCMPESTRI  ( dest src imm -- ) { HEX: 3a HEX: 61 } HEX: 66 3-operand-rm-sse ;
565 : PCMPISTRM  ( dest src imm -- ) { HEX: 3a HEX: 62 } HEX: 66 3-operand-rm-sse ;
566 : PCMPISTRI  ( dest src imm -- ) { HEX: 3a HEX: 63 } HEX: 66 3-operand-rm-sse ;
567
568 : MOVMSKPS   ( dest src -- ) HEX: 50 f       2-operand-int/sse ;
569 : MOVMSKPD   ( dest src -- ) HEX: 50 HEX: 66 2-operand-int/sse ;
570 : SQRTPS     ( dest src -- ) HEX: 51 f       2-operand-rm-sse ;
571 : SQRTPD     ( dest src -- ) HEX: 51 HEX: 66 2-operand-rm-sse ;
572 : SQRTSD     ( dest src -- ) HEX: 51 HEX: f2 2-operand-rm-sse ;
573 : SQRTSS     ( dest src -- ) HEX: 51 HEX: f3 2-operand-rm-sse ;
574 : RSQRTPS    ( dest src -- ) HEX: 52 f       2-operand-rm-sse ;
575 : RSQRTSS    ( dest src -- ) HEX: 52 HEX: f3 2-operand-rm-sse ;
576 : RCPPS      ( dest src -- ) HEX: 53 f       2-operand-rm-sse ;
577 : RCPSS      ( dest src -- ) HEX: 53 HEX: f3 2-operand-rm-sse ;
578 : ANDPS      ( dest src -- ) HEX: 54 f       2-operand-rm-sse ;
579 : ANDPD      ( dest src -- ) HEX: 54 HEX: 66 2-operand-rm-sse ;
580 : ANDNPS     ( dest src -- ) HEX: 55 f       2-operand-rm-sse ;
581 : ANDNPD     ( dest src -- ) HEX: 55 HEX: 66 2-operand-rm-sse ;
582 : ORPS       ( dest src -- ) HEX: 56 f       2-operand-rm-sse ;
583 : ORPD       ( dest src -- ) HEX: 56 HEX: 66 2-operand-rm-sse ;
584 : XORPS      ( dest src -- ) HEX: 57 f       2-operand-rm-sse ;
585 : XORPD      ( dest src -- ) HEX: 57 HEX: 66 2-operand-rm-sse ;
586 : ADDPS      ( dest src -- ) HEX: 58 f       2-operand-rm-sse ;
587 : ADDPD      ( dest src -- ) HEX: 58 HEX: 66 2-operand-rm-sse ;
588 : ADDSD      ( dest src -- ) HEX: 58 HEX: f2 2-operand-rm-sse ;
589 : ADDSS      ( dest src -- ) HEX: 58 HEX: f3 2-operand-rm-sse ;
590 : MULPS      ( dest src -- ) HEX: 59 f       2-operand-rm-sse ;
591 : MULPD      ( dest src -- ) HEX: 59 HEX: 66 2-operand-rm-sse ;
592 : MULSD      ( dest src -- ) HEX: 59 HEX: f2 2-operand-rm-sse ;
593 : MULSS      ( dest src -- ) HEX: 59 HEX: f3 2-operand-rm-sse ;
594 : CVTPS2PD   ( dest src -- ) HEX: 5a f       2-operand-rm-sse ;
595 : CVTPD2PS   ( dest src -- ) HEX: 5a HEX: 66 2-operand-rm-sse ;
596 : CVTSD2SS   ( dest src -- ) HEX: 5a HEX: f2 2-operand-rm-sse ;
597 : CVTSS2SD   ( dest src -- ) HEX: 5a HEX: f3 2-operand-rm-sse ;
598 : CVTDQ2PS   ( dest src -- ) HEX: 5b f       2-operand-rm-sse ;
599 : CVTPS2DQ   ( dest src -- ) HEX: 5b HEX: 66 2-operand-rm-sse ;
600 : CVTTPS2DQ  ( dest src -- ) HEX: 5b HEX: f3 2-operand-rm-sse ;
601 : SUBPS      ( dest src -- ) HEX: 5c f       2-operand-rm-sse ;
602 : SUBPD      ( dest src -- ) HEX: 5c HEX: 66 2-operand-rm-sse ;
603 : SUBSD      ( dest src -- ) HEX: 5c HEX: f2 2-operand-rm-sse ;
604 : SUBSS      ( dest src -- ) HEX: 5c HEX: f3 2-operand-rm-sse ;
605 : MINPS      ( dest src -- ) HEX: 5d f       2-operand-rm-sse ;
606 : MINPD      ( dest src -- ) HEX: 5d HEX: 66 2-operand-rm-sse ;
607 : MINSD      ( dest src -- ) HEX: 5d HEX: f2 2-operand-rm-sse ;
608 : MINSS      ( dest src -- ) HEX: 5d HEX: f3 2-operand-rm-sse ;
609 : DIVPS      ( dest src -- ) HEX: 5e f       2-operand-rm-sse ;
610 : DIVPD      ( dest src -- ) HEX: 5e HEX: 66 2-operand-rm-sse ;
611 : DIVSD      ( dest src -- ) HEX: 5e HEX: f2 2-operand-rm-sse ;
612 : DIVSS      ( dest src -- ) HEX: 5e HEX: f3 2-operand-rm-sse ;
613 : MAXPS      ( dest src -- ) HEX: 5f f       2-operand-rm-sse ;
614 : MAXPD      ( dest src -- ) HEX: 5f HEX: 66 2-operand-rm-sse ;
615 : MAXSD      ( dest src -- ) HEX: 5f HEX: f2 2-operand-rm-sse ;
616 : MAXSS      ( dest src -- ) HEX: 5f HEX: f3 2-operand-rm-sse ;
617 : PUNPCKLBW  ( dest src -- ) HEX: 60 HEX: 66 2-operand-rm-sse ;
618 : PUNPCKLWD  ( dest src -- ) HEX: 61 HEX: 66 2-operand-rm-sse ;
619 : PUNPCKLDQ  ( dest src -- ) HEX: 62 HEX: 66 2-operand-rm-sse ;
620 : PACKSSWB   ( dest src -- ) HEX: 63 HEX: 66 2-operand-rm-sse ;
621 : PCMPGTB    ( dest src -- ) HEX: 64 HEX: 66 2-operand-rm-sse ;
622 : PCMPGTW    ( dest src -- ) HEX: 65 HEX: 66 2-operand-rm-sse ;
623 : PCMPGTD    ( dest src -- ) HEX: 66 HEX: 66 2-operand-rm-sse ;
624 : PACKUSWB   ( dest src -- ) HEX: 67 HEX: 66 2-operand-rm-sse ;
625 : PUNPCKHBW  ( dest src -- ) HEX: 68 HEX: 66 2-operand-rm-sse ;
626 : PUNPCKHWD  ( dest src -- ) HEX: 69 HEX: 66 2-operand-rm-sse ;
627 : PUNPCKHDQ  ( dest src -- ) HEX: 6a HEX: 66 2-operand-rm-sse ;
628 : PACKSSDW   ( dest src -- ) HEX: 6b HEX: 66 2-operand-rm-sse ;
629 : PUNPCKLQDQ ( dest src -- ) HEX: 6c HEX: 66 2-operand-rm-sse ;
630 : PUNPCKHQDQ ( dest src -- ) HEX: 6d HEX: 66 2-operand-rm-sse ;
631
632 : MOVD       ( dest src -- ) { HEX: 6e HEX: 7e } HEX: 66 2-operand-rm-mr-sse ;
633 : MOVDQA     ( dest src -- ) { HEX: 6f HEX: 7f } HEX: 66 2-operand-rm-mr-sse ;
634 : MOVDQU     ( dest src -- ) { HEX: 6f HEX: 7f } HEX: f3 2-operand-rm-mr-sse ;
635
636 <PRIVATE
637
638 : 2shuffler ( indexes/mask -- mask )
639     dup integer? [ first2 { 1 0 } bitfield ] unless ;
640 : 4shuffler ( indexes/mask -- mask )
641     dup integer? [ first4 { 6 4 2 0 } bitfield ] unless ;
642
643 PRIVATE>
644
645 : PSHUFD     ( dest src imm -- ) 4shuffler HEX: 70 HEX: 66 3-operand-rm-sse ;
646 : PSHUFLW    ( dest src imm -- ) 4shuffler HEX: 70 HEX: f2 3-operand-rm-sse ;
647 : PSHUFHW    ( dest src imm -- ) 4shuffler HEX: 70 HEX: f3 3-operand-rm-sse ;
648
649 <PRIVATE
650
651 : (PSRLW-imm) ( dest imm -- ) BIN: 010 HEX: 71 HEX: 66 2-operand-sse-shift ;
652 : (PSRAW-imm) ( dest imm -- ) BIN: 100 HEX: 71 HEX: 66 2-operand-sse-shift ;
653 : (PSLLW-imm) ( dest imm -- ) BIN: 110 HEX: 71 HEX: 66 2-operand-sse-shift ;
654 : (PSRLD-imm) ( dest imm -- ) BIN: 010 HEX: 72 HEX: 66 2-operand-sse-shift ;
655 : (PSRAD-imm) ( dest imm -- ) BIN: 100 HEX: 72 HEX: 66 2-operand-sse-shift ;
656 : (PSLLD-imm) ( dest imm -- ) BIN: 110 HEX: 72 HEX: 66 2-operand-sse-shift ;
657 : (PSRLQ-imm) ( dest imm -- ) BIN: 010 HEX: 73 HEX: 66 2-operand-sse-shift ;
658 : (PSLLQ-imm) ( dest imm -- ) BIN: 110 HEX: 73 HEX: 66 2-operand-sse-shift ;
659
660 : (PSRLW-reg) ( dest src -- ) HEX: d1 HEX: 66 2-operand-rm-sse ;
661 : (PSRLD-reg) ( dest src -- ) HEX: d2 HEX: 66 2-operand-rm-sse ;
662 : (PSRLQ-reg) ( dest src -- ) HEX: d3 HEX: 66 2-operand-rm-sse ;
663 : (PSRAW-reg) ( dest src -- ) HEX: e1 HEX: 66 2-operand-rm-sse ;
664 : (PSRAD-reg) ( dest src -- ) HEX: e2 HEX: 66 2-operand-rm-sse ;
665 : (PSLLW-reg) ( dest src -- ) HEX: f1 HEX: 66 2-operand-rm-sse ;
666 : (PSLLD-reg) ( dest src -- ) HEX: f2 HEX: 66 2-operand-rm-sse ;
667 : (PSLLQ-reg) ( dest src -- ) HEX: f3 HEX: 66 2-operand-rm-sse ;
668
669 PRIVATE>
670
671 : PSRLW ( dest src -- ) dup integer? [ (PSRLW-imm) ] [ (PSRLW-reg) ] if ;
672 : PSRAW ( dest src -- ) dup integer? [ (PSRAW-imm) ] [ (PSRAW-reg) ] if ;
673 : PSLLW ( dest src -- ) dup integer? [ (PSLLW-imm) ] [ (PSLLW-reg) ] if ;
674 : PSRLD ( dest src -- ) dup integer? [ (PSRLD-imm) ] [ (PSRLD-reg) ] if ;
675 : PSRAD ( dest src -- ) dup integer? [ (PSRAD-imm) ] [ (PSRAD-reg) ] if ;
676 : PSLLD ( dest src -- ) dup integer? [ (PSLLD-imm) ] [ (PSLLD-reg) ] if ;
677 : PSRLQ ( dest src -- ) dup integer? [ (PSRLQ-imm) ] [ (PSRLQ-reg) ] if ;
678 : PSLLQ ( dest src -- ) dup integer? [ (PSLLQ-imm) ] [ (PSLLQ-reg) ] if ;
679
680 : PSRLDQ     ( dest imm -- ) BIN: 011 HEX: 73 HEX: 66 2-operand-sse-shift ;
681 : PSLLDQ     ( dest imm -- ) BIN: 111 HEX: 73 HEX: 66 2-operand-sse-shift ;
682
683 : PCMPEQB    ( dest src -- ) HEX: 74 HEX: 66 2-operand-rm-sse ;
684 : PCMPEQW    ( dest src -- ) HEX: 75 HEX: 66 2-operand-rm-sse ;
685 : PCMPEQD    ( dest src -- ) HEX: 76 HEX: 66 2-operand-rm-sse ;
686 : HADDPD     ( dest src -- ) HEX: 7c HEX: 66 2-operand-rm-sse ;
687 : HADDPS     ( dest src -- ) HEX: 7c HEX: f2 2-operand-rm-sse ;
688 : HSUBPD     ( dest src -- ) HEX: 7d HEX: 66 2-operand-rm-sse ;
689 : HSUBPS     ( dest src -- ) HEX: 7d HEX: f2 2-operand-rm-sse ;
690
691 : FXSAVE     ( dest -- ) { BIN: 000 f { HEX: 0f HEX: ae } } 1-operand ;
692 : FXRSTOR    ( src -- )  { BIN: 001 f { HEX: 0f HEX: ae } } 1-operand ;
693 : LDMXCSR    ( src -- )  { BIN: 010 f { HEX: 0f HEX: ae } } 1-operand ;
694 : STMXCSR    ( dest -- ) { BIN: 011 f { HEX: 0f HEX: ae } } 1-operand ;
695 : LFENCE     ( -- ) HEX: 0f , HEX: ae , OCT: 350 , ;
696 : MFENCE     ( -- ) HEX: 0f , HEX: ae , OCT: 360 , ;
697 : SFENCE     ( -- ) HEX: 0f , HEX: ae , OCT: 370 , ;
698 : CLFLUSH    ( dest -- ) { BIN: 111 f { HEX: 0f HEX: ae } } 1-operand ;
699
700 : POPCNT     ( dest src -- ) HEX: b8 HEX: f3 2-operand-rm-sse ;
701
702 : CMPEQPS    ( dest src -- ) 0 HEX: c2 f       2-operand-sse-cmp ;
703 : CMPLTPS    ( dest src -- ) 1 HEX: c2 f       2-operand-sse-cmp ;
704 : CMPLEPS    ( dest src -- ) 2 HEX: c2 f       2-operand-sse-cmp ;
705 : CMPUNORDPS ( dest src -- ) 3 HEX: c2 f       2-operand-sse-cmp ;
706 : CMPNEQPS   ( dest src -- ) 4 HEX: c2 f       2-operand-sse-cmp ;
707 : CMPNLTPS   ( dest src -- ) 5 HEX: c2 f       2-operand-sse-cmp ;
708 : CMPNLEPS   ( dest src -- ) 6 HEX: c2 f       2-operand-sse-cmp ;
709 : CMPORDPS   ( dest src -- ) 7 HEX: c2 f       2-operand-sse-cmp ;
710
711 : CMPEQPD    ( dest src -- ) 0 HEX: c2 HEX: 66 2-operand-sse-cmp ;
712 : CMPLTPD    ( dest src -- ) 1 HEX: c2 HEX: 66 2-operand-sse-cmp ;
713 : CMPLEPD    ( dest src -- ) 2 HEX: c2 HEX: 66 2-operand-sse-cmp ;
714 : CMPUNORDPD ( dest src -- ) 3 HEX: c2 HEX: 66 2-operand-sse-cmp ;
715 : CMPNEQPD   ( dest src -- ) 4 HEX: c2 HEX: 66 2-operand-sse-cmp ;
716 : CMPNLTPD   ( dest src -- ) 5 HEX: c2 HEX: 66 2-operand-sse-cmp ;
717 : CMPNLEPD   ( dest src -- ) 6 HEX: c2 HEX: 66 2-operand-sse-cmp ;
718 : CMPORDPD   ( dest src -- ) 7 HEX: c2 HEX: 66 2-operand-sse-cmp ;
719
720 : CMPEQSD    ( dest src -- ) 0 HEX: c2 HEX: f2 2-operand-sse-cmp ;
721 : CMPLTSD    ( dest src -- ) 1 HEX: c2 HEX: f2 2-operand-sse-cmp ;
722 : CMPLESD    ( dest src -- ) 2 HEX: c2 HEX: f2 2-operand-sse-cmp ;
723 : CMPUNORDSD ( dest src -- ) 3 HEX: c2 HEX: f2 2-operand-sse-cmp ;
724 : CMPNEQSD   ( dest src -- ) 4 HEX: c2 HEX: f2 2-operand-sse-cmp ;
725 : CMPNLTSD   ( dest src -- ) 5 HEX: c2 HEX: f2 2-operand-sse-cmp ;
726 : CMPNLESD   ( dest src -- ) 6 HEX: c2 HEX: f2 2-operand-sse-cmp ;
727 : CMPORDSD   ( dest src -- ) 7 HEX: c2 HEX: f2 2-operand-sse-cmp ;
728
729 : CMPEQSS    ( dest src -- ) 0 HEX: c2 HEX: f3 2-operand-sse-cmp ;
730 : CMPLTSS    ( dest src -- ) 1 HEX: c2 HEX: f3 2-operand-sse-cmp ;
731 : CMPLESS    ( dest src -- ) 2 HEX: c2 HEX: f3 2-operand-sse-cmp ;
732 : CMPUNORDSS ( dest src -- ) 3 HEX: c2 HEX: f3 2-operand-sse-cmp ;
733 : CMPNEQSS   ( dest src -- ) 4 HEX: c2 HEX: f3 2-operand-sse-cmp ;
734 : CMPNLTSS   ( dest src -- ) 5 HEX: c2 HEX: f3 2-operand-sse-cmp ;
735 : CMPNLESS   ( dest src -- ) 6 HEX: c2 HEX: f3 2-operand-sse-cmp ;
736 : CMPORDSS   ( dest src -- ) 7 HEX: c2 HEX: f3 2-operand-sse-cmp ;
737
738 : MOVNTI     ( dest src -- ) swap { HEX: 0f HEX: c3 } (2-operand) ;
739
740 : PINSRW     ( dest src imm -- ) HEX: c4 HEX: 66 3-operand-rm-sse ;
741 : SHUFPS     ( dest src imm -- ) 4shuffler HEX: c6 f       3-operand-rm-sse ;
742 : SHUFPD     ( dest src imm -- ) 2shuffler HEX: c6 HEX: 66 3-operand-rm-sse ;
743
744 : ADDSUBPD   ( dest src -- ) HEX: d0 HEX: 66 2-operand-rm-sse ;
745 : ADDSUBPS   ( dest src -- ) HEX: d0 HEX: f2 2-operand-rm-sse ;
746 : PADDQ      ( dest src -- ) HEX: d4 HEX: 66 2-operand-rm-sse ;
747 : PMULLW     ( dest src -- ) HEX: d5 HEX: 66 2-operand-rm-sse ;
748 : PMOVMSKB   ( dest src -- ) HEX: d7 HEX: 66 2-operand-rm-sse ;
749 : PSUBUSB    ( dest src -- ) HEX: d8 HEX: 66 2-operand-rm-sse ;
750 : PSUBUSW    ( dest src -- ) HEX: d9 HEX: 66 2-operand-rm-sse ;
751 : PMINUB     ( dest src -- ) HEX: da HEX: 66 2-operand-rm-sse ;
752 : PAND       ( dest src -- ) HEX: db HEX: 66 2-operand-rm-sse ;
753 : PADDUSB    ( dest src -- ) HEX: dc HEX: 66 2-operand-rm-sse ;
754 : PADDUSW    ( dest src -- ) HEX: dd HEX: 66 2-operand-rm-sse ;
755 : PMAXUB     ( dest src -- ) HEX: de HEX: 66 2-operand-rm-sse ;
756 : PANDN      ( dest src -- ) HEX: df HEX: 66 2-operand-rm-sse ;
757 : PAVGB      ( dest src -- ) HEX: e0 HEX: 66 2-operand-rm-sse ;
758 : PAVGW      ( dest src -- ) HEX: e3 HEX: 66 2-operand-rm-sse ;
759 : PMULHUW    ( dest src -- ) HEX: e4 HEX: 66 2-operand-rm-sse ;
760 : PMULHW     ( dest src -- ) HEX: e5 HEX: 66 2-operand-rm-sse ;
761 : CVTTPD2DQ  ( dest src -- ) HEX: e6 HEX: 66 2-operand-rm-sse ;
762 : CVTPD2DQ   ( dest src -- ) HEX: e6 HEX: f2 2-operand-rm-sse ;
763 : CVTDQ2PD   ( dest src -- ) HEX: e6 HEX: f3 2-operand-rm-sse ;
764
765 : MOVNTDQ    ( dest src -- ) HEX: e7 HEX: 66 2-operand-mr-sse ;
766
767 : PSUBSB     ( dest src -- ) HEX: e8 HEX: 66 2-operand-rm-sse ;
768 : PSUBSW     ( dest src -- ) HEX: e9 HEX: 66 2-operand-rm-sse ;
769 : PMINSW     ( dest src -- ) HEX: ea HEX: 66 2-operand-rm-sse ;
770 : POR        ( dest src -- ) HEX: eb HEX: 66 2-operand-rm-sse ;
771 : PADDSB     ( dest src -- ) HEX: ec HEX: 66 2-operand-rm-sse ;
772 : PADDSW     ( dest src -- ) HEX: ed HEX: 66 2-operand-rm-sse ;
773 : PMAXSW     ( dest src -- ) HEX: ee HEX: 66 2-operand-rm-sse ;
774 : PXOR       ( dest src -- ) HEX: ef HEX: 66 2-operand-rm-sse ;
775 : LDDQU      ( dest src -- ) HEX: f0 HEX: f2 2-operand-rm-sse ;
776 : PMULUDQ    ( dest src -- ) HEX: f4 HEX: 66 2-operand-rm-sse ;
777 : PMADDWD    ( dest src -- ) HEX: f5 HEX: 66 2-operand-rm-sse ;
778 : PSADBW     ( dest src -- ) HEX: f6 HEX: 66 2-operand-rm-sse ;
779 : MASKMOVDQU ( dest src -- ) HEX: f7 HEX: 66 2-operand-rm-sse ;
780 : PSUBB      ( dest src -- ) HEX: f8 HEX: 66 2-operand-rm-sse ;
781 : PSUBW      ( dest src -- ) HEX: f9 HEX: 66 2-operand-rm-sse ;
782 : PSUBD      ( dest src -- ) HEX: fa HEX: 66 2-operand-rm-sse ;
783 : PSUBQ      ( dest src -- ) HEX: fb HEX: 66 2-operand-rm-sse ;
784 : PADDB      ( dest src -- ) HEX: fc HEX: 66 2-operand-rm-sse ;
785 : PADDW      ( dest src -- ) HEX: fd HEX: 66 2-operand-rm-sse ;
786 : PADDD      ( dest src -- ) HEX: fe HEX: 66 2-operand-rm-sse ;
787
788 ! x86-64 branch prediction hints
789
790 : HWNT ( -- ) HEX: 2e , ; ! Hint branch Weakly Not Taken
791 : HST  ( -- ) HEX: 3e , ; ! Hint branch Strongly Taken