1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
204
205
206
207
208
209
210
211
212
213
214
215
216
217
218
219
220
221
222
223
224
225
226
227
228
229
230
231
232
233
234
235
236
237
238
239
240
241
242
243
244
245
246
247
248
249
250
251
252
253
254
255
256
257
258
259
260
261
262
263
264
265
266
267
268
269
270
271
272
273
274
275
276
277
278
279
280
281
282
283
284
285
286
287
288
289
290
291
292
293
294
295
296
297
298
299
300
301
302
303
304
305
306
307
308
309
310
311
312
313
314
315
316
317
318
319
320
321
322
323
324
325
326
327
328
329
330
331
332
333
334
335
336
337
338
339
340
341
342
343
344
345
346
347
348
349
350
351
352
353
354
355
356
357
358
359
360
361
362
363
364
365
366
367
368
369
370
371
372
373
374
375
376
377
378
379
380
381
382
383
384
385
386
387
388
389
390
391
392
393
394
395
396
397
398
399
400
401
402
403
404
405
406
407
408
409
410
411
412
413
414
415
416
417
418
419
420
421
422
423
424
425
426
427
428
429
430
431
432
433
434
435
436
437
438
439
440
441
442
443
444
445
446
447
448
449
450
451
452
453
454
455
456
457
458
459
460
461
462
463
464
465
466
467
468
469
470
471
472
473
474
475
476
477
478
479
480
481
482
483
484
485
486
487
488
489
490
491
492
493
494
495
496
497
498
499
500
501
502
503
504
505
506
507
508
509
510
511
512
513
514
515
516
517
518
519
520
521
522
523
524
525
526
527
528
529
530
531
532
533
534
535
536
537
538
539
540
541
542
543
544
545
546
547
548
549
550
551
552
553
554
555
556
557
558
559
560
561
562
563
564
565
566
567
568
569
570
571
572
573
574
575
576
577
578
579
580
581
582
583
584
|
// RUN: llvm-mc -triple x86_64-unknown-unknown --show-encoding %s | FileCheck %s
//////////////////////////
// 2 operand instructions
/////////////////////////
// vphsubwd
// CHECK: vphsubwd (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe2,0x0c,0x01]
vphsubwd (%rcx,%rax), %xmm1
// CHECK: vphsubwd %xmm0, %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe2,0xc8]
vphsubwd %xmm0, %xmm1
// vphsubdq
// CHECK: vphsubdq (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe3,0x0c,0x01]
vphsubdq (%rcx,%rax), %xmm1
// CHECK: vphsubdq %xmm0, %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe3,0xc8]
vphsubdq %xmm0, %xmm1
// vphsubbw
// CHECK: vphsubbw (%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe1,0x08]
vphsubbw (%rax), %xmm1
// CHECK: vphsubbw %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xe1,0xca]
vphsubbw %xmm2, %xmm1
// vphaddwq
// CHECK: vphaddwq (%rcx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xc7,0x21]
vphaddwq (%rcx), %xmm4
// CHECK: vphaddwq %xmm6, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0xc7,0xd6]
vphaddwq %xmm6, %xmm2
// vphaddwd
// CHECK: vphaddwd (%rdx,%rax), %xmm7
// CHECK: encoding: [0x8f,0xe9,0x78,0xc6,0x3c,0x02]
vphaddwd (%rdx,%rax), %xmm7
// CHECK: vphaddwd %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xc6,0xe3]
vphaddwd %xmm3, %xmm4
// vphadduwq
// CHECK: vphadduwq (%rcx,%rax), %xmm6
// CHECK: encoding: [0x8f,0xe9,0x78,0xd7,0x34,0x01]
vphadduwq (%rcx,%rax), %xmm6
// CHECK: vphadduwq %xmm7, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0xd7,0xc7]
vphadduwq %xmm7, %xmm0
// vphadduwd
// CHECK: vphadduwd (%rax), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x78,0xd6,0x28]
vphadduwd (%rax), %xmm5
// CHECK: vphadduwd %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xd6,0xca]
vphadduwd %xmm2, %xmm1
// vphaddudq
// CHECK: vphaddudq 8(%rcx,%rax), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xdb,0x64,0x01,0x08]
vphaddudq 8(%rcx,%rax), %xmm4
// CHECK: vphaddudq %xmm6, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0xdb,0xd6]
vphaddudq %xmm6, %xmm2
// vphaddubw
// CHECK: vphaddubw (%rcx), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x78,0xd1,0x19]
vphaddubw (%rcx), %xmm3
// CHECK: vphaddubw %xmm5, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0xd1,0xc5]
vphaddubw %xmm5, %xmm0
// vphaddubq
// CHECK: vphaddubq (%rcx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xd3,0x21]
vphaddubq (%rcx), %xmm4
// CHECK: vphaddubq %xmm2, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0xd3,0xd2]
vphaddubq %xmm2, %xmm2
// vphaddubd
// CHECK: vphaddubd (%rax), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x78,0xd2,0x28]
vphaddubd (%rax), %xmm5
// CHECK: vphaddubd %xmm5, %xmm7
// CHECK: encoding: [0x8f,0xe9,0x78,0xd2,0xfd]
vphaddubd %xmm5, %xmm7
// vphadddq
// CHECK: vphadddq (%rdx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x78,0xcb,0x22]
vphadddq (%rdx), %xmm4
// CHECK: vphadddq %xmm4, %xmm5
// CHECK: encoding: [0x8f,0xe9,0x78,0xcb,0xec]
vphadddq %xmm4, %xmm5
// vphaddbw
// CHECK: vphaddbw (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xc1,0x0c,0x01]
vphaddbw (%rcx,%rax), %xmm1
// CHECK: vphaddbw %xmm5, %xmm6
// CHECK: encoding: [0x8f,0xe9,0x78,0xc1,0xf5]
vphaddbw %xmm5, %xmm6
// vphaddbq
// CHECK: vphaddbq (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xc3,0x0c,0x01]
vphaddbq (%rcx,%rax), %xmm1
// CHECK: vphaddbq %xmm2, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0xc3,0xc2]
vphaddbq %xmm2, %xmm0
// vphaddbd
// CHECK: vphaddbd (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0xc2,0x0c,0x01]
vphaddbd (%rcx,%rax), %xmm1
// CHECK: vphaddbd %xmm1, %xmm3
// CHECK: encoding: [0x8f,0xe9,0x78,0xc2,0xd9]
vphaddbd %xmm1, %xmm3
// vfrczss
// CHECK: vfrczss (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0x82,0x0c,0x01]
vfrczss (%rcx,%rax), %xmm1
// CHECK: vfrczss %xmm5, %xmm7
// CHECK: encoding: [0x8f,0xe9,0x78,0x82,0xfd]
vfrczss %xmm5, %xmm7
// vfrczsd
// CHECK: vfrczsd (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0x83,0x0c,0x01]
vfrczsd (%rcx,%rax), %xmm1
// CHECK: vfrczsd %xmm7, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0x83,0xc7]
vfrczsd %xmm7, %xmm0
// vfrczps
// CHECK: vfrczps 4(%rax), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x78,0x80,0x58,0x04]
vfrczps 4(%rax), %xmm3
// CHECK: vfrczps %xmm6, %xmm5
// CHECK: encoding: [0x8f,0xe9,0x78,0x80,0xee]
vfrczps %xmm6, %xmm5
// CHECK: vfrczps (%rcx), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0x80,0x09]
vfrczps (%rcx), %xmm1
// CHECK: vfrczps %ymm2, %ymm4
// CHECK: encoding: [0x8f,0xe9,0x7c,0x80,0xe2]
vfrczps %ymm2, %ymm4
// vfrczpd
// CHECK: vfrczpd (%rcx,%rax), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x78,0x81,0x0c,0x01]
vfrczpd (%rcx,%rax), %xmm1
// CHECK: vfrczpd %xmm7, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x78,0x81,0xc7]
vfrczpd %xmm7, %xmm0
// CHECK: vfrczpd (%rcx,%rax), %ymm2
// CHECK: encoding: [0x8f,0xe9,0x7c,0x81,0x14,0x01]
vfrczpd (%rcx,%rax), %ymm2
// CHECK: vfrczpd %ymm5, %ymm3
// CHECK: encoding: [0x8f,0xe9,0x7c,0x81,0xdd]
vfrczpd %ymm5, %ymm3
//////////////////////////
// 3 operand instructions
/////////////////////////
// vpshlw
// CHECK: vpshlw %xmm0, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0x95,0xd1]
vpshlw %xmm0, %xmm1, %xmm2
// CHECK: vpshlw (%rax), %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0xf0,0x95,0x10]
vpshlw (%rax), %xmm1, %xmm2
// CHECK: vpshlw %xmm0, (%rax,%rcx), %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0x95,0x14,0x08]
vpshlw %xmm0, (%rax,%rcx), %xmm2
// vpshlq
// CHECK: vpshlq %xmm2, %xmm4, %xmm6
// CHECK: encoding: [0x8f,0xe9,0x68,0x97,0xf4]
vpshlq %xmm2, %xmm4, %xmm6
// CHECK: vpshlq (%rcx), %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe9,0xe8,0x97,0x09]
vpshlq (%rcx), %xmm2, %xmm1
// CHECK: vpshlq %xmm5, (%rdx,%rcx), %xmm6
// CHECK: encoding: [0x8f,0xe9,0x50,0x97,0x34,0x0a]
vpshlq %xmm5, (%rdx,%rcx), %xmm6
// vpshld
// CHECK: vpshld %xmm7, %xmm5, %xmm3
// CHECK: encoding: [0x8f,0xe9,0x40,0x96,0xdd]
vpshld %xmm7, %xmm5, %xmm3
// CHECK: vpshld 4(%rax), %xmm3, %xmm3
// CHECK: encoding: [0x8f,0xe9,0xe0,0x96,0x58,0x04]
vpshld 4(%rax), %xmm3, %xmm3
// CHECK: vpshld %xmm1, (%rax,%rcx), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x70,0x96,0x2c,0x08]
vpshld %xmm1, (%rax,%rcx), %xmm5
// vpshlb
// CHECK: vpshlb %xmm1, %xmm2, %xmm3
// CHECK: encoding: [0x8f,0xe9,0x70,0x94,0xda]
vpshlb %xmm1, %xmm2, %xmm3
// CHECK: vpshlb (%rcx), %xmm0, %xmm7
// CHECK: encoding: [0x8f,0xe9,0xf8,0x94,0x39]
vpshlb (%rcx), %xmm0, %xmm7
// CHECK: vpshlb %xmm2, (%rax,%rdx), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x68,0x94,0x1c,0x10]
vpshlb %xmm2, (%rax,%rdx), %xmm3
// vpshaw
// CHECK: vpshaw %xmm7, %xmm5, %xmm3
// CHECK: encoding: [0x8f,0xe9,0x40,0x99,0xdd]
vpshaw %xmm7, %xmm5, %xmm3
// CHECK: vpshaw (%rax), %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe9,0xe8,0x99,0x08]
vpshaw (%rax), %xmm2, %xmm1
// CHECK: vpshaw %xmm0, 8(%rax,%rcx), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x78,0x99,0x5c,0x08,0x08]
vpshaw %xmm0, 8(%rax,%rcx), %xmm3
// vpshaq
// CHECK: vpshaq %xmm4, %xmm4, %xmm4
// CHECK: encoding: [0x8f,0xe9,0x58,0x9b,0xe4]
vpshaq %xmm4, %xmm4, %xmm4
// CHECK: vpshaq (%rcx), %xmm2, %xmm0
// CHECK: encoding: [0x8f,0xe9,0xe8,0x9b,0x01]
vpshaq (%rcx), %xmm2, %xmm0
// CHECK: vpshaq %xmm6, (%rax,%rcx), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x48,0x9b,0x2c,0x08]
vpshaq %xmm6, (%rax,%rcx), %xmm5
// vpshad
// CHECK: vpshad %xmm5, %xmm4, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x50,0x9a,0xc4]
vpshad %xmm5, %xmm4, %xmm0
// CHECK: vpshad (%rax), %xmm2, %xmm5
// CHECK: encoding: [0x8f,0xe9,0xe8,0x9a,0x28]
vpshad (%rax), %xmm2, %xmm5
// CHECK: vpshad %xmm2, (%rax), %xmm5
// CHECK: encoding: [0x8f,0xe9,0x68,0x9a,0x28]
vpshad %xmm2, (%rax), %xmm5
// vpshab
// CHECK: vpshab %xmm1, %xmm1, %xmm0
// CHECK: encoding: [0x8f,0xe9,0x70,0x98,0xc1]
vpshab %xmm1, %xmm1, %xmm0
// CHECK: vpshab (%rcx), %xmm4, %xmm0
// CHECK: encoding: [0x8f,0xe9,0xd8,0x98,0x01]
vpshab (%rcx), %xmm4, %xmm0
// CHECK: vpshab %xmm5, (%rcx), %xmm3
// CHECK: encoding: [0x8f,0xe9,0x50,0x98,0x19]
vpshab %xmm5, (%rcx), %xmm3
// vprotw
// CHECK: vprotw (%rax), %xmm3, %xmm6
// CHECK: encoding: [0x8f,0xe9,0xe0,0x91,0x30]
vprotw (%rax), %xmm3, %xmm6
// CHECK: vprotw %xmm5, (%rax,%rcx), %xmm1
// CHECK: encoding: [0x8f,0xe9,0x50,0x91,0x0c,0x08]
vprotw %xmm5, (%rax,%rcx), %xmm1
// CHECK: vprotw %xmm0, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0x91,0xd1]
vprotw %xmm0, %xmm1, %xmm2
// CHECK: vprotw $42, (%rcx), %xmm1
// CHECK: encoding: [0x8f,0xe8,0x78,0xc1,0x09,0x2a]
vprotw $42, (%rcx), %xmm1
// CHECK: vprotw $41, (%rax), %xmm4
// CHECK: encoding: [0x8f,0xe8,0x78,0xc1,0x20,0x29]
vprotw $41, (%rax), %xmm4
// CHECK: vprotw $40, %xmm1, %xmm3
// CHECK: encoding: [0x8f,0xe8,0x78,0xc1,0xd9,0x28]
vprotw $40, %xmm1, %xmm3
// vprotq
// CHECK: vprotq (%rax), %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0xf0,0x93,0x10]
vprotq (%rax), %xmm1, %xmm2
// CHECK: vprotq (%rax,%rcx), %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0xf0,0x93,0x14,0x08]
vprotq (%rax,%rcx), %xmm1, %xmm2
// CHECK: vprotq %xmm0, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x78,0x93,0xd1]
vprotq %xmm0, %xmm1, %xmm2
// CHECK: vprotq $42, (%rax), %xmm2
// CHECK: encoding: [0x8f,0xe8,0x78,0xc3,0x10,0x2a]
vprotq $42, (%rax), %xmm2
// CHECK: vprotq $42, (%rax,%rcx), %xmm2
// CHECK: encoding: [0x8f,0xe8,0x78,0xc3,0x14,0x08,0x2a]
vprotq $42, (%rax,%rcx), %xmm2
// CHECK: vprotq $42, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x78,0xc3,0xd1,0x2a]
vprotq $42, %xmm1, %xmm2
// vprotd
// CHECK: vprotd (%rax), %xmm0, %xmm3
// CHECK: encoding: [0x8f,0xe9,0xf8,0x92,0x18]
vprotd (%rax), %xmm0, %xmm3
// CHECK: vprotd %xmm2, (%rax,%rcx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x68,0x92,0x24,0x08]
vprotd %xmm2, (%rax,%rcx), %xmm4
// CHECK: vprotd %xmm5, %xmm3, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x50,0x92,0xd3]
vprotd %xmm5, %xmm3, %xmm2
// CHECK: vprotd $43, (%rcx), %xmm6
// CHECK: encoding: [0x8f,0xe8,0x78,0xc2,0x31,0x2b]
vprotd $43, (%rcx), %xmm6
// CHECK: vprotd $44, (%rax,%rcx), %xmm7
// CHECK: encoding: [0x8f,0xe8,0x78,0xc2,0x3c,0x08,0x2c]
vprotd $44, (%rax,%rcx), %xmm7
// CHECK: vprotd $45, %xmm4, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x78,0xc2,0xe4,0x2d]
vprotd $45, %xmm4, %xmm4
// vprotb
// CHECK: vprotb (%rcx), %xmm2, %xmm5
// CHECK: encoding: [0x8f,0xe9,0xe8,0x90,0x29]
vprotb (%rcx), %xmm2, %xmm5
// CHECK: vprotb %xmm5, (%rax,%rcx), %xmm4
// CHECK: encoding: [0x8f,0xe9,0x50,0x90,0x24,0x08]
vprotb %xmm5, (%rax,%rcx), %xmm4
// CHECK: vprotb %xmm4, %xmm3, %xmm2
// CHECK: encoding: [0x8f,0xe9,0x58,0x90,0xd3]
vprotb %xmm4, %xmm3, %xmm2
// CHECK: vprotb $46, (%rax), %xmm3
// CHECK: encoding: [0x8f,0xe8,0x78,0xc0,0x18,0x2e]
vprotb $46, (%rax), %xmm3
// CHECK: vprotb $47, (%rax,%rcx), %xmm7
// CHECK: encoding: [0x8f,0xe8,0x78,0xc0,0x3c,0x08,0x2f]
vprotb $47, (%rax,%rcx), %xmm7
// CHECK: vprotb $48, %xmm5, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x78,0xc0,0xed,0x30]
vprotb $48, %xmm5, %xmm5
//////////////////////////
// 4 operand instructions
/////////////////////////
// vpmadcswd
// CHECK: vpmadcswd %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xb6,0xe2,0x10]
vpmadcswd %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: vpmadcswd %xmm1, (%rax), %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xb6,0x20,0x10]
vpmadcswd %xmm1, (%rax), %xmm3, %xmm4
// vpmadcsswd
// CHECK: vpmadcsswd %xmm1, %xmm4, %xmm6, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x48,0xa6,0xe4,0x10]
vpmadcsswd %xmm1, %xmm4, %xmm6, %xmm4
// CHECK: vpmadcsswd %xmm1, (%rax,%rcx), %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xa6,0x24,0x08,0x10]
vpmadcsswd %xmm1, (%rax,%rcx), %xmm3, %xmm4
// vpmacsww
// CHECK: vpmacsww %xmm0, %xmm2, %xmm5, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x50,0x95,0xe2,0x00]
vpmacsww %xmm0, %xmm2, %xmm5, %xmm4
// CHECK: vpmacsww %xmm1, (%rax), %xmm6, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x48,0x95,0x20,0x10]
vpmacsww %xmm1, (%rax), %xmm6, %xmm4
// vpmacswd
// CHECK: vpmacswd %xmm4, %xmm5, %xmm6, %xmm7
// CHECK: encoding: [0x8f,0xe8,0x48,0x96,0xfd,0x40]
vpmacswd %xmm4, %xmm5, %xmm6, %xmm7
// CHECK: vpmacswd %xmm0, (%rax), %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x70,0x96,0x10,0x00]
vpmacswd %xmm0, (%rax), %xmm1, %xmm2
// vpmacssww
// CHECK: vpmacssww %xmm4, %xmm3, %xmm2, %xmm1
// CHECK: encoding: [0x8f,0xe8,0x68,0x85,0xcb,0x40]
vpmacssww %xmm4, %xmm3, %xmm2, %xmm1
// CHECK: vpmacssww %xmm6, (%rcx), %xmm7, %xmm7
// CHECK: encoding: [0x8f,0xe8,0x40,0x85,0x39,0x60]
vpmacssww %xmm6, (%rcx), %xmm7, %xmm7
// vpmacsswd
// CHECK: vpmacsswd %xmm4, %xmm2, %xmm4, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x58,0x86,0xd2,0x40]
vpmacsswd %xmm4, %xmm2, %xmm4, %xmm2
// CHECK: vpmacsswd %xmm0, 8(%rax,%rcx), %xmm1, %xmm0
// CHECK: encoding: [0x8f,0xe8,0x70,0x86,0x44,0x08,0x08,0x00]
vpmacsswd %xmm0, 8(%rax,%rcx), %xmm1, %xmm0
// vpmacssdql
// CHECK: vpmacssdql %xmm1, %xmm1, %xmm2, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x68,0x87,0xe1,0x10]
vpmacssdql %xmm1, %xmm1, %xmm2, %xmm4
// CHECK: vpmacssdql %xmm7, (%rcx), %xmm6, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x48,0x87,0x29,0x70]
vpmacssdql %xmm7, (%rcx), %xmm6, %xmm5
// vpmacssdqh
// CHECK: vpmacssdqh %xmm3, %xmm2, %xmm0, %xmm1
// CHECK: encoding: [0x8f,0xe8,0x78,0x8f,0xca,0x30]
vpmacssdqh %xmm3, %xmm2, %xmm0, %xmm1
// CHECK: vpmacssdqh %xmm7, (%rax,%rcx), %xmm2, %xmm3
// CHECK: encoding: [0x8f,0xe8,0x68,0x8f,0x1c,0x08,0x70]
vpmacssdqh %xmm7, (%rax,%rcx), %xmm2, %xmm3
// vpmacssdd
// CHECK: vpmacssdd %xmm2, %xmm2, %xmm3, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x60,0x8e,0xea,0x20]
vpmacssdd %xmm2, %xmm2, %xmm3, %xmm5
// CHECK: vpmacssdd %xmm4, (%rax), %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x70,0x8e,0x10,0x40]
vpmacssdd %xmm4, (%rax), %xmm1, %xmm2
// vpmacsdql
// CHECK: vpmacsdql %xmm3, %xmm0, %xmm6, %xmm7
// CHECK: encoding: [0x8f,0xe8,0x48,0x97,0xf8,0x30]
vpmacsdql %xmm3, %xmm0, %xmm6, %xmm7
// CHECK: vpmacsdql %xmm5, 8(%rcx), %xmm3, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x60,0x97,0x69,0x08,0x50]
vpmacsdql %xmm5, 8(%rcx), %xmm3, %xmm5
// vpmacsdqh
// CHECK: vpmacsdqh %xmm7, %xmm5, %xmm3, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x60,0x9f,0xd5,0x70]
vpmacsdqh %xmm7, %xmm5, %xmm3, %xmm2
// CHECK: vpmacsdqh %xmm5, 4(%rax), %xmm2, %xmm0
// CHECK: encoding: [0x8f,0xe8,0x68,0x9f,0x40,0x04,0x50]
vpmacsdqh %xmm5, 4(%rax), %xmm2, %xmm0
// vpmacsdd
// CHECK: vpmacsdd %xmm4, %xmm6, %xmm4, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x58,0x9e,0xd6,0x40]
vpmacsdd %xmm4, %xmm6, %xmm4, %xmm2
// CHECK: vpmacsdd %xmm4, (%rax,%rcx), %xmm4, %xmm3
// CHECK: encoding: [0x8f,0xe8,0x58,0x9e,0x1c,0x08,0x40]
vpmacsdd %xmm4, (%rax,%rcx), %xmm4, %xmm3
// vpcomw
// CHECK: vpcomw $42, %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0xe2,0x2a]
vpcomw $42, %xmm2, %xmm3, %xmm4
// CHECK: vpcomw $42, (%rax), %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xcd,0x20,0x2a]
vpcomw $42, (%rax), %xmm3, %xmm4
// vpcomuw
// CHECK: vpcomuw $43, %xmm1, %xmm3, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x60,0xed,0xe9,0x2b]
vpcomuw $43, %xmm1, %xmm3, %xmm5
// CHECK: vpcomuw $44, (%rax,%rcx), %xmm0, %xmm6
// CHECK: encoding: [0x8f,0xe8,0x78,0xed,0x34,0x08,0x2c]
vpcomuw $44, (%rax,%rcx), %xmm0, %xmm6
// vpcomuq
// CHECK: vpcomuq $45, %xmm3, %xmm3, %xmm7
// CHECK: encoding: [0x8f,0xe8,0x60,0xef,0xfb,0x2d]
vpcomuq $45, %xmm3, %xmm3, %xmm7
// CHECK: vpcomuq $46, (%rax), %xmm3, %xmm1
// CHECK: encoding: [0x8f,0xe8,0x60,0xef,0x08,0x2e]
vpcomuq $46, (%rax), %xmm3, %xmm1
// vpcomud
// CHECK: vpcomud $47, %xmm0, %xmm1, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x70,0xee,0xd0,0x2f]
vpcomud $47, %xmm0, %xmm1, %xmm2
// CHECK: vpcomud $48, 4(%rax), %xmm6, %xmm3
// CHECK: encoding: [0x8f,0xe8,0x48,0xee,0x58,0x04,0x30]
vpcomud $48, 4(%rax), %xmm6, %xmm3
// vpcomub
// CHECK: vpcomub $49, %xmm3, %xmm4, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x58,0xec,0xeb,0x31]
vpcomub $49, %xmm3, %xmm4, %xmm5
// CHECK: vpcomub $50, (%rcx), %xmm6, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x48,0xec,0x11,0x32]
vpcomub $50, (%rcx), %xmm6, %xmm2
// vpcomq
// CHECK: vpcomq $51, %xmm3, %xmm0, %xmm5
// CHECK: encoding: [0x8f,0xe8,0x78,0xcf,0xeb,0x33]
vpcomq $51, %xmm3, %xmm0, %xmm5
// CHECK: vpcomq $52, (%rax), %xmm1, %xmm7
// CHECK: encoding: [0x8f,0xe8,0x70,0xcf,0x38,0x34]
vpcomq $52, (%rax), %xmm1, %xmm7
// vpcomd
// CHECK: vpcomd $53, %xmm3, %xmm3, %xmm0
// CHECK: encoding: [0x8f,0xe8,0x60,0xce,0xc3,0x35]
vpcomd $53, %xmm3, %xmm3, %xmm0
// CHECK: vpcomd $54, (%rcx), %xmm2, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x68,0xce,0x11,0x36]
vpcomd $54, (%rcx), %xmm2, %xmm2
// vpcomb
// CHECK: vpcomb $55, %xmm6, %xmm4, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x58,0xcc,0xd6,0x37]
vpcomb $55, %xmm6, %xmm4, %xmm2
// CHECK: vpcomb $56, 8(%rax), %xmm3, %xmm2
// CHECK: encoding: [0x8f,0xe8,0x60,0xcc,0x50,0x08,0x38]
vpcomb $56, 8(%rax), %xmm3, %xmm2
// vpperm
// CHECK: vpperm %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xa3,0xe2,0x10]
vpperm %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: vpperm (%rax), %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0xe0,0xa3,0x20,0x20]
vpperm (%rax), %xmm2, %xmm3, %xmm4
// CHECK: vpperm %xmm1, (%rax), %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xa3,0x20,0x10]
vpperm %xmm1, (%rax), %xmm3, %xmm4
// vpcmov
// CHECK: vpcmov %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xa2,0xe2,0x10]
vpcmov %xmm1, %xmm2, %xmm3, %xmm4
// CHECK: vpcmov (%rax), %xmm2, %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0xe0,0xa2,0x20,0x20]
vpcmov (%rax), %xmm2, %xmm3, %xmm4
// CHECK: vpcmov %xmm1, (%rax), %xmm3, %xmm4
// CHECK: encoding: [0x8f,0xe8,0x60,0xa2,0x20,0x10]
vpcmov %xmm1, (%rax), %xmm3, %xmm4
// CHECK: vpcmov %ymm1, %ymm2, %ymm3, %ymm4
// CHECK: encoding: [0x8f,0xe8,0x64,0xa2,0xe2,0x10]
vpcmov %ymm1, %ymm2, %ymm3, %ymm4
// CHECK: vpcmov (%rax), %ymm2, %ymm3, %ymm4
// CHECK: encoding: [0x8f,0xe8,0xe4,0xa2,0x20,0x20]
vpcmov (%rax), %ymm2, %ymm3, %ymm4
// CHECK: vpcmov %ymm1, (%rax), %ymm3, %ymm4
// CHECK: encoding: [0x8f,0xe8,0x64,0xa2,0x20,0x10]
vpcmov %ymm1, (%rax), %ymm3, %ymm4
//////////////////////////
// 5 operand instructions
/////////////////////////
// vpermil2pd
// CHECK: vpermil2pd $1, %xmm5, %xmm2, %xmm1, %xmm7
// CHECK: encoding: [0xc4,0xe3,0x71,0x49,0xfa,0x51]
vpermil2pd $1, %xmm5, %xmm2, %xmm1, %xmm7
// CHECK: vpermil2pd $2, (%rax), %xmm3, %xmm3, %xmm4
// CHECK: encoding: [0xc4,0xe3,0xe1,0x49,0x20,0x32]
vpermil2pd $2, (%rax), %xmm3, %xmm3, %xmm4
// CHECK: vpermil2pd $3, 8(%rax), %ymm0, %ymm4, %ymm6
// CHECK: encoding: [0xc4,0xe3,0xdd,0x49,0x70,0x08,0x03]
vpermil2pd $3, 8(%rax), %ymm0, %ymm4, %ymm6
// CHECK: vpermil2pd $0, %xmm3, (%rax,%rcx), %xmm1, %xmm0
// CHECK: encoding: [0xc4,0xe3,0x71,0x49,0x04,0x08,0x30]
vpermil2pd $0, %xmm3, (%rax,%rcx), %xmm1, %xmm0
// CHECK: vpermil2pd $1, %ymm1, %ymm2, %ymm3, %ymm4
// CHECK: encoding: [0xc4,0xe3,0x65,0x49,0xe2,0x11]
vpermil2pd $1, %ymm1, %ymm2, %ymm3, %ymm4
// CHECK: vpermil2pd $2, %ymm1, (%rax), %ymm3, %ymm4
// CHECK: encoding: [0xc4,0xe3,0x65,0x49,0x20,0x12]
vpermil2pd $2, %ymm1, (%rax), %ymm3, %ymm4
// vpermil2ps
// CHECK: vpermil2ps $0, %xmm4, %xmm3, %xmm2, %xmm1
// CHECK: encoding: [0xc4,0xe3,0x69,0x48,0xcb,0x40]
vpermil2ps $0, %xmm4, %xmm3, %xmm2, %xmm1
// CHECK: vpermil2ps $1, 4(%rax), %xmm2, %xmm3, %xmm0
// CHECK: encoding: [0xc4,0xe3,0xe1,0x48,0x40,0x04,0x21]
vpermil2ps $1, 4(%rax), %xmm2, %xmm3, %xmm0
// CHECK: vpermil2ps $2, (%rax), %ymm1, %ymm5, %ymm6
// CHECK: encoding: [0xc4,0xe3,0xd5,0x48,0x30,0x12]
vpermil2ps $2, (%rax), %ymm1, %ymm5, %ymm6
// CHECK: vpermil2ps $3, %xmm1, (%rax), %xmm3, %xmm4
// CHECK: encoding: [0xc4,0xe3,0x61,0x48,0x20,0x13]
vpermil2ps $3, %xmm1, (%rax), %xmm3, %xmm4
// CHECK: vpermil2ps $0, %ymm4, %ymm4, %ymm2, %ymm2
// CHECK: encoding: [0xc4,0xe3,0x6d,0x48,0xd4,0x40]
vpermil2ps $0, %ymm4, %ymm4, %ymm2, %ymm2
// CHECK: vpermil2pd $1, %ymm1, 4(%rax), %ymm1, %ymm0
// CHECK: encoding: [0xc4,0xe3,0x75,0x49,0x40,0x04,0x11]
vpermil2pd $1, %ymm1, 4(%rax), %ymm1, %ymm0
|