diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S index dbc1c9f285..7dc1d18720 100644 --- a/src/jumper/SkJumper_generated.S +++ b/src/jumper/SkJumper_generated.S @@ -35,53 +35,37 @@ _sk_start_pipeline_aarch64: .long 0xaa0303f4 // mov x20, x3 .long 0xf8408685 // ldr x5, [x20], #8 .long 0xaa0003f7 // mov x23, x0 - .long 0xaa0203f6 // mov x22, x2 + .long 0xaa0203f5 // mov x21, x2 .long 0x910012e8 // add x8, x23, #0x4 .long 0xaa0403f3 // mov x19, x4 - .long 0xeb16011f // cmp x8, x22 - .long 0xaa0103f5 // mov x21, x1 + .long 0xeb15011f // cmp x8, x21 + .long 0xaa0103f6 // mov x22, x1 .long 0x9100c3fd // add x29, sp, #0x30 .long 0x54000069 // b.ls 40 // b.plast .long 0xaa1703e2 // mov x2, x23 - .long 0x14000017 // b 98 + .long 0x1400000f // b 78 .long 0xf90007e5 // str x5, [sp, #8] .long 0xf94007e5 // ldr x5, [sp, #8] - .long 0x6f00e400 // movi v0.2d, #0x0 - .long 0x6f00e401 // movi v1.2d, #0x0 - .long 0x6f00e402 // movi v2.2d, #0x0 - .long 0x6f00e403 // movi v3.2d, #0x0 - .long 0x6f00e404 // movi v4.2d, #0x0 - .long 0x6f00e405 // movi v5.2d, #0x0 - .long 0x6f00e406 // movi v6.2d, #0x0 - .long 0x6f00e407 // movi v7.2d, #0x0 .long 0xaa1303e0 // mov x0, x19 .long 0xaa1403e1 // mov x1, x20 .long 0xaa1703e2 // mov x2, x23 - .long 0xaa1503e3 // mov x3, x21 + .long 0xaa1603e3 // mov x3, x22 .long 0xaa1f03e4 // mov x4, xzr .long 0xd63f00a0 // blr x5 .long 0xf94007e5 // ldr x5, [sp, #8] .long 0x910012e2 // add x2, x23, #0x4 .long 0x910022e8 // add x8, x23, #0x8 - .long 0xeb16011f // cmp x8, x22 + .long 0xeb15011f // cmp x8, x21 .long 0xaa0203f7 // mov x23, x2 - .long 0x54fffd89 // b.ls 44 // b.plast - .long 0xcb0202c4 // sub x4, x22, x2 - .long 0xb4000224 // cbz x4, e0 + .long 0x54fffe89 // b.ls 44 // b.plast + .long 0xcb0202a4 // sub x4, x21, x2 + .long 0xb4000124 // cbz x4, a0 .long 0xaa1303e0 // mov x0, x19 .long 0xaa1403e1 // mov x1, x20 - .long 0xaa1503e3 // mov x3, x21 + .long 0xaa1603e3 // mov x3, x22 .long 0xa9437bfd // ldp x29, x30, [sp, #48] .long 0xa9424ff4 // ldp x20, x19, [sp, #32] .long 0xa94157f6 // ldp x22, x21, [sp, #16] - .long 0x6f00e400 // movi v0.2d, #0x0 - .long 0x6f00e401 // movi v1.2d, #0x0 - .long 0x6f00e402 // movi v2.2d, #0x0 - .long 0x6f00e403 // movi v3.2d, #0x0 - .long 0x6f00e404 // movi v4.2d, #0x0 - .long 0x6f00e405 // movi v5.2d, #0x0 - .long 0x6f00e406 // movi v6.2d, #0x0 - .long 0x6f00e407 // movi v7.2d, #0x0 .long 0xf84407f7 // ldr x23, [sp], #64 .long 0xd61f00a0 // br x5 .long 0xa9437bfd // ldp x29, x30, [sp, #48] @@ -1269,7 +1253,7 @@ _sk_srcover_rgba_8888_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020908 // add x8, x8, x2, lsl #2 - .long 0xb5000504 // cbnz x4, 115c + .long 0xb5000504 // cbnz x4, 111c .long 0x3dc00104 // ldr q4, [x8] .long 0x6f00e625 // movi v5.2d, #0xff000000ff .long 0x6f380486 // ushr v6.4s, v4.4s, #8 @@ -1304,42 +1288,42 @@ _sk_srcover_rgba_8888_aarch64: .long 0x6e21a871 // fcvtnu v17.4s, v3.4s .long 0x4f385631 // shl v17.4s, v17.4s, #24 .long 0x4eb11e10 // orr v16.16b, v16.16b, v17.16b - .long 0xb5000284 // cbnz x4, 1198 + .long 0xb5000284 // cbnz x4, 1158 .long 0x3d800110 // str q16, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000300 // b.eq 11c4 // b.none + .long 0x54000300 // b.eq 1184 // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x6f00e404 // movi v4.2d, #0x0 - .long 0x540000c0 // b.eq 1188 // b.none + .long 0x540000c0 // b.eq 1148 // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffa61 // b.ne 10c4 // b.any + .long 0x54fffa61 // b.ne 1084 // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4e040fe4 // dup v4.4s, wzr .long 0x4d408124 // ld1 {v4.s}[2], [x9] .long 0xfd400105 // ldr d5, [x8] .long 0x6e054084 // ext v4.16b, v4.16b, v5.16b, #8 .long 0x6e044084 // ext v4.16b, v4.16b, v4.16b, #8 - .long 0x17ffffcc // b 10c4 + .long 0x17ffffcc // b 1084 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000180 // b.eq 11d0 // b.none + .long 0x54000180 // b.eq 1190 // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 11bc // b.none + .long 0x540000a0 // b.eq 117c // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd01 // b.ne 1150 // b.any + .long 0x54fffd01 // b.ne 1110 // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4d008130 // st1 {v16.s}[2], [x9] .long 0xfd000110 // str d16, [x8] - .long 0x17ffffe4 // b 1150 + .long 0x17ffffe4 // b 1110 .long 0x4e040fe4 // dup v4.4s, wzr .long 0x0d408104 // ld1 {v4.s}[0], [x8] - .long 0x17ffffbe // b 10c4 + .long 0x17ffffbe // b 1084 .long 0x0d008110 // st1 {v16.s}[0], [x8] - .long 0x17ffffdf // b 1150 + .long 0x17ffffdf // b 1110 HIDDEN _sk_clamp_0_aarch64 .globl _sk_clamp_0_aarch64 @@ -1723,7 +1707,7 @@ _sk_scale_u8_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020108 // add x8, x8, x2 - .long 0xb50002e4 // cbnz x4, 16f0 + .long 0xb50002e4 // cbnz x4, 16b0 .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -1748,12 +1732,12 @@ _sk_scale_u8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 173c // b.none + .long 0x54000220 // b.eq 16fc // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e410 // movi d16, #0x0 - .long 0x540000c0 // b.eq 171c // b.none + .long 0x540000c0 // b.eq 16dc // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd61 // b.ne 16b8 // b.any + .long 0x54fffd61 // b.ne 1678 // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020ff0 // dup v16.4h, wzr .long 0x4e0a1d30 // mov v16.h[2], w9 @@ -1764,11 +1748,11 @@ _sk_scale_u8_aarch64: .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4 .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4 - .long 0x17ffffe0 // b 16b8 + .long 0x17ffffe0 // b 1678 .long 0x39400108 // ldrb w8, [x8] .long 0x0e020ff0 // dup v16.4h, wzr .long 0x4e021d10 // mov v16.h[0], w8 - .long 0x17ffffdc // b 16b8 + .long 0x17ffffdc // b 1678 HIDDEN _sk_lerp_1_float_aarch64 .globl _sk_lerp_1_float_aarch64 @@ -1797,7 +1781,7 @@ _sk_lerp_u8_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020108 // add x8, x8, x2 - .long 0xb50003e4 // cbnz x4, 1810 + .long 0xb50003e4 // cbnz x4, 17d0 .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -1830,12 +1814,12 @@ _sk_lerp_u8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 185c // b.none + .long 0x54000220 // b.eq 181c // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e410 // movi d16, #0x0 - .long 0x540000c0 // b.eq 183c // b.none + .long 0x540000c0 // b.eq 17fc // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffc61 // b.ne 17b8 // b.any + .long 0x54fffc61 // b.ne 1778 // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020ff0 // dup v16.4h, wzr .long 0x4e0a1d30 // mov v16.h[2], w9 @@ -1846,11 +1830,11 @@ _sk_lerp_u8_aarch64: .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4 .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4 - .long 0x17ffffd8 // b 17b8 + .long 0x17ffffd8 // b 1778 .long 0x39400108 // ldrb w8, [x8] .long 0x0e020ff0 // dup v16.4h, wzr .long 0x4e021d10 // mov v16.h[0], w8 - .long 0x17ffffd4 // b 17b8 + .long 0x17ffffd4 // b 1778 HIDDEN _sk_lerp_565_aarch64 .globl _sk_lerp_565_aarch64 @@ -1859,7 +1843,7 @@ _sk_lerp_565_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020508 // add x8, x8, x2, lsl #1 - .long 0xb50005c4 // cbnz x4, 1930 + .long 0xb50005c4 // cbnz x4, 18f0 .long 0xfd400110 // ldr d16, [x8] .long 0x321b17e8 // orr w8, wzr, #0x7e0 .long 0x4e040d12 // dup v18.4s, w8 @@ -1907,12 +1891,12 @@ _sk_lerp_565_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 197c // b.none + .long 0x54000220 // b.eq 193c // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e410 // movi d16, #0x0 - .long 0x540000c0 // b.eq 195c // b.none + .long 0x540000c0 // b.eq 191c // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fff9a1 // b.ne 1880 // b.any + .long 0x54fff9a1 // b.ne 1840 // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0e020ff0 // dup v16.4h, wzr .long 0x0d405130 // ld1 {v16.h}[2], [x9] @@ -1923,10 +1907,10 @@ _sk_lerp_565_aarch64: .long 0x0e401a31 // uzp1 v17.4h, v17.4h, v0.4h .long 0x2e112210 // ext v16.8b, v16.8b, v17.8b, #4 .long 0x2e102210 // ext v16.8b, v16.8b, v16.8b, #4 - .long 0x17ffffc2 // b 1880 + .long 0x17ffffc2 // b 1840 .long 0x0e020ff0 // dup v16.4h, wzr .long 0x0d404110 // ld1 {v16.h}[0], [x8] - .long 0x17ffffbf // b 1880 + .long 0x17ffffbf // b 1840 HIDDEN _sk_load_tables_aarch64 .globl _sk_load_tables_aarch64 @@ -1935,7 +1919,7 @@ _sk_load_tables_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400109 // ldr x9, [x8] .long 0x8b020929 // add x9, x9, x2, lsl #2 - .long 0xb50006e4 // cbnz x4, 1a70 + .long 0xb50006e4 // cbnz x4, 1a30 .long 0x3dc00122 // ldr q2, [x9] .long 0xa940a909 // ldp x9, x10, [x8, #8] .long 0x6f00e620 // movi v0.2d, #0xff000000ff @@ -1992,22 +1976,22 @@ _sk_load_tables_aarch64: .long 0xd61f00a0 // br x5 .long 0x1200048a // and w10, w4, #0x3 .long 0x7100055f // cmp w10, #0x1 - .long 0x540001a0 // b.eq 1aac // b.none + .long 0x540001a0 // b.eq 1a6c // b.none .long 0x7100095f // cmp w10, #0x2 .long 0x6f00e402 // movi v2.2d, #0x0 - .long 0x540000c0 // b.eq 1a9c // b.none + .long 0x540000c0 // b.eq 1a5c // b.none .long 0x71000d5f // cmp w10, #0x3 - .long 0x54fff881 // b.ne 199c // b.any + .long 0x54fff881 // b.ne 195c // b.any .long 0x9100212a // add x10, x9, #0x8 .long 0x4e040fe2 // dup v2.4s, wzr .long 0x4d408142 // ld1 {v2.s}[2], [x10] .long 0xfd400120 // ldr d0, [x9] .long 0x6e004040 // ext v0.16b, v2.16b, v0.16b, #8 .long 0x6e004002 // ext v2.16b, v0.16b, v0.16b, #8 - .long 0x17ffffbd // b 199c + .long 0x17ffffbd // b 195c .long 0x4e040fe2 // dup v2.4s, wzr .long 0x0d408122 // ld1 {v2.s}[0], [x9] - .long 0x17ffffba // b 199c + .long 0x17ffffba // b 195c HIDDEN _sk_load_tables_u16_be_aarch64 .globl _sk_load_tables_u16_be_aarch64 @@ -2016,7 +2000,7 @@ _sk_load_tables_u16_be_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400109 // ldr x9, [x8] .long 0x8b020d29 // add x9, x9, x2, lsl #3 - .long 0xb5000744 // cbnz x4, 1bac + .long 0xb5000744 // cbnz x4, 1b6c .long 0x0c400520 // ld4 {v0.4h-v3.4h}, [x9] .long 0xa940a909 // ldp x9, x10, [x8, #8] .long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8 @@ -2076,14 +2060,14 @@ _sk_load_tables_u16_be_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d606120 // ld4 {v0.h-v3.h}[0], [x9] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fff8c0 // b.eq 1acc // b.none + .long 0x54fff8c0 // b.eq 1a8c // b.none .long 0x9100212a // add x10, x9, #0x8 .long 0x0d606940 // ld4 {v0.h-v3.h}[1], [x10] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fff843 // b.cc 1acc // b.lo, b.ul, b.last + .long 0x54fff843 // b.cc 1a8c // b.lo, b.ul, b.last .long 0x91004129 // add x9, x9, #0x10 .long 0x0d607120 // ld4 {v0.h-v3.h}[2], [x9] - .long 0x17ffffbf // b 1acc + .long 0x17ffffbf // b 1a8c HIDDEN _sk_load_tables_rgb_u16_be_aarch64 .globl _sk_load_tables_rgb_u16_be_aarch64 @@ -2093,7 +2077,7 @@ _sk_load_tables_rgb_u16_be_aarch64: .long 0x321f07ea // orr w10, wzr, #0x6 .long 0xf9400109 // ldr x9, [x8] .long 0x9b0a2449 // madd x9, x2, x10, x9 - .long 0xb5000664 // cbnz x4, 1cb0 + .long 0xb5000664 // cbnz x4, 1c70 .long 0x0c404520 // ld3 {v0.4h-v2.4h}, [x9] .long 0xa940a909 // ldp x9, x10, [x8, #8] .long 0x2f07b7e0 // bic v0.4h, #0xff, lsl #8 @@ -2146,14 +2130,14 @@ _sk_load_tables_rgb_u16_be_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d406120 // ld3 {v0.h-v2.h}[0], [x9] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fff9a0 // b.eq 1bec // b.none + .long 0x54fff9a0 // b.eq 1bac // b.none .long 0x9100192a // add x10, x9, #0x6 .long 0x0d406940 // ld3 {v0.h-v2.h}[1], [x10] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fff923 // b.cc 1bec // b.lo, b.ul, b.last + .long 0x54fff923 // b.cc 1bac // b.lo, b.ul, b.last .long 0x91003129 // add x9, x9, #0xc .long 0x0d407120 // ld3 {v0.h-v2.h}[2], [x9] - .long 0x17ffffc6 // b 1bec + .long 0x17ffffc6 // b 1bac HIDDEN _sk_byte_tables_aarch64 .globl _sk_byte_tables_aarch64 @@ -2798,7 +2782,7 @@ _sk_load_a8_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020108 // add x8, x8, x2 - .long 0xb50002e4 // cbnz x4, 2654 + .long 0xb50002e4 // cbnz x4, 2614 .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -2823,12 +2807,12 @@ _sk_load_a8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 26a0 // b.none + .long 0x54000220 // b.eq 2660 // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e402 // movi d2, #0x0 - .long 0x540000c0 // b.eq 2680 // b.none + .long 0x540000c0 // b.eq 2640 // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd61 // b.ne 261c // b.any + .long 0x54fffd61 // b.ne 25dc // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020fe2 // dup v2.4h, wzr .long 0x4e0a1d22 // mov v2.h[2], w9 @@ -2839,11 +2823,11 @@ _sk_load_a8_aarch64: .long 0x0e401800 // uzp1 v0.4h, v0.4h, v0.4h .long 0x2e002040 // ext v0.8b, v2.8b, v0.8b, #4 .long 0x2e002002 // ext v2.8b, v0.8b, v0.8b, #4 - .long 0x17ffffe0 // b 261c + .long 0x17ffffe0 // b 25dc .long 0x39400108 // ldrb w8, [x8] .long 0x0e020fe2 // dup v2.4h, wzr .long 0x4e021d02 // mov v2.h[0], w8 - .long 0x17ffffdc // b 261c + .long 0x17ffffdc // b 25dc HIDDEN _sk_gather_a8_aarch64 .globl _sk_gather_a8_aarch64 @@ -2892,7 +2876,7 @@ _sk_store_a8_aarch64: .long 0x6e21aa10 // fcvtnu v16.4s, v16.4s .long 0x0e612a10 // xtn v16.4h, v16.4s .long 0x8b020108 // add x8, x8, x2 - .long 0xb5000184 // cbnz x4, 2778 + .long 0xb5000184 // cbnz x4, 2738 .long 0x0e0e3e09 // umov w9, v16.h[3] .long 0x0e0a3e0a // umov w10, v16.h[2] .long 0x0e063e0b // umov w11, v16.h[1] @@ -2906,21 +2890,21 @@ _sk_store_a8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000180 // b.eq 27b0 // b.none + .long 0x54000180 // b.eq 2770 // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 279c // b.none + .long 0x540000a0 // b.eq 275c // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffee1 // b.ne 276c // b.any + .long 0x54fffee1 // b.ne 272c // b.any .long 0x0e0a3e09 // umov w9, v16.h[2] .long 0x39000909 // strb w9, [x8, #2] .long 0x0e023e09 // umov w9, v16.h[0] .long 0x0e063e0a // umov w10, v16.h[1] .long 0x3900050a // strb w10, [x8, #1] .long 0x39000109 // strb w9, [x8] - .long 0x17fffff0 // b 276c + .long 0x17fffff0 // b 272c .long 0x0e023e09 // umov w9, v16.h[0] .long 0x39000109 // strb w9, [x8] - .long 0x17ffffed // b 276c + .long 0x17ffffed // b 272c HIDDEN _sk_load_g8_aarch64 .globl _sk_load_g8_aarch64 @@ -2929,7 +2913,7 @@ _sk_load_g8_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020108 // add x8, x8, x2 - .long 0xb50002e4 // cbnz x4, 2824 + .long 0xb50002e4 // cbnz x4, 27e4 .long 0x39400109 // ldrb w9, [x8] .long 0x3940050a // ldrb w10, [x8, #1] .long 0x3940090b // ldrb w11, [x8, #2] @@ -2954,12 +2938,12 @@ _sk_load_g8_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 2870 // b.none + .long 0x54000220 // b.eq 2830 // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e400 // movi d0, #0x0 - .long 0x540000c0 // b.eq 2850 // b.none + .long 0x540000c0 // b.eq 2810 // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffd61 // b.ne 27ec // b.any + .long 0x54fffd61 // b.ne 27ac // b.any .long 0x39400909 // ldrb w9, [x8, #2] .long 0x0e020fe0 // dup v0.4h, wzr .long 0x4e0a1d20 // mov v0.h[2], w9 @@ -2970,11 +2954,11 @@ _sk_load_g8_aarch64: .long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h .long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4 .long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4 - .long 0x17ffffe0 // b 27ec + .long 0x17ffffe0 // b 27ac .long 0x39400108 // ldrb w8, [x8] .long 0x0e020fe0 // dup v0.4h, wzr .long 0x4e021d00 // mov v0.h[0], w8 - .long 0x17ffffdc // b 27ec + .long 0x17ffffdc // b 27ac HIDDEN _sk_gather_g8_aarch64 .globl _sk_gather_g8_aarch64 @@ -3017,9 +3001,9 @@ FUNCTION(_sk_gather_i8_aarch64) _sk_gather_i8_aarch64: .long 0xaa0103e8 // mov x8, x1 .long 0xf8408429 // ldr x9, [x1], #8 - .long 0xb4000069 // cbz x9, 290c + .long 0xb4000069 // cbz x9, 28cc .long 0xaa0903ea // mov x10, x9 - .long 0x14000003 // b 2914 + .long 0x14000003 // b 28d4 .long 0xf940050a // ldr x10, [x8, #8] .long 0x91004101 // add x1, x8, #0x10 .long 0xf8410548 // ldr x8, [x10], #16 @@ -3082,7 +3066,7 @@ _sk_load_565_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020508 // add x8, x8, x2, lsl #1 - .long 0xb50003c4 // cbnz x4, 2a68 + .long 0xb50003c4 // cbnz x4, 2a28 .long 0xfd400100 // ldr d0, [x8] .long 0x321b17e8 // orr w8, wzr, #0x7e0 .long 0x4e040d02 // dup v2.4s, w8 @@ -3114,12 +3098,12 @@ _sk_load_565_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 2ab4 // b.none + .long 0x54000220 // b.eq 2a74 // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e400 // movi d0, #0x0 - .long 0x540000c0 // b.eq 2a94 // b.none + .long 0x540000c0 // b.eq 2a54 // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffba1 // b.ne 29f8 // b.any + .long 0x54fffba1 // b.ne 29b8 // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0e020fe0 // dup v0.4h, wzr .long 0x0d405120 // ld1 {v0.h}[2], [x9] @@ -3130,10 +3114,10 @@ _sk_load_565_aarch64: .long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h .long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4 .long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4 - .long 0x17ffffd2 // b 29f8 + .long 0x17ffffd2 // b 29b8 .long 0x0e020fe0 // dup v0.4h, wzr .long 0x0d404100 // ld1 {v0.h}[0], [x8] - .long 0x17ffffcf // b 29f8 + .long 0x17ffffcf // b 29b8 HIDDEN _sk_gather_565_aarch64 .globl _sk_gather_565_aarch64 @@ -3205,24 +3189,24 @@ _sk_store_565_aarch64: .long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b .long 0x8b020508 // add x8, x8, x2, lsl #1 .long 0x0e612a10 // xtn v16.4h, v16.4s - .long 0xb50000a4 // cbnz x4, 2bc8 + .long 0xb50000a4 // cbnz x4, 2b88 .long 0xfd000110 // str d16, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000120 // b.eq 2bf4 // b.none + .long 0x54000120 // b.eq 2bb4 // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 2bec // b.none + .long 0x540000a0 // b.eq 2bac // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffee1 // b.ne 2bbc // b.any + .long 0x54fffee1 // b.ne 2b7c // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0d005130 // st1 {v16.h}[2], [x9] .long 0x91000909 // add x9, x8, #0x2 .long 0x0d004930 // st1 {v16.h}[1], [x9] .long 0x0d004110 // st1 {v16.h}[0], [x8] - .long 0x17fffff1 // b 2bbc + .long 0x17fffff1 // b 2b7c HIDDEN _sk_load_4444_aarch64 .globl _sk_load_4444_aarch64 @@ -3231,7 +3215,7 @@ _sk_load_4444_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020508 // add x8, x8, x2, lsl #1 - .long 0xb5000444 // cbnz x4, 2c90 + .long 0xb5000444 // cbnz x4, 2c50 .long 0xfd400100 // ldr d0, [x8] .long 0x52a6f108 // mov w8, #0x37880000 .long 0x2f10a400 // uxtl v0.4s, v0.4h @@ -3267,12 +3251,12 @@ _sk_load_4444_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000220 // b.eq 2cdc // b.none + .long 0x54000220 // b.eq 2c9c // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x2f00e400 // movi d0, #0x0 - .long 0x540000c0 // b.eq 2cbc // b.none + .long 0x540000c0 // b.eq 2c7c // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffb21 // b.ne 2c10 // b.any + .long 0x54fffb21 // b.ne 2bd0 // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0e020fe0 // dup v0.4h, wzr .long 0x0d405120 // ld1 {v0.h}[2], [x9] @@ -3283,10 +3267,10 @@ _sk_load_4444_aarch64: .long 0x0e401821 // uzp1 v1.4h, v1.4h, v0.4h .long 0x2e012000 // ext v0.8b, v0.8b, v1.8b, #4 .long 0x2e002000 // ext v0.8b, v0.8b, v0.8b, #4 - .long 0x17ffffce // b 2c10 + .long 0x17ffffce // b 2bd0 .long 0x0e020fe0 // dup v0.4h, wzr .long 0x0d404100 // ld1 {v0.h}[0], [x8] - .long 0x17ffffcb // b 2c10 + .long 0x17ffffcb // b 2bd0 HIDDEN _sk_gather_4444_aarch64 .globl _sk_gather_4444_aarch64 @@ -3365,24 +3349,24 @@ _sk_store_4444_aarch64: .long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b .long 0x8b020508 // add x8, x8, x2, lsl #1 .long 0x0e612a10 // xtn v16.4h, v16.4s - .long 0xb50000a4 // cbnz x4, 2e0c + .long 0xb50000a4 // cbnz x4, 2dcc .long 0xfd000110 // str d16, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000120 // b.eq 2e38 // b.none + .long 0x54000120 // b.eq 2df8 // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 2e30 // b.none + .long 0x540000a0 // b.eq 2df0 // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffee1 // b.ne 2e00 // b.any + .long 0x54fffee1 // b.ne 2dc0 // b.any .long 0x91001109 // add x9, x8, #0x4 .long 0x0d005130 // st1 {v16.h}[2], [x9] .long 0x91000909 // add x9, x8, #0x2 .long 0x0d004930 // st1 {v16.h}[1], [x9] .long 0x0d004110 // st1 {v16.h}[0], [x8] - .long 0x17fffff1 // b 2e00 + .long 0x17fffff1 // b 2dc0 HIDDEN _sk_load_8888_aarch64 .globl _sk_load_8888_aarch64 @@ -3391,7 +3375,7 @@ _sk_load_8888_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020908 // add x8, x8, x2, lsl #2 - .long 0xb50002e4 // cbnz x4, 2ea8 + .long 0xb50002e4 // cbnz x4, 2e68 .long 0x3dc00100 // ldr q0, [x8] .long 0x6f00e621 // movi v1.2d, #0xff000000ff .long 0x52a77008 // mov w8, #0x3b800000 @@ -3416,22 +3400,22 @@ _sk_load_8888_aarch64: .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x540001a0 // b.eq 2ee4 // b.none + .long 0x540001a0 // b.eq 2ea4 // b.none .long 0x7100093f // cmp w9, #0x2 .long 0x6f00e400 // movi v0.2d, #0x0 - .long 0x540000c0 // b.eq 2ed4 // b.none + .long 0x540000c0 // b.eq 2e94 // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffc81 // b.ne 2e54 // b.any + .long 0x54fffc81 // b.ne 2e14 // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4e040fe0 // dup v0.4s, wzr .long 0x4d408120 // ld1 {v0.s}[2], [x9] .long 0xfd400101 // ldr d1, [x8] .long 0x6e014000 // ext v0.16b, v0.16b, v1.16b, #8 .long 0x6e004000 // ext v0.16b, v0.16b, v0.16b, #8 - .long 0x17ffffdd // b 2e54 + .long 0x17ffffdd // b 2e14 .long 0x4e040fe0 // dup v0.4s, wzr .long 0x0d408100 // ld1 {v0.s}[0], [x8] - .long 0x17ffffda // b 2e54 + .long 0x17ffffda // b 2e14 HIDDEN _sk_gather_8888_aarch64 .globl _sk_gather_8888_aarch64 @@ -3499,24 +3483,24 @@ _sk_store_8888_aarch64: .long 0x4eb21e31 // orr v17.16b, v17.16b, v18.16b .long 0x8b020908 // add x8, x8, x2, lsl #2 .long 0x4eb01e30 // orr v16.16b, v17.16b, v16.16b - .long 0xb50000a4 // cbnz x4, 2fe8 + .long 0xb50000a4 // cbnz x4, 2fa8 .long 0x3d800110 // str q16, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x12000489 // and w9, w4, #0x3 .long 0x7100053f // cmp w9, #0x1 - .long 0x54000120 // b.eq 3014 // b.none + .long 0x54000120 // b.eq 2fd4 // b.none .long 0x7100093f // cmp w9, #0x2 - .long 0x540000a0 // b.eq 300c // b.none + .long 0x540000a0 // b.eq 2fcc // b.none .long 0x71000d3f // cmp w9, #0x3 - .long 0x54fffee1 // b.ne 2fdc // b.any + .long 0x54fffee1 // b.ne 2f9c // b.any .long 0x91002109 // add x9, x8, #0x8 .long 0x4d008130 // st1 {v16.s}[2], [x9] .long 0xfd000110 // str d16, [x8] - .long 0x17fffff3 // b 2fdc + .long 0x17fffff3 // b 2f9c .long 0x0d008110 // st1 {v16.s}[0], [x8] - .long 0x17fffff1 // b 2fdc + .long 0x17fffff1 // b 2f9c HIDDEN _sk_load_f16_aarch64 .globl _sk_load_f16_aarch64 @@ -3525,7 +3509,7 @@ _sk_load_f16_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020d08 // add x8, x8, x2, lsl #3 - .long 0xb5000124 // cbnz x4, 304c + .long 0xb5000124 // cbnz x4, 300c .long 0x0c400510 // ld4 {v16.4h-v19.4h}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x0e217a00 // fcvtl v0.4s, v16.4h @@ -3536,14 +3520,14 @@ _sk_load_f16_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d606110 // ld4 {v16.h-v19.h}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fffee0 // b.eq 3030 // b.none + .long 0x54fffee0 // b.eq 2ff0 // b.none .long 0x91002109 // add x9, x8, #0x8 .long 0x0d606930 // ld4 {v16.h-v19.h}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffe63 // b.cc 3030 // b.lo, b.ul, b.last + .long 0x54fffe63 // b.cc 2ff0 // b.lo, b.ul, b.last .long 0x91004108 // add x8, x8, #0x10 .long 0x0d607110 // ld4 {v16.h-v19.h}[2], [x8] - .long 0x17fffff0 // b 3030 + .long 0x17fffff0 // b 2ff0 HIDDEN _sk_gather_f16_aarch64 .globl _sk_gather_f16_aarch64 @@ -3597,21 +3581,21 @@ _sk_store_f16_aarch64: .long 0xf9400108 // ldr x8, [x8] .long 0x0e216873 // fcvtn v19.4h, v3.4s .long 0x8b020d08 // add x8, x8, x2, lsl #3 - .long 0xb50000a4 // cbnz x4, 3134 + .long 0xb50000a4 // cbnz x4, 30f4 .long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0xf100049f // cmp x4, #0x1 .long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8] - .long 0x54ffff60 // b.eq 3128 // b.none + .long 0x54ffff60 // b.eq 30e8 // b.none .long 0x91002109 // add x9, x8, #0x8 .long 0xf1000c9f // cmp x4, #0x3 .long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9] - .long 0x54fffee3 // b.cc 3128 // b.lo, b.ul, b.last + .long 0x54fffee3 // b.cc 30e8 // b.lo, b.ul, b.last .long 0x91004108 // add x8, x8, #0x10 .long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8] - .long 0x17fffff4 // b 3128 + .long 0x17fffff4 // b 30e8 HIDDEN _sk_load_u16_be_aarch64 .globl _sk_load_u16_be_aarch64 @@ -3620,7 +3604,7 @@ _sk_load_u16_be_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b020d08 // add x8, x8, x2, lsl #3 - .long 0xb5000404 // cbnz x4, 31e8 + .long 0xb5000404 // cbnz x4, 31a8 .long 0x0c400500 // ld4 {v0.4h-v3.4h}, [x8] .long 0x0f185410 // shl v16.4h, v0.4h, #8 .long 0x2f180411 // ushr v17.4h, v0.4h, #8 @@ -3654,14 +3638,14 @@ _sk_load_u16_be_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d606100 // ld4 {v0.h-v3.h}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fffc00 // b.eq 3170 // b.none + .long 0x54fffc00 // b.eq 3130 // b.none .long 0x91002109 // add x9, x8, #0x8 .long 0x0d606920 // ld4 {v0.h-v3.h}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffb83 // b.cc 3170 // b.lo, b.ul, b.last + .long 0x54fffb83 // b.cc 3130 // b.lo, b.ul, b.last .long 0x91004108 // add x8, x8, #0x10 .long 0x0d607100 // ld4 {v0.h-v3.h}[2], [x8] - .long 0x17ffffd9 // b 3170 + .long 0x17ffffd9 // b 3130 HIDDEN _sk_load_rgb_u16_be_aarch64 .globl _sk_load_rgb_u16_be_aarch64 @@ -3671,7 +3655,7 @@ _sk_load_rgb_u16_be_aarch64: .long 0x321f07e9 // orr w9, wzr, #0x6 .long 0xf9400108 // ldr x8, [x8] .long 0x9b092048 // madd x8, x2, x9, x8 - .long 0xb5000384 // cbnz x4, 3290 + .long 0xb5000384 // cbnz x4, 3250 .long 0x0c404500 // ld3 {v0.4h-v2.4h}, [x8] .long 0x0f185403 // shl v3.4h, v0.4h, #8 .long 0x2f180410 // ushr v16.4h, v0.4h, #8 @@ -3701,14 +3685,14 @@ _sk_load_rgb_u16_be_aarch64: .long 0xd61f00a0 // br x5 .long 0x0d406100 // ld3 {v0.h-v2.h}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54fffc80 // b.eq 3228 // b.none + .long 0x54fffc80 // b.eq 31e8 // b.none .long 0x91001909 // add x9, x8, #0x6 .long 0x0d406920 // ld3 {v0.h-v2.h}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffc03 // b.cc 3228 // b.lo, b.ul, b.last + .long 0x54fffc03 // b.cc 31e8 // b.lo, b.ul, b.last .long 0x91003108 // add x8, x8, #0xc .long 0x0d407100 // ld3 {v0.h-v2.h}[2], [x8] - .long 0x17ffffdd // b 3228 + .long 0x17ffffdd // b 31e8 HIDDEN _sk_store_u16_be_aarch64 .globl _sk_store_u16_be_aarch64 @@ -3744,21 +3728,21 @@ _sk_store_u16_be_aarch64: .long 0x2f180694 // ushr v20.4h, v20.4h, #8 .long 0x8b020d08 // add x8, x8, x2, lsl #3 .long 0x0eb41eb3 // orr v19.8b, v21.8b, v20.8b - .long 0xb50000a4 // cbnz x4, 3344 + .long 0xb50000a4 // cbnz x4, 3304 .long 0x0c000510 // st4 {v16.4h-v19.4h}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0xf100049f // cmp x4, #0x1 .long 0x0d206110 // st4 {v16.h-v19.h}[0], [x8] - .long 0x54ffff60 // b.eq 3338 // b.none + .long 0x54ffff60 // b.eq 32f8 // b.none .long 0x91002109 // add x9, x8, #0x8 .long 0xf1000c9f // cmp x4, #0x3 .long 0x0d206930 // st4 {v16.h-v19.h}[1], [x9] - .long 0x54fffee3 // b.cc 3338 // b.lo, b.ul, b.last + .long 0x54fffee3 // b.cc 32f8 // b.lo, b.ul, b.last .long 0x91004108 // add x8, x8, #0x10 .long 0x0d207110 // st4 {v16.h-v19.h}[2], [x8] - .long 0x17fffff4 // b 3338 + .long 0x17fffff4 // b 32f8 HIDDEN _sk_load_f32_aarch64 .globl _sk_load_f32_aarch64 @@ -3767,21 +3751,21 @@ _sk_load_f32_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b021108 // add x8, x8, x2, lsl #4 - .long 0xb50000a4 // cbnz x4, 338c + .long 0xb50000a4 // cbnz x4, 334c .long 0x4c400900 // ld4 {v0.4s-v3.4s}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0x0d60a100 // ld4 {v0.s-v3.s}[0], [x8] .long 0xf100049f // cmp x4, #0x1 - .long 0x54ffff60 // b.eq 3380 // b.none + .long 0x54ffff60 // b.eq 3340 // b.none .long 0x91004109 // add x9, x8, #0x10 .long 0x0d60b120 // ld4 {v0.s-v3.s}[1], [x9] .long 0xf1000c9f // cmp x4, #0x3 - .long 0x54fffee3 // b.cc 3380 // b.lo, b.ul, b.last + .long 0x54fffee3 // b.cc 3340 // b.lo, b.ul, b.last .long 0x91008108 // add x8, x8, #0x20 .long 0x4d60a100 // ld4 {v0.s-v3.s}[2], [x8] - .long 0x17fffff4 // b 3380 + .long 0x17fffff4 // b 3340 HIDDEN _sk_store_f32_aarch64 .globl _sk_store_f32_aarch64 @@ -3790,21 +3774,21 @@ _sk_store_f32_aarch64: .long 0xf9400028 // ldr x8, [x1] .long 0xf9400108 // ldr x8, [x8] .long 0x8b021108 // add x8, x8, x2, lsl #4 - .long 0xb50000a4 // cbnz x4, 33d4 + .long 0xb50000a4 // cbnz x4, 3394 .long 0x4c000900 // st4 {v0.4s-v3.4s}, [x8] .long 0xf9400425 // ldr x5, [x1, #8] .long 0x91004021 // add x1, x1, #0x10 .long 0xd61f00a0 // br x5 .long 0xf100049f // cmp x4, #0x1 .long 0x0d20a100 // st4 {v0.s-v3.s}[0], [x8] - .long 0x54ffff60 // b.eq 33c8 // b.none + .long 0x54ffff60 // b.eq 3388 // b.none .long 0x91004109 // add x9, x8, #0x10 .long 0xf1000c9f // cmp x4, #0x3 .long 0x0d20b120 // st4 {v0.s-v3.s}[1], [x9] - .long 0x54fffee3 // b.cc 33c8 // b.lo, b.ul, b.last + .long 0x54fffee3 // b.cc 3388 // b.lo, b.ul, b.last .long 0x91008108 // add x8, x8, #0x20 .long 0x4d20a100 // st4 {v0.s-v3.s}[2], [x8] - .long 0x17fffff4 // b 33c8 + .long 0x17fffff4 // b 3388 HIDDEN _sk_clamp_x_aarch64 .globl _sk_clamp_x_aarch64 @@ -4263,7 +4247,7 @@ _sk_gradient_aarch64: .long 0x6f00e411 // movi v17.2d, #0x0 .long 0xf9400109 // ldr x9, [x8] .long 0xf100093f // cmp x9, #0x2 - .long 0x540001c3 // b.cc 39f4 // b.lo, b.ul, b.last + .long 0x540001c3 // b.cc 39b4 // b.lo, b.ul, b.last .long 0xf940250a // ldr x10, [x8, #72] .long 0xd1000529 // sub x9, x9, #0x1 .long 0x6f00e401 // movi v1.2d, #0x0 @@ -4274,7 +4258,7 @@ _sk_gradient_aarch64: .long 0x6e23e403 // fcmge v3.4s, v0.4s, v3.4s .long 0x4e221c63 // and v3.16b, v3.16b, v2.16b .long 0x4ea18461 // add v1.4s, v3.4s, v1.4s - .long 0xb5ffff69 // cbnz x9, 39d4 + .long 0xb5ffff69 // cbnz x9, 3994 .long 0x6f20a431 // uxtl2 v17.2d, v1.4s .long 0x2f20a421 // uxtl v1.2d, v1.2s .long 0xa940b10a // ldp x10, x12, [x8, #8] @@ -4784,48 +4768,32 @@ _sk_start_pipeline_vfp4: .long 0xe24dd004 // sub sp, sp, #4 .long 0xe1a04003 // mov r4, r3 .long 0xe59b8008 // ldr r8, [fp, #8] - .long 0xe4949004 // ldr r9, [r4], #4 + .long 0xe4945004 // ldr r5, [r4], #4 .long 0xe1a06000 // mov r6, r0 .long 0xe2860002 // add r0, r6, #2 .long 0xe1a07002 // mov r7, r2 - .long 0xe1a05001 // mov r5, r1 + .long 0xe1a09001 // mov r9, r1 .long 0xe1500007 // cmp r0, r7 - .long 0x8a000012 // bhi 7c + .long 0x8a00000a // bhi 5c .long 0xe3a0a000 // mov sl, #0 - .long 0xf2800010 // vmov.i32 d0, #0 .long 0xe1a00008 // mov r0, r8 - .long 0xf2801010 // vmov.i32 d1, #0 .long 0xe1a01004 // mov r1, r4 - .long 0xf2802010 // vmov.i32 d2, #0 .long 0xe1a02006 // mov r2, r6 - .long 0xf2803010 // vmov.i32 d3, #0 - .long 0xe1a03005 // mov r3, r5 - .long 0xf2804010 // vmov.i32 d4, #0 + .long 0xe1a03009 // mov r3, r9 .long 0xe58da000 // str sl, [sp] - .long 0xf2805010 // vmov.i32 d5, #0 - .long 0xf2806010 // vmov.i32 d6, #0 - .long 0xf2807010 // vmov.i32 d7, #0 - .long 0xe12fff39 // blx r9 + .long 0xe12fff35 // blx r5 .long 0xe2860004 // add r0, r6, #4 .long 0xe2866002 // add r6, r6, #2 .long 0xe1500007 // cmp r0, r7 - .long 0x9affffed // bls 34 + .long 0x9afffff5 // bls 34 .long 0xe0570006 // subs r0, r7, r6 - .long 0x0a00000d // beq bc - .long 0xf2800010 // vmov.i32 d0, #0 + .long 0x0a000005 // beq 7c .long 0xe58d0000 // str r0, [sp] - .long 0xf2801010 // vmov.i32 d1, #0 .long 0xe1a00008 // mov r0, r8 - .long 0xf2802010 // vmov.i32 d2, #0 .long 0xe1a01004 // mov r1, r4 - .long 0xf2803010 // vmov.i32 d3, #0 .long 0xe1a02006 // mov r2, r6 - .long 0xf2804010 // vmov.i32 d4, #0 - .long 0xe1a03005 // mov r3, r5 - .long 0xf2805010 // vmov.i32 d5, #0 - .long 0xf2806010 // vmov.i32 d6, #0 - .long 0xf2807010 // vmov.i32 d7, #0 - .long 0xe12fff39 // blx r9 + .long 0xe1a03009 // mov r3, r9 + .long 0xe12fff35 // blx r5 .long 0xe24bd01c // sub sp, fp, #28 .long 0xe8bd8ff0 // pop {r4, r5, r6, r7, r8, r9, sl, fp, pc} @@ -6185,7 +6153,7 @@ _sk_srcover_rgba_8888_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc102 // add ip, ip, r2, lsl #2 - .long 0x0a00002c // beq 1408 + .long 0x0a00002c // beq 13c8 .long 0xed9c4b00 // vldr d4, [ip] .long 0xf2c71f10 // vmov.f32 d17, #1 .long 0xeddf6b2f // vldr d22, [pc, #188] @@ -6225,7 +6193,7 @@ _sk_srcover_rgba_8888_vfp4: .long 0xf2f00530 // vshl.s32 d16, d16, #16 .long 0xf26111b2 // vorr d17, d17, d18 .long 0xf26101b0 // vorr d16, d17, d16 - .long 0x0a000007 // beq 1414 + .long 0x0a000007 // beq 13d4 .long 0xedcc0b00 // vstr d16, [ip] .long 0xe591c004 // ldr ip, [r1, #4] .long 0xe2811008 // add r1, r1, #8 @@ -6233,9 +6201,9 @@ _sk_srcover_rgba_8888_vfp4: .long 0xe12fff1c // bx ip .long 0xeddf4a06 // vldr s9, [pc, #24] .long 0xed9c4a00 // vldr s8, [ip] - .long 0xeaffffd0 // b 1358 + .long 0xeaffffd0 // b 1318 .long 0xf4cc083f // vst1.32 {d16[0]}, [ip :32] - .long 0xeafffff6 // b 13f8 + .long 0xeafffff6 // b 13b8 .long 0xe320f000 // nop {0} .long 0x437f0000 // .word 0x437f0000 .long 0x437f0000 // .word 0x437f0000 @@ -6679,7 +6647,7 @@ _sk_scale_u8_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc002 // add ip, ip, r2 - .long 0x0a000014 // beq 1a20 + .long 0x0a000014 // beq 19e0 .long 0xe1dcc0b0 // ldrh ip, [ip] .long 0xe1cdc0b4 // strh ip, [sp, #4] .long 0xe28dc004 // add ip, sp, #4 @@ -6704,7 +6672,7 @@ _sk_scale_u8_vfp4: .long 0xe5dcc000 // ldrb ip, [ip] .long 0xeddf8a03 // vldr s17, [pc, #12] .long 0xee08ca10 // vmov s16, ip - .long 0xeaffffec // b 19e4 + .long 0xeaffffec // b 19a4 .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 .long 0x00000000 // .word 0x00000000 @@ -6745,7 +6713,7 @@ _sk_lerp_u8_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc002 // add ip, ip, r2 - .long 0x0a00001e // beq 1b28 + .long 0x0a00001e // beq 1ae8 .long 0xe1dcc0b0 // ldrh ip, [ip] .long 0xe1cdc0b4 // strh ip, [sp, #4] .long 0xe28dc004 // add ip, sp, #4 @@ -6780,7 +6748,7 @@ _sk_lerp_u8_vfp4: .long 0xe5dcc000 // ldrb ip, [ip] .long 0xeddf8a03 // vldr s17, [pc, #12] .long 0xee08ca10 // vmov s16, ip - .long 0xeaffffe2 // b 1ac4 + .long 0xeaffffe2 // b 1a84 .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 .long 0x00000000 // .word 0x00000000 @@ -6798,7 +6766,7 @@ _sk_lerp_565_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc082 // add ip, ip, r2, lsl #1 - .long 0x0a00002e // beq 1c28 + .long 0x0a00002e // beq 1be8 .long 0xe59cc000 // ldr ip, [ip] .long 0xe58dc004 // str ip, [sp, #4] .long 0xe28dc004 // add ip, sp, #4 @@ -6849,7 +6817,7 @@ _sk_lerp_565_vfp4: .long 0xe1dcc0b0 // ldrh ip, [ip] .long 0xeddf8a07 // vldr s17, [pc, #28] .long 0xee08ca10 // vmov s16, ip - .long 0xeaffffd1 // b 1b80 + .long 0xeaffffd1 // b 1b40 .long 0x3d042108 // .word 0x3d042108 .long 0x3d042108 // .word 0x3d042108 .long 0x3a020821 // .word 0x3a020821 @@ -6869,7 +6837,7 @@ _sk_load_tables_vfp4: .long 0xe59ce000 // ldr lr, [ip] .long 0xe3540001 // cmp r4, #1 .long 0xe08ee102 // add lr, lr, r2, lsl #2 - .long 0x0a000023 // beq 1d04 + .long 0x0a000023 // beq 1cc4 .long 0xed9e0b00 // vldr d0, [lr] .long 0xf3c7001f // vmov.i32 d16, #255 .long 0xe59c7004 // ldr r7, [ip, #4] @@ -6908,7 +6876,7 @@ _sk_load_tables_vfp4: .long 0xe12fff1c // bx ip .long 0xeddf0a03 // vldr s1, [pc, #12] .long 0xed9e0a00 // vldr s0, [lr] - .long 0xeaffffd9 // b 1c78 + .long 0xeaffffd9 // b 1c38 .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 .long 0x00000000 // .word 0x00000000 @@ -6925,7 +6893,7 @@ _sk_load_tables_u16_be_vfp4: .long 0xe3540000 // cmp r4, #0 .long 0xe08ee182 // add lr, lr, r2, lsl #3 .long 0xf4ee070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [lr] - .long 0x1a000001 // bne 1d48 + .long 0x1a000001 // bne 1d08 .long 0xe28e4008 // add r4, lr, #8 .long 0xf4e4074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [r4] .long 0xee924bb0 // vmov.u16 r4, d18[0] @@ -6997,7 +6965,7 @@ _sk_load_tables_rgb_u16_be_vfp4: .long 0xe59d4020 // ldr r4, [sp, #32] .long 0xf4ee060f // vld3.16 {d16[0],d17[0],d18[0]}, [lr] .long 0xe3540000 // cmp r4, #0 - .long 0x1a000001 // bne 1e54 + .long 0x1a000001 // bne 1e14 .long 0xe28e4006 // add r4, lr, #6 .long 0xf4e4064f // vld3.16 {d16[1],d17[1],d18[1]}, [r4] .long 0xee924bb0 // vmov.u16 r4, d18[0] @@ -7712,7 +7680,7 @@ _sk_load_a8_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc002 // add ip, ip, r2 - .long 0x0a000012 // beq 28d4 + .long 0x0a000012 // beq 2894 .long 0xe1dcc0b0 // ldrh ip, [ip] .long 0xe1cdc0b0 // strh ip, [sp] .long 0xe1a0c00d // mov ip, sp @@ -7735,7 +7703,7 @@ _sk_load_a8_vfp4: .long 0xe5dcc000 // ldrb ip, [ip] .long 0xeddf0a04 // vldr s1, [pc, #16] .long 0xee00ca10 // vmov s0, ip - .long 0xeaffffee // b 28a0 + .long 0xeaffffee // b 2860 .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -7789,7 +7757,7 @@ _sk_store_a8_vfp4: .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc002 // add ip, ip, r2 .long 0xf3fb07a1 // vcvt.u32.f32 d16, d17 - .long 0x0a000007 // beq 29b4 + .long 0x0a000007 // beq 2974 .long 0xee30eb90 // vmov.32 lr, d16[1] .long 0xee104b90 // vmov.32 r4, d16[0] .long 0xe5cce001 // strb lr, [ip, #1] @@ -7800,7 +7768,7 @@ _sk_store_a8_vfp4: .long 0xe12fff1c // bx ip .long 0xee10eb90 // vmov.32 lr, d16[0] .long 0xe5cce000 // strb lr, [ip] - .long 0xeafffff8 // b 29a4 + .long 0xeafffff8 // b 2964 .long 0x437f0000 // .word 0x437f0000 .long 0x437f0000 // .word 0x437f0000 @@ -7815,7 +7783,7 @@ _sk_load_g8_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc002 // add ip, ip, r2 - .long 0x0a000012 // beq 2a34 + .long 0x0a000012 // beq 29f4 .long 0xe1dcc0b0 // ldrh ip, [ip] .long 0xe1cdc0b0 // strh ip, [sp] .long 0xe1a0c00d // mov ip, sp @@ -7838,7 +7806,7 @@ _sk_load_g8_vfp4: .long 0xe5dcc000 // ldrb ip, [ip] .long 0xeddf0a04 // vldr s1, [pc, #16] .long 0xee00ca10 // vmov s0, ip - .long 0xeaffffee // b 2a00 + .long 0xeaffffee // b 29c0 .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -7942,7 +7910,7 @@ _sk_load_565_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc082 // add ip, ip, r2, lsl #1 - .long 0x0a00001a // beq 2c14 + .long 0x0a00001a // beq 2bd4 .long 0xe59cc000 // ldr ip, [ip] .long 0xe58dc000 // str ip, [sp] .long 0xe1a0c00d // mov ip, sp @@ -7973,7 +7941,7 @@ _sk_load_565_vfp4: .long 0xe1dcc0b0 // ldrh ip, [ip] .long 0xeddf0a08 // vldr s1, [pc, #32] .long 0xee00ca10 // vmov s0, ip - .long 0xeaffffe5 // b 2bbc + .long 0xeaffffe5 // b 2b7c .long 0xe320f000 // nop {0} .long 0x37842108 // .word 0x37842108 .long 0x37842108 // .word 0x37842108 @@ -8056,7 +8024,7 @@ _sk_store_565_vfp4: .long 0xf2eb1531 // vshl.s32 d17, d17, #11 .long 0xf26001b1 // vorr d16, d16, d17 .long 0xf26001b2 // vorr d16, d16, d18 - .long 0x0a000005 // beq 2d60 + .long 0x0a000005 // beq 2d20 .long 0xf3f60121 // vuzp.16 d16, d17 .long 0xf4cc080f // vst1.32 {d16[0]}, [ip] .long 0xe591c004 // ldr ip, [r1, #4] @@ -8065,7 +8033,7 @@ _sk_store_565_vfp4: .long 0xe12fff1c // bx ip .long 0xee10eb90 // vmov.32 lr, d16[0] .long 0xe1cce0b0 // strh lr, [ip] - .long 0xeafffff8 // b 2d50 + .long 0xeafffff8 // b 2d10 .long 0xe320f000 // nop {0} .long 0x427c0000 // .word 0x427c0000 .long 0x427c0000 // .word 0x427c0000 @@ -8081,7 +8049,7 @@ _sk_load_4444_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc082 // add ip, ip, r2, lsl #1 - .long 0x0a00001d // beq 2e10 + .long 0x0a00001d // beq 2dd0 .long 0xe59cc000 // ldr ip, [ip] .long 0xe58dc000 // str ip, [sp] .long 0xe1a0c00d // mov ip, sp @@ -8115,7 +8083,7 @@ _sk_load_4444_vfp4: .long 0xe1dcc0b0 // ldrh ip, [ip] .long 0xeddf0a09 // vldr s1, [pc, #36] .long 0xee00ca10 // vmov s0, ip - .long 0xeaffffe2 // b 2dac + .long 0xeaffffe2 // b 2d6c .long 0x37888889 // .word 0x37888889 .long 0x37888889 // .word 0x37888889 .long 0x39888889 // .word 0x39888889 @@ -8209,7 +8177,7 @@ _sk_store_4444_vfp4: .long 0xf26201b0 // vorr d16, d18, d16 .long 0xf26001b3 // vorr d16, d16, d19 .long 0xf26001b1 // vorr d16, d16, d17 - .long 0x0a000005 // beq 2f88 + .long 0x0a000005 // beq 2f48 .long 0xf3f60121 // vuzp.16 d16, d17 .long 0xf4cc080f // vst1.32 {d16[0]}, [ip] .long 0xe591c004 // ldr ip, [r1, #4] @@ -8218,7 +8186,7 @@ _sk_store_4444_vfp4: .long 0xe12fff1c // bx ip .long 0xee10eb90 // vmov.32 lr, d16[0] .long 0xe1cce0b0 // strh lr, [ip] - .long 0xeafffff8 // b 2f78 + .long 0xeafffff8 // b 2f38 .long 0xe320f000 // nop {0} HIDDEN _sk_load_8888_vfp4 @@ -8231,7 +8199,7 @@ _sk_load_8888_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0001 // cmp lr, #1 .long 0xe08cc102 // add ip, ip, r2, lsl #2 - .long 0x0a000014 // beq 3008 + .long 0x0a000014 // beq 2fc8 .long 0xed9c0b00 // vldr d0, [ip] .long 0xf3c7001f // vmov.i32 d16, #255 .long 0xe591c004 // ldr ip, [r1, #4] @@ -8255,7 +8223,7 @@ _sk_load_8888_vfp4: .long 0xe12fff1c // bx ip .long 0xeddf0a04 // vldr s1, [pc, #16] .long 0xed9c0a00 // vldr s0, [ip] - .long 0xeaffffe8 // b 2fb8 + .long 0xeaffffe8 // b 2f78 .long 0xe320f000 // nop {0} .long 0x3b808081 // .word 0x3b808081 .long 0x3b808081 // .word 0x3b808081 @@ -8332,14 +8300,14 @@ _sk_store_8888_vfp4: .long 0xf2f81533 // vshl.s32 d17, d19, #24 .long 0xf26001b2 // vorr d16, d16, d18 .long 0xf26001b1 // vorr d16, d16, d17 - .long 0x0a000004 // beq 3134 + .long 0x0a000004 // beq 30f4 .long 0xedcc0b00 // vstr d16, [ip] .long 0xe591c004 // ldr ip, [r1, #4] .long 0xe2811008 // add r1, r1, #8 .long 0xe8bd4800 // pop {fp, lr} .long 0xe12fff1c // bx ip .long 0xf4cc083f // vst1.32 {d16[0]}, [ip :32] - .long 0xeafffff9 // b 3124 + .long 0xeafffff9 // b 30e4 .long 0xe320f000 // nop {0} .long 0x437f0000 // .word 0x437f0000 .long 0x437f0000 // .word 0x437f0000 @@ -8355,7 +8323,7 @@ _sk_load_f16_vfp4: .long 0xe35e0000 // cmp lr, #0 .long 0xe08cc182 // add ip, ip, r2, lsl #3 .long 0xf4ec070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [ip] - .long 0x1a000001 // bne 3170 + .long 0x1a000001 // bne 3130 .long 0xe28cc008 // add ip, ip, #8 .long 0xf4ec074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [ip] .long 0xf3b60720 // vcvt.f32.f16 q0, d16 @@ -8425,7 +8393,7 @@ _sk_store_f16_vfp4: .long 0xf3f65622 // vcvt.f16.f32 d21, q9 .long 0xf3f64600 // vcvt.f16.f32 d20, q0 .long 0xf4cc470f // vst4.16 {d20[0],d21[0],d22[0],d23[0]}, [ip] - .long 0x1a000001 // bne 3260 + .long 0x1a000001 // bne 3220 .long 0xe28cc008 // add ip, ip, #8 .long 0xf4cc474f // vst4.16 {d20[1],d21[1],d22[1],d23[1]}, [ip] .long 0xe591c004 // ldr ip, [r1, #4] @@ -8446,7 +8414,7 @@ _sk_load_u16_be_vfp4: .long 0xe35e0000 // cmp lr, #0 .long 0xe08cc182 // add ip, ip, r2, lsl #3 .long 0xf4ec070f // vld4.16 {d16[0],d17[0],d18[0],d19[0]}, [ip] - .long 0x1a000001 // bne 32a0 + .long 0x1a000001 // bne 3260 .long 0xe28cc008 // add ip, ip, #8 .long 0xf4ec074f // vld4.16 {d16[1],d17[1],d18[1],d19[1]}, [ip] .long 0xee90cbb0 // vmov.u16 ip, d16[0] @@ -8514,7 +8482,7 @@ _sk_load_rgb_u16_be_vfp4: .long 0xe59de018 // ldr lr, [sp, #24] .long 0xf4ec060f // vld3.16 {d16[0],d17[0],d18[0]}, [ip] .long 0xe35e0000 // cmp lr, #0 - .long 0x1a000001 // bne 339c + .long 0x1a000001 // bne 335c .long 0xe28cc006 // add ip, ip, #6 .long 0xf4ec064f // vld3.16 {d16[1],d17[1],d18[1]}, [ip] .long 0xee90cbb0 // vmov.u16 ip, d16[0] @@ -8606,7 +8574,7 @@ _sk_store_u16_be_vfp4: .long 0xe35e0000 // cmp lr, #0 .long 0xf3f60124 // vuzp.16 d16, d20 .long 0xf4cc070f // vst4.16 {d16[0],d17[0],d18[0],d19[0]}, [ip] - .long 0x1a000001 // bne 34f8 + .long 0x1a000001 // bne 34b8 .long 0xe28cc008 // add ip, ip, #8 .long 0xf4cc074f // vst4.16 {d16[1],d17[1],d18[1],d19[1]}, [ip] .long 0xe591c004 // ldr ip, [r1, #4] @@ -8626,14 +8594,14 @@ _sk_load_f32_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0000 // cmp lr, #0 .long 0xe08cc202 // add ip, ip, r2, lsl #4 - .long 0x1a000004 // bne 3540 + .long 0x1a000004 // bne 3500 .long 0xf42c008f // vld4.32 {d0-d3}, [ip] .long 0xe591c004 // ldr ip, [r1, #4] .long 0xe2811008 // add r1, r1, #8 .long 0xe8bd4800 // pop {fp, lr} .long 0xe12fff1c // bx ip .long 0xf4ac0f8f // vld4.32 {d0[]-d3[]}, [ip] - .long 0xeafffff9 // b 3530 + .long 0xeafffff9 // b 34f0 HIDDEN _sk_store_f32_vfp4 .globl _sk_store_f32_vfp4 @@ -8645,14 +8613,14 @@ _sk_store_f32_vfp4: .long 0xe59cc000 // ldr ip, [ip] .long 0xe35e0000 // cmp lr, #0 .long 0xe08cc202 // add ip, ip, r2, lsl #4 - .long 0x1a000004 // bne 3578 + .long 0x1a000004 // bne 3538 .long 0xf40c008f // vst4.32 {d0-d3}, [ip] .long 0xe591c004 // ldr ip, [r1, #4] .long 0xe2811008 // add r1, r1, #8 .long 0xe8bd4800 // pop {fp, lr} .long 0xe12fff1c // bx ip .long 0xf48c0b0f // vst4.32 {d0[0],d1[0],d2[0],d3[0]}, [ip] - .long 0xeafffff9 // b 3568 + .long 0xeafffff9 // b 3528 HIDDEN _sk_clamp_x_vfp4 .globl _sk_clamp_x_vfp4 @@ -9228,7 +9196,7 @@ _sk_gradient_vfp4: .long 0xe591c000 // ldr ip, [r1] .long 0xe59c4000 // ldr r4, [ip] .long 0xe3540002 // cmp r4, #2 - .long 0x3a00000b // bcc 3d48 + .long 0x3a00000b // bcc 3d08 .long 0xe59c5024 // ldr r5, [ip, #36] .long 0xf2c01010 // vmov.i32 d17, #0 .long 0xf2c02011 // vmov.i32 d18, #1 @@ -9240,7 +9208,7 @@ _sk_gradient_vfp4: .long 0xf3403e23 // vcge.f32 d19, d0, d19 .long 0xf35231b1 // vbsl d19, d18, d17 .long 0xf26308a0 // vadd.i32 d16, d19, d16 - .long 0x1afffff9 // bne 3d30 + .long 0x1afffff9 // bne 3cf0 .long 0xee304b90 // vmov.32 r4, d16[1] .long 0xe59c6010 // ldr r6, [ip, #16] .long 0xee10eb90 // vmov.32 lr, d16[0] @@ -9818,9 +9786,9 @@ _sk_start_pipeline_hsw: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 80 // push %rax - .byte 76,137,195 // mov %r8,%rbx + .byte 77,137,196 // mov %r8,%r12 .byte 73,137,208 // mov %rdx,%r8 - .byte 73,137,244 // mov %rsi,%r12 + .byte 72,137,243 // mov %rsi,%rbx .byte 73,137,254 // mov %rdi,%r14 .byte 72,137,206 // mov %rcx,%rsi .byte 72,173 // lods %ds:(%rsi),%rax @@ -9830,41 +9798,25 @@ _sk_start_pipeline_hsw: .byte 76,57,193 // cmp %r8,%rcx .byte 118,5 // jbe 33 <_sk_start_pipeline_hsw+0x33> .byte 76,137,242 // mov %r14,%rdx - .byte 235,77 // jmp 80 <_sk_start_pipeline_hsw+0x80> + .byte 235,42 // jmp 5d <_sk_start_pipeline_hsw+0x5d> .byte 76,137,69,208 // mov %r8,-0x30(%rbp) - .byte 65,184,0,0,0,0 // mov $0x0,%r8d - .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 - .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 - .byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2 - .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 - .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 - .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 - .byte 197,204,87,246 // vxorps %ymm6,%ymm6,%ymm6 - .byte 197,196,87,255 // vxorps %ymm7,%ymm7,%ymm7 - .byte 72,137,223 // mov %rbx,%rdi + .byte 69,49,192 // xor %r8d,%r8d + .byte 76,137,231 // mov %r12,%rdi .byte 76,137,254 // mov %r15,%rsi .byte 76,137,242 // mov %r14,%rdx - .byte 76,137,225 // mov %r12,%rcx + .byte 72,137,217 // mov %rbx,%rcx .byte 65,255,213 // callq *%r13 .byte 76,139,69,208 // mov -0x30(%rbp),%r8 .byte 73,141,86,8 // lea 0x8(%r14),%rdx .byte 73,131,198,16 // add $0x10,%r14 .byte 77,57,198 // cmp %r8,%r14 .byte 73,137,214 // mov %rdx,%r14 - .byte 118,183 // jbe 37 <_sk_start_pipeline_hsw+0x37> + .byte 118,218 // jbe 37 <_sk_start_pipeline_hsw+0x37> .byte 73,41,208 // sub %rdx,%r8 - .byte 116,44 // je b1 <_sk_start_pipeline_hsw+0xb1> - .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 - .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 - .byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2 - .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 - .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 - .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 - .byte 197,204,87,246 // vxorps %ymm6,%ymm6,%ymm6 - .byte 197,196,87,255 // vxorps %ymm7,%ymm7,%ymm7 - .byte 72,137,223 // mov %rbx,%rdi + .byte 116,12 // je 6e <_sk_start_pipeline_hsw+0x6e> + .byte 76,137,231 // mov %r12,%rdi .byte 76,137,254 // mov %r15,%rsi - .byte 76,137,225 // mov %r12,%rcx + .byte 72,137,217 // mov %rbx,%rcx .byte 65,255,213 // callq *%r13 .byte 72,131,196,8 // add $0x8,%rsp .byte 91 // pop %rbx @@ -9889,7 +9841,7 @@ _sk_seed_shader_hsw: .byte 197,249,110,194 // vmovd %edx,%xmm0 .byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,206,75,0,0 // vbroadcastss 0x4bce(%rip),%ymm1 # 4ca8 <_sk_callback_hsw+0x144> + .byte 196,226,125,24,13,205,75,0,0 // vbroadcastss 0x4bcd(%rip),%ymm1 # 4c64 <_sk_callback_hsw+0x144> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0 .byte 197,249,110,209 // vmovd %ecx,%xmm2 @@ -9897,7 +9849,7 @@ _sk_seed_shader_hsw: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,174,75,0,0 // vbroadcastss 0x4bae(%rip),%ymm2 # 4cac <_sk_callback_hsw+0x148> + .byte 196,226,125,24,21,173,75,0,0 // vbroadcastss 0x4bad(%rip),%ymm2 # 4c68 <_sk_callback_hsw+0x148> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -9916,13 +9868,13 @@ _sk_dither_hsw: .byte 197,121,110,201 // vmovd %ecx,%xmm9 .byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9 .byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9 - .byte 196,98,125,88,21,117,75,0,0 // vpbroadcastd 0x4b75(%rip),%ymm10 # 4cb0 <_sk_callback_hsw+0x14c> + .byte 196,98,125,88,21,116,75,0,0 // vpbroadcastd 0x4b74(%rip),%ymm10 # 4c6c <_sk_callback_hsw+0x14c> .byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11 .byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11 .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10 - .byte 196,98,125,88,37,90,75,0,0 // vpbroadcastd 0x4b5a(%rip),%ymm12 # 4cb4 <_sk_callback_hsw+0x150> - .byte 196,98,125,88,45,85,75,0,0 // vpbroadcastd 0x4b55(%rip),%ymm13 # 4cb8 <_sk_callback_hsw+0x154> + .byte 196,98,125,88,37,89,75,0,0 // vpbroadcastd 0x4b59(%rip),%ymm12 # 4c70 <_sk_callback_hsw+0x150> + .byte 196,98,125,88,45,84,75,0,0 // vpbroadcastd 0x4b54(%rip),%ymm13 # 4c74 <_sk_callback_hsw+0x154> .byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14 .byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14 .byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13 @@ -9937,8 +9889,8 @@ _sk_dither_hsw: .byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8 .byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,7,75,0,0 // vbroadcastss 0x4b07(%rip),%ymm9 # 4cbc <_sk_callback_hsw+0x158> - .byte 196,98,125,24,21,2,75,0,0 // vbroadcastss 0x4b02(%rip),%ymm10 # 4cc0 <_sk_callback_hsw+0x15c> + .byte 196,98,125,24,13,6,75,0,0 // vbroadcastss 0x4b06(%rip),%ymm9 # 4c78 <_sk_callback_hsw+0x158> + .byte 196,98,125,24,21,1,75,0,0 // vbroadcastss 0x4b01(%rip),%ymm10 # 4c7c <_sk_callback_hsw+0x15c> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8 .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 @@ -10007,7 +9959,7 @@ HIDDEN _sk_srcatop_hsw FUNCTION(_sk_srcatop_hsw) _sk_srcatop_hsw: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,90,74,0,0 // vbroadcastss 0x4a5a(%rip),%ymm8 # 4cc4 <_sk_callback_hsw+0x160> + .byte 196,98,125,24,5,89,74,0,0 // vbroadcastss 0x4a59(%rip),%ymm8 # 4c80 <_sk_callback_hsw+0x160> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0 .byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1 @@ -10023,7 +9975,7 @@ HIDDEN _sk_dstatop_hsw .globl _sk_dstatop_hsw FUNCTION(_sk_dstatop_hsw) _sk_dstatop_hsw: - .byte 196,98,125,24,5,45,74,0,0 // vbroadcastss 0x4a2d(%rip),%ymm8 # 4cc8 <_sk_callback_hsw+0x164> + .byte 196,98,125,24,5,44,74,0,0 // vbroadcastss 0x4a2c(%rip),%ymm8 # 4c84 <_sk_callback_hsw+0x164> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0 @@ -10062,7 +10014,7 @@ HIDDEN _sk_srcout_hsw .globl _sk_srcout_hsw FUNCTION(_sk_srcout_hsw) _sk_srcout_hsw: - .byte 196,98,125,24,5,212,73,0,0 // vbroadcastss 0x49d4(%rip),%ymm8 # 4ccc <_sk_callback_hsw+0x168> + .byte 196,98,125,24,5,211,73,0,0 // vbroadcastss 0x49d3(%rip),%ymm8 # 4c88 <_sk_callback_hsw+0x168> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -10075,7 +10027,7 @@ HIDDEN _sk_dstout_hsw .globl _sk_dstout_hsw FUNCTION(_sk_dstout_hsw) _sk_dstout_hsw: - .byte 196,226,125,24,5,183,73,0,0 // vbroadcastss 0x49b7(%rip),%ymm0 # 4cd0 <_sk_callback_hsw+0x16c> + .byte 196,226,125,24,5,182,73,0,0 // vbroadcastss 0x49b6(%rip),%ymm0 # 4c8c <_sk_callback_hsw+0x16c> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -10088,7 +10040,7 @@ HIDDEN _sk_srcover_hsw .globl _sk_srcover_hsw FUNCTION(_sk_srcover_hsw) _sk_srcover_hsw: - .byte 196,98,125,24,5,154,73,0,0 // vbroadcastss 0x499a(%rip),%ymm8 # 4cd4 <_sk_callback_hsw+0x170> + .byte 196,98,125,24,5,153,73,0,0 // vbroadcastss 0x4999(%rip),%ymm8 # 4c90 <_sk_callback_hsw+0x170> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0 .byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1 @@ -10101,7 +10053,7 @@ HIDDEN _sk_dstover_hsw .globl _sk_dstover_hsw FUNCTION(_sk_dstover_hsw) _sk_dstover_hsw: - .byte 196,98,125,24,5,121,73,0,0 // vbroadcastss 0x4979(%rip),%ymm8 # 4cd8 <_sk_callback_hsw+0x174> + .byte 196,98,125,24,5,120,73,0,0 // vbroadcastss 0x4978(%rip),%ymm8 # 4c94 <_sk_callback_hsw+0x174> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 .byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1 @@ -10125,7 +10077,7 @@ HIDDEN _sk_multiply_hsw .globl _sk_multiply_hsw FUNCTION(_sk_multiply_hsw) _sk_multiply_hsw: - .byte 196,98,125,24,5,68,73,0,0 // vbroadcastss 0x4944(%rip),%ymm8 # 4cdc <_sk_callback_hsw+0x178> + .byte 196,98,125,24,5,67,73,0,0 // vbroadcastss 0x4943(%rip),%ymm8 # 4c98 <_sk_callback_hsw+0x178> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -10173,7 +10125,7 @@ HIDDEN _sk_xor__hsw .globl _sk_xor__hsw FUNCTION(_sk_xor__hsw) _sk_xor__hsw: - .byte 196,98,125,24,5,191,72,0,0 // vbroadcastss 0x48bf(%rip),%ymm8 # 4ce0 <_sk_callback_hsw+0x17c> + .byte 196,98,125,24,5,190,72,0,0 // vbroadcastss 0x48be(%rip),%ymm8 # 4c9c <_sk_callback_hsw+0x17c> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -10207,7 +10159,7 @@ _sk_darken_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,71,72,0,0 // vbroadcastss 0x4847(%rip),%ymm8 # 4ce4 <_sk_callback_hsw+0x180> + .byte 196,98,125,24,5,70,72,0,0 // vbroadcastss 0x4846(%rip),%ymm8 # 4ca0 <_sk_callback_hsw+0x180> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -10232,7 +10184,7 @@ _sk_lighten_hsw: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,246,71,0,0 // vbroadcastss 0x47f6(%rip),%ymm8 # 4ce8 <_sk_callback_hsw+0x184> + .byte 196,98,125,24,5,245,71,0,0 // vbroadcastss 0x47f5(%rip),%ymm8 # 4ca4 <_sk_callback_hsw+0x184> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -10260,7 +10212,7 @@ _sk_difference_hsw: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,153,71,0,0 // vbroadcastss 0x4799(%rip),%ymm8 # 4cec <_sk_callback_hsw+0x188> + .byte 196,98,125,24,5,152,71,0,0 // vbroadcastss 0x4798(%rip),%ymm8 # 4ca8 <_sk_callback_hsw+0x188> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -10282,7 +10234,7 @@ _sk_exclusion_hsw: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,87,71,0,0 // vbroadcastss 0x4757(%rip),%ymm8 # 4cf0 <_sk_callback_hsw+0x18c> + .byte 196,98,125,24,5,86,71,0,0 // vbroadcastss 0x4756(%rip),%ymm8 # 4cac <_sk_callback_hsw+0x18c> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -10292,7 +10244,7 @@ HIDDEN _sk_colorburn_hsw .globl _sk_colorburn_hsw FUNCTION(_sk_colorburn_hsw) _sk_colorburn_hsw: - .byte 196,98,125,24,5,69,71,0,0 // vbroadcastss 0x4745(%rip),%ymm8 # 4cf4 <_sk_callback_hsw+0x190> + .byte 196,98,125,24,5,68,71,0,0 // vbroadcastss 0x4744(%rip),%ymm8 # 4cb0 <_sk_callback_hsw+0x190> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -10350,7 +10302,7 @@ HIDDEN _sk_colordodge_hsw FUNCTION(_sk_colordodge_hsw) _sk_colordodge_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,80,70,0,0 // vbroadcastss 0x4650(%rip),%ymm9 # 4cf8 <_sk_callback_hsw+0x194> + .byte 196,98,125,24,13,79,70,0,0 // vbroadcastss 0x464f(%rip),%ymm9 # 4cb4 <_sk_callback_hsw+0x194> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -10403,7 +10355,7 @@ HIDDEN _sk_hardlight_hsw .globl _sk_hardlight_hsw FUNCTION(_sk_hardlight_hsw) _sk_hardlight_hsw: - .byte 196,98,125,24,5,113,69,0,0 // vbroadcastss 0x4571(%rip),%ymm8 # 4cfc <_sk_callback_hsw+0x198> + .byte 196,98,125,24,5,112,69,0,0 // vbroadcastss 0x4570(%rip),%ymm8 # 4cb8 <_sk_callback_hsw+0x198> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -10454,7 +10406,7 @@ HIDDEN _sk_overlay_hsw .globl _sk_overlay_hsw FUNCTION(_sk_overlay_hsw) _sk_overlay_hsw: - .byte 196,98,125,24,5,169,68,0,0 // vbroadcastss 0x44a9(%rip),%ymm8 # 4d00 <_sk_callback_hsw+0x19c> + .byte 196,98,125,24,5,168,68,0,0 // vbroadcastss 0x44a8(%rip),%ymm8 # 4cbc <_sk_callback_hsw+0x19c> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -10515,10 +10467,10 @@ _sk_softlight_hsw: .byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8 .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,29,180,67,0,0 // vbroadcastss 0x43b4(%rip),%ymm11 # 4d08 <_sk_callback_hsw+0x1a4> + .byte 196,98,125,24,29,179,67,0,0 // vbroadcastss 0x43b3(%rip),%ymm11 # 4cc4 <_sk_callback_hsw+0x1a4> .byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12 .byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8 - .byte 196,98,125,24,37,165,67,0,0 // vbroadcastss 0x43a5(%rip),%ymm12 # 4d0c <_sk_callback_hsw+0x1a8> + .byte 196,98,125,24,37,164,67,0,0 // vbroadcastss 0x43a4(%rip),%ymm12 # 4cc8 <_sk_callback_hsw+0x1a8> .byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8 .byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14 .byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14 @@ -10528,7 +10480,7 @@ _sk_softlight_hsw: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,104,67,0,0 // vbroadcastss 0x4368(%rip),%ymm8 # 4d04 <_sk_callback_hsw+0x1a0> + .byte 196,98,125,24,5,103,67,0,0 // vbroadcastss 0x4367(%rip),%ymm8 # 4cc0 <_sk_callback_hsw+0x1a0> .byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13 @@ -10641,11 +10593,11 @@ _sk_hue_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,108,65,0,0 // vbroadcastss 0x416c(%rip),%ymm14 # 4d10 <_sk_callback_hsw+0x1ac> - .byte 196,98,125,24,61,103,65,0,0 // vbroadcastss 0x4167(%rip),%ymm15 # 4d14 <_sk_callback_hsw+0x1b0> + .byte 196,98,125,24,53,107,65,0,0 // vbroadcastss 0x416b(%rip),%ymm14 # 4ccc <_sk_callback_hsw+0x1ac> + .byte 196,98,125,24,61,102,65,0,0 // vbroadcastss 0x4166(%rip),%ymm15 # 4cd0 <_sk_callback_hsw+0x1b0> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,88,65,0,0 // vbroadcastss 0x4158(%rip),%ymm0 # 4d18 <_sk_callback_hsw+0x1b4> + .byte 196,226,125,24,5,87,65,0,0 // vbroadcastss 0x4157(%rip),%ymm0 # 4cd4 <_sk_callback_hsw+0x1b4> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -10700,7 +10652,7 @@ _sk_hue_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,69,64,0,0 // vbroadcastss 0x4045(%rip),%ymm1 # 4d1c <_sk_callback_hsw+0x1b8> + .byte 196,226,125,24,13,68,64,0,0 // vbroadcastss 0x4044(%rip),%ymm1 # 4cd8 <_sk_callback_hsw+0x1b8> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -10754,11 +10706,11 @@ _sk_saturation_hsw: .byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10 .byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10 .byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - .byte 196,98,125,24,53,92,63,0,0 // vbroadcastss 0x3f5c(%rip),%ymm14 # 4d20 <_sk_callback_hsw+0x1bc> - .byte 196,98,125,24,61,87,63,0,0 // vbroadcastss 0x3f57(%rip),%ymm15 # 4d24 <_sk_callback_hsw+0x1c0> + .byte 196,98,125,24,53,91,63,0,0 // vbroadcastss 0x3f5b(%rip),%ymm14 # 4cdc <_sk_callback_hsw+0x1bc> + .byte 196,98,125,24,61,86,63,0,0 // vbroadcastss 0x3f56(%rip),%ymm15 # 4ce0 <_sk_callback_hsw+0x1c0> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13 - .byte 196,226,125,24,5,72,63,0,0 // vbroadcastss 0x3f48(%rip),%ymm0 # 4d28 <_sk_callback_hsw+0x1c4> + .byte 196,226,125,24,5,71,63,0,0 // vbroadcastss 0x3f47(%rip),%ymm0 # 4ce4 <_sk_callback_hsw+0x1c4> .byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13 .byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10 .byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -10813,7 +10765,7 @@ _sk_saturation_hsw: .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 .byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9 .byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8 - .byte 196,226,125,24,13,53,62,0,0 // vbroadcastss 0x3e35(%rip),%ymm1 # 4d2c <_sk_callback_hsw+0x1c8> + .byte 196,226,125,24,13,52,62,0,0 // vbroadcastss 0x3e34(%rip),%ymm1 # 4ce8 <_sk_callback_hsw+0x1c8> .byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11 @@ -10841,11 +10793,11 @@ _sk_color_hsw: .byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8 .byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10 .byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11 - .byte 196,98,125,24,45,206,61,0,0 // vbroadcastss 0x3dce(%rip),%ymm13 # 4d30 <_sk_callback_hsw+0x1cc> - .byte 196,98,125,24,53,201,61,0,0 // vbroadcastss 0x3dc9(%rip),%ymm14 # 4d34 <_sk_callback_hsw+0x1d0> + .byte 196,98,125,24,45,205,61,0,0 // vbroadcastss 0x3dcd(%rip),%ymm13 # 4cec <_sk_callback_hsw+0x1cc> + .byte 196,98,125,24,53,200,61,0,0 // vbroadcastss 0x3dc8(%rip),%ymm14 # 4cf0 <_sk_callback_hsw+0x1d0> .byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12 .byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12 - .byte 196,98,125,24,61,186,61,0,0 // vbroadcastss 0x3dba(%rip),%ymm15 # 4d38 <_sk_callback_hsw+0x1d4> + .byte 196,98,125,24,61,185,61,0,0 // vbroadcastss 0x3db9(%rip),%ymm15 # 4cf4 <_sk_callback_hsw+0x1d4> .byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -10901,7 +10853,7 @@ _sk_color_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,156,60,0,0 // vbroadcastss 0x3c9c(%rip),%ymm0 # 4d3c <_sk_callback_hsw+0x1d8> + .byte 196,226,125,24,5,155,60,0,0 // vbroadcastss 0x3c9b(%rip),%ymm0 # 4cf8 <_sk_callback_hsw+0x1d8> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -10929,11 +10881,11 @@ _sk_luminosity_hsw: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10 .byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11 - .byte 196,98,125,24,45,53,60,0,0 // vbroadcastss 0x3c35(%rip),%ymm13 # 4d40 <_sk_callback_hsw+0x1dc> - .byte 196,98,125,24,53,48,60,0,0 // vbroadcastss 0x3c30(%rip),%ymm14 # 4d44 <_sk_callback_hsw+0x1e0> + .byte 196,98,125,24,45,52,60,0,0 // vbroadcastss 0x3c34(%rip),%ymm13 # 4cfc <_sk_callback_hsw+0x1dc> + .byte 196,98,125,24,53,47,60,0,0 // vbroadcastss 0x3c2f(%rip),%ymm14 # 4d00 <_sk_callback_hsw+0x1e0> .byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12 .byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12 - .byte 196,98,125,24,61,33,60,0,0 // vbroadcastss 0x3c21(%rip),%ymm15 # 4d48 <_sk_callback_hsw+0x1e4> + .byte 196,98,125,24,61,32,60,0,0 // vbroadcastss 0x3c20(%rip),%ymm15 # 4d04 <_sk_callback_hsw+0x1e4> .byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12 .byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9 .byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -10989,7 +10941,7 @@ _sk_luminosity_hsw: .byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1 .byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8 .byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9 - .byte 196,226,125,24,5,3,59,0,0 // vbroadcastss 0x3b03(%rip),%ymm0 # 4d4c <_sk_callback_hsw+0x1e8> + .byte 196,226,125,24,5,2,59,0,0 // vbroadcastss 0x3b02(%rip),%ymm0 # 4d08 <_sk_callback_hsw+0x1e8> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -11015,19 +10967,19 @@ _sk_srcover_rgba_8888_hsw: .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,180,0,0,0 // jne 1358 <_sk_srcover_rgba_8888_hsw+0xcd> + .byte 15,133,180,0,0,0 // jne 1315 <_sk_srcover_rgba_8888_hsw+0xcd> .byte 196,193,124,16,58 // vmovups (%r10),%ymm7 - .byte 197,196,84,37,15,62,0,0 // vandps 0x3e0f(%rip),%ymm7,%ymm4 # 50c0 <_sk_callback_hsw+0x55c> + .byte 197,196,84,37,18,62,0,0 // vandps 0x3e12(%rip),%ymm7,%ymm4 # 5080 <_sk_callback_hsw+0x560> .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 - .byte 196,226,69,0,45,34,62,0,0 // vpshufb 0x3e22(%rip),%ymm7,%ymm5 # 50e0 <_sk_callback_hsw+0x57c> + .byte 196,226,69,0,45,37,62,0,0 // vpshufb 0x3e25(%rip),%ymm7,%ymm5 # 50a0 <_sk_callback_hsw+0x580> .byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5 - .byte 196,226,69,0,53,53,62,0,0 // vpshufb 0x3e35(%rip),%ymm7,%ymm6 # 5100 <_sk_callback_hsw+0x59c> + .byte 196,226,69,0,53,56,62,0,0 // vpshufb 0x3e38(%rip),%ymm7,%ymm6 # 50c0 <_sk_callback_hsw+0x5a0> .byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6 .byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,111,58,0,0 // vbroadcastss 0x3a6f(%rip),%ymm8 # 4d50 <_sk_callback_hsw+0x1ec> + .byte 196,98,125,24,5,110,58,0,0 // vbroadcastss 0x3a6e(%rip),%ymm8 # 4d0c <_sk_callback_hsw+0x1ec> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 - .byte 196,98,125,24,13,102,58,0,0 // vbroadcastss 0x3a66(%rip),%ymm9 # 4d54 <_sk_callback_hsw+0x1f0> + .byte 196,98,125,24,13,101,58,0,0 // vbroadcastss 0x3a65(%rip),%ymm9 # 4d10 <_sk_callback_hsw+0x1f0> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0 .byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1 @@ -11047,7 +10999,7 @@ _sk_srcover_rgba_8888_hsw: .byte 196,65,53,235,202 // vpor %ymm10,%ymm9,%ymm9 .byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,53 // jne 1381 <_sk_srcover_rgba_8888_hsw+0xf6> + .byte 117,53 // jne 133e <_sk_srcover_rgba_8888_hsw+0xf6> .byte 196,65,124,17,2 // vmovups %ymm8,(%r10) .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,201 // mov %r9,%rcx @@ -11060,7 +11012,7 @@ _sk_srcover_rgba_8888_hsw: .byte 196,225,249,110,224 // vmovq %rax,%xmm4 .byte 196,226,125,33,228 // vpmovsxbd %xmm4,%ymm4 .byte 196,194,93,44,58 // vmaskmovps (%r10),%ymm4,%ymm7 - .byte 233,40,255,255,255 // jmpq 12a9 <_sk_srcover_rgba_8888_hsw+0x1e> + .byte 233,40,255,255,255 // jmpq 1266 <_sk_srcover_rgba_8888_hsw+0x1e> .byte 185,8,0,0,0 // mov $0x8,%ecx .byte 68,41,193 // sub %r8d,%ecx .byte 192,225,3 // shl $0x3,%cl @@ -11069,7 +11021,7 @@ _sk_srcover_rgba_8888_hsw: .byte 196,97,249,110,200 // vmovq %rax,%xmm9 .byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9 .byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10) - .byte 235,170 // jmp 1351 <_sk_srcover_rgba_8888_hsw+0xc6> + .byte 235,170 // jmp 130e <_sk_srcover_rgba_8888_hsw+0xc6> HIDDEN _sk_clamp_0_hsw .globl _sk_clamp_0_hsw @@ -11087,7 +11039,7 @@ HIDDEN _sk_clamp_1_hsw .globl _sk_clamp_1_hsw FUNCTION(_sk_clamp_1_hsw) _sk_clamp_1_hsw: - .byte 196,98,125,24,5,139,57,0,0 // vbroadcastss 0x398b(%rip),%ymm8 # 4d58 <_sk_callback_hsw+0x1f4> + .byte 196,98,125,24,5,138,57,0,0 // vbroadcastss 0x398a(%rip),%ymm8 # 4d14 <_sk_callback_hsw+0x1f4> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -11099,7 +11051,7 @@ HIDDEN _sk_clamp_a_hsw .globl _sk_clamp_a_hsw FUNCTION(_sk_clamp_a_hsw) _sk_clamp_a_hsw: - .byte 196,98,125,24,5,110,57,0,0 // vbroadcastss 0x396e(%rip),%ymm8 # 4d5c <_sk_callback_hsw+0x1f8> + .byte 196,98,125,24,5,109,57,0,0 // vbroadcastss 0x396d(%rip),%ymm8 # 4d18 <_sk_callback_hsw+0x1f8> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -11185,7 +11137,7 @@ FUNCTION(_sk_unpremul_hsw) _sk_unpremul_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,182,56,0,0 // vbroadcastss 0x38b6(%rip),%ymm10 # 4d60 <_sk_callback_hsw+0x1fc> + .byte 196,98,125,24,21,181,56,0,0 // vbroadcastss 0x38b5(%rip),%ymm10 # 4d1c <_sk_callback_hsw+0x1fc> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -11198,16 +11150,16 @@ HIDDEN _sk_from_srgb_hsw .globl _sk_from_srgb_hsw FUNCTION(_sk_from_srgb_hsw) _sk_from_srgb_hsw: - .byte 196,98,125,24,5,151,56,0,0 // vbroadcastss 0x3897(%rip),%ymm8 # 4d64 <_sk_callback_hsw+0x200> + .byte 196,98,125,24,5,150,56,0,0 // vbroadcastss 0x3896(%rip),%ymm8 # 4d20 <_sk_callback_hsw+0x200> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,137,56,0,0 // vbroadcastss 0x3889(%rip),%ymm11 # 4d68 <_sk_callback_hsw+0x204> - .byte 196,98,125,24,37,132,56,0,0 // vbroadcastss 0x3884(%rip),%ymm12 # 4d6c <_sk_callback_hsw+0x208> + .byte 196,98,125,24,29,136,56,0,0 // vbroadcastss 0x3888(%rip),%ymm11 # 4d24 <_sk_callback_hsw+0x204> + .byte 196,98,125,24,37,131,56,0,0 // vbroadcastss 0x3883(%rip),%ymm12 # 4d28 <_sk_callback_hsw+0x208> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13 - .byte 196,98,125,24,53,117,56,0,0 // vbroadcastss 0x3875(%rip),%ymm14 # 4d70 <_sk_callback_hsw+0x20c> + .byte 196,98,125,24,53,116,56,0,0 // vbroadcastss 0x3874(%rip),%ymm14 # 4d2c <_sk_callback_hsw+0x20c> .byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13 - .byte 196,98,125,24,21,107,56,0,0 // vbroadcastss 0x386b(%rip),%ymm10 # 4d74 <_sk_callback_hsw+0x210> + .byte 196,98,125,24,21,106,56,0,0 // vbroadcastss 0x386a(%rip),%ymm10 # 4d30 <_sk_callback_hsw+0x210> .byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0 .byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -11231,19 +11183,19 @@ HIDDEN _sk_to_srgb_hsw FUNCTION(_sk_to_srgb_hsw) _sk_to_srgb_hsw: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,15,56,0,0 // vbroadcastss 0x380f(%rip),%ymm8 # 4d78 <_sk_callback_hsw+0x214> + .byte 196,98,125,24,5,14,56,0,0 // vbroadcastss 0x380e(%rip),%ymm8 # 4d34 <_sk_callback_hsw+0x214> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,5,56,0,0 // vbroadcastss 0x3805(%rip),%ymm11 # 4d7c <_sk_callback_hsw+0x218> - .byte 196,98,125,24,37,0,56,0,0 // vbroadcastss 0x3800(%rip),%ymm12 # 4d80 <_sk_callback_hsw+0x21c> + .byte 196,98,125,24,29,4,56,0,0 // vbroadcastss 0x3804(%rip),%ymm11 # 4d38 <_sk_callback_hsw+0x218> + .byte 196,98,125,24,37,255,55,0,0 // vbroadcastss 0x37ff(%rip),%ymm12 # 4d3c <_sk_callback_hsw+0x21c> .byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13 .byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13 - .byte 196,98,125,24,53,241,55,0,0 // vbroadcastss 0x37f1(%rip),%ymm14 # 4d84 <_sk_callback_hsw+0x220> + .byte 196,98,125,24,53,240,55,0,0 // vbroadcastss 0x37f0(%rip),%ymm14 # 4d40 <_sk_callback_hsw+0x220> .byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13 - .byte 196,98,125,24,61,231,55,0,0 // vbroadcastss 0x37e7(%rip),%ymm15 # 4d88 <_sk_callback_hsw+0x224> + .byte 196,98,125,24,61,230,55,0,0 // vbroadcastss 0x37e6(%rip),%ymm15 # 4d44 <_sk_callback_hsw+0x224> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9 - .byte 196,98,125,24,45,211,55,0,0 // vbroadcastss 0x37d3(%rip),%ymm13 # 4d8c <_sk_callback_hsw+0x228> + .byte 196,98,125,24,45,210,55,0,0 // vbroadcastss 0x37d2(%rip),%ymm13 # 4d48 <_sk_callback_hsw+0x228> .byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -11277,26 +11229,26 @@ _sk_rgb_to_hsl_hsw: .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,72,55,0,0 // vbroadcastss 0x3748(%rip),%ymm11 # 4d90 <_sk_callback_hsw+0x22c> + .byte 196,98,125,24,29,71,55,0,0 // vbroadcastss 0x3747(%rip),%ymm11 # 4d4c <_sk_callback_hsw+0x22c> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13 - .byte 196,98,125,24,53,53,55,0,0 // vbroadcastss 0x3735(%rip),%ymm14 # 4d94 <_sk_callback_hsw+0x230> + .byte 196,98,125,24,53,52,55,0,0 // vbroadcastss 0x3734(%rip),%ymm14 # 4d50 <_sk_callback_hsw+0x230> .byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15 .byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13 .byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12 .byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2 .byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13 - .byte 196,98,125,24,53,28,55,0,0 // vbroadcastss 0x371c(%rip),%ymm14 # 4d9c <_sk_callback_hsw+0x238> + .byte 196,98,125,24,53,27,55,0,0 // vbroadcastss 0x371b(%rip),%ymm14 # 4d58 <_sk_callback_hsw+0x238> .byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13 - .byte 196,98,125,24,53,10,55,0,0 // vbroadcastss 0x370a(%rip),%ymm14 # 4d98 <_sk_callback_hsw+0x234> + .byte 196,98,125,24,53,9,55,0,0 // vbroadcastss 0x3709(%rip),%ymm14 # 4d54 <_sk_callback_hsw+0x234> .byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2 .byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1 .byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,29,237,54,0,0 // vbroadcastss 0x36ed(%rip),%ymm11 # 4da4 <_sk_callback_hsw+0x240> + .byte 196,98,125,24,29,236,54,0,0 // vbroadcastss 0x36ec(%rip),%ymm11 # 4d60 <_sk_callback_hsw+0x240> .byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2 .byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11 .byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12 @@ -11306,7 +11258,7 @@ _sk_rgb_to_hsl_hsw: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0 .byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1 - .byte 196,98,125,24,5,176,54,0,0 // vbroadcastss 0x36b0(%rip),%ymm8 # 4da0 <_sk_callback_hsw+0x23c> + .byte 196,98,125,24,5,175,54,0,0 // vbroadcastss 0x36af(%rip),%ymm8 # 4d5c <_sk_callback_hsw+0x23c> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -11323,30 +11275,30 @@ _sk_hsl_to_rgb_hsw: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,233 // vmovaps %ymm1,%ymm5 .byte 197,252,40,224 // vmovaps %ymm0,%ymm4 - .byte 196,98,125,24,5,125,54,0,0 // vbroadcastss 0x367d(%rip),%ymm8 # 4da8 <_sk_callback_hsw+0x244> + .byte 196,98,125,24,5,124,54,0,0 // vbroadcastss 0x367c(%rip),%ymm8 # 4d64 <_sk_callback_hsw+0x244> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10 .byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11 .byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9 .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 - .byte 196,98,125,24,13,96,54,0,0 // vbroadcastss 0x3660(%rip),%ymm9 # 4dac <_sk_callback_hsw+0x248> + .byte 196,98,125,24,13,95,54,0,0 // vbroadcastss 0x365f(%rip),%ymm9 # 4d68 <_sk_callback_hsw+0x248> .byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9 - .byte 196,98,125,24,29,86,54,0,0 // vbroadcastss 0x3656(%rip),%ymm11 # 4db0 <_sk_callback_hsw+0x24c> + .byte 196,98,125,24,29,85,54,0,0 // vbroadcastss 0x3655(%rip),%ymm11 # 4d6c <_sk_callback_hsw+0x24c> .byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,45,64,54,0,0 // vbroadcastss 0x3640(%rip),%ymm13 # 4db8 <_sk_callback_hsw+0x254> + .byte 196,98,125,24,45,63,54,0,0 // vbroadcastss 0x363f(%rip),%ymm13 # 4d74 <_sk_callback_hsw+0x254> .byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0 - .byte 196,98,125,24,53,54,54,0,0 // vbroadcastss 0x3636(%rip),%ymm14 # 4dbc <_sk_callback_hsw+0x258> + .byte 196,98,125,24,53,53,54,0,0 // vbroadcastss 0x3635(%rip),%ymm14 # 4d78 <_sk_callback_hsw+0x258> .byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12 .byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12 - .byte 196,226,125,24,29,28,54,0,0 // vbroadcastss 0x361c(%rip),%ymm3 # 4db4 <_sk_callback_hsw+0x250> + .byte 196,226,125,24,29,27,54,0,0 // vbroadcastss 0x361b(%rip),%ymm3 # 4d70 <_sk_callback_hsw+0x250> .byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7 .byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7 .byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12 .byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,37,7,54,0,0 // vbroadcastss 0x3607(%rip),%ymm12 # 4dc0 <_sk_callback_hsw+0x25c> + .byte 196,98,125,24,37,6,54,0,0 // vbroadcastss 0x3606(%rip),%ymm12 # 4d7c <_sk_callback_hsw+0x25c> .byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15 .byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0 .byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15 @@ -11362,7 +11314,7 @@ _sk_hsl_to_rgb_hsw: .byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0 .byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7 .byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1 - .byte 196,226,125,24,5,179,53,0,0 // vbroadcastss 0x35b3(%rip),%ymm0 # 4dc4 <_sk_callback_hsw+0x260> + .byte 196,226,125,24,5,178,53,0,0 // vbroadcastss 0x35b2(%rip),%ymm0 # 4d80 <_sk_callback_hsw+0x260> .byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0 .byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 @@ -11410,12 +11362,12 @@ _sk_scale_u8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,58 // jne 18f2 <_sk_scale_u8_hsw+0x44> + .byte 117,58 // jne 18af <_sk_scale_u8_hsw+0x44> .byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8 - .byte 197,57,219,5,218,57,0,0 // vpand 0x39da(%rip),%xmm8,%xmm8 # 52a0 <_sk_callback_hsw+0x73c> + .byte 197,57,219,5,221,57,0,0 // vpand 0x39dd(%rip),%xmm8,%xmm8 # 5260 <_sk_callback_hsw+0x740> .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,239,52,0,0 // vbroadcastss 0x34ef(%rip),%ymm9 # 4dc8 <_sk_callback_hsw+0x264> + .byte 196,98,125,24,13,238,52,0,0 // vbroadcastss 0x34ee(%rip),%ymm9 # 4d84 <_sk_callback_hsw+0x264> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -11428,15 +11380,15 @@ _sk_scale_u8_hsw: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,183 // ja 18be <_sk_scale_u8_hsw+0x10> + .byte 119,183 // ja 187b <_sk_scale_u8_hsw+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 198c <_sk_scale_u8_hsw+0xde> + .byte 76,141,21,121,0,0,0 // lea 0x79(%rip),%r10 # 1948 <_sk_scale_u8_hsw+0xdd> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 235,152 // jmp 18be <_sk_scale_u8_hsw+0x10> + .byte 235,152 // jmp 187b <_sk_scale_u8_hsw+0x10> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -11444,7 +11396,7 @@ _sk_scale_u8_hsw: .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,111,255,255,255 // jmpq 18be <_sk_scale_u8_hsw+0x10> + .byte 233,111,255,255,255 // jmpq 187b <_sk_scale_u8_hsw+0x10> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -11455,22 +11407,24 @@ _sk_scale_u8_hsw: .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8 - .byte 233,51,255,255,255 // jmpq 18be <_sk_scale_u8_hsw+0x10> + .byte 233,51,255,255,255 // jmpq 187b <_sk_scale_u8_hsw+0x10> .byte 144 // nop - .byte 143 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,170,255,255,255,154 // ljmp *-0x65000001(%rdx) + .byte 255,171,255,255,255,155 // ljmp *-0x64000001(%rbx) .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf00199c <_sk_callback_hsw+0xffffffffdeffce38> + .byte 234 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,211 // callq *%rbx + .byte 255 // (bad) + .byte 223,255 // (bad) + .byte 255 // (bad) + .byte 255,212 // callq *%rsp .byte 255 // (bad) .byte 255 // (bad) - .byte 255,195 // inc %ebx + .byte 255,196 // inc %esp .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -11499,12 +11453,12 @@ _sk_lerp_u8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,78 // jne 1a2f <_sk_lerp_u8_hsw+0x58> + .byte 117,78 // jne 19eb <_sk_lerp_u8_hsw+0x58> .byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8 - .byte 197,57,219,5,193,56,0,0 // vpand 0x38c1(%rip),%xmm8,%xmm8 # 52b0 <_sk_callback_hsw+0x74c> + .byte 197,57,219,5,197,56,0,0 // vpand 0x38c5(%rip),%xmm8,%xmm8 # 5270 <_sk_callback_hsw+0x750> .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,202,51,0,0 // vbroadcastss 0x33ca(%rip),%ymm9 # 4dcc <_sk_callback_hsw+0x268> + .byte 196,98,125,24,13,202,51,0,0 // vbroadcastss 0x33ca(%rip),%ymm9 # 4d88 <_sk_callback_hsw+0x268> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0 @@ -11521,15 +11475,15 @@ _sk_lerp_u8_hsw: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,163 // ja 19e7 <_sk_lerp_u8_hsw+0x10> + .byte 119,163 // ja 19a3 <_sk_lerp_u8_hsw+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,121,0,0,0 // lea 0x79(%rip),%r10 # 1ac8 <_sk_lerp_u8_hsw+0xf1> + .byte 76,141,21,121,0,0,0 // lea 0x79(%rip),%r10 # 1a84 <_sk_lerp_u8_hsw+0xf1> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 235,132 // jmp 19e7 <_sk_lerp_u8_hsw+0x10> + .byte 235,132 // jmp 19a3 <_sk_lerp_u8_hsw+0x10> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -11537,7 +11491,7 @@ _sk_lerp_u8_hsw: .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,91,255,255,255 // jmpq 19e7 <_sk_lerp_u8_hsw+0x10> + .byte 233,91,255,255,255 // jmpq 19a3 <_sk_lerp_u8_hsw+0x10> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -11548,7 +11502,7 @@ _sk_lerp_u8_hsw: .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8 - .byte 233,31,255,255,255 // jmpq 19e7 <_sk_lerp_u8_hsw+0x10> + .byte 233,31,255,255,255 // jmpq 19a3 <_sk_lerp_u8_hsw+0x10> .byte 144 // nop .byte 255 // (bad) .byte 255 // (bad) @@ -11577,23 +11531,23 @@ _sk_lerp_565_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,169,0,0,0 // jne 1b9b <_sk_lerp_565_hsw+0xb7> + .byte 15,133,169,0,0,0 // jne 1b57 <_sk_lerp_565_hsw+0xb7> .byte 196,65,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm8 .byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8 - .byte 196,98,125,88,13,202,50,0,0 // vpbroadcastd 0x32ca(%rip),%ymm9 # 4dd0 <_sk_callback_hsw+0x26c> + .byte 196,98,125,88,13,202,50,0,0 // vpbroadcastd 0x32ca(%rip),%ymm9 # 4d8c <_sk_callback_hsw+0x26c> .byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,187,50,0,0 // vbroadcastss 0x32bb(%rip),%ymm10 # 4dd4 <_sk_callback_hsw+0x270> + .byte 196,98,125,24,21,187,50,0,0 // vbroadcastss 0x32bb(%rip),%ymm10 # 4d90 <_sk_callback_hsw+0x270> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,88,21,177,50,0,0 // vpbroadcastd 0x32b1(%rip),%ymm10 # 4dd8 <_sk_callback_hsw+0x274> + .byte 196,98,125,88,21,177,50,0,0 // vpbroadcastd 0x32b1(%rip),%ymm10 # 4d94 <_sk_callback_hsw+0x274> .byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,162,50,0,0 // vbroadcastss 0x32a2(%rip),%ymm11 # 4ddc <_sk_callback_hsw+0x278> + .byte 196,98,125,24,29,162,50,0,0 // vbroadcastss 0x32a2(%rip),%ymm11 # 4d98 <_sk_callback_hsw+0x278> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,88,29,152,50,0,0 // vpbroadcastd 0x3298(%rip),%ymm11 # 4de0 <_sk_callback_hsw+0x27c> + .byte 196,98,125,88,29,152,50,0,0 // vpbroadcastd 0x3298(%rip),%ymm11 # 4d9c <_sk_callback_hsw+0x27c> .byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,137,50,0,0 // vbroadcastss 0x3289(%rip),%ymm11 # 4de4 <_sk_callback_hsw+0x280> + .byte 196,98,125,24,29,137,50,0,0 // vbroadcastss 0x3289(%rip),%ymm11 # 4da0 <_sk_callback_hsw+0x280> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,226,53,168,196 // vfmadd213ps %ymm4,%ymm9,%ymm0 @@ -11614,27 +11568,27 @@ _sk_lerp_565_hsw: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,68,255,255,255 // ja 1af8 <_sk_lerp_565_hsw+0x14> + .byte 15,135,68,255,255,255 // ja 1ab4 <_sk_lerp_565_hsw+0x14> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,101,0,0,0 // lea 0x65(%rip),%r10 # 1c24 <_sk_lerp_565_hsw+0x140> + .byte 76,141,21,101,0,0,0 // lea 0x65(%rip),%r10 # 1be0 <_sk_lerp_565_hsw+0x140> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 233,34,255,255,255 // jmpq 1af8 <_sk_lerp_565_hsw+0x14> + .byte 233,34,255,255,255 // jmpq 1ab4 <_sk_lerp_565_hsw+0x14> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,65,57,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8 .byte 196,65,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm9 .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,4,255,255,255 // jmpq 1af8 <_sk_lerp_565_hsw+0x14> + .byte 233,4,255,255,255 // jmpq 1ab4 <_sk_lerp_565_hsw+0x14> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,65,57,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm8,%xmm8 .byte 196,65,57,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm8,%xmm8 .byte 196,65,57,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm8,%xmm8 .byte 196,65,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm9 .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8 - .byte 233,214,254,255,255 // jmpq 1af8 <_sk_lerp_565_hsw+0x14> + .byte 233,214,254,255,255 // jmpq 1ab4 <_sk_lerp_565_hsw+0x14> .byte 102,144 // xchg %ax,%ax .byte 164 // movsb %ds:(%rsi),%es:(%rdi) .byte 255 // (bad) @@ -11667,23 +11621,23 @@ _sk_load_tables_hsw: .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,105 // jne 1cbe <_sk_load_tables_hsw+0x7e> + .byte 117,105 // jne 1c7a <_sk_load_tables_hsw+0x7e> .byte 196,193,124,16,26 // vmovups (%r10),%ymm3 - .byte 197,228,84,13,190,52,0,0 // vandps 0x34be(%rip),%ymm3,%ymm1 # 5120 <_sk_callback_hsw+0x5bc> + .byte 197,228,84,13,194,52,0,0 // vandps 0x34c2(%rip),%ymm3,%ymm1 # 50e0 <_sk_callback_hsw+0x5c0> .byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8 .byte 72,139,72,8 // mov 0x8(%rax),%rcx .byte 76,139,80,16 // mov 0x10(%rax),%r10 .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2 .byte 196,226,109,146,4,137 // vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0 - .byte 196,226,101,0,21,190,52,0,0 // vpshufb 0x34be(%rip),%ymm3,%ymm2 # 5140 <_sk_callback_hsw+0x5dc> + .byte 196,226,101,0,21,194,52,0,0 // vpshufb 0x34c2(%rip),%ymm3,%ymm2 # 5100 <_sk_callback_hsw+0x5e0> .byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9 .byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1 .byte 72,139,64,24 // mov 0x18(%rax),%rax - .byte 196,98,101,0,13,198,52,0,0 // vpshufb 0x34c6(%rip),%ymm3,%ymm9 # 5160 <_sk_callback_hsw+0x5fc> + .byte 196,98,101,0,13,202,52,0,0 // vpshufb 0x34ca(%rip),%ymm3,%ymm9 # 5120 <_sk_callback_hsw+0x600> .byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,54,49,0,0 // vbroadcastss 0x3136(%rip),%ymm8 # 4de8 <_sk_callback_hsw+0x284> + .byte 196,98,125,24,5,54,49,0,0 // vbroadcastss 0x3136(%rip),%ymm8 # 4da4 <_sk_callback_hsw+0x284> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,201 // mov %r9,%rcx @@ -11696,7 +11650,7 @@ _sk_load_tables_hsw: .byte 196,193,249,110,195 // vmovq %r11,%xmm0 .byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0 .byte 196,194,125,44,26 // vmaskmovps (%r10),%ymm0,%ymm3 - .byte 233,115,255,255,255 // jmpq 1c5a <_sk_load_tables_hsw+0x1a> + .byte 233,115,255,255,255 // jmpq 1c16 <_sk_load_tables_hsw+0x1a> HIDDEN _sk_load_tables_u16_be_hsw .globl _sk_load_tables_u16_be_hsw @@ -11706,7 +11660,7 @@ _sk_load_tables_u16_be_hsw: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,201,0,0,0 // jne 1dc6 <_sk_load_tables_u16_be_hsw+0xdf> + .byte 15,133,201,0,0,0 // jne 1d82 <_sk_load_tables_u16_be_hsw+0xdf> .byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8 .byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2 .byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3 @@ -11722,7 +11676,7 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1 .byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2 .byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8 - .byte 197,121,111,21,114,53,0,0 // vmovdqa 0x3572(%rip),%xmm10 # 52c0 <_sk_callback_hsw+0x75c> + .byte 197,121,111,21,118,53,0,0 // vmovdqa 0x3576(%rip),%xmm10 # 5280 <_sk_callback_hsw+0x760> .byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -11744,36 +11698,36 @@ _sk_load_tables_u16_be_hsw: .byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3 .byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,47,48,0,0 // vbroadcastss 0x302f(%rip),%ymm8 # 4dec <_sk_callback_hsw+0x288> + .byte 196,98,125,24,5,47,48,0,0 // vbroadcastss 0x302f(%rip),%ymm8 # 4da8 <_sk_callback_hsw+0x288> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je 1e2c <_sk_load_tables_u16_be_hsw+0x145> + .byte 116,85 // je 1de8 <_sk_load_tables_u16_be_hsw+0x145> .byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb 1e2c <_sk_load_tables_u16_be_hsw+0x145> + .byte 114,72 // jb 1de8 <_sk_load_tables_u16_be_hsw+0x145> .byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je 1e39 <_sk_load_tables_u16_be_hsw+0x152> + .byte 116,72 // je 1df5 <_sk_load_tables_u16_be_hsw+0x152> .byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb 1e39 <_sk_load_tables_u16_be_hsw+0x152> + .byte 114,59 // jb 1df5 <_sk_load_tables_u16_be_hsw+0x152> .byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,9,255,255,255 // je 1d18 <_sk_load_tables_u16_be_hsw+0x31> + .byte 15,132,9,255,255,255 // je 1cd4 <_sk_load_tables_u16_be_hsw+0x31> .byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,248,254,255,255 // jb 1d18 <_sk_load_tables_u16_be_hsw+0x31> + .byte 15,130,248,254,255,255 // jb 1cd4 <_sk_load_tables_u16_be_hsw+0x31> .byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9 - .byte 233,236,254,255,255 // jmpq 1d18 <_sk_load_tables_u16_be_hsw+0x31> + .byte 233,236,254,255,255 // jmpq 1cd4 <_sk_load_tables_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,223,254,255,255 // jmpq 1d18 <_sk_load_tables_u16_be_hsw+0x31> + .byte 233,223,254,255,255 // jmpq 1cd4 <_sk_load_tables_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,214,254,255,255 // jmpq 1d18 <_sk_load_tables_u16_be_hsw+0x31> + .byte 233,214,254,255,255 // jmpq 1cd4 <_sk_load_tables_u16_be_hsw+0x31> HIDDEN _sk_load_tables_rgb_u16_be_hsw .globl _sk_load_tables_rgb_u16_be_hsw @@ -11783,7 +11737,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,193,0,0,0 // jne 1f15 <_sk_load_tables_rgb_u16_be_hsw+0xd3> + .byte 15,133,193,0,0,0 // jne 1ed1 <_sk_load_tables_rgb_u16_be_hsw+0xd3> .byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0 .byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2 .byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1 @@ -11804,7 +11758,7 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3 .byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2 .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8 - .byte 197,121,111,13,18,52,0,0 // vmovdqa 0x3412(%rip),%xmm9 # 52d0 <_sk_callback_hsw+0x76c> + .byte 197,121,111,13,22,52,0,0 // vmovdqa 0x3416(%rip),%xmm9 # 5290 <_sk_callback_hsw+0x770> .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0 .byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1 .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3 @@ -11821,48 +11775,48 @@ _sk_load_tables_rgb_u16_be_hsw: .byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8 .byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,221,46,0,0 // vbroadcastss 0x2edd(%rip),%ymm3 # 4df0 <_sk_callback_hsw+0x28c> + .byte 196,226,125,24,29,221,46,0,0 // vbroadcastss 0x2edd(%rip),%ymm3 # 4dac <_sk_callback_hsw+0x28c> .byte 255,224 // jmpq *%rax .byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0 .byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,5 // jne 1f2e <_sk_load_tables_rgb_u16_be_hsw+0xec> - .byte 233,90,255,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 117,5 // jne 1eea <_sk_load_tables_rgb_u16_be_hsw+0xec> + .byte 233,90,255,255,255 // jmpq 1e44 <_sk_load_tables_rgb_u16_be_hsw+0x46> .byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1 .byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,26 // jb 1f5d <_sk_load_tables_rgb_u16_be_hsw+0x11b> + .byte 114,26 // jb 1f19 <_sk_load_tables_rgb_u16_be_hsw+0x11b> .byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1 .byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 117,10 // jne 1f62 <_sk_load_tables_rgb_u16_be_hsw+0x120> - .byte 233,43,255,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46> - .byte 233,38,255,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 1f1e <_sk_load_tables_rgb_u16_be_hsw+0x120> + .byte 233,43,255,255,255 // jmpq 1e44 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,38,255,255,255 // jmpq 1e44 <_sk_load_tables_rgb_u16_be_hsw+0x46> .byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1 .byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,26 // jb 1f91 <_sk_load_tables_rgb_u16_be_hsw+0x14f> + .byte 114,26 // jb 1f4d <_sk_load_tables_rgb_u16_be_hsw+0x14f> .byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1 .byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 117,10 // jne 1f96 <_sk_load_tables_rgb_u16_be_hsw+0x154> - .byte 233,247,254,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46> - .byte 233,242,254,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 1f52 <_sk_load_tables_rgb_u16_be_hsw+0x154> + .byte 233,247,254,255,255 // jmpq 1e44 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,242,254,255,255 // jmpq 1e44 <_sk_load_tables_rgb_u16_be_hsw+0x46> .byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3 .byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,20 // jb 1fbf <_sk_load_tables_rgb_u16_be_hsw+0x17d> + .byte 114,20 // jb 1f7b <_sk_load_tables_rgb_u16_be_hsw+0x17d> .byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3 .byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3 - .byte 233,201,254,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46> - .byte 233,196,254,255,255 // jmpq 1e88 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,201,254,255,255 // jmpq 1e44 <_sk_load_tables_rgb_u16_be_hsw+0x46> + .byte 233,196,254,255,255 // jmpq 1e44 <_sk_load_tables_rgb_u16_be_hsw+0x46> HIDDEN _sk_byte_tables_hsw .globl _sk_byte_tables_hsw FUNCTION(_sk_byte_tables_hsw) _sk_byte_tables_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,37,46,0,0 // vbroadcastss 0x2e25(%rip),%ymm8 # 4df4 <_sk_callback_hsw+0x290> + .byte 196,98,125,24,5,37,46,0,0 // vbroadcastss 0x2e25(%rip),%ymm8 # 4db0 <_sk_callback_hsw+0x290> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9 .byte 196,65,249,126,201 // vmovq %xmm9,%r9 @@ -11984,7 +11938,7 @@ _sk_byte_tables_hsw: .byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax .byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,202,43,0,0 // vbroadcastss 0x2bca(%rip),%ymm8 # 4df8 <_sk_callback_hsw+0x294> + .byte 196,98,125,24,5,202,43,0,0 // vbroadcastss 0x2bca(%rip),%ymm8 # 4db4 <_sk_callback_hsw+0x294> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 @@ -12100,7 +12054,7 @@ _sk_byte_tables_rgb_hsw: .byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax .byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,182,41,0,0 // vbroadcastss 0x29b6(%rip),%ymm8 # 4dfc <_sk_callback_hsw+0x298> + .byte 196,98,125,24,5,182,41,0,0 // vbroadcastss 0x29b6(%rip),%ymm8 # 4db8 <_sk_callback_hsw+0x298> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 @@ -12199,33 +12153,33 @@ _sk_parametric_r_hsw: .byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10 .byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,144,40,0,0 // vbroadcastss 0x2890(%rip),%ymm12 # 4e00 <_sk_callback_hsw+0x29c> - .byte 196,98,125,24,45,139,40,0,0 // vbroadcastss 0x288b(%rip),%ymm13 # 4e04 <_sk_callback_hsw+0x2a0> + .byte 196,98,125,24,37,144,40,0,0 // vbroadcastss 0x2890(%rip),%ymm12 # 4dbc <_sk_callback_hsw+0x29c> + .byte 196,98,125,24,45,139,40,0,0 // vbroadcastss 0x288b(%rip),%ymm13 # 4dc0 <_sk_callback_hsw+0x2a0> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,129,40,0,0 // vbroadcastss 0x2881(%rip),%ymm13 # 4e08 <_sk_callback_hsw+0x2a4> + .byte 196,98,125,24,45,129,40,0,0 // vbroadcastss 0x2881(%rip),%ymm13 # 4dc4 <_sk_callback_hsw+0x2a4> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,119,40,0,0 // vbroadcastss 0x2877(%rip),%ymm13 # 4e0c <_sk_callback_hsw+0x2a8> + .byte 196,98,125,24,45,119,40,0,0 // vbroadcastss 0x2877(%rip),%ymm13 # 4dc8 <_sk_callback_hsw+0x2a8> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,109,40,0,0 // vbroadcastss 0x286d(%rip),%ymm11 # 4e10 <_sk_callback_hsw+0x2ac> + .byte 196,98,125,24,29,109,40,0,0 // vbroadcastss 0x286d(%rip),%ymm11 # 4dcc <_sk_callback_hsw+0x2ac> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,99,40,0,0 // vbroadcastss 0x2863(%rip),%ymm12 # 4e14 <_sk_callback_hsw+0x2b0> + .byte 196,98,125,24,37,99,40,0,0 // vbroadcastss 0x2863(%rip),%ymm12 # 4dd0 <_sk_callback_hsw+0x2b0> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,89,40,0,0 // vbroadcastss 0x2859(%rip),%ymm12 # 4e18 <_sk_callback_hsw+0x2b4> + .byte 196,98,125,24,37,89,40,0,0 // vbroadcastss 0x2859(%rip),%ymm12 # 4dd4 <_sk_callback_hsw+0x2b4> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,58,40,0,0 // vbroadcastss 0x283a(%rip),%ymm11 # 4e1c <_sk_callback_hsw+0x2b8> + .byte 196,98,125,24,29,58,40,0,0 // vbroadcastss 0x283a(%rip),%ymm11 # 4dd8 <_sk_callback_hsw+0x2b8> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,48,40,0,0 // vbroadcastss 0x2830(%rip),%ymm11 # 4e20 <_sk_callback_hsw+0x2bc> + .byte 196,98,125,24,29,48,40,0,0 // vbroadcastss 0x2830(%rip),%ymm11 # 4ddc <_sk_callback_hsw+0x2bc> .byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11 - .byte 196,226,125,24,5,38,40,0,0 // vbroadcastss 0x2826(%rip),%ymm0 # 4e24 <_sk_callback_hsw+0x2c0> + .byte 196,226,125,24,5,38,40,0,0 // vbroadcastss 0x2826(%rip),%ymm0 # 4de0 <_sk_callback_hsw+0x2c0> .byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,28,40,0,0 // vbroadcastss 0x281c(%rip),%ymm10 # 4e28 <_sk_callback_hsw+0x2c4> + .byte 196,98,125,24,21,28,40,0,0 // vbroadcastss 0x281c(%rip),%ymm10 # 4de4 <_sk_callback_hsw+0x2c4> .byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0 .byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0 - .byte 196,98,125,24,21,15,40,0,0 // vbroadcastss 0x280f(%rip),%ymm10 # 4e2c <_sk_callback_hsw+0x2c8> + .byte 196,98,125,24,21,15,40,0,0 // vbroadcastss 0x280f(%rip),%ymm10 # 4de8 <_sk_callback_hsw+0x2c8> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -12233,7 +12187,7 @@ _sk_parametric_r_hsw: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,230,39,0,0 // vbroadcastss 0x27e6(%rip),%ymm8 # 4e30 <_sk_callback_hsw+0x2cc> + .byte 196,98,125,24,5,230,39,0,0 // vbroadcastss 0x27e6(%rip),%ymm8 # 4dec <_sk_callback_hsw+0x2cc> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12253,33 +12207,33 @@ _sk_parametric_g_hsw: .byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10 .byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,158,39,0,0 // vbroadcastss 0x279e(%rip),%ymm12 # 4e34 <_sk_callback_hsw+0x2d0> - .byte 196,98,125,24,45,153,39,0,0 // vbroadcastss 0x2799(%rip),%ymm13 # 4e38 <_sk_callback_hsw+0x2d4> + .byte 196,98,125,24,37,158,39,0,0 // vbroadcastss 0x279e(%rip),%ymm12 # 4df0 <_sk_callback_hsw+0x2d0> + .byte 196,98,125,24,45,153,39,0,0 // vbroadcastss 0x2799(%rip),%ymm13 # 4df4 <_sk_callback_hsw+0x2d4> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,143,39,0,0 // vbroadcastss 0x278f(%rip),%ymm13 # 4e3c <_sk_callback_hsw+0x2d8> + .byte 196,98,125,24,45,143,39,0,0 // vbroadcastss 0x278f(%rip),%ymm13 # 4df8 <_sk_callback_hsw+0x2d8> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,133,39,0,0 // vbroadcastss 0x2785(%rip),%ymm13 # 4e40 <_sk_callback_hsw+0x2dc> + .byte 196,98,125,24,45,133,39,0,0 // vbroadcastss 0x2785(%rip),%ymm13 # 4dfc <_sk_callback_hsw+0x2dc> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,123,39,0,0 // vbroadcastss 0x277b(%rip),%ymm11 # 4e44 <_sk_callback_hsw+0x2e0> + .byte 196,98,125,24,29,123,39,0,0 // vbroadcastss 0x277b(%rip),%ymm11 # 4e00 <_sk_callback_hsw+0x2e0> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,113,39,0,0 // vbroadcastss 0x2771(%rip),%ymm12 # 4e48 <_sk_callback_hsw+0x2e4> + .byte 196,98,125,24,37,113,39,0,0 // vbroadcastss 0x2771(%rip),%ymm12 # 4e04 <_sk_callback_hsw+0x2e4> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,103,39,0,0 // vbroadcastss 0x2767(%rip),%ymm12 # 4e4c <_sk_callback_hsw+0x2e8> + .byte 196,98,125,24,37,103,39,0,0 // vbroadcastss 0x2767(%rip),%ymm12 # 4e08 <_sk_callback_hsw+0x2e8> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,72,39,0,0 // vbroadcastss 0x2748(%rip),%ymm11 # 4e50 <_sk_callback_hsw+0x2ec> + .byte 196,98,125,24,29,72,39,0,0 // vbroadcastss 0x2748(%rip),%ymm11 # 4e0c <_sk_callback_hsw+0x2ec> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,62,39,0,0 // vbroadcastss 0x273e(%rip),%ymm11 # 4e54 <_sk_callback_hsw+0x2f0> + .byte 196,98,125,24,29,62,39,0,0 // vbroadcastss 0x273e(%rip),%ymm11 # 4e10 <_sk_callback_hsw+0x2f0> .byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11 - .byte 196,226,125,24,13,52,39,0,0 // vbroadcastss 0x2734(%rip),%ymm1 # 4e58 <_sk_callback_hsw+0x2f4> + .byte 196,226,125,24,13,52,39,0,0 // vbroadcastss 0x2734(%rip),%ymm1 # 4e14 <_sk_callback_hsw+0x2f4> .byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,42,39,0,0 // vbroadcastss 0x272a(%rip),%ymm10 # 4e5c <_sk_callback_hsw+0x2f8> + .byte 196,98,125,24,21,42,39,0,0 // vbroadcastss 0x272a(%rip),%ymm10 # 4e18 <_sk_callback_hsw+0x2f8> .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1 - .byte 196,98,125,24,21,29,39,0,0 // vbroadcastss 0x271d(%rip),%ymm10 # 4e60 <_sk_callback_hsw+0x2fc> + .byte 196,98,125,24,21,29,39,0,0 // vbroadcastss 0x271d(%rip),%ymm10 # 4e1c <_sk_callback_hsw+0x2fc> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -12287,7 +12241,7 @@ _sk_parametric_g_hsw: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,244,38,0,0 // vbroadcastss 0x26f4(%rip),%ymm8 # 4e64 <_sk_callback_hsw+0x300> + .byte 196,98,125,24,5,244,38,0,0 // vbroadcastss 0x26f4(%rip),%ymm8 # 4e20 <_sk_callback_hsw+0x300> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12307,33 +12261,33 @@ _sk_parametric_b_hsw: .byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10 .byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,172,38,0,0 // vbroadcastss 0x26ac(%rip),%ymm12 # 4e68 <_sk_callback_hsw+0x304> - .byte 196,98,125,24,45,167,38,0,0 // vbroadcastss 0x26a7(%rip),%ymm13 # 4e6c <_sk_callback_hsw+0x308> + .byte 196,98,125,24,37,172,38,0,0 // vbroadcastss 0x26ac(%rip),%ymm12 # 4e24 <_sk_callback_hsw+0x304> + .byte 196,98,125,24,45,167,38,0,0 // vbroadcastss 0x26a7(%rip),%ymm13 # 4e28 <_sk_callback_hsw+0x308> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,157,38,0,0 // vbroadcastss 0x269d(%rip),%ymm13 # 4e70 <_sk_callback_hsw+0x30c> + .byte 196,98,125,24,45,157,38,0,0 // vbroadcastss 0x269d(%rip),%ymm13 # 4e2c <_sk_callback_hsw+0x30c> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,147,38,0,0 // vbroadcastss 0x2693(%rip),%ymm13 # 4e74 <_sk_callback_hsw+0x310> + .byte 196,98,125,24,45,147,38,0,0 // vbroadcastss 0x2693(%rip),%ymm13 # 4e30 <_sk_callback_hsw+0x310> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,137,38,0,0 // vbroadcastss 0x2689(%rip),%ymm11 # 4e78 <_sk_callback_hsw+0x314> + .byte 196,98,125,24,29,137,38,0,0 // vbroadcastss 0x2689(%rip),%ymm11 # 4e34 <_sk_callback_hsw+0x314> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,127,38,0,0 // vbroadcastss 0x267f(%rip),%ymm12 # 4e7c <_sk_callback_hsw+0x318> + .byte 196,98,125,24,37,127,38,0,0 // vbroadcastss 0x267f(%rip),%ymm12 # 4e38 <_sk_callback_hsw+0x318> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,117,38,0,0 // vbroadcastss 0x2675(%rip),%ymm12 # 4e80 <_sk_callback_hsw+0x31c> + .byte 196,98,125,24,37,117,38,0,0 // vbroadcastss 0x2675(%rip),%ymm12 # 4e3c <_sk_callback_hsw+0x31c> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,86,38,0,0 // vbroadcastss 0x2656(%rip),%ymm11 # 4e84 <_sk_callback_hsw+0x320> + .byte 196,98,125,24,29,86,38,0,0 // vbroadcastss 0x2656(%rip),%ymm11 # 4e40 <_sk_callback_hsw+0x320> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,76,38,0,0 // vbroadcastss 0x264c(%rip),%ymm11 # 4e88 <_sk_callback_hsw+0x324> + .byte 196,98,125,24,29,76,38,0,0 // vbroadcastss 0x264c(%rip),%ymm11 # 4e44 <_sk_callback_hsw+0x324> .byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11 - .byte 196,226,125,24,21,66,38,0,0 // vbroadcastss 0x2642(%rip),%ymm2 # 4e8c <_sk_callback_hsw+0x328> + .byte 196,226,125,24,21,66,38,0,0 // vbroadcastss 0x2642(%rip),%ymm2 # 4e48 <_sk_callback_hsw+0x328> .byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,56,38,0,0 // vbroadcastss 0x2638(%rip),%ymm10 # 4e90 <_sk_callback_hsw+0x32c> + .byte 196,98,125,24,21,56,38,0,0 // vbroadcastss 0x2638(%rip),%ymm10 # 4e4c <_sk_callback_hsw+0x32c> .byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2 .byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2 - .byte 196,98,125,24,21,43,38,0,0 // vbroadcastss 0x262b(%rip),%ymm10 # 4e94 <_sk_callback_hsw+0x330> + .byte 196,98,125,24,21,43,38,0,0 // vbroadcastss 0x262b(%rip),%ymm10 # 4e50 <_sk_callback_hsw+0x330> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -12341,7 +12295,7 @@ _sk_parametric_b_hsw: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,2,38,0,0 // vbroadcastss 0x2602(%rip),%ymm8 # 4e98 <_sk_callback_hsw+0x334> + .byte 196,98,125,24,5,2,38,0,0 // vbroadcastss 0x2602(%rip),%ymm8 # 4e54 <_sk_callback_hsw+0x334> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12361,33 +12315,33 @@ _sk_parametric_a_hsw: .byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10 .byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3 .byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11 - .byte 196,98,125,24,37,186,37,0,0 // vbroadcastss 0x25ba(%rip),%ymm12 # 4e9c <_sk_callback_hsw+0x338> - .byte 196,98,125,24,45,181,37,0,0 // vbroadcastss 0x25b5(%rip),%ymm13 # 4ea0 <_sk_callback_hsw+0x33c> + .byte 196,98,125,24,37,186,37,0,0 // vbroadcastss 0x25ba(%rip),%ymm12 # 4e58 <_sk_callback_hsw+0x338> + .byte 196,98,125,24,45,181,37,0,0 // vbroadcastss 0x25b5(%rip),%ymm13 # 4e5c <_sk_callback_hsw+0x33c> .byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,171,37,0,0 // vbroadcastss 0x25ab(%rip),%ymm13 # 4ea4 <_sk_callback_hsw+0x340> + .byte 196,98,125,24,45,171,37,0,0 // vbroadcastss 0x25ab(%rip),%ymm13 # 4e60 <_sk_callback_hsw+0x340> .byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10 - .byte 196,98,125,24,45,161,37,0,0 // vbroadcastss 0x25a1(%rip),%ymm13 # 4ea8 <_sk_callback_hsw+0x344> + .byte 196,98,125,24,45,161,37,0,0 // vbroadcastss 0x25a1(%rip),%ymm13 # 4e64 <_sk_callback_hsw+0x344> .byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13 - .byte 196,98,125,24,29,151,37,0,0 // vbroadcastss 0x2597(%rip),%ymm11 # 4eac <_sk_callback_hsw+0x348> + .byte 196,98,125,24,29,151,37,0,0 // vbroadcastss 0x2597(%rip),%ymm11 # 4e68 <_sk_callback_hsw+0x348> .byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11 - .byte 196,98,125,24,37,141,37,0,0 // vbroadcastss 0x258d(%rip),%ymm12 # 4eb0 <_sk_callback_hsw+0x34c> + .byte 196,98,125,24,37,141,37,0,0 // vbroadcastss 0x258d(%rip),%ymm12 # 4e6c <_sk_callback_hsw+0x34c> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,131,37,0,0 // vbroadcastss 0x2583(%rip),%ymm12 # 4eb4 <_sk_callback_hsw+0x350> + .byte 196,98,125,24,37,131,37,0,0 // vbroadcastss 0x2583(%rip),%ymm12 # 4e70 <_sk_callback_hsw+0x350> .byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10 .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,100,37,0,0 // vbroadcastss 0x2564(%rip),%ymm11 # 4eb8 <_sk_callback_hsw+0x354> + .byte 196,98,125,24,29,100,37,0,0 // vbroadcastss 0x2564(%rip),%ymm11 # 4e74 <_sk_callback_hsw+0x354> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,90,37,0,0 // vbroadcastss 0x255a(%rip),%ymm11 # 4ebc <_sk_callback_hsw+0x358> + .byte 196,98,125,24,29,90,37,0,0 // vbroadcastss 0x255a(%rip),%ymm11 # 4e78 <_sk_callback_hsw+0x358> .byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11 - .byte 196,226,125,24,29,80,37,0,0 // vbroadcastss 0x2550(%rip),%ymm3 # 4ec0 <_sk_callback_hsw+0x35c> + .byte 196,226,125,24,29,80,37,0,0 // vbroadcastss 0x2550(%rip),%ymm3 # 4e7c <_sk_callback_hsw+0x35c> .byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,70,37,0,0 // vbroadcastss 0x2546(%rip),%ymm10 # 4ec4 <_sk_callback_hsw+0x360> + .byte 196,98,125,24,21,70,37,0,0 // vbroadcastss 0x2546(%rip),%ymm10 # 4e80 <_sk_callback_hsw+0x360> .byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3 .byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3 - .byte 196,98,125,24,21,57,37,0,0 // vbroadcastss 0x2539(%rip),%ymm10 # 4ec8 <_sk_callback_hsw+0x364> + .byte 196,98,125,24,21,57,37,0,0 // vbroadcastss 0x2539(%rip),%ymm10 # 4e84 <_sk_callback_hsw+0x364> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -12395,7 +12349,7 @@ _sk_parametric_a_hsw: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,16,37,0,0 // vbroadcastss 0x2510(%rip),%ymm8 # 4ecc <_sk_callback_hsw+0x368> + .byte 196,98,125,24,5,16,37,0,0 // vbroadcastss 0x2510(%rip),%ymm8 # 4e88 <_sk_callback_hsw+0x368> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12404,26 +12358,26 @@ HIDDEN _sk_lab_to_xyz_hsw .globl _sk_lab_to_xyz_hsw FUNCTION(_sk_lab_to_xyz_hsw) _sk_lab_to_xyz_hsw: - .byte 196,98,125,24,5,2,37,0,0 // vbroadcastss 0x2502(%rip),%ymm8 # 4ed0 <_sk_callback_hsw+0x36c> - .byte 196,98,125,24,13,253,36,0,0 // vbroadcastss 0x24fd(%rip),%ymm9 # 4ed4 <_sk_callback_hsw+0x370> - .byte 196,98,125,24,21,248,36,0,0 // vbroadcastss 0x24f8(%rip),%ymm10 # 4ed8 <_sk_callback_hsw+0x374> + .byte 196,98,125,24,5,2,37,0,0 // vbroadcastss 0x2502(%rip),%ymm8 # 4e8c <_sk_callback_hsw+0x36c> + .byte 196,98,125,24,13,253,36,0,0 // vbroadcastss 0x24fd(%rip),%ymm9 # 4e90 <_sk_callback_hsw+0x370> + .byte 196,98,125,24,21,248,36,0,0 // vbroadcastss 0x24f8(%rip),%ymm10 # 4e94 <_sk_callback_hsw+0x374> .byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1 .byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2 - .byte 196,98,125,24,13,233,36,0,0 // vbroadcastss 0x24e9(%rip),%ymm9 # 4edc <_sk_callback_hsw+0x378> + .byte 196,98,125,24,13,233,36,0,0 // vbroadcastss 0x24e9(%rip),%ymm9 # 4e98 <_sk_callback_hsw+0x378> .byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9 - .byte 196,226,125,24,5,223,36,0,0 // vbroadcastss 0x24df(%rip),%ymm0 # 4ee0 <_sk_callback_hsw+0x37c> + .byte 196,226,125,24,5,223,36,0,0 // vbroadcastss 0x24df(%rip),%ymm0 # 4e9c <_sk_callback_hsw+0x37c> .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 - .byte 196,98,125,24,5,214,36,0,0 // vbroadcastss 0x24d6(%rip),%ymm8 # 4ee4 <_sk_callback_hsw+0x380> + .byte 196,98,125,24,5,214,36,0,0 // vbroadcastss 0x24d6(%rip),%ymm8 # 4ea0 <_sk_callback_hsw+0x380> .byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8 - .byte 196,98,125,24,13,204,36,0,0 // vbroadcastss 0x24cc(%rip),%ymm9 # 4ee8 <_sk_callback_hsw+0x384> + .byte 196,98,125,24,13,204,36,0,0 // vbroadcastss 0x24cc(%rip),%ymm9 # 4ea4 <_sk_callback_hsw+0x384> .byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9 .byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 - .byte 196,226,125,24,21,185,36,0,0 // vbroadcastss 0x24b9(%rip),%ymm2 # 4eec <_sk_callback_hsw+0x388> + .byte 196,226,125,24,21,185,36,0,0 // vbroadcastss 0x24b9(%rip),%ymm2 # 4ea8 <_sk_callback_hsw+0x388> .byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10 - .byte 196,98,125,24,29,175,36,0,0 // vbroadcastss 0x24af(%rip),%ymm11 # 4ef0 <_sk_callback_hsw+0x38c> + .byte 196,98,125,24,29,175,36,0,0 // vbroadcastss 0x24af(%rip),%ymm11 # 4eac <_sk_callback_hsw+0x38c> .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,37,165,36,0,0 // vbroadcastss 0x24a5(%rip),%ymm12 # 4ef4 <_sk_callback_hsw+0x390> + .byte 196,98,125,24,37,165,36,0,0 // vbroadcastss 0x24a5(%rip),%ymm12 # 4eb0 <_sk_callback_hsw+0x390> .byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8 .byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -12438,9 +12392,9 @@ _sk_lab_to_xyz_hsw: .byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 .byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2 - .byte 196,226,125,24,5,90,36,0,0 // vbroadcastss 0x245a(%rip),%ymm0 # 4ef8 <_sk_callback_hsw+0x394> + .byte 196,226,125,24,5,90,36,0,0 // vbroadcastss 0x245a(%rip),%ymm0 # 4eb4 <_sk_callback_hsw+0x394> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,81,36,0,0 // vbroadcastss 0x2451(%rip),%ymm8 # 4efc <_sk_callback_hsw+0x398> + .byte 196,98,125,24,5,81,36,0,0 // vbroadcastss 0x2451(%rip),%ymm8 # 4eb8 <_sk_callback_hsw+0x398> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12452,12 +12406,12 @@ _sk_load_a8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,52 // jne 2af2 <_sk_load_a8_hsw+0x3e> + .byte 117,52 // jne 2aae <_sk_load_a8_hsw+0x3e> .byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0 - .byte 197,249,219,5,20,40,0,0 // vpand 0x2814(%rip),%xmm0,%xmm0 # 52e0 <_sk_callback_hsw+0x77c> + .byte 197,249,219,5,24,40,0,0 // vpand 0x2818(%rip),%xmm0,%xmm0 # 52a0 <_sk_callback_hsw+0x780> .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,34,36,0,0 // vbroadcastss 0x2422(%rip),%ymm1 # 4f00 <_sk_callback_hsw+0x39c> + .byte 196,226,125,24,13,34,36,0,0 // vbroadcastss 0x2422(%rip),%ymm1 # 4ebc <_sk_callback_hsw+0x39c> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -12469,15 +12423,15 @@ _sk_load_a8_hsw: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,190 // ja 2ac4 <_sk_load_a8_hsw+0x10> + .byte 119,190 // ja 2a80 <_sk_load_a8_hsw+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 2b88 <_sk_load_a8_hsw+0xd4> + .byte 76,141,21,119,0,0,0 // lea 0x77(%rip),%r10 # 2b44 <_sk_load_a8_hsw+0xd4> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,159 // jmp 2ac4 <_sk_load_a8_hsw+0x10> + .byte 235,159 // jmp 2a80 <_sk_load_a8_hsw+0x10> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -12485,7 +12439,7 @@ _sk_load_a8_hsw: .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,119,255,255,255 // jmpq 2ac4 <_sk_load_a8_hsw+0x10> + .byte 233,119,255,255,255 // jmpq 2a80 <_sk_load_a8_hsw+0x10> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -12496,7 +12450,7 @@ _sk_load_a8_hsw: .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,60,255,255,255 // jmpq 2ac4 <_sk_load_a8_hsw+0x10> + .byte 233,60,255,255,255 // jmpq 2a80 <_sk_load_a8_hsw+0x10> .byte 146 // xchg %eax,%edx .byte 255 // (bad) .byte 255 // (bad) @@ -12557,7 +12511,7 @@ _sk_gather_a8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,170,34,0,0 // vbroadcastss 0x22aa(%rip),%ymm1 # 4f04 <_sk_callback_hsw+0x3a0> + .byte 196,226,125,24,13,170,34,0,0 // vbroadcastss 0x22aa(%rip),%ymm1 # 4ec0 <_sk_callback_hsw+0x3a0> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -12571,14 +12525,14 @@ FUNCTION(_sk_store_a8_hsw) _sk_store_a8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,140,34,0,0 // vbroadcastss 0x228c(%rip),%ymm8 # 4f08 <_sk_callback_hsw+0x3a4> + .byte 196,98,125,24,5,140,34,0,0 // vbroadcastss 0x228c(%rip),%ymm8 # 4ec4 <_sk_callback_hsw+0x3a4> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 2ca5 <_sk_store_a8_hsw+0x37> + .byte 117,10 // jne 2c61 <_sk_store_a8_hsw+0x37> .byte 196,65,123,17,4,19 // vmovsd %xmm8,(%r11,%rdx,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12586,25 +12540,25 @@ _sk_store_a8_hsw: .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,236 // ja 2ca1 <_sk_store_a8_hsw+0x33> + .byte 119,236 // ja 2c5d <_sk_store_a8_hsw+0x33> .byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8 .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,87,0,0,0 // lea 0x57(%rip),%r10 # 2d1c <_sk_store_a8_hsw+0xae> + .byte 76,141,21,87,0,0,0 // lea 0x57(%rip),%r10 # 2cd8 <_sk_store_a8_hsw+0xae> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,20,4,19,0 // vpextrb $0x0,%xmm8,(%r11,%rdx,1) - .byte 235,202 // jmp 2ca1 <_sk_store_a8_hsw+0x33> + .byte 235,202 // jmp 2c5d <_sk_store_a8_hsw+0x33> .byte 196,67,121,20,68,19,2,4 // vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1) - .byte 196,98,57,0,5,8,38,0,0 // vpshufb 0x2608(%rip),%xmm8,%xmm8 # 52f0 <_sk_callback_hsw+0x78c> + .byte 196,98,57,0,5,12,38,0,0 // vpshufb 0x260c(%rip),%xmm8,%xmm8 # 52b0 <_sk_callback_hsw+0x790> .byte 196,67,121,21,4,19,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,1) - .byte 235,176 // jmp 2ca1 <_sk_store_a8_hsw+0x33> + .byte 235,176 // jmp 2c5d <_sk_store_a8_hsw+0x33> .byte 196,67,121,20,68,19,6,12 // vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1) .byte 196,67,121,20,68,19,5,10 // vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1) .byte 196,67,121,20,68,19,4,8 // vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1) - .byte 196,98,57,0,5,238,37,0,0 // vpshufb 0x25ee(%rip),%xmm8,%xmm8 # 5300 <_sk_callback_hsw+0x79c> + .byte 196,98,57,0,5,242,37,0,0 // vpshufb 0x25f2(%rip),%xmm8,%xmm8 # 52c0 <_sk_callback_hsw+0x7a0> .byte 196,65,121,126,4,19 // vmovd %xmm8,(%r11,%rdx,1) - .byte 235,135 // jmp 2ca1 <_sk_store_a8_hsw+0x33> + .byte 235,135 // jmp 2c5d <_sk_store_a8_hsw+0x33> .byte 102,144 // xchg %ax,%ax .byte 178,255 // mov $0xff,%dl .byte 255 // (bad) @@ -12633,15 +12587,15 @@ _sk_load_g8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,57 // jne 2d7b <_sk_load_g8_hsw+0x43> + .byte 117,57 // jne 2d37 <_sk_load_g8_hsw+0x43> .byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0 - .byte 197,249,219,5,192,37,0,0 // vpand 0x25c0(%rip),%xmm0,%xmm0 # 5310 <_sk_callback_hsw+0x7ac> + .byte 197,249,219,5,196,37,0,0 // vpand 0x25c4(%rip),%xmm0,%xmm0 # 52d0 <_sk_callback_hsw+0x7b0> .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,170,33,0,0 // vbroadcastss 0x21aa(%rip),%ymm1 # 4f0c <_sk_callback_hsw+0x3a8> + .byte 196,226,125,24,13,170,33,0,0 // vbroadcastss 0x21aa(%rip),%ymm1 # 4ec8 <_sk_callback_hsw+0x3a8> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,159,33,0,0 // vbroadcastss 0x219f(%rip),%ymm3 # 4f10 <_sk_callback_hsw+0x3ac> + .byte 196,226,125,24,29,159,33,0,0 // vbroadcastss 0x219f(%rip),%ymm3 # 4ecc <_sk_callback_hsw+0x3ac> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -12650,15 +12604,15 @@ _sk_load_g8_hsw: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,185 // ja 2d48 <_sk_load_g8_hsw+0x10> + .byte 119,185 // ja 2d04 <_sk_load_g8_hsw+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 2e14 <_sk_load_g8_hsw+0xdc> + .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 2dd0 <_sk_load_g8_hsw+0xdc> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,154 // jmp 2d48 <_sk_load_g8_hsw+0x10> + .byte 235,154 // jmp 2d04 <_sk_load_g8_hsw+0x10> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -12666,7 +12620,7 @@ _sk_load_g8_hsw: .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,114,255,255,255 // jmpq 2d48 <_sk_load_g8_hsw+0x10> + .byte 233,114,255,255,255 // jmpq 2d04 <_sk_load_g8_hsw+0x10> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -12677,7 +12631,7 @@ _sk_load_g8_hsw: .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,55,255,255,255 // jmpq 2d48 <_sk_load_g8_hsw+0x10> + .byte 233,55,255,255,255 // jmpq 2d04 <_sk_load_g8_hsw+0x10> .byte 15,31,0 // nopl (%rax) .byte 143 // (bad) .byte 255 // (bad) @@ -12739,10 +12693,10 @@ _sk_gather_g8_hsw: .byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,46,32,0,0 // vbroadcastss 0x202e(%rip),%ymm1 # 4f14 <_sk_callback_hsw+0x3b0> + .byte 196,226,125,24,13,46,32,0,0 // vbroadcastss 0x202e(%rip),%ymm1 # 4ed0 <_sk_callback_hsw+0x3b0> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,35,32,0,0 // vbroadcastss 0x2023(%rip),%ymm3 # 4f18 <_sk_callback_hsw+0x3b4> + .byte 196,226,125,24,29,35,32,0,0 // vbroadcastss 0x2023(%rip),%ymm3 # 4ed4 <_sk_callback_hsw+0x3b4> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -12754,9 +12708,9 @@ _sk_gather_i8_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,137,193 // mov %rax,%r9 .byte 77,133,201 // test %r9,%r9 - .byte 116,5 // je 2f0e <_sk_gather_i8_hsw+0xf> + .byte 116,5 // je 2eca <_sk_gather_i8_hsw+0xf> .byte 76,137,200 // mov %r9,%rax - .byte 235,2 // jmp 2f10 <_sk_gather_i8_hsw+0x11> + .byte 235,2 // jmp 2ecc <_sk_gather_i8_hsw+0x11> .byte 72,173 // lods %ds:(%rsi),%rax .byte 83 // push %rbx .byte 76,139,16 // mov (%rax),%r10 @@ -12790,14 +12744,14 @@ _sk_gather_i8_hsw: .byte 73,139,65,8 // mov 0x8(%r9),%rax .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,226,117,144,28,128 // vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3 - .byte 197,229,219,5,203,33,0,0 // vpand 0x21cb(%rip),%ymm3,%ymm0 # 5180 <_sk_callback_hsw+0x61c> + .byte 197,229,219,5,207,33,0,0 // vpand 0x21cf(%rip),%ymm3,%ymm0 # 5140 <_sk_callback_hsw+0x620> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,90,31,0,0 // vbroadcastss 0x1f5a(%rip),%ymm8 # 4f1c <_sk_callback_hsw+0x3b8> + .byte 196,98,125,24,5,90,31,0,0 // vbroadcastss 0x1f5a(%rip),%ymm8 # 4ed8 <_sk_callback_hsw+0x3b8> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,208,33,0,0 // vpshufb 0x21d0(%rip),%ymm3,%ymm1 # 51a0 <_sk_callback_hsw+0x63c> + .byte 196,226,101,0,13,212,33,0,0 // vpshufb 0x21d4(%rip),%ymm3,%ymm1 # 5160 <_sk_callback_hsw+0x640> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,222,33,0,0 // vpshufb 0x21de(%rip),%ymm3,%ymm2 # 51c0 <_sk_callback_hsw+0x65c> + .byte 196,226,101,0,21,226,33,0,0 // vpshufb 0x21e2(%rip),%ymm3,%ymm2 # 5180 <_sk_callback_hsw+0x660> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -12814,53 +12768,53 @@ _sk_load_565_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,114 // jne 307a <_sk_load_565_hsw+0x7c> + .byte 117,114 // jne 3036 <_sk_load_565_hsw+0x7c> .byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,4,31,0,0 // vpbroadcastd 0x1f04(%rip),%ymm0 # 4f20 <_sk_callback_hsw+0x3bc> + .byte 196,226,125,88,5,4,31,0,0 // vpbroadcastd 0x1f04(%rip),%ymm0 # 4edc <_sk_callback_hsw+0x3bc> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,247,30,0,0 // vbroadcastss 0x1ef7(%rip),%ymm1 # 4f24 <_sk_callback_hsw+0x3c0> + .byte 196,226,125,24,13,247,30,0,0 // vbroadcastss 0x1ef7(%rip),%ymm1 # 4ee0 <_sk_callback_hsw+0x3c0> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,238,30,0,0 // vpbroadcastd 0x1eee(%rip),%ymm1 # 4f28 <_sk_callback_hsw+0x3c4> + .byte 196,226,125,88,13,238,30,0,0 // vpbroadcastd 0x1eee(%rip),%ymm1 # 4ee4 <_sk_callback_hsw+0x3c4> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,225,30,0,0 // vbroadcastss 0x1ee1(%rip),%ymm3 # 4f2c <_sk_callback_hsw+0x3c8> + .byte 196,226,125,24,29,225,30,0,0 // vbroadcastss 0x1ee1(%rip),%ymm3 # 4ee8 <_sk_callback_hsw+0x3c8> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,216,30,0,0 // vpbroadcastd 0x1ed8(%rip),%ymm3 # 4f30 <_sk_callback_hsw+0x3cc> + .byte 196,226,125,88,29,216,30,0,0 // vpbroadcastd 0x1ed8(%rip),%ymm3 # 4eec <_sk_callback_hsw+0x3cc> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,203,30,0,0 // vbroadcastss 0x1ecb(%rip),%ymm3 # 4f34 <_sk_callback_hsw+0x3d0> + .byte 196,226,125,24,29,203,30,0,0 // vbroadcastss 0x1ecb(%rip),%ymm3 # 4ef0 <_sk_callback_hsw+0x3d0> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,192,30,0,0 // vbroadcastss 0x1ec0(%rip),%ymm3 # 4f38 <_sk_callback_hsw+0x3d4> + .byte 196,226,125,24,29,192,30,0,0 // vbroadcastss 0x1ec0(%rip),%ymm3 # 4ef4 <_sk_callback_hsw+0x3d4> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,7 // and $0x7,%r9b .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,128 // ja 300e <_sk_load_565_hsw+0x10> + .byte 119,128 // ja 2fca <_sk_load_565_hsw+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 30fc <_sk_load_565_hsw+0xfe> + .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 30b8 <_sk_load_565_hsw+0xfe> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 233,94,255,255,255 // jmpq 300e <_sk_load_565_hsw+0x10> + .byte 233,94,255,255,255 // jmpq 2fca <_sk_load_565_hsw+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,65,255,255,255 // jmpq 300e <_sk_load_565_hsw+0x10> + .byte 233,65,255,255,255 // jmpq 2fca <_sk_load_565_hsw+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,20,255,255,255 // jmpq 300e <_sk_load_565_hsw+0x10> + .byte 233,20,255,255,255 // jmpq 2fca <_sk_load_565_hsw+0x10> .byte 102,144 // xchg %ax,%ax .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi) .byte 255 // (bad) @@ -12922,23 +12876,23 @@ _sk_gather_565_hsw: .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2 - .byte 196,226,125,88,5,115,29,0,0 // vpbroadcastd 0x1d73(%rip),%ymm0 # 4f3c <_sk_callback_hsw+0x3d8> + .byte 196,226,125,88,5,115,29,0,0 // vpbroadcastd 0x1d73(%rip),%ymm0 # 4ef8 <_sk_callback_hsw+0x3d8> .byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,102,29,0,0 // vbroadcastss 0x1d66(%rip),%ymm1 # 4f40 <_sk_callback_hsw+0x3dc> + .byte 196,226,125,24,13,102,29,0,0 // vbroadcastss 0x1d66(%rip),%ymm1 # 4efc <_sk_callback_hsw+0x3dc> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,93,29,0,0 // vpbroadcastd 0x1d5d(%rip),%ymm1 # 4f44 <_sk_callback_hsw+0x3e0> + .byte 196,226,125,88,13,93,29,0,0 // vpbroadcastd 0x1d5d(%rip),%ymm1 # 4f00 <_sk_callback_hsw+0x3e0> .byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,80,29,0,0 // vbroadcastss 0x1d50(%rip),%ymm3 # 4f48 <_sk_callback_hsw+0x3e4> + .byte 196,226,125,24,29,80,29,0,0 // vbroadcastss 0x1d50(%rip),%ymm3 # 4f04 <_sk_callback_hsw+0x3e4> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,88,29,71,29,0,0 // vpbroadcastd 0x1d47(%rip),%ymm3 # 4f4c <_sk_callback_hsw+0x3e8> + .byte 196,226,125,88,29,71,29,0,0 // vpbroadcastd 0x1d47(%rip),%ymm3 # 4f08 <_sk_callback_hsw+0x3e8> .byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,58,29,0,0 // vbroadcastss 0x1d3a(%rip),%ymm3 # 4f50 <_sk_callback_hsw+0x3ec> + .byte 196,226,125,24,29,58,29,0,0 // vbroadcastss 0x1d3a(%rip),%ymm3 # 4f0c <_sk_callback_hsw+0x3ec> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,47,29,0,0 // vbroadcastss 0x1d2f(%rip),%ymm3 # 4f54 <_sk_callback_hsw+0x3f0> + .byte 196,226,125,24,29,47,29,0,0 // vbroadcastss 0x1d2f(%rip),%ymm3 # 4f10 <_sk_callback_hsw+0x3f0> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_hsw @@ -12947,11 +12901,11 @@ FUNCTION(_sk_store_565_hsw) _sk_store_565_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,35,29,0,0 // vbroadcastss 0x1d23(%rip),%ymm8 # 4f58 <_sk_callback_hsw+0x3f4> + .byte 196,98,125,24,5,35,29,0,0 // vbroadcastss 0x1d23(%rip),%ymm8 # 4f14 <_sk_callback_hsw+0x3f4> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9 - .byte 196,98,125,24,21,14,29,0,0 // vbroadcastss 0x1d0e(%rip),%ymm10 # 4f5c <_sk_callback_hsw+0x3f8> + .byte 196,98,125,24,21,14,29,0,0 // vbroadcastss 0x1d0e(%rip),%ymm10 # 4f18 <_sk_callback_hsw+0x3f8> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10 @@ -12962,7 +12916,7 @@ _sk_store_565_hsw: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 328c <_sk_store_565_hsw+0x65> + .byte 117,10 // jne 3248 <_sk_store_565_hsw+0x65> .byte 196,65,122,127,4,83 // vmovdqu %xmm8,(%r11,%rdx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -12970,22 +12924,22 @@ _sk_store_565_hsw: .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,236 // ja 3288 <_sk_store_565_hsw+0x61> + .byte 119,236 // ja 3244 <_sk_store_565_hsw+0x61> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # 32ec <_sk_store_565_hsw+0xc5> + .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # 32a8 <_sk_store_565_hsw+0xc5> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2) - .byte 235,207 // jmp 3288 <_sk_store_565_hsw+0x61> + .byte 235,207 // jmp 3244 <_sk_store_565_hsw+0x61> .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2) .byte 196,65,121,126,4,83 // vmovd %xmm8,(%r11,%rdx,2) - .byte 235,191 // jmp 3288 <_sk_store_565_hsw+0x61> + .byte 235,191 // jmp 3244 <_sk_store_565_hsw+0x61> .byte 196,67,121,21,68,83,12,6 // vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2) .byte 196,67,121,21,68,83,10,5 // vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2) .byte 196,67,121,21,68,83,8,4 // vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2) .byte 196,65,121,214,4,83 // vmovq %xmm8,(%r11,%rdx,2) - .byte 235,159 // jmp 3288 <_sk_store_565_hsw+0x61> + .byte 235,159 // jmp 3244 <_sk_store_565_hsw+0x61> .byte 15,31,0 // nopl (%rax) .byte 196 // (bad) .byte 255 // (bad) @@ -13018,28 +12972,28 @@ _sk_load_4444_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,138,0,0,0 // jne 33a0 <_sk_load_4444_hsw+0x98> + .byte 15,133,138,0,0,0 // jne 335c <_sk_load_4444_hsw+0x98> .byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,54,28,0,0 // vpbroadcastd 0x1c36(%rip),%ymm0 # 4f60 <_sk_callback_hsw+0x3fc> + .byte 196,226,125,88,5,54,28,0,0 // vpbroadcastd 0x1c36(%rip),%ymm0 # 4f1c <_sk_callback_hsw+0x3fc> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,41,28,0,0 // vbroadcastss 0x1c29(%rip),%ymm1 # 4f64 <_sk_callback_hsw+0x400> + .byte 196,226,125,24,13,41,28,0,0 // vbroadcastss 0x1c29(%rip),%ymm1 # 4f20 <_sk_callback_hsw+0x400> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,32,28,0,0 // vpbroadcastd 0x1c20(%rip),%ymm1 # 4f68 <_sk_callback_hsw+0x404> + .byte 196,226,125,88,13,32,28,0,0 // vpbroadcastd 0x1c20(%rip),%ymm1 # 4f24 <_sk_callback_hsw+0x404> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,19,28,0,0 // vbroadcastss 0x1c13(%rip),%ymm2 # 4f6c <_sk_callback_hsw+0x408> + .byte 196,226,125,24,21,19,28,0,0 // vbroadcastss 0x1c13(%rip),%ymm2 # 4f28 <_sk_callback_hsw+0x408> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,10,28,0,0 // vpbroadcastd 0x1c0a(%rip),%ymm2 # 4f70 <_sk_callback_hsw+0x40c> + .byte 196,226,125,88,21,10,28,0,0 // vpbroadcastd 0x1c0a(%rip),%ymm2 # 4f2c <_sk_callback_hsw+0x40c> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,253,27,0,0 // vbroadcastss 0x1bfd(%rip),%ymm8 # 4f74 <_sk_callback_hsw+0x410> + .byte 196,98,125,24,5,253,27,0,0 // vbroadcastss 0x1bfd(%rip),%ymm8 # 4f30 <_sk_callback_hsw+0x410> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,243,27,0,0 // vpbroadcastd 0x1bf3(%rip),%ymm8 # 4f78 <_sk_callback_hsw+0x414> + .byte 196,98,125,88,5,243,27,0,0 // vpbroadcastd 0x1bf3(%rip),%ymm8 # 4f34 <_sk_callback_hsw+0x414> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,229,27,0,0 // vbroadcastss 0x1be5(%rip),%ymm8 # 4f7c <_sk_callback_hsw+0x418> + .byte 196,98,125,24,5,229,27,0,0 // vbroadcastss 0x1be5(%rip),%ymm8 # 4f38 <_sk_callback_hsw+0x418> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -13048,27 +13002,27 @@ _sk_load_4444_hsw: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,100,255,255,255 // ja 331c <_sk_load_4444_hsw+0x14> + .byte 15,135,100,255,255,255 // ja 32d8 <_sk_load_4444_hsw+0x14> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,97,0,0,0 // lea 0x61(%rip),%r10 # 3424 <_sk_load_4444_hsw+0x11c> + .byte 76,141,21,97,0,0,0 // lea 0x61(%rip),%r10 # 33e0 <_sk_load_4444_hsw+0x11c> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 233,66,255,255,255 // jmpq 331c <_sk_load_4444_hsw+0x14> + .byte 233,66,255,255,255 // jmpq 32d8 <_sk_load_4444_hsw+0x14> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,37,255,255,255 // jmpq 331c <_sk_load_4444_hsw+0x14> + .byte 233,37,255,255,255 // jmpq 32d8 <_sk_load_4444_hsw+0x14> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,248,254,255,255 // jmpq 331c <_sk_load_4444_hsw+0x14> + .byte 233,248,254,255,255 // jmpq 32d8 <_sk_load_4444_hsw+0x14> .byte 168,255 // test $0xff,%al .byte 255 // (bad) .byte 255,194 // inc %edx @@ -13129,25 +13083,25 @@ _sk_gather_4444_hsw: .byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax .byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0 .byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3 - .byte 196,226,125,88,5,143,26,0,0 // vpbroadcastd 0x1a8f(%rip),%ymm0 # 4f80 <_sk_callback_hsw+0x41c> + .byte 196,226,125,88,5,143,26,0,0 // vpbroadcastd 0x1a8f(%rip),%ymm0 # 4f3c <_sk_callback_hsw+0x41c> .byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,130,26,0,0 // vbroadcastss 0x1a82(%rip),%ymm1 # 4f84 <_sk_callback_hsw+0x420> + .byte 196,226,125,24,13,130,26,0,0 // vbroadcastss 0x1a82(%rip),%ymm1 # 4f40 <_sk_callback_hsw+0x420> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,88,13,121,26,0,0 // vpbroadcastd 0x1a79(%rip),%ymm1 # 4f88 <_sk_callback_hsw+0x424> + .byte 196,226,125,88,13,121,26,0,0 // vpbroadcastd 0x1a79(%rip),%ymm1 # 4f44 <_sk_callback_hsw+0x424> .byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,108,26,0,0 // vbroadcastss 0x1a6c(%rip),%ymm2 # 4f8c <_sk_callback_hsw+0x428> + .byte 196,226,125,24,21,108,26,0,0 // vbroadcastss 0x1a6c(%rip),%ymm2 # 4f48 <_sk_callback_hsw+0x428> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,88,21,99,26,0,0 // vpbroadcastd 0x1a63(%rip),%ymm2 # 4f90 <_sk_callback_hsw+0x42c> + .byte 196,226,125,88,21,99,26,0,0 // vpbroadcastd 0x1a63(%rip),%ymm2 # 4f4c <_sk_callback_hsw+0x42c> .byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,86,26,0,0 // vbroadcastss 0x1a56(%rip),%ymm8 # 4f94 <_sk_callback_hsw+0x430> + .byte 196,98,125,24,5,86,26,0,0 // vbroadcastss 0x1a56(%rip),%ymm8 # 4f50 <_sk_callback_hsw+0x430> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,88,5,76,26,0,0 // vpbroadcastd 0x1a4c(%rip),%ymm8 # 4f98 <_sk_callback_hsw+0x434> + .byte 196,98,125,88,5,76,26,0,0 // vpbroadcastd 0x1a4c(%rip),%ymm8 # 4f54 <_sk_callback_hsw+0x434> .byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,62,26,0,0 // vbroadcastss 0x1a3e(%rip),%ymm8 # 4f9c <_sk_callback_hsw+0x438> + .byte 196,98,125,24,5,62,26,0,0 // vbroadcastss 0x1a3e(%rip),%ymm8 # 4f58 <_sk_callback_hsw+0x438> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -13158,7 +13112,7 @@ FUNCTION(_sk_store_4444_hsw) _sk_store_4444_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,43,26,0,0 // vbroadcastss 0x1a2b(%rip),%ymm8 # 4fa0 <_sk_callback_hsw+0x43c> + .byte 196,98,125,24,5,43,26,0,0 // vbroadcastss 0x1a2b(%rip),%ymm8 # 4f5c <_sk_callback_hsw+0x43c> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9 @@ -13176,7 +13130,7 @@ _sk_store_4444_hsw: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 35d8 <_sk_store_4444_hsw+0x71> + .byte 117,10 // jne 3594 <_sk_store_4444_hsw+0x71> .byte 196,65,122,127,4,83 // vmovdqu %xmm8,(%r11,%rdx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -13184,22 +13138,22 @@ _sk_store_4444_hsw: .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,236 // ja 35d4 <_sk_store_4444_hsw+0x6d> + .byte 119,236 // ja 3590 <_sk_store_4444_hsw+0x6d> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # 3638 <_sk_store_4444_hsw+0xd1> + .byte 76,141,21,69,0,0,0 // lea 0x45(%rip),%r10 # 35f4 <_sk_store_4444_hsw+0xd1> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2) - .byte 235,207 // jmp 35d4 <_sk_store_4444_hsw+0x6d> + .byte 235,207 // jmp 3590 <_sk_store_4444_hsw+0x6d> .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2) .byte 196,65,121,126,4,83 // vmovd %xmm8,(%r11,%rdx,2) - .byte 235,191 // jmp 35d4 <_sk_store_4444_hsw+0x6d> + .byte 235,191 // jmp 3590 <_sk_store_4444_hsw+0x6d> .byte 196,67,121,21,68,83,12,6 // vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2) .byte 196,67,121,21,68,83,10,5 // vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2) .byte 196,67,121,21,68,83,8,4 // vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2) .byte 196,65,121,214,4,83 // vmovq %xmm8,(%r11,%rdx,2) - .byte 235,159 // jmp 35d4 <_sk_store_4444_hsw+0x6d> + .byte 235,159 // jmp 3590 <_sk_store_4444_hsw+0x6d> .byte 15,31,0 // nopl (%rax) .byte 196 // (bad) .byte 255 // (bad) @@ -13234,16 +13188,16 @@ _sk_load_8888_hsw: .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,88 // jne 36c1 <_sk_load_8888_hsw+0x6d> + .byte 117,88 // jne 367d <_sk_load_8888_hsw+0x6d> .byte 196,193,124,16,26 // vmovups (%r10),%ymm3 - .byte 197,228,84,5,106,27,0,0 // vandps 0x1b6a(%rip),%ymm3,%ymm0 # 51e0 <_sk_callback_hsw+0x67c> + .byte 197,228,84,5,110,27,0,0 // vandps 0x1b6e(%rip),%ymm3,%ymm0 # 51a0 <_sk_callback_hsw+0x680> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,33,25,0,0 // vbroadcastss 0x1921(%rip),%ymm8 # 4fa4 <_sk_callback_hsw+0x440> + .byte 196,98,125,24,5,33,25,0,0 // vbroadcastss 0x1921(%rip),%ymm8 # 4f60 <_sk_callback_hsw+0x440> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,111,27,0,0 // vpshufb 0x1b6f(%rip),%ymm3,%ymm1 # 5200 <_sk_callback_hsw+0x69c> + .byte 196,226,101,0,13,115,27,0,0 // vpshufb 0x1b73(%rip),%ymm3,%ymm1 # 51c0 <_sk_callback_hsw+0x6a0> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,125,27,0,0 // vpshufb 0x1b7d(%rip),%ymm3,%ymm2 # 5220 <_sk_callback_hsw+0x6bc> + .byte 196,226,101,0,21,129,27,0,0 // vpshufb 0x1b81(%rip),%ymm3,%ymm2 # 51e0 <_sk_callback_hsw+0x6c0> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -13260,7 +13214,7 @@ _sk_load_8888_hsw: .byte 196,225,249,110,192 // vmovq %rax,%xmm0 .byte 196,226,125,33,192 // vpmovsxbd %xmm0,%ymm0 .byte 196,194,125,44,26 // vmaskmovps (%r10),%ymm0,%ymm3 - .byte 235,135 // jmp 366e <_sk_load_8888_hsw+0x1a> + .byte 235,135 // jmp 362a <_sk_load_8888_hsw+0x1a> HIDDEN _sk_gather_8888_hsw .globl _sk_gather_8888_hsw @@ -13275,14 +13229,14 @@ _sk_gather_8888_hsw: .byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - .byte 197,229,219,5,43,27,0,0 // vpand 0x1b2b(%rip),%ymm3,%ymm0 # 5240 <_sk_callback_hsw+0x6dc> + .byte 197,229,219,5,47,27,0,0 // vpand 0x1b2f(%rip),%ymm3,%ymm0 # 5200 <_sk_callback_hsw+0x6e0> .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,134,24,0,0 // vbroadcastss 0x1886(%rip),%ymm8 # 4fa8 <_sk_callback_hsw+0x444> + .byte 196,98,125,24,5,134,24,0,0 // vbroadcastss 0x1886(%rip),%ymm8 # 4f64 <_sk_callback_hsw+0x444> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,226,101,0,13,48,27,0,0 // vpshufb 0x1b30(%rip),%ymm3,%ymm1 # 5260 <_sk_callback_hsw+0x6fc> + .byte 196,226,101,0,13,52,27,0,0 // vpshufb 0x1b34(%rip),%ymm3,%ymm1 # 5220 <_sk_callback_hsw+0x700> .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,226,101,0,21,62,27,0,0 // vpshufb 0x1b3e(%rip),%ymm3,%ymm2 # 5280 <_sk_callback_hsw+0x71c> + .byte 196,226,101,0,21,66,27,0,0 // vpshufb 0x1b42(%rip),%ymm3,%ymm2 # 5240 <_sk_callback_hsw+0x720> .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3 @@ -13299,7 +13253,7 @@ _sk_store_8888_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 - .byte 196,98,125,24,5,54,24,0,0 // vbroadcastss 0x1836(%rip),%ymm8 # 4fac <_sk_callback_hsw+0x448> + .byte 196,98,125,24,5,54,24,0,0 // vbroadcastss 0x1836(%rip),%ymm8 # 4f68 <_sk_callback_hsw+0x448> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -13315,7 +13269,7 @@ _sk_store_8888_hsw: .byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8 .byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,12 // jne 37d0 <_sk_store_8888_hsw+0x73> + .byte 117,12 // jne 378c <_sk_store_8888_hsw+0x73> .byte 196,65,124,17,2 // vmovups %ymm8,(%r10) .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,201 // mov %r9,%rcx @@ -13328,7 +13282,7 @@ _sk_store_8888_hsw: .byte 196,97,249,110,200 // vmovq %rax,%xmm9 .byte 196,66,125,33,201 // vpmovsxbd %xmm9,%ymm9 .byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10) - .byte 235,211 // jmp 37c9 <_sk_store_8888_hsw+0x6c> + .byte 235,211 // jmp 3785 <_sk_store_8888_hsw+0x6c> HIDDEN _sk_load_f16_hsw .globl _sk_load_f16_hsw @@ -13337,7 +13291,7 @@ _sk_load_f16_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,97 // jne 3861 <_sk_load_f16_hsw+0x6b> + .byte 117,97 // jne 381d <_sk_load_f16_hsw+0x6b> .byte 197,121,16,4,208 // vmovupd (%rax,%rdx,8),%xmm8 .byte 197,249,16,84,208,16 // vmovupd 0x10(%rax,%rdx,8),%xmm2 .byte 197,249,16,92,208,32 // vmovupd 0x20(%rax,%rdx,8),%xmm3 @@ -13363,29 +13317,29 @@ _sk_load_f16_hsw: .byte 197,123,16,4,208 // vmovsd (%rax,%rdx,8),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,79 // je 38c0 <_sk_load_f16_hsw+0xca> + .byte 116,79 // je 387c <_sk_load_f16_hsw+0xca> .byte 197,57,22,68,208,8 // vmovhpd 0x8(%rax,%rdx,8),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,67 // jb 38c0 <_sk_load_f16_hsw+0xca> + .byte 114,67 // jb 387c <_sk_load_f16_hsw+0xca> .byte 197,251,16,84,208,16 // vmovsd 0x10(%rax,%rdx,8),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,68 // je 38cd <_sk_load_f16_hsw+0xd7> + .byte 116,68 // je 3889 <_sk_load_f16_hsw+0xd7> .byte 197,233,22,84,208,24 // vmovhpd 0x18(%rax,%rdx,8),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,56 // jb 38cd <_sk_load_f16_hsw+0xd7> + .byte 114,56 // jb 3889 <_sk_load_f16_hsw+0xd7> .byte 197,251,16,92,208,32 // vmovsd 0x20(%rax,%rdx,8),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,114,255,255,255 // je 3817 <_sk_load_f16_hsw+0x21> + .byte 15,132,114,255,255,255 // je 37d3 <_sk_load_f16_hsw+0x21> .byte 197,225,22,92,208,40 // vmovhpd 0x28(%rax,%rdx,8),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,98,255,255,255 // jb 3817 <_sk_load_f16_hsw+0x21> + .byte 15,130,98,255,255,255 // jb 37d3 <_sk_load_f16_hsw+0x21> .byte 197,122,126,76,208,48 // vmovq 0x30(%rax,%rdx,8),%xmm9 - .byte 233,87,255,255,255 // jmpq 3817 <_sk_load_f16_hsw+0x21> + .byte 233,87,255,255,255 // jmpq 37d3 <_sk_load_f16_hsw+0x21> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,74,255,255,255 // jmpq 3817 <_sk_load_f16_hsw+0x21> + .byte 233,74,255,255,255 // jmpq 37d3 <_sk_load_f16_hsw+0x21> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,65,255,255,255 // jmpq 3817 <_sk_load_f16_hsw+0x21> + .byte 233,65,255,255,255 // jmpq 37d3 <_sk_load_f16_hsw+0x21> HIDDEN _sk_gather_f16_hsw .globl _sk_gather_f16_hsw @@ -13443,7 +13397,7 @@ _sk_store_f16_hsw: .byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9 .byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,27 // jne 39c5 <_sk_store_f16_hsw+0x65> + .byte 117,27 // jne 3981 <_sk_store_f16_hsw+0x65> .byte 197,120,17,28,208 // vmovups %xmm11,(%rax,%rdx,8) .byte 197,120,17,84,208,16 // vmovups %xmm10,0x10(%rax,%rdx,8) .byte 197,120,17,76,208,32 // vmovups %xmm9,0x20(%rax,%rdx,8) @@ -13452,22 +13406,22 @@ _sk_store_f16_hsw: .byte 255,224 // jmpq *%rax .byte 197,121,214,28,208 // vmovq %xmm11,(%rax,%rdx,8) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,241 // je 39c1 <_sk_store_f16_hsw+0x61> + .byte 116,241 // je 397d <_sk_store_f16_hsw+0x61> .byte 197,121,23,92,208,8 // vmovhpd %xmm11,0x8(%rax,%rdx,8) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,229 // jb 39c1 <_sk_store_f16_hsw+0x61> + .byte 114,229 // jb 397d <_sk_store_f16_hsw+0x61> .byte 197,121,214,84,208,16 // vmovq %xmm10,0x10(%rax,%rdx,8) - .byte 116,221 // je 39c1 <_sk_store_f16_hsw+0x61> + .byte 116,221 // je 397d <_sk_store_f16_hsw+0x61> .byte 197,121,23,84,208,24 // vmovhpd %xmm10,0x18(%rax,%rdx,8) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,209 // jb 39c1 <_sk_store_f16_hsw+0x61> + .byte 114,209 // jb 397d <_sk_store_f16_hsw+0x61> .byte 197,121,214,76,208,32 // vmovq %xmm9,0x20(%rax,%rdx,8) - .byte 116,201 // je 39c1 <_sk_store_f16_hsw+0x61> + .byte 116,201 // je 397d <_sk_store_f16_hsw+0x61> .byte 197,121,23,76,208,40 // vmovhpd %xmm9,0x28(%rax,%rdx,8) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,189 // jb 39c1 <_sk_store_f16_hsw+0x61> + .byte 114,189 // jb 397d <_sk_store_f16_hsw+0x61> .byte 197,121,214,68,208,48 // vmovq %xmm8,0x30(%rax,%rdx,8) - .byte 235,181 // jmp 39c1 <_sk_store_f16_hsw+0x61> + .byte 235,181 // jmp 397d <_sk_store_f16_hsw+0x61> HIDDEN _sk_load_u16_be_hsw .globl _sk_load_u16_be_hsw @@ -13477,7 +13431,7 @@ _sk_load_u16_be_hsw: .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,204,0,0,0 // jne 3aee <_sk_load_u16_be_hsw+0xe2> + .byte 15,133,204,0,0,0 // jne 3aaa <_sk_load_u16_be_hsw+0xe2> .byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8 .byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2 .byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3 @@ -13496,7 +13450,7 @@ _sk_load_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,45,21,0,0 // vbroadcastss 0x152d(%rip),%ymm10 # 4fb0 <_sk_callback_hsw+0x44c> + .byte 196,98,125,24,21,45,21,0,0 // vbroadcastss 0x152d(%rip),%ymm10 # 4f6c <_sk_callback_hsw+0x44c> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -13524,29 +13478,29 @@ _sk_load_u16_be_hsw: .byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je 3b54 <_sk_load_u16_be_hsw+0x148> + .byte 116,85 // je 3b10 <_sk_load_u16_be_hsw+0x148> .byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb 3b54 <_sk_load_u16_be_hsw+0x148> + .byte 114,72 // jb 3b10 <_sk_load_u16_be_hsw+0x148> .byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je 3b61 <_sk_load_u16_be_hsw+0x155> + .byte 116,72 // je 3b1d <_sk_load_u16_be_hsw+0x155> .byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb 3b61 <_sk_load_u16_be_hsw+0x155> + .byte 114,59 // jb 3b1d <_sk_load_u16_be_hsw+0x155> .byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,6,255,255,255 // je 3a3d <_sk_load_u16_be_hsw+0x31> + .byte 15,132,6,255,255,255 // je 39f9 <_sk_load_u16_be_hsw+0x31> .byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,245,254,255,255 // jb 3a3d <_sk_load_u16_be_hsw+0x31> + .byte 15,130,245,254,255,255 // jb 39f9 <_sk_load_u16_be_hsw+0x31> .byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9 - .byte 233,233,254,255,255 // jmpq 3a3d <_sk_load_u16_be_hsw+0x31> + .byte 233,233,254,255,255 // jmpq 39f9 <_sk_load_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,220,254,255,255 // jmpq 3a3d <_sk_load_u16_be_hsw+0x31> + .byte 233,220,254,255,255 // jmpq 39f9 <_sk_load_u16_be_hsw+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,211,254,255,255 // jmpq 3a3d <_sk_load_u16_be_hsw+0x31> + .byte 233,211,254,255,255 // jmpq 39f9 <_sk_load_u16_be_hsw+0x31> HIDDEN _sk_load_rgb_u16_be_hsw .globl _sk_load_rgb_u16_be_hsw @@ -13556,7 +13510,7 @@ _sk_load_rgb_u16_be_hsw: .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,82 // lea (%rdx,%rdx,2),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,204,0,0,0 // jne 3c48 <_sk_load_rgb_u16_be_hsw+0xde> + .byte 15,133,204,0,0,0 // jne 3c04 <_sk_load_rgb_u16_be_hsw+0xde> .byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0 .byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2 .byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1 @@ -13580,7 +13534,7 @@ _sk_load_rgb_u16_be_hsw: .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0 .byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,21,190,19,0,0 // vbroadcastss 0x13be(%rip),%ymm10 # 4fb4 <_sk_callback_hsw+0x450> + .byte 196,98,125,24,21,190,19,0,0 // vbroadcastss 0x13be(%rip),%ymm10 # 4f70 <_sk_callback_hsw+0x450> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -13597,41 +13551,41 @@ _sk_load_rgb_u16_be_hsw: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,114,19,0,0 // vbroadcastss 0x1372(%rip),%ymm3 # 4fb8 <_sk_callback_hsw+0x454> + .byte 196,226,125,24,29,114,19,0,0 // vbroadcastss 0x1372(%rip),%ymm3 # 4f74 <_sk_callback_hsw+0x454> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0 .byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,5 // jne 3c61 <_sk_load_rgb_u16_be_hsw+0xf7> - .byte 233,79,255,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46> + .byte 117,5 // jne 3c1d <_sk_load_rgb_u16_be_hsw+0xf7> + .byte 233,79,255,255,255 // jmpq 3b6c <_sk_load_rgb_u16_be_hsw+0x46> .byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1 .byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,26 // jb 3c90 <_sk_load_rgb_u16_be_hsw+0x126> + .byte 114,26 // jb 3c4c <_sk_load_rgb_u16_be_hsw+0x126> .byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1 .byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 117,10 // jne 3c95 <_sk_load_rgb_u16_be_hsw+0x12b> - .byte 233,32,255,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46> - .byte 233,27,255,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 3c51 <_sk_load_rgb_u16_be_hsw+0x12b> + .byte 233,32,255,255,255 // jmpq 3b6c <_sk_load_rgb_u16_be_hsw+0x46> + .byte 233,27,255,255,255 // jmpq 3b6c <_sk_load_rgb_u16_be_hsw+0x46> .byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1 .byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,26 // jb 3cc4 <_sk_load_rgb_u16_be_hsw+0x15a> + .byte 114,26 // jb 3c80 <_sk_load_rgb_u16_be_hsw+0x15a> .byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1 .byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 117,10 // jne 3cc9 <_sk_load_rgb_u16_be_hsw+0x15f> - .byte 233,236,254,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46> - .byte 233,231,254,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46> + .byte 117,10 // jne 3c85 <_sk_load_rgb_u16_be_hsw+0x15f> + .byte 233,236,254,255,255 // jmpq 3b6c <_sk_load_rgb_u16_be_hsw+0x46> + .byte 233,231,254,255,255 // jmpq 3b6c <_sk_load_rgb_u16_be_hsw+0x46> .byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3 .byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,20 // jb 3cf2 <_sk_load_rgb_u16_be_hsw+0x188> + .byte 114,20 // jb 3cae <_sk_load_rgb_u16_be_hsw+0x188> .byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3 .byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3 - .byte 233,190,254,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46> - .byte 233,185,254,255,255 // jmpq 3bb0 <_sk_load_rgb_u16_be_hsw+0x46> + .byte 233,190,254,255,255 // jmpq 3b6c <_sk_load_rgb_u16_be_hsw+0x46> + .byte 233,185,254,255,255 // jmpq 3b6c <_sk_load_rgb_u16_be_hsw+0x46> HIDDEN _sk_store_u16_be_hsw .globl _sk_store_u16_be_hsw @@ -13640,7 +13594,7 @@ _sk_store_u16_be_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax - .byte 196,98,125,24,5,175,18,0,0 // vbroadcastss 0x12af(%rip),%ymm8 # 4fbc <_sk_callback_hsw+0x458> + .byte 196,98,125,24,5,175,18,0,0 // vbroadcastss 0x12af(%rip),%ymm8 # 4f78 <_sk_callback_hsw+0x458> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -13678,7 +13632,7 @@ _sk_store_u16_be_hsw: .byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9 .byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,31 // jne 3df1 <_sk_store_u16_be_hsw+0xfa> + .byte 117,31 // jne 3dad <_sk_store_u16_be_hsw+0xfa> .byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2) .byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2) .byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2) @@ -13687,22 +13641,22 @@ _sk_store_u16_be_hsw: .byte 255,224 // jmpq *%rax .byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 3ded <_sk_store_u16_be_hsw+0xf6> + .byte 116,240 // je 3da9 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 3ded <_sk_store_u16_be_hsw+0xf6> + .byte 114,227 // jb 3da9 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2) - .byte 116,218 // je 3ded <_sk_store_u16_be_hsw+0xf6> + .byte 116,218 // je 3da9 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,205 // jb 3ded <_sk_store_u16_be_hsw+0xf6> + .byte 114,205 // jb 3da9 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2) - .byte 116,196 // je 3ded <_sk_store_u16_be_hsw+0xf6> + .byte 116,196 // je 3da9 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,183 // jb 3ded <_sk_store_u16_be_hsw+0xf6> + .byte 114,183 // jb 3da9 <_sk_store_u16_be_hsw+0xf6> .byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2) - .byte 235,174 // jmp 3ded <_sk_store_u16_be_hsw+0xf6> + .byte 235,174 // jmp 3da9 <_sk_store_u16_be_hsw+0xf6> HIDDEN _sk_load_f32_hsw .globl _sk_load_f32_hsw @@ -13710,10 +13664,10 @@ FUNCTION(_sk_load_f32_hsw) _sk_load_f32_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 119,110 // ja 3eb5 <_sk_load_f32_hsw+0x76> + .byte 119,110 // ja 3e71 <_sk_load_f32_hsw+0x76> .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 - .byte 76,141,29,135,0,0,0 // lea 0x87(%rip),%r11 # 3ee0 <_sk_load_f32_hsw+0xa1> + .byte 76,141,29,135,0,0,0 // lea 0x87(%rip),%r11 # 3e9c <_sk_load_f32_hsw+0xa1> .byte 75,99,4,131 // movslq (%r11,%r8,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax @@ -13774,7 +13728,7 @@ _sk_store_f32_hsw: .byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8 .byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11 .byte 77,133,192 // test %r8,%r8 - .byte 117,55 // jne 3f6d <_sk_store_f32_hsw+0x6d> + .byte 117,55 // jne 3f29 <_sk_store_f32_hsw+0x6d> .byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 .byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 .byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -13787,22 +13741,22 @@ _sk_store_f32_hsw: .byte 255,224 // jmpq *%rax .byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 3f69 <_sk_store_f32_hsw+0x69> + .byte 116,240 // je 3f25 <_sk_store_f32_hsw+0x69> .byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 3f69 <_sk_store_f32_hsw+0x69> + .byte 114,227 // jb 3f25 <_sk_store_f32_hsw+0x69> .byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4) - .byte 116,218 // je 3f69 <_sk_store_f32_hsw+0x69> + .byte 116,218 // je 3f25 <_sk_store_f32_hsw+0x69> .byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,205 // jb 3f69 <_sk_store_f32_hsw+0x69> + .byte 114,205 // jb 3f25 <_sk_store_f32_hsw+0x69> .byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4) - .byte 116,195 // je 3f69 <_sk_store_f32_hsw+0x69> + .byte 116,195 // je 3f25 <_sk_store_f32_hsw+0x69> .byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,181 // jb 3f69 <_sk_store_f32_hsw+0x69> + .byte 114,181 // jb 3f25 <_sk_store_f32_hsw+0x69> .byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4) - .byte 235,171 // jmp 3f69 <_sk_store_f32_hsw+0x69> + .byte 235,171 // jmp 3f25 <_sk_store_f32_hsw+0x69> HIDDEN _sk_clamp_x_hsw .globl _sk_clamp_x_hsw @@ -13875,7 +13829,7 @@ _sk_mirror_x_hsw: .byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11 .byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0 .byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8 - .byte 197,178,89,5,61,15,0,0 // vmulss 0xf3d(%rip),%xmm9,%xmm0 # 4fc0 <_sk_callback_hsw+0x45c> + .byte 197,178,89,5,61,15,0,0 // vmulss 0xf3d(%rip),%xmm9,%xmm0 # 4f7c <_sk_callback_hsw+0x45c> .byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0 .byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0 .byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0 @@ -13901,7 +13855,7 @@ _sk_mirror_y_hsw: .byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11 .byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1 .byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8 - .byte 197,178,89,13,225,14,0,0 // vmulss 0xee1(%rip),%xmm9,%xmm1 # 4fc4 <_sk_callback_hsw+0x460> + .byte 197,178,89,13,225,14,0,0 // vmulss 0xee1(%rip),%xmm9,%xmm1 # 4f80 <_sk_callback_hsw+0x460> .byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1 .byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1 .byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1 @@ -13922,7 +13876,7 @@ FUNCTION(_sk_clamp_x_1_hsw) _sk_clamp_x_1_hsw: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,154,14,0,0 // vbroadcastss 0xe9a(%rip),%ymm8 # 4fc8 <_sk_callback_hsw+0x464> + .byte 196,98,125,24,5,154,14,0,0 // vbroadcastss 0xe9a(%rip),%ymm8 # 4f84 <_sk_callback_hsw+0x464> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -13940,9 +13894,9 @@ HIDDEN _sk_mirror_x_1_hsw .globl _sk_mirror_x_1_hsw FUNCTION(_sk_mirror_x_1_hsw) _sk_mirror_x_1_hsw: - .byte 196,98,125,24,5,125,14,0,0 // vbroadcastss 0xe7d(%rip),%ymm8 # 4fcc <_sk_callback_hsw+0x468> + .byte 196,98,125,24,5,125,14,0,0 // vbroadcastss 0xe7d(%rip),%ymm8 # 4f88 <_sk_callback_hsw+0x468> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,13,115,14,0,0 // vbroadcastss 0xe73(%rip),%ymm9 # 4fd0 <_sk_callback_hsw+0x46c> + .byte 196,98,125,24,13,115,14,0,0 // vbroadcastss 0xe73(%rip),%ymm9 # 4f8c <_sk_callback_hsw+0x46c> .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 @@ -13958,11 +13912,11 @@ HIDDEN _sk_luminance_to_alpha_hsw .globl _sk_luminance_to_alpha_hsw FUNCTION(_sk_luminance_to_alpha_hsw) _sk_luminance_to_alpha_hsw: - .byte 196,226,125,24,29,67,14,0,0 // vbroadcastss 0xe43(%rip),%ymm3 # 4fd4 <_sk_callback_hsw+0x470> - .byte 196,98,125,24,5,62,14,0,0 // vbroadcastss 0xe3e(%rip),%ymm8 # 4fd8 <_sk_callback_hsw+0x474> + .byte 196,226,125,24,29,67,14,0,0 // vbroadcastss 0xe43(%rip),%ymm3 # 4f90 <_sk_callback_hsw+0x470> + .byte 196,98,125,24,5,62,14,0,0 // vbroadcastss 0xe3e(%rip),%ymm8 # 4f94 <_sk_callback_hsw+0x474> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1 - .byte 196,226,125,24,29,47,14,0,0 // vbroadcastss 0xe2f(%rip),%ymm3 # 4fdc <_sk_callback_hsw+0x478> + .byte 196,226,125,24,29,47,14,0,0 // vbroadcastss 0xe2f(%rip),%ymm3 # 4f98 <_sk_callback_hsw+0x478> .byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -14136,9 +14090,9 @@ _sk_evenly_spaced_gradient_hsw: .byte 76,139,72,8 // mov 0x8(%rax),%r9 .byte 77,137,211 // mov %r10,%r11 .byte 73,255,203 // dec %r11 - .byte 120,7 // js 4466 <_sk_evenly_spaced_gradient_hsw+0x19> + .byte 120,7 // js 4422 <_sk_evenly_spaced_gradient_hsw+0x19> .byte 196,193,242,42,203 // vcvtsi2ss %r11,%xmm1,%xmm1 - .byte 235,22 // jmp 447c <_sk_evenly_spaced_gradient_hsw+0x2f> + .byte 235,22 // jmp 4438 <_sk_evenly_spaced_gradient_hsw+0x2f> .byte 76,137,219 // mov %r11,%rbx .byte 72,209,235 // shr %rbx .byte 65,131,227,1 // and $0x1,%r11d @@ -14149,7 +14103,7 @@ _sk_evenly_spaced_gradient_hsw: .byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1 .byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11 .byte 73,131,250,8 // cmp $0x8,%r10 - .byte 119,70 // ja 44d5 <_sk_evenly_spaced_gradient_hsw+0x88> + .byte 119,70 // ja 4491 <_sk_evenly_spaced_gradient_hsw+0x88> .byte 196,66,37,22,1 // vpermps (%r9),%ymm11,%ymm8 .byte 72,139,88,40 // mov 0x28(%rax),%rbx .byte 196,98,37,22,11 // vpermps (%rbx),%ymm11,%ymm9 @@ -14165,7 +14119,7 @@ _sk_evenly_spaced_gradient_hsw: .byte 196,226,37,22,27 // vpermps (%rbx),%ymm11,%ymm3 .byte 72,139,64,64 // mov 0x40(%rax),%rax .byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13 - .byte 235,110 // jmp 4543 <_sk_evenly_spaced_gradient_hsw+0xf6> + .byte 235,110 // jmp 44ff <_sk_evenly_spaced_gradient_hsw+0xf6> .byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,2,117,146,4,153 // vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8 @@ -14202,14 +14156,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw .globl _sk_gauss_a_to_rgba_hsw FUNCTION(_sk_gauss_a_to_rgba_hsw) _sk_gauss_a_to_rgba_hsw: - .byte 196,226,125,24,5,119,10,0,0 // vbroadcastss 0xa77(%rip),%ymm0 # 4fe0 <_sk_callback_hsw+0x47c> - .byte 196,226,125,24,13,114,10,0,0 // vbroadcastss 0xa72(%rip),%ymm1 # 4fe4 <_sk_callback_hsw+0x480> + .byte 196,226,125,24,5,119,10,0,0 // vbroadcastss 0xa77(%rip),%ymm0 # 4f9c <_sk_callback_hsw+0x47c> + .byte 196,226,125,24,13,114,10,0,0 // vbroadcastss 0xa72(%rip),%ymm1 # 4fa0 <_sk_callback_hsw+0x480> .byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1 - .byte 196,226,125,24,5,104,10,0,0 // vbroadcastss 0xa68(%rip),%ymm0 # 4fe8 <_sk_callback_hsw+0x484> + .byte 196,226,125,24,5,104,10,0,0 // vbroadcastss 0xa68(%rip),%ymm0 # 4fa4 <_sk_callback_hsw+0x484> .byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0 - .byte 196,226,125,24,13,94,10,0,0 // vbroadcastss 0xa5e(%rip),%ymm1 # 4fec <_sk_callback_hsw+0x488> + .byte 196,226,125,24,13,94,10,0,0 // vbroadcastss 0xa5e(%rip),%ymm1 # 4fa8 <_sk_callback_hsw+0x488> .byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1 - .byte 196,226,125,24,5,84,10,0,0 // vbroadcastss 0xa54(%rip),%ymm0 # 4ff0 <_sk_callback_hsw+0x48c> + .byte 196,226,125,24,5,84,10,0,0 // vbroadcastss 0xa54(%rip),%ymm0 # 4fac <_sk_callback_hsw+0x48c> .byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 @@ -14224,11 +14178,11 @@ _sk_gradient_hsw: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 73,131,249,1 // cmp $0x1,%r9 - .byte 15,134,180,0,0,0 // jbe 4674 <_sk_gradient_hsw+0xc3> + .byte 15,134,180,0,0,0 // jbe 4630 <_sk_gradient_hsw+0xc3> .byte 76,139,80,72 // mov 0x48(%rax),%r10 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 65,187,1,0,0,0 // mov $0x1,%r11d - .byte 196,226,125,24,21,29,10,0,0 // vbroadcastss 0xa1d(%rip),%ymm2 # 4ff4 <_sk_callback_hsw+0x490> + .byte 196,226,125,24,21,29,10,0,0 // vbroadcastss 0xa1d(%rip),%ymm2 # 4fb0 <_sk_callback_hsw+0x490> .byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9 .byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3 .byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3 @@ -14236,10 +14190,10 @@ _sk_gradient_hsw: .byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9 .byte 73,255,195 // inc %r11 .byte 77,57,217 // cmp %r11,%r9 - .byte 117,226 // jne 45dc <_sk_gradient_hsw+0x2b> + .byte 117,226 // jne 4598 <_sk_gradient_hsw+0x2b> .byte 76,139,80,8 // mov 0x8(%rax),%r10 .byte 73,131,249,8 // cmp $0x8,%r9 - .byte 118,121 // jbe 467d <_sk_gradient_hsw+0xcc> + .byte 118,121 // jbe 4639 <_sk_gradient_hsw+0xcc> .byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14 .byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1 .byte 196,2,117,146,4,138 // vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8 @@ -14263,7 +14217,7 @@ _sk_gradient_hsw: .byte 196,130,21,146,28,137 // vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3 .byte 72,139,64,64 // mov 0x40(%rax),%rax .byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13 - .byte 235,77 // jmp 46c1 <_sk_gradient_hsw+0x110> + .byte 235,77 // jmp 467d <_sk_gradient_hsw+0x110> .byte 76,139,80,8 // mov 0x8(%rax),%r10 .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 .byte 196,66,53,22,2 // vpermps (%r10),%ymm9,%ymm8 @@ -14323,24 +14277,24 @@ _sk_xy_to_unit_angle_hsw: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,156,8,0,0 // vbroadcastss 0x89c(%rip),%ymm13 # 4ff8 <_sk_callback_hsw+0x494> - .byte 196,98,125,24,53,151,8,0,0 // vbroadcastss 0x897(%rip),%ymm14 # 4ffc <_sk_callback_hsw+0x498> + .byte 196,98,125,24,45,156,8,0,0 // vbroadcastss 0x89c(%rip),%ymm13 # 4fb4 <_sk_callback_hsw+0x494> + .byte 196,98,125,24,53,151,8,0,0 // vbroadcastss 0x897(%rip),%ymm14 # 4fb8 <_sk_callback_hsw+0x498> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 - .byte 196,98,125,24,45,141,8,0,0 // vbroadcastss 0x88d(%rip),%ymm13 # 5000 <_sk_callback_hsw+0x49c> + .byte 196,98,125,24,45,141,8,0,0 // vbroadcastss 0x88d(%rip),%ymm13 # 4fbc <_sk_callback_hsw+0x49c> .byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13 - .byte 196,98,125,24,53,131,8,0,0 // vbroadcastss 0x883(%rip),%ymm14 # 5004 <_sk_callback_hsw+0x4a0> + .byte 196,98,125,24,53,131,8,0,0 // vbroadcastss 0x883(%rip),%ymm14 # 4fc0 <_sk_callback_hsw+0x4a0> .byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14 .byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,110,8,0,0 // vbroadcastss 0x86e(%rip),%ymm10 # 5008 <_sk_callback_hsw+0x4a4> + .byte 196,98,125,24,21,110,8,0,0 // vbroadcastss 0x86e(%rip),%ymm10 # 4fc4 <_sk_callback_hsw+0x4a4> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,88,8,0,0 // vbroadcastss 0x858(%rip),%ymm10 # 500c <_sk_callback_hsw+0x4a8> + .byte 196,98,125,24,21,88,8,0,0 // vbroadcastss 0x858(%rip),%ymm10 # 4fc8 <_sk_callback_hsw+0x4a8> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,66,8,0,0 // vbroadcastss 0x842(%rip),%ymm10 # 5010 <_sk_callback_hsw+0x4ac> + .byte 196,98,125,24,21,66,8,0,0 // vbroadcastss 0x842(%rip),%ymm10 # 4fcc <_sk_callback_hsw+0x4ac> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -14363,7 +14317,7 @@ HIDDEN _sk_save_xy_hsw FUNCTION(_sk_save_xy_hsw) _sk_save_xy_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,15,8,0,0 // vbroadcastss 0x80f(%rip),%ymm8 # 5014 <_sk_callback_hsw+0x4b0> + .byte 196,98,125,24,5,15,8,0,0 // vbroadcastss 0x80f(%rip),%ymm8 # 4fd0 <_sk_callback_hsw+0x4b0> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -14397,9 +14351,9 @@ HIDDEN _sk_bilinear_nx_hsw FUNCTION(_sk_bilinear_nx_hsw) _sk_bilinear_nx_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,163,7,0,0 // vbroadcastss 0x7a3(%rip),%ymm0 # 5018 <_sk_callback_hsw+0x4b4> + .byte 196,226,125,24,5,163,7,0,0 // vbroadcastss 0x7a3(%rip),%ymm0 # 4fd4 <_sk_callback_hsw+0x4b4> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,154,7,0,0 // vbroadcastss 0x79a(%rip),%ymm8 # 501c <_sk_callback_hsw+0x4b8> + .byte 196,98,125,24,5,154,7,0,0 // vbroadcastss 0x79a(%rip),%ymm8 # 4fd8 <_sk_callback_hsw+0x4b8> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -14410,7 +14364,7 @@ HIDDEN _sk_bilinear_px_hsw FUNCTION(_sk_bilinear_px_hsw) _sk_bilinear_px_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,130,7,0,0 // vbroadcastss 0x782(%rip),%ymm0 # 5020 <_sk_callback_hsw+0x4bc> + .byte 196,226,125,24,5,130,7,0,0 // vbroadcastss 0x782(%rip),%ymm0 # 4fdc <_sk_callback_hsw+0x4bc> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -14422,9 +14376,9 @@ HIDDEN _sk_bilinear_ny_hsw FUNCTION(_sk_bilinear_ny_hsw) _sk_bilinear_ny_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,102,7,0,0 // vbroadcastss 0x766(%rip),%ymm1 # 5024 <_sk_callback_hsw+0x4c0> + .byte 196,226,125,24,13,102,7,0,0 // vbroadcastss 0x766(%rip),%ymm1 # 4fe0 <_sk_callback_hsw+0x4c0> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,92,7,0,0 // vbroadcastss 0x75c(%rip),%ymm8 # 5028 <_sk_callback_hsw+0x4c4> + .byte 196,98,125,24,5,92,7,0,0 // vbroadcastss 0x75c(%rip),%ymm8 # 4fe4 <_sk_callback_hsw+0x4c4> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -14435,7 +14389,7 @@ HIDDEN _sk_bilinear_py_hsw FUNCTION(_sk_bilinear_py_hsw) _sk_bilinear_py_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,68,7,0,0 // vbroadcastss 0x744(%rip),%ymm1 # 502c <_sk_callback_hsw+0x4c8> + .byte 196,226,125,24,13,68,7,0,0 // vbroadcastss 0x744(%rip),%ymm1 # 4fe8 <_sk_callback_hsw+0x4c8> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -14447,13 +14401,13 @@ HIDDEN _sk_bicubic_n3x_hsw FUNCTION(_sk_bicubic_n3x_hsw) _sk_bicubic_n3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,39,7,0,0 // vbroadcastss 0x727(%rip),%ymm0 # 5030 <_sk_callback_hsw+0x4cc> + .byte 196,226,125,24,5,39,7,0,0 // vbroadcastss 0x727(%rip),%ymm0 # 4fec <_sk_callback_hsw+0x4cc> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,30,7,0,0 // vbroadcastss 0x71e(%rip),%ymm8 # 5034 <_sk_callback_hsw+0x4d0> + .byte 196,98,125,24,5,30,7,0,0 // vbroadcastss 0x71e(%rip),%ymm8 # 4ff0 <_sk_callback_hsw+0x4d0> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,15,7,0,0 // vbroadcastss 0x70f(%rip),%ymm10 # 5038 <_sk_callback_hsw+0x4d4> - .byte 196,98,125,24,29,10,7,0,0 // vbroadcastss 0x70a(%rip),%ymm11 # 503c <_sk_callback_hsw+0x4d8> + .byte 196,98,125,24,21,15,7,0,0 // vbroadcastss 0x70f(%rip),%ymm10 # 4ff4 <_sk_callback_hsw+0x4d4> + .byte 196,98,125,24,29,10,7,0,0 // vbroadcastss 0x70a(%rip),%ymm11 # 4ff8 <_sk_callback_hsw+0x4d8> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -14465,16 +14419,16 @@ HIDDEN _sk_bicubic_n1x_hsw FUNCTION(_sk_bicubic_n1x_hsw) _sk_bicubic_n1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,237,6,0,0 // vbroadcastss 0x6ed(%rip),%ymm0 # 5040 <_sk_callback_hsw+0x4dc> + .byte 196,226,125,24,5,237,6,0,0 // vbroadcastss 0x6ed(%rip),%ymm0 # 4ffc <_sk_callback_hsw+0x4dc> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,228,6,0,0 // vbroadcastss 0x6e4(%rip),%ymm8 # 5044 <_sk_callback_hsw+0x4e0> + .byte 196,98,125,24,5,228,6,0,0 // vbroadcastss 0x6e4(%rip),%ymm8 # 5000 <_sk_callback_hsw+0x4e0> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm9 # 5048 <_sk_callback_hsw+0x4e4> - .byte 196,98,125,24,21,213,6,0,0 // vbroadcastss 0x6d5(%rip),%ymm10 # 504c <_sk_callback_hsw+0x4e8> + .byte 196,98,125,24,13,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm9 # 5004 <_sk_callback_hsw+0x4e4> + .byte 196,98,125,24,21,213,6,0,0 // vbroadcastss 0x6d5(%rip),%ymm10 # 5008 <_sk_callback_hsw+0x4e8> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,203,6,0,0 // vbroadcastss 0x6cb(%rip),%ymm9 # 5050 <_sk_callback_hsw+0x4ec> + .byte 196,98,125,24,13,203,6,0,0 // vbroadcastss 0x6cb(%rip),%ymm9 # 500c <_sk_callback_hsw+0x4ec> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,193,6,0,0 // vbroadcastss 0x6c1(%rip),%ymm10 # 5054 <_sk_callback_hsw+0x4f0> + .byte 196,98,125,24,21,193,6,0,0 // vbroadcastss 0x6c1(%rip),%ymm10 # 5010 <_sk_callback_hsw+0x4f0> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -14485,14 +14439,14 @@ HIDDEN _sk_bicubic_p1x_hsw FUNCTION(_sk_bicubic_p1x_hsw) _sk_bicubic_p1x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,169,6,0,0 // vbroadcastss 0x6a9(%rip),%ymm8 # 5058 <_sk_callback_hsw+0x4f4> + .byte 196,98,125,24,5,169,6,0,0 // vbroadcastss 0x6a9(%rip),%ymm8 # 5014 <_sk_callback_hsw+0x4f4> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,155,6,0,0 // vbroadcastss 0x69b(%rip),%ymm10 # 505c <_sk_callback_hsw+0x4f8> - .byte 196,98,125,24,29,150,6,0,0 // vbroadcastss 0x696(%rip),%ymm11 # 5060 <_sk_callback_hsw+0x4fc> + .byte 196,98,125,24,21,155,6,0,0 // vbroadcastss 0x69b(%rip),%ymm10 # 5018 <_sk_callback_hsw+0x4f8> + .byte 196,98,125,24,29,150,6,0,0 // vbroadcastss 0x696(%rip),%ymm11 # 501c <_sk_callback_hsw+0x4fc> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,135,6,0,0 // vbroadcastss 0x687(%rip),%ymm8 # 5064 <_sk_callback_hsw+0x500> + .byte 196,98,125,24,5,135,6,0,0 // vbroadcastss 0x687(%rip),%ymm8 # 5020 <_sk_callback_hsw+0x500> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -14503,12 +14457,12 @@ HIDDEN _sk_bicubic_p3x_hsw FUNCTION(_sk_bicubic_p3x_hsw) _sk_bicubic_p3x_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,111,6,0,0 // vbroadcastss 0x66f(%rip),%ymm0 # 5068 <_sk_callback_hsw+0x504> + .byte 196,226,125,24,5,111,6,0,0 // vbroadcastss 0x66f(%rip),%ymm0 # 5024 <_sk_callback_hsw+0x504> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,92,6,0,0 // vbroadcastss 0x65c(%rip),%ymm10 # 506c <_sk_callback_hsw+0x508> - .byte 196,98,125,24,29,87,6,0,0 // vbroadcastss 0x657(%rip),%ymm11 # 5070 <_sk_callback_hsw+0x50c> + .byte 196,98,125,24,21,92,6,0,0 // vbroadcastss 0x65c(%rip),%ymm10 # 5028 <_sk_callback_hsw+0x508> + .byte 196,98,125,24,29,87,6,0,0 // vbroadcastss 0x657(%rip),%ymm11 # 502c <_sk_callback_hsw+0x50c> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -14520,13 +14474,13 @@ HIDDEN _sk_bicubic_n3y_hsw FUNCTION(_sk_bicubic_n3y_hsw) _sk_bicubic_n3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,58,6,0,0 // vbroadcastss 0x63a(%rip),%ymm1 # 5074 <_sk_callback_hsw+0x510> + .byte 196,226,125,24,13,58,6,0,0 // vbroadcastss 0x63a(%rip),%ymm1 # 5030 <_sk_callback_hsw+0x510> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,48,6,0,0 // vbroadcastss 0x630(%rip),%ymm8 # 5078 <_sk_callback_hsw+0x514> + .byte 196,98,125,24,5,48,6,0,0 // vbroadcastss 0x630(%rip),%ymm8 # 5034 <_sk_callback_hsw+0x514> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,33,6,0,0 // vbroadcastss 0x621(%rip),%ymm10 # 507c <_sk_callback_hsw+0x518> - .byte 196,98,125,24,29,28,6,0,0 // vbroadcastss 0x61c(%rip),%ymm11 # 5080 <_sk_callback_hsw+0x51c> + .byte 196,98,125,24,21,33,6,0,0 // vbroadcastss 0x621(%rip),%ymm10 # 5038 <_sk_callback_hsw+0x518> + .byte 196,98,125,24,29,28,6,0,0 // vbroadcastss 0x61c(%rip),%ymm11 # 503c <_sk_callback_hsw+0x51c> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -14538,16 +14492,16 @@ HIDDEN _sk_bicubic_n1y_hsw FUNCTION(_sk_bicubic_n1y_hsw) _sk_bicubic_n1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,255,5,0,0 // vbroadcastss 0x5ff(%rip),%ymm1 # 5084 <_sk_callback_hsw+0x520> + .byte 196,226,125,24,13,255,5,0,0 // vbroadcastss 0x5ff(%rip),%ymm1 # 5040 <_sk_callback_hsw+0x520> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,245,5,0,0 // vbroadcastss 0x5f5(%rip),%ymm8 # 5088 <_sk_callback_hsw+0x524> + .byte 196,98,125,24,5,245,5,0,0 // vbroadcastss 0x5f5(%rip),%ymm8 # 5044 <_sk_callback_hsw+0x524> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,235,5,0,0 // vbroadcastss 0x5eb(%rip),%ymm9 # 508c <_sk_callback_hsw+0x528> - .byte 196,98,125,24,21,230,5,0,0 // vbroadcastss 0x5e6(%rip),%ymm10 # 5090 <_sk_callback_hsw+0x52c> + .byte 196,98,125,24,13,235,5,0,0 // vbroadcastss 0x5eb(%rip),%ymm9 # 5048 <_sk_callback_hsw+0x528> + .byte 196,98,125,24,21,230,5,0,0 // vbroadcastss 0x5e6(%rip),%ymm10 # 504c <_sk_callback_hsw+0x52c> .byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,13,220,5,0,0 // vbroadcastss 0x5dc(%rip),%ymm9 # 5094 <_sk_callback_hsw+0x530> + .byte 196,98,125,24,13,220,5,0,0 // vbroadcastss 0x5dc(%rip),%ymm9 # 5050 <_sk_callback_hsw+0x530> .byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9 - .byte 196,98,125,24,21,210,5,0,0 // vbroadcastss 0x5d2(%rip),%ymm10 # 5098 <_sk_callback_hsw+0x534> + .byte 196,98,125,24,21,210,5,0,0 // vbroadcastss 0x5d2(%rip),%ymm10 # 5054 <_sk_callback_hsw+0x534> .byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10 .byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -14558,14 +14512,14 @@ HIDDEN _sk_bicubic_p1y_hsw FUNCTION(_sk_bicubic_p1y_hsw) _sk_bicubic_p1y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,186,5,0,0 // vbroadcastss 0x5ba(%rip),%ymm8 # 509c <_sk_callback_hsw+0x538> + .byte 196,98,125,24,5,186,5,0,0 // vbroadcastss 0x5ba(%rip),%ymm8 # 5058 <_sk_callback_hsw+0x538> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,171,5,0,0 // vbroadcastss 0x5ab(%rip),%ymm10 # 50a0 <_sk_callback_hsw+0x53c> - .byte 196,98,125,24,29,166,5,0,0 // vbroadcastss 0x5a6(%rip),%ymm11 # 50a4 <_sk_callback_hsw+0x540> + .byte 196,98,125,24,21,171,5,0,0 // vbroadcastss 0x5ab(%rip),%ymm10 # 505c <_sk_callback_hsw+0x53c> + .byte 196,98,125,24,29,166,5,0,0 // vbroadcastss 0x5a6(%rip),%ymm11 # 5060 <_sk_callback_hsw+0x540> .byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11 .byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11 - .byte 196,98,125,24,5,151,5,0,0 // vbroadcastss 0x597(%rip),%ymm8 # 50a8 <_sk_callback_hsw+0x544> + .byte 196,98,125,24,5,151,5,0,0 // vbroadcastss 0x597(%rip),%ymm8 # 5064 <_sk_callback_hsw+0x544> .byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -14576,12 +14530,12 @@ HIDDEN _sk_bicubic_p3y_hsw FUNCTION(_sk_bicubic_p3y_hsw) _sk_bicubic_p3y_hsw: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,127,5,0,0 // vbroadcastss 0x57f(%rip),%ymm1 # 50ac <_sk_callback_hsw+0x548> + .byte 196,226,125,24,13,127,5,0,0 // vbroadcastss 0x57f(%rip),%ymm1 # 5068 <_sk_callback_hsw+0x548> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,107,5,0,0 // vbroadcastss 0x56b(%rip),%ymm10 # 50b0 <_sk_callback_hsw+0x54c> - .byte 196,98,125,24,29,102,5,0,0 // vbroadcastss 0x566(%rip),%ymm11 # 50b4 <_sk_callback_hsw+0x550> + .byte 196,98,125,24,21,107,5,0,0 // vbroadcastss 0x56b(%rip),%ymm10 # 506c <_sk_callback_hsw+0x54c> + .byte 196,98,125,24,29,102,5,0,0 // vbroadcastss 0x566(%rip),%ymm11 # 5070 <_sk_callback_hsw+0x550> .byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11 .byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -14711,25 +14665,25 @@ BALIGN4 .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 4d59 <.literal4+0xb1> + .byte 71,225,61 // rex.RXB loope 4d15 <.literal4+0xb1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 4d69 <.literal4+0xc1> + .byte 71,225,61 // rex.RXB loope 4d25 <.literal4+0xc1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 4d79 <.literal4+0xd1> + .byte 71,225,61 // rex.RXB loope 4d35 <.literal4+0xd1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 4d89 <.literal4+0xe1> + .byte 71,225,61 // rex.RXB loope 4d45 <.literal4+0xe1> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) @@ -14779,7 +14733,7 @@ BALIGN4 .byte 190,129,128,128,59 // mov $0x3b808081,%esi .byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4de1 <.literal4+0x139> + .byte 224,7 // loopne 4d9d <.literal4+0x139> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -14795,10 +14749,10 @@ BALIGN4 .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) .byte 0,52,255 // add %dh,(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,0 // jg 4e08 <.literal4+0x160> + .byte 127,0 // jg 4dc4 <.literal4+0x160> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4e81 <.literal4+0x1d9> + .byte 119,115 // ja 4e3d <.literal4+0x1d9> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -14812,10 +14766,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4e3c <.literal4+0x194> + .byte 127,0 // jg 4df8 <.literal4+0x194> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4eb5 <.literal4+0x20d> + .byte 119,115 // ja 4e71 <.literal4+0x20d> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -14829,10 +14783,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4e70 <.literal4+0x1c8> + .byte 127,0 // jg 4e2c <.literal4+0x1c8> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4ee9 <.literal4+0x241> + .byte 119,115 // ja 4ea5 <.literal4+0x241> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -14846,10 +14800,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 4ea4 <.literal4+0x1fc> + .byte 127,0 // jg 4e60 <.literal4+0x1fc> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 4f1d <.literal4+0x275> + .byte 119,115 // ja 4ed9 <.literal4+0x275> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -14862,7 +14816,7 @@ BALIGN4 .byte 0,75,0 // add %cl,0x0(%rbx) .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax) .byte 66,0,0 // rex.X add %al,(%rax) - .byte 127,67 // jg 4f1b <.literal4+0x273> + .byte 127,67 // jg 4ed7 <.literal4+0x273> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -14874,10 +14828,10 @@ BALIGN4 .byte 190,80,128,3,62 // mov $0x3e038050,%esi .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 4f3b <.literal4+0x293> + .byte 118,63 // jbe 4ef7 <.literal4+0x293> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 4f4f <.literal4+0x2a7> + .byte 127,67 // jg 4f0b <.literal4+0x2a7> .byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax) @@ -14886,7 +14840,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4f31 <.literal4+0x289> + .byte 224,7 // loopne 4eed <.literal4+0x289> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -14898,7 +14852,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 4f4d <.literal4+0x2a5> + .byte 224,7 // loopne 4f09 <.literal4+0x2a5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -14909,7 +14863,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 4fa2 <.literal4+0x2fa> + .byte 124,66 // jl 4f5e <.literal4+0x2fa> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax) @@ -14927,9 +14881,9 @@ BALIGN4 .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax) .byte 0,0 // add %al,(%rax) .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax) - .byte 112,65 // jo 4fe5 <.literal4+0x33d> + .byte 112,65 // jo 4fa1 <.literal4+0x33d> .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 4ff3 <.literal4+0x34b> + .byte 127,67 // jg 4faf <.literal4+0x34b> .byte 128,0,128 // addb $0x80,(%rax) .byte 55 // (bad) .byte 128,0,128 // addb $0x80,(%rax) @@ -14937,7 +14891,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 5007 <.literal4+0x35f> + .byte 127,71 // jg 4fc3 <.literal4+0x35f> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -15049,16 +15003,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0050e8 <_sk_callback_hsw+0xa000584> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0050a8 <_sk_callback_hsw+0xa000588> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120050f0 <_sk_callback_hsw+0x1200058c> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120050b0 <_sk_callback_hsw+0x12000590> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0050f8 <_sk_callback_hsw+0x1a000594> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0050b8 <_sk_callback_hsw+0x1a000598> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005100 <_sk_callback_hsw+0x300059c> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30050c0 <_sk_callback_hsw+0x30005a0> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -15101,16 +15055,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005148 <_sk_callback_hsw+0xa0005e4> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005108 <_sk_callback_hsw+0xa0005e8> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005150 <_sk_callback_hsw+0x120005ec> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005110 <_sk_callback_hsw+0x120005f0> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005158 <_sk_callback_hsw+0x1a0005f4> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005118 <_sk_callback_hsw+0x1a0005f8> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005160 <_sk_callback_hsw+0x30005fc> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005120 <_sk_callback_hsw+0x3000600> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -15153,16 +15107,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0051a8 <_sk_callback_hsw+0xa000644> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005168 <_sk_callback_hsw+0xa000648> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120051b0 <_sk_callback_hsw+0x1200064c> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005170 <_sk_callback_hsw+0x12000650> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0051b8 <_sk_callback_hsw+0x1a000654> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005178 <_sk_callback_hsw+0x1a000658> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30051c0 <_sk_callback_hsw+0x300065c> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005180 <_sk_callback_hsw+0x3000660> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -15205,16 +15159,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005208 <_sk_callback_hsw+0xa0006a4> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0051c8 <_sk_callback_hsw+0xa0006a8> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005210 <_sk_callback_hsw+0x120006ac> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 120051d0 <_sk_callback_hsw+0x120006b0> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005218 <_sk_callback_hsw+0x1a0006b4> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a0051d8 <_sk_callback_hsw+0x1a0006b8> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005220 <_sk_callback_hsw+0x30006bc> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 30051e0 <_sk_callback_hsw+0x30006c0> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -15257,16 +15211,16 @@ BALIGN32 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005268 <_sk_callback_hsw+0xa000704> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005228 <_sk_callback_hsw+0xa000708> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005270 <_sk_callback_hsw+0x1200070c> + .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 12005230 <_sk_callback_hsw+0x12000710> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005278 <_sk_callback_hsw+0x1a000714> + .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a005238 <_sk_callback_hsw+0x1a000718> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005280 <_sk_callback_hsw+0x300071c> + .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 3005240 <_sk_callback_hsw+0x3000720> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -15371,9 +15325,9 @@ _sk_start_pipeline_avx: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 80 // push %rax - .byte 76,137,195 // mov %r8,%rbx + .byte 77,137,196 // mov %r8,%r12 .byte 73,137,208 // mov %rdx,%r8 - .byte 73,137,244 // mov %rsi,%r12 + .byte 72,137,243 // mov %rsi,%rbx .byte 73,137,254 // mov %rdi,%r14 .byte 72,137,206 // mov %rcx,%rsi .byte 72,173 // lods %ds:(%rsi),%rax @@ -15383,41 +15337,25 @@ _sk_start_pipeline_avx: .byte 76,57,193 // cmp %r8,%rcx .byte 118,5 // jbe 33 <_sk_start_pipeline_avx+0x33> .byte 76,137,242 // mov %r14,%rdx - .byte 235,77 // jmp 80 <_sk_start_pipeline_avx+0x80> + .byte 235,42 // jmp 5d <_sk_start_pipeline_avx+0x5d> .byte 76,137,69,208 // mov %r8,-0x30(%rbp) - .byte 65,184,0,0,0,0 // mov $0x0,%r8d - .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 - .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 - .byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2 - .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 - .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 - .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 - .byte 197,204,87,246 // vxorps %ymm6,%ymm6,%ymm6 - .byte 197,196,87,255 // vxorps %ymm7,%ymm7,%ymm7 - .byte 72,137,223 // mov %rbx,%rdi + .byte 69,49,192 // xor %r8d,%r8d + .byte 76,137,231 // mov %r12,%rdi .byte 76,137,254 // mov %r15,%rsi .byte 76,137,242 // mov %r14,%rdx - .byte 76,137,225 // mov %r12,%rcx + .byte 72,137,217 // mov %rbx,%rcx .byte 65,255,213 // callq *%r13 .byte 76,139,69,208 // mov -0x30(%rbp),%r8 .byte 73,141,86,8 // lea 0x8(%r14),%rdx .byte 73,131,198,16 // add $0x10,%r14 .byte 77,57,198 // cmp %r8,%r14 .byte 73,137,214 // mov %rdx,%r14 - .byte 118,183 // jbe 37 <_sk_start_pipeline_avx+0x37> + .byte 118,218 // jbe 37 <_sk_start_pipeline_avx+0x37> .byte 73,41,208 // sub %rdx,%r8 - .byte 116,44 // je b1 <_sk_start_pipeline_avx+0xb1> - .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 - .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 - .byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2 - .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 - .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 - .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 - .byte 197,204,87,246 // vxorps %ymm6,%ymm6,%ymm6 - .byte 197,196,87,255 // vxorps %ymm7,%ymm7,%ymm7 - .byte 72,137,223 // mov %rbx,%rdi + .byte 116,12 // je 6e <_sk_start_pipeline_avx+0x6e> + .byte 76,137,231 // mov %r12,%rdi .byte 76,137,254 // mov %r15,%rsi - .byte 76,137,225 // mov %r12,%rcx + .byte 72,137,217 // mov %rbx,%rcx .byte 65,255,213 // callq *%r13 .byte 72,131,196,8 // add $0x8,%rsp .byte 91 // pop %rbx @@ -15443,7 +15381,7 @@ _sk_seed_shader_avx: .byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,224,103,0,0 // vbroadcastss 0x67e0(%rip),%ymm1 # 68c0 <_sk_callback_avx+0x142> + .byte 196,226,125,24,13,227,103,0,0 // vbroadcastss 0x67e3(%rip),%ymm1 # 6880 <_sk_callback_avx+0x142> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0 .byte 197,249,110,209 // vmovd %ecx,%xmm2 @@ -15452,7 +15390,7 @@ _sk_seed_shader_avx: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,21,186,103,0,0 // vbroadcastss 0x67ba(%rip),%ymm2 # 68c4 <_sk_callback_avx+0x146> + .byte 196,226,125,24,21,189,103,0,0 // vbroadcastss 0x67bd(%rip),%ymm2 # 6884 <_sk_callback_avx+0x146> .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 @@ -15476,7 +15414,7 @@ _sk_dither_avx: .byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9 .byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9 .byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10 - .byte 196,98,125,24,29,99,103,0,0 // vbroadcastss 0x6763(%rip),%ymm11 # 68c8 <_sk_callback_avx+0x14a> + .byte 196,98,125,24,29,102,103,0,0 // vbroadcastss 0x6766(%rip),%ymm11 # 6888 <_sk_callback_avx+0x14a> .byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9 .byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 @@ -15487,8 +15425,8 @@ _sk_dither_avx: .byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11 .byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11 .byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11 - .byte 196,98,125,24,37,36,103,0,0 // vbroadcastss 0x6724(%rip),%ymm12 # 68cc <_sk_callback_avx+0x14e> - .byte 196,98,125,24,45,31,103,0,0 // vbroadcastss 0x671f(%rip),%ymm13 # 68d0 <_sk_callback_avx+0x152> + .byte 196,98,125,24,37,39,103,0,0 // vbroadcastss 0x6727(%rip),%ymm12 # 688c <_sk_callback_avx+0x14e> + .byte 196,98,125,24,45,34,103,0,0 // vbroadcastss 0x6722(%rip),%ymm13 # 6890 <_sk_callback_avx+0x152> .byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14 .byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15 .byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14 @@ -15515,9 +15453,9 @@ _sk_dither_avx: .byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8 .byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,138,102,0,0 // vbroadcastss 0x668a(%rip),%ymm9 # 68d4 <_sk_callback_avx+0x156> + .byte 196,98,125,24,13,141,102,0,0 // vbroadcastss 0x668d(%rip),%ymm9 # 6894 <_sk_callback_avx+0x156> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,128,102,0,0 // vbroadcastss 0x6680(%rip),%ymm9 # 68d8 <_sk_callback_avx+0x15a> + .byte 196,98,125,24,13,131,102,0,0 // vbroadcastss 0x6683(%rip),%ymm9 # 6898 <_sk_callback_avx+0x15a> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 @@ -15586,7 +15524,7 @@ HIDDEN _sk_srcatop_avx FUNCTION(_sk_srcatop_avx) _sk_srcatop_avx: .byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0 - .byte 196,98,125,24,5,216,101,0,0 // vbroadcastss 0x65d8(%rip),%ymm8 # 68dc <_sk_callback_avx+0x15e> + .byte 196,98,125,24,5,219,101,0,0 // vbroadcastss 0x65db(%rip),%ymm8 # 689c <_sk_callback_avx+0x15e> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -15607,7 +15545,7 @@ HIDDEN _sk_dstatop_avx FUNCTION(_sk_dstatop_avx) _sk_dstatop_avx: .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 - .byte 196,98,125,24,13,154,101,0,0 // vbroadcastss 0x659a(%rip),%ymm9 # 68e0 <_sk_callback_avx+0x162> + .byte 196,98,125,24,13,157,101,0,0 // vbroadcastss 0x659d(%rip),%ymm9 # 68a0 <_sk_callback_avx+0x162> .byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0 @@ -15649,7 +15587,7 @@ HIDDEN _sk_srcout_avx .globl _sk_srcout_avx FUNCTION(_sk_srcout_avx) _sk_srcout_avx: - .byte 196,98,125,24,5,57,101,0,0 // vbroadcastss 0x6539(%rip),%ymm8 # 68e4 <_sk_callback_avx+0x166> + .byte 196,98,125,24,5,60,101,0,0 // vbroadcastss 0x653c(%rip),%ymm8 # 68a4 <_sk_callback_avx+0x166> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -15662,7 +15600,7 @@ HIDDEN _sk_dstout_avx .globl _sk_dstout_avx FUNCTION(_sk_dstout_avx) _sk_dstout_avx: - .byte 196,226,125,24,5,28,101,0,0 // vbroadcastss 0x651c(%rip),%ymm0 # 68e8 <_sk_callback_avx+0x16a> + .byte 196,226,125,24,5,31,101,0,0 // vbroadcastss 0x651f(%rip),%ymm0 # 68a8 <_sk_callback_avx+0x16a> .byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3 .byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0 .byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1 @@ -15675,7 +15613,7 @@ HIDDEN _sk_srcover_avx .globl _sk_srcover_avx FUNCTION(_sk_srcover_avx) _sk_srcover_avx: - .byte 196,98,125,24,5,255,100,0,0 // vbroadcastss 0x64ff(%rip),%ymm8 # 68ec <_sk_callback_avx+0x16e> + .byte 196,98,125,24,5,2,101,0,0 // vbroadcastss 0x6502(%rip),%ymm8 # 68ac <_sk_callback_avx+0x16e> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -15692,7 +15630,7 @@ HIDDEN _sk_dstover_avx .globl _sk_dstover_avx FUNCTION(_sk_dstover_avx) _sk_dstover_avx: - .byte 196,98,125,24,5,210,100,0,0 // vbroadcastss 0x64d2(%rip),%ymm8 # 68f0 <_sk_callback_avx+0x172> + .byte 196,98,125,24,5,213,100,0,0 // vbroadcastss 0x64d5(%rip),%ymm8 # 68b0 <_sk_callback_avx+0x172> .byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0 @@ -15720,7 +15658,7 @@ HIDDEN _sk_multiply_avx .globl _sk_multiply_avx FUNCTION(_sk_multiply_avx) _sk_multiply_avx: - .byte 196,98,125,24,5,145,100,0,0 // vbroadcastss 0x6491(%rip),%ymm8 # 68f4 <_sk_callback_avx+0x176> + .byte 196,98,125,24,5,148,100,0,0 // vbroadcastss 0x6494(%rip),%ymm8 # 68b4 <_sk_callback_avx+0x176> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -15780,7 +15718,7 @@ HIDDEN _sk_xor__avx .globl _sk_xor__avx FUNCTION(_sk_xor__avx) _sk_xor__avx: - .byte 196,98,125,24,5,224,99,0,0 // vbroadcastss 0x63e0(%rip),%ymm8 # 68f8 <_sk_callback_avx+0x17a> + .byte 196,98,125,24,5,227,99,0,0 // vbroadcastss 0x63e3(%rip),%ymm8 # 68b8 <_sk_callback_avx+0x17a> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -15817,7 +15755,7 @@ _sk_darken_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,96,99,0,0 // vbroadcastss 0x6360(%rip),%ymm8 # 68fc <_sk_callback_avx+0x17e> + .byte 196,98,125,24,5,99,99,0,0 // vbroadcastss 0x6363(%rip),%ymm8 # 68bc <_sk_callback_avx+0x17e> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -15843,7 +15781,7 @@ _sk_lighten_avx: .byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9 .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,12,99,0,0 // vbroadcastss 0x630c(%rip),%ymm8 # 6900 <_sk_callback_avx+0x182> + .byte 196,98,125,24,5,15,99,0,0 // vbroadcastss 0x630f(%rip),%ymm8 # 68c0 <_sk_callback_avx+0x182> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -15872,7 +15810,7 @@ _sk_difference_avx: .byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,172,98,0,0 // vbroadcastss 0x62ac(%rip),%ymm8 # 6904 <_sk_callback_avx+0x186> + .byte 196,98,125,24,5,175,98,0,0 // vbroadcastss 0x62af(%rip),%ymm8 # 68c4 <_sk_callback_avx+0x186> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -15895,7 +15833,7 @@ _sk_exclusion_avx: .byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2 .byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2 .byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2 - .byte 196,98,125,24,5,103,98,0,0 // vbroadcastss 0x6267(%rip),%ymm8 # 6908 <_sk_callback_avx+0x18a> + .byte 196,98,125,24,5,106,98,0,0 // vbroadcastss 0x626a(%rip),%ymm8 # 68c8 <_sk_callback_avx+0x18a> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 .byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8 .byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3 @@ -15906,7 +15844,7 @@ HIDDEN _sk_colorburn_avx .globl _sk_colorburn_avx FUNCTION(_sk_colorburn_avx) _sk_colorburn_avx: - .byte 196,98,125,24,5,82,98,0,0 // vbroadcastss 0x6252(%rip),%ymm8 # 690c <_sk_callback_avx+0x18e> + .byte 196,98,125,24,5,85,98,0,0 // vbroadcastss 0x6255(%rip),%ymm8 # 68cc <_sk_callback_avx+0x18e> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11 .byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10 @@ -15968,7 +15906,7 @@ HIDDEN _sk_colordodge_avx FUNCTION(_sk_colordodge_avx) _sk_colordodge_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 - .byte 196,98,125,24,13,78,97,0,0 // vbroadcastss 0x614e(%rip),%ymm9 # 6910 <_sk_callback_avx+0x192> + .byte 196,98,125,24,13,81,97,0,0 // vbroadcastss 0x6151(%rip),%ymm9 # 68d0 <_sk_callback_avx+0x192> .byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10 .byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11 .byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9 @@ -16025,7 +15963,7 @@ HIDDEN _sk_hardlight_avx .globl _sk_hardlight_avx FUNCTION(_sk_hardlight_avx) _sk_hardlight_avx: - .byte 196,98,125,24,5,96,96,0,0 // vbroadcastss 0x6060(%rip),%ymm8 # 6914 <_sk_callback_avx+0x196> + .byte 196,98,125,24,5,99,96,0,0 // vbroadcastss 0x6063(%rip),%ymm8 # 68d4 <_sk_callback_avx+0x196> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -16080,7 +16018,7 @@ HIDDEN _sk_overlay_avx .globl _sk_overlay_avx FUNCTION(_sk_overlay_avx) _sk_overlay_avx: - .byte 196,98,125,24,5,137,95,0,0 // vbroadcastss 0x5f89(%rip),%ymm8 # 6918 <_sk_callback_avx+0x19a> + .byte 196,98,125,24,5,140,95,0,0 // vbroadcastss 0x5f8c(%rip),%ymm8 # 68d8 <_sk_callback_avx+0x19a> .byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10 .byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -16146,10 +16084,10 @@ _sk_softlight_avx: .byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8 .byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11 .byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8 - .byte 196,98,125,24,29,128,94,0,0 // vbroadcastss 0x5e80(%rip),%ymm11 # 6920 <_sk_callback_avx+0x1a2> + .byte 196,98,125,24,29,131,94,0,0 // vbroadcastss 0x5e83(%rip),%ymm11 # 68e0 <_sk_callback_avx+0x1a2> .byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13 .byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8 - .byte 196,98,125,24,45,113,94,0,0 // vbroadcastss 0x5e71(%rip),%ymm13 # 6924 <_sk_callback_avx+0x1a6> + .byte 196,98,125,24,45,116,94,0,0 // vbroadcastss 0x5e74(%rip),%ymm13 # 68e4 <_sk_callback_avx+0x1a6> .byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14 .byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8 .byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14 @@ -16160,7 +16098,7 @@ _sk_softlight_avx: .byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15 .byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14 .byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15 - .byte 196,98,125,24,5,47,94,0,0 // vbroadcastss 0x5e2f(%rip),%ymm8 # 691c <_sk_callback_avx+0x19e> + .byte 196,98,125,24,5,50,94,0,0 // vbroadcastss 0x5e32(%rip),%ymm8 # 68dc <_sk_callback_avx+0x19e> .byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12 .byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0 .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 @@ -16287,12 +16225,12 @@ _sk_hue_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,254,91,0,0 // vbroadcastss 0x5bfe(%rip),%ymm14 # 6928 <_sk_callback_avx+0x1aa> + .byte 196,98,125,24,53,1,92,0,0 // vbroadcastss 0x5c01(%rip),%ymm14 # 68e8 <_sk_callback_avx+0x1aa> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,244,91,0,0 // vbroadcastss 0x5bf4(%rip),%ymm15 # 692c <_sk_callback_avx+0x1ae> + .byte 196,98,125,24,61,247,91,0,0 // vbroadcastss 0x5bf7(%rip),%ymm15 # 68ec <_sk_callback_avx+0x1ae> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,229,91,0,0 // vbroadcastss 0x5be5(%rip),%ymm0 # 6930 <_sk_callback_avx+0x1b2> + .byte 196,226,125,24,5,232,91,0,0 // vbroadcastss 0x5be8(%rip),%ymm0 # 68f0 <_sk_callback_avx+0x1b2> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -16353,7 +16291,7 @@ _sk_hue_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,190,90,0,0 // vbroadcastss 0x5abe(%rip),%ymm8 # 6934 <_sk_callback_avx+0x1b6> + .byte 196,98,125,24,5,193,90,0,0 // vbroadcastss 0x5ac1(%rip),%ymm8 # 68f4 <_sk_callback_avx+0x1b6> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -16410,12 +16348,12 @@ _sk_saturation_avx: .byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11 .byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11 .byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - .byte 196,98,125,24,53,204,89,0,0 // vbroadcastss 0x59cc(%rip),%ymm14 # 6938 <_sk_callback_avx+0x1ba> + .byte 196,98,125,24,53,207,89,0,0 // vbroadcastss 0x59cf(%rip),%ymm14 # 68f8 <_sk_callback_avx+0x1ba> .byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11 - .byte 196,98,125,24,61,194,89,0,0 // vbroadcastss 0x59c2(%rip),%ymm15 # 693c <_sk_callback_avx+0x1be> + .byte 196,98,125,24,61,197,89,0,0 // vbroadcastss 0x59c5(%rip),%ymm15 # 68fc <_sk_callback_avx+0x1be> .byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 - .byte 196,226,125,24,5,179,89,0,0 // vbroadcastss 0x59b3(%rip),%ymm0 # 6940 <_sk_callback_avx+0x1c2> + .byte 196,226,125,24,5,182,89,0,0 // vbroadcastss 0x59b6(%rip),%ymm0 # 6900 <_sk_callback_avx+0x1c2> .byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13 .byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11 .byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13 @@ -16476,7 +16414,7 @@ _sk_saturation_avx: .byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10 .byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,140,88,0,0 // vbroadcastss 0x588c(%rip),%ymm8 # 6944 <_sk_callback_avx+0x1c6> + .byte 196,98,125,24,5,143,88,0,0 // vbroadcastss 0x588f(%rip),%ymm8 # 6904 <_sk_callback_avx+0x1c6> .byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9 .byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1 .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 @@ -16505,12 +16443,12 @@ _sk_color_avx: .byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp) .byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8 .byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9 - .byte 196,98,125,24,45,34,88,0,0 // vbroadcastss 0x5822(%rip),%ymm13 # 6948 <_sk_callback_avx+0x1ca> + .byte 196,98,125,24,45,37,88,0,0 // vbroadcastss 0x5825(%rip),%ymm13 # 6908 <_sk_callback_avx+0x1ca> .byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10 - .byte 196,98,125,24,53,24,88,0,0 // vbroadcastss 0x5818(%rip),%ymm14 # 694c <_sk_callback_avx+0x1ce> + .byte 196,98,125,24,53,27,88,0,0 // vbroadcastss 0x581b(%rip),%ymm14 # 690c <_sk_callback_avx+0x1ce> .byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,9,88,0,0 // vbroadcastss 0x5809(%rip),%ymm15 # 6950 <_sk_callback_avx+0x1d2> + .byte 196,98,125,24,61,12,88,0,0 // vbroadcastss 0x580c(%rip),%ymm15 # 6910 <_sk_callback_avx+0x1d2> .byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -16573,7 +16511,7 @@ _sk_color_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,208,86,0,0 // vbroadcastss 0x56d0(%rip),%ymm0 # 6954 <_sk_callback_avx+0x1d6> + .byte 196,226,125,24,5,211,86,0,0 // vbroadcastss 0x56d3(%rip),%ymm0 # 6914 <_sk_callback_avx+0x1d6> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -16603,12 +16541,12 @@ _sk_luminosity_avx: .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8 .byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9 - .byte 196,98,125,24,45,98,86,0,0 // vbroadcastss 0x5662(%rip),%ymm13 # 6958 <_sk_callback_avx+0x1da> + .byte 196,98,125,24,45,101,86,0,0 // vbroadcastss 0x5665(%rip),%ymm13 # 6918 <_sk_callback_avx+0x1da> .byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10 - .byte 196,98,125,24,53,88,86,0,0 // vbroadcastss 0x5658(%rip),%ymm14 # 695c <_sk_callback_avx+0x1de> + .byte 196,98,125,24,53,91,86,0,0 // vbroadcastss 0x565b(%rip),%ymm14 # 691c <_sk_callback_avx+0x1de> .byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11 .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,61,73,86,0,0 // vbroadcastss 0x5649(%rip),%ymm15 # 6960 <_sk_callback_avx+0x1e2> + .byte 196,98,125,24,61,76,86,0,0 // vbroadcastss 0x564c(%rip),%ymm15 # 6920 <_sk_callback_avx+0x1e2> .byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11 .byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0 .byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11 @@ -16671,7 +16609,7 @@ _sk_luminosity_avx: .byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9 .byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0 .byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8 - .byte 196,226,125,24,5,16,85,0,0 // vbroadcastss 0x5510(%rip),%ymm0 # 6964 <_sk_callback_avx+0x1e6> + .byte 196,226,125,24,5,19,85,0,0 // vbroadcastss 0x5513(%rip),%ymm0 # 6924 <_sk_callback_avx+0x1e6> .byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11 @@ -16700,9 +16638,9 @@ _sk_srcover_rgba_8888_avx: .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,43,1,0,0 // jne 15e3 <_sk_srcover_rgba_8888_avx+0x144> + .byte 15,133,43,1,0,0 // jne 15a0 <_sk_srcover_rgba_8888_avx+0x144> .byte 196,193,124,16,58 // vmovups (%r10),%ymm7 - .byte 197,124,40,13,59,89,0,0 // vmovaps 0x593b(%rip),%ymm9 # 6e00 <_sk_callback_avx+0x682> + .byte 197,124,40,13,62,89,0,0 // vmovaps 0x593e(%rip),%ymm9 # 6dc0 <_sk_callback_avx+0x682> .byte 196,193,68,84,225 // vandps %ymm9,%ymm7,%ymm4 .byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4 .byte 197,209,114,215,8 // vpsrld $0x8,%xmm7,%xmm5 @@ -16720,9 +16658,9 @@ _sk_srcover_rgba_8888_avx: .byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7 .byte 196,227,53,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm7 .byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7 - .byte 196,98,125,24,5,66,84,0,0 // vbroadcastss 0x5442(%rip),%ymm8 # 6968 <_sk_callback_avx+0x1ea> + .byte 196,98,125,24,5,69,84,0,0 // vbroadcastss 0x5445(%rip),%ymm8 # 6928 <_sk_callback_avx+0x1ea> .byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8 - .byte 196,98,125,24,13,57,84,0,0 // vbroadcastss 0x5439(%rip),%ymm9 # 696c <_sk_callback_avx+0x1ee> + .byte 196,98,125,24,13,60,84,0,0 // vbroadcastss 0x543c(%rip),%ymm9 # 692c <_sk_callback_avx+0x1ee> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10 .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0 @@ -16755,7 +16693,7 @@ _sk_srcover_rgba_8888_avx: .byte 196,65,53,86,202 // vorpd %ymm10,%ymm9,%ymm9 .byte 196,65,61,86,193 // vorpd %ymm9,%ymm8,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,87 // jne 162e <_sk_srcover_rgba_8888_avx+0x18f> + .byte 117,87 // jne 15eb <_sk_srcover_rgba_8888_avx+0x18f> .byte 196,65,124,17,2 // vmovups %ymm8,(%r10) .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,201 // mov %r9,%rcx @@ -16767,13 +16705,13 @@ _sk_srcover_rgba_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,225,249,110,224 // vmovq %rax,%xmm4 .byte 196,226,121,48,228 // vpmovzxbw %xmm4,%xmm4 - .byte 196,226,89,0,45,245,86,0,0 // vpshufb 0x56f5(%rip),%xmm4,%xmm5 # 6d00 <_sk_callback_avx+0x582> + .byte 196,226,89,0,45,248,86,0,0 // vpshufb 0x56f8(%rip),%xmm4,%xmm5 # 6cc0 <_sk_callback_avx+0x582> .byte 196,226,121,33,237 // vpmovsxbd %xmm5,%xmm5 - .byte 196,226,89,0,37,247,86,0,0 // vpshufb 0x56f7(%rip),%xmm4,%xmm4 # 6d10 <_sk_callback_avx+0x592> + .byte 196,226,89,0,37,250,86,0,0 // vpshufb 0x56fa(%rip),%xmm4,%xmm4 # 6cd0 <_sk_callback_avx+0x592> .byte 196,226,121,33,228 // vpmovsxbd %xmm4,%xmm4 .byte 196,227,85,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm4 .byte 196,194,93,44,58 // vmaskmovps (%r10),%ymm4,%ymm7 - .byte 233,143,254,255,255 // jmpq 14bd <_sk_srcover_rgba_8888_avx+0x1e> + .byte 233,143,254,255,255 // jmpq 147a <_sk_srcover_rgba_8888_avx+0x1e> .byte 185,8,0,0,0 // mov $0x8,%ecx .byte 68,41,193 // sub %r8d,%ecx .byte 192,225,3 // shl $0x3,%cl @@ -16781,13 +16719,13 @@ _sk_srcover_rgba_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,97,249,110,200 // vmovq %rax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 - .byte 196,98,49,0,21,170,86,0,0 // vpshufb 0x56aa(%rip),%xmm9,%xmm10 # 6d00 <_sk_callback_avx+0x582> + .byte 196,98,49,0,21,173,86,0,0 // vpshufb 0x56ad(%rip),%xmm9,%xmm10 # 6cc0 <_sk_callback_avx+0x582> .byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10 - .byte 196,98,49,0,13,172,86,0,0 // vpshufb 0x56ac(%rip),%xmm9,%xmm9 # 6d10 <_sk_callback_avx+0x592> + .byte 196,98,49,0,13,175,86,0,0 // vpshufb 0x56af(%rip),%xmm9,%xmm9 # 6cd0 <_sk_callback_avx+0x592> .byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 .byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10) - .byte 233,99,255,255,255 // jmpq 15dc <_sk_srcover_rgba_8888_avx+0x13d> + .byte 233,99,255,255,255 // jmpq 1599 <_sk_srcover_rgba_8888_avx+0x13d> HIDDEN _sk_clamp_0_avx .globl _sk_clamp_0_avx @@ -16805,7 +16743,7 @@ HIDDEN _sk_clamp_1_avx .globl _sk_clamp_1_avx FUNCTION(_sk_clamp_1_avx) _sk_clamp_1_avx: - .byte 196,98,125,24,5,209,82,0,0 // vbroadcastss 0x52d1(%rip),%ymm8 # 6970 <_sk_callback_avx+0x1f2> + .byte 196,98,125,24,5,212,82,0,0 // vbroadcastss 0x52d4(%rip),%ymm8 # 6930 <_sk_callback_avx+0x1f2> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 @@ -16817,7 +16755,7 @@ HIDDEN _sk_clamp_a_avx .globl _sk_clamp_a_avx FUNCTION(_sk_clamp_a_avx) _sk_clamp_a_avx: - .byte 196,98,125,24,5,180,82,0,0 // vbroadcastss 0x52b4(%rip),%ymm8 # 6974 <_sk_callback_avx+0x1f6> + .byte 196,98,125,24,5,183,82,0,0 // vbroadcastss 0x52b7(%rip),%ymm8 # 6934 <_sk_callback_avx+0x1f6> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0 .byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1 @@ -16903,7 +16841,7 @@ FUNCTION(_sk_unpremul_avx) _sk_unpremul_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9 - .byte 196,98,125,24,21,252,81,0,0 // vbroadcastss 0x51fc(%rip),%ymm10 # 6978 <_sk_callback_avx+0x1fa> + .byte 196,98,125,24,21,255,81,0,0 // vbroadcastss 0x51ff(%rip),%ymm10 # 6938 <_sk_callback_avx+0x1fa> .byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10 .byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 @@ -16916,17 +16854,17 @@ HIDDEN _sk_from_srgb_avx .globl _sk_from_srgb_avx FUNCTION(_sk_from_srgb_avx) _sk_from_srgb_avx: - .byte 196,98,125,24,5,221,81,0,0 // vbroadcastss 0x51dd(%rip),%ymm8 # 697c <_sk_callback_avx+0x1fe> + .byte 196,98,125,24,5,224,81,0,0 // vbroadcastss 0x51e0(%rip),%ymm8 # 693c <_sk_callback_avx+0x1fe> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10 - .byte 196,98,125,24,29,207,81,0,0 // vbroadcastss 0x51cf(%rip),%ymm11 # 6980 <_sk_callback_avx+0x202> + .byte 196,98,125,24,29,210,81,0,0 // vbroadcastss 0x51d2(%rip),%ymm11 # 6940 <_sk_callback_avx+0x202> .byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12 - .byte 196,98,125,24,45,197,81,0,0 // vbroadcastss 0x51c5(%rip),%ymm13 # 6984 <_sk_callback_avx+0x206> + .byte 196,98,125,24,45,200,81,0,0 // vbroadcastss 0x51c8(%rip),%ymm13 # 6944 <_sk_callback_avx+0x206> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,37,182,81,0,0 // vbroadcastss 0x51b6(%rip),%ymm12 # 6988 <_sk_callback_avx+0x20a> + .byte 196,98,125,24,37,185,81,0,0 // vbroadcastss 0x51b9(%rip),%ymm12 # 6948 <_sk_callback_avx+0x20a> .byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10 - .byte 196,98,125,24,53,172,81,0,0 // vbroadcastss 0x51ac(%rip),%ymm14 # 698c <_sk_callback_avx+0x20e> + .byte 196,98,125,24,53,175,81,0,0 // vbroadcastss 0x51af(%rip),%ymm14 # 694c <_sk_callback_avx+0x20e> .byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0 .byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0 .byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9 @@ -16953,20 +16891,20 @@ HIDDEN _sk_to_srgb_avx FUNCTION(_sk_to_srgb_avx) _sk_to_srgb_avx: .byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9 - .byte 196,98,125,24,5,65,81,0,0 // vbroadcastss 0x5141(%rip),%ymm8 # 6990 <_sk_callback_avx+0x212> + .byte 196,98,125,24,5,68,81,0,0 // vbroadcastss 0x5144(%rip),%ymm8 # 6950 <_sk_callback_avx+0x212> .byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10 - .byte 196,98,125,24,29,55,81,0,0 // vbroadcastss 0x5137(%rip),%ymm11 # 6994 <_sk_callback_avx+0x216> + .byte 196,98,125,24,29,58,81,0,0 // vbroadcastss 0x513a(%rip),%ymm11 # 6954 <_sk_callback_avx+0x216> .byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12 - .byte 196,98,125,24,45,45,81,0,0 // vbroadcastss 0x512d(%rip),%ymm13 # 6998 <_sk_callback_avx+0x21a> + .byte 196,98,125,24,45,48,81,0,0 // vbroadcastss 0x5130(%rip),%ymm13 # 6958 <_sk_callback_avx+0x21a> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12 - .byte 196,98,125,24,53,30,81,0,0 // vbroadcastss 0x511e(%rip),%ymm14 # 699c <_sk_callback_avx+0x21e> + .byte 196,98,125,24,53,33,81,0,0 // vbroadcastss 0x5121(%rip),%ymm14 # 695c <_sk_callback_avx+0x21e> .byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12 - .byte 196,98,125,24,61,20,81,0,0 // vbroadcastss 0x5114(%rip),%ymm15 # 69a0 <_sk_callback_avx+0x222> + .byte 196,98,125,24,61,23,81,0,0 // vbroadcastss 0x5117(%rip),%ymm15 # 6960 <_sk_callback_avx+0x222> .byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9 .byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9 .byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9 - .byte 196,98,125,24,37,0,81,0,0 // vbroadcastss 0x5100(%rip),%ymm12 # 69a4 <_sk_callback_avx+0x226> + .byte 196,98,125,24,37,3,81,0,0 // vbroadcastss 0x5103(%rip),%ymm12 # 6964 <_sk_callback_avx+0x226> .byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9 @@ -17003,7 +16941,7 @@ _sk_rgb_to_hsl_avx: .byte 197,124,93,201 // vminps %ymm1,%ymm0,%ymm9 .byte 197,52,93,202 // vminps %ymm2,%ymm9,%ymm9 .byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10 - .byte 196,98,125,24,29,102,80,0,0 // vbroadcastss 0x5066(%rip),%ymm11 # 69a8 <_sk_callback_avx+0x22a> + .byte 196,98,125,24,29,105,80,0,0 // vbroadcastss 0x5069(%rip),%ymm11 # 6968 <_sk_callback_avx+0x22a> .byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11 .byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12 .byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12 @@ -17013,19 +16951,19 @@ _sk_rgb_to_hsl_avx: .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1 .byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,63,80,0,0 // vbroadcastss 0x503f(%rip),%ymm11 # 69b4 <_sk_callback_avx+0x236> + .byte 196,98,125,24,29,66,80,0,0 // vbroadcastss 0x5042(%rip),%ymm11 # 6974 <_sk_callback_avx+0x236> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,45,80,0,0 // vbroadcastss 0x502d(%rip),%ymm11 # 69b0 <_sk_callback_avx+0x232> + .byte 196,98,125,24,29,48,80,0,0 // vbroadcastss 0x5030(%rip),%ymm11 # 6970 <_sk_callback_avx+0x232> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,21,80,0,0 // vbroadcastss 0x5015(%rip),%ymm2 # 69ac <_sk_callback_avx+0x22e> + .byte 196,226,125,24,21,24,80,0,0 // vbroadcastss 0x5018(%rip),%ymm2 # 696c <_sk_callback_avx+0x22e> .byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14 .byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2 .byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0 .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 .byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0 .byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1 - .byte 196,98,125,24,37,252,79,0,0 // vbroadcastss 0x4ffc(%rip),%ymm12 # 69bc <_sk_callback_avx+0x23e> + .byte 196,98,125,24,37,255,79,0,0 // vbroadcastss 0x4fff(%rip),%ymm12 # 697c <_sk_callback_avx+0x23e> .byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2 .byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12 .byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11 @@ -17035,7 +16973,7 @@ _sk_rgb_to_hsl_avx: .byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1 .byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0 .byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1 - .byte 196,98,125,24,5,191,79,0,0 // vbroadcastss 0x4fbf(%rip),%ymm8 # 69b8 <_sk_callback_avx+0x23a> + .byte 196,98,125,24,5,194,79,0,0 // vbroadcastss 0x4fc2(%rip),%ymm8 # 6978 <_sk_callback_avx+0x23a> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -17052,7 +16990,7 @@ _sk_hsl_to_rgb_avx: .byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp) .byte 197,252,40,225 // vmovaps %ymm1,%ymm4 .byte 197,252,40,216 // vmovaps %ymm0,%ymm3 - .byte 196,98,125,24,5,140,79,0,0 // vbroadcastss 0x4f8c(%rip),%ymm8 # 69c0 <_sk_callback_avx+0x242> + .byte 196,98,125,24,5,143,79,0,0 // vbroadcastss 0x4f8f(%rip),%ymm8 # 6980 <_sk_callback_avx+0x242> .byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9 .byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10 .byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11 @@ -17060,23 +16998,23 @@ _sk_hsl_to_rgb_avx: .byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10 .byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,29,102,79,0,0 // vbroadcastss 0x4f66(%rip),%ymm11 # 69c4 <_sk_callback_avx+0x246> + .byte 196,98,125,24,29,105,79,0,0 // vbroadcastss 0x4f69(%rip),%ymm11 # 6984 <_sk_callback_avx+0x246> .byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11 .byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12 .byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15 .byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11 - .byte 196,98,125,24,37,80,79,0,0 // vbroadcastss 0x4f50(%rip),%ymm12 # 69cc <_sk_callback_avx+0x24e> + .byte 196,98,125,24,37,83,79,0,0 // vbroadcastss 0x4f53(%rip),%ymm12 # 698c <_sk_callback_avx+0x24e> .byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0 - .byte 196,98,125,24,45,70,79,0,0 // vbroadcastss 0x4f46(%rip),%ymm13 # 69d0 <_sk_callback_avx+0x252> + .byte 196,98,125,24,45,73,79,0,0 // vbroadcastss 0x4f49(%rip),%ymm13 # 6990 <_sk_callback_avx+0x252> .byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14 .byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14 .byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14 - .byte 196,226,125,24,13,39,79,0,0 // vbroadcastss 0x4f27(%rip),%ymm1 # 69c8 <_sk_callback_avx+0x24a> + .byte 196,226,125,24,13,42,79,0,0 // vbroadcastss 0x4f2a(%rip),%ymm1 # 6988 <_sk_callback_avx+0x24a> .byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7 .byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7 .byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14 .byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7 - .byte 196,98,125,24,53,18,79,0,0 // vbroadcastss 0x4f12(%rip),%ymm14 # 69d4 <_sk_callback_avx+0x256> + .byte 196,98,125,24,53,21,79,0,0 // vbroadcastss 0x4f15(%rip),%ymm14 # 6994 <_sk_callback_avx+0x256> .byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15 .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0 @@ -17095,7 +17033,7 @@ _sk_hsl_to_rgb_avx: .byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6 .byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6 .byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5 - .byte 196,226,125,24,5,180,78,0,0 // vbroadcastss 0x4eb4(%rip),%ymm0 # 69d8 <_sk_callback_avx+0x25a> + .byte 196,226,125,24,5,183,78,0,0 // vbroadcastss 0x4eb7(%rip),%ymm0 # 6998 <_sk_callback_avx+0x25a> .byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0 .byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3 .byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0 @@ -17145,15 +17083,15 @@ _sk_scale_u8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,74 // jne 1c1b <_sk_scale_u8_avx+0x54> + .byte 117,74 // jne 1bd8 <_sk_scale_u8_avx+0x54> .byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8 - .byte 197,57,219,5,65,81,0,0 // vpand 0x5141(%rip),%xmm8,%xmm8 # 6d20 <_sk_callback_avx+0x5a2> + .byte 197,57,219,5,68,81,0,0 // vpand 0x5144(%rip),%xmm8,%xmm8 # 6ce0 <_sk_callback_avx+0x5a2> .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,218,77,0,0 // vbroadcastss 0x4dda(%rip),%ymm9 # 69dc <_sk_callback_avx+0x25e> + .byte 196,98,125,24,13,221,77,0,0 // vbroadcastss 0x4ddd(%rip),%ymm9 # 699c <_sk_callback_avx+0x25e> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 .byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1 @@ -17166,15 +17104,15 @@ _sk_scale_u8_avx: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,167 // ja 1bd7 <_sk_scale_u8_avx+0x10> + .byte 119,167 // ja 1b94 <_sk_scale_u8_avx+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,121,0,0,0 // lea 0x79(%rip),%r10 # 1cb4 <_sk_scale_u8_avx+0xed> + .byte 76,141,21,124,0,0,0 // lea 0x7c(%rip),%r10 # 1c74 <_sk_scale_u8_avx+0xf0> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 235,136 // jmp 1bd7 <_sk_scale_u8_avx+0x10> + .byte 235,136 // jmp 1b94 <_sk_scale_u8_avx+0x10> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -17182,7 +17120,7 @@ _sk_scale_u8_avx: .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8 - .byte 233,95,255,255,255 // jmpq 1bd7 <_sk_scale_u8_avx+0x10> + .byte 233,95,255,255,255 // jmpq 1b94 <_sk_scale_u8_avx+0x10> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -17193,24 +17131,24 @@ _sk_scale_u8_avx: .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - .byte 233,35,255,255,255 // jmpq 1bd7 <_sk_scale_u8_avx+0x10> - .byte 144 // nop + .byte 233,35,255,255,255 // jmpq 1b94 <_sk_scale_u8_avx+0x10> + .byte 15,31,0 // nopl (%rax) + .byte 141 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,171,255,255,255,155 // ljmp *-0x64000001(%rbx) + .byte 255,168,255,255,255,152 // ljmp *-0x67000001(%rax) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,231 // jmpq *%rdi .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 234 // (bad) + .byte 220,255 // fdivr %st,%st(7) + .byte 255 // (bad) + .byte 255,209 // callq *%rcx .byte 255 // (bad) .byte 255 // (bad) - .byte 255 // (bad) - .byte 223,255 // (bad) - .byte 255 // (bad) - .byte 255,212 // callq *%rsp - .byte 255 // (bad) - .byte 255 // (bad) - .byte 255,196 // inc %esp + .byte 255,193 // inc %ecx .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -17243,15 +17181,15 @@ _sk_lerp_u8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,110 // jne 1d87 <_sk_lerp_u8_avx+0x78> + .byte 117,110 // jne 1d47 <_sk_lerp_u8_avx+0x78> .byte 196,66,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm8 - .byte 197,57,219,5,9,80,0,0 // vpand 0x5009(%rip),%xmm8,%xmm8 # 6d30 <_sk_callback_avx+0x5b2> + .byte 197,57,219,5,9,80,0,0 // vpand 0x5009(%rip),%xmm8,%xmm8 # 6cf0 <_sk_callback_avx+0x5b2> .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,13,150,76,0,0 // vbroadcastss 0x4c96(%rip),%ymm9 # 69e0 <_sk_callback_avx+0x262> + .byte 196,98,125,24,13,150,76,0,0 // vbroadcastss 0x4c96(%rip),%ymm9 # 69a0 <_sk_callback_avx+0x262> .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 @@ -17272,15 +17210,15 @@ _sk_lerp_u8_avx: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,131 // ja 1d1f <_sk_lerp_u8_avx+0x10> + .byte 119,131 // ja 1cdf <_sk_lerp_u8_avx+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,125,0,0,0 // lea 0x7d(%rip),%r10 # 1e24 <_sk_lerp_u8_avx+0x115> + .byte 76,141,21,125,0,0,0 // lea 0x7d(%rip),%r10 # 1de4 <_sk_lerp_u8_avx+0x115> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 233,97,255,255,255 // jmpq 1d1f <_sk_lerp_u8_avx+0x10> + .byte 233,97,255,255,255 // jmpq 1cdf <_sk_lerp_u8_avx+0x10> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -17288,7 +17226,7 @@ _sk_lerp_u8_avx: .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8 - .byte 233,56,255,255,255 // jmpq 1d1f <_sk_lerp_u8_avx+0x10> + .byte 233,56,255,255,255 // jmpq 1cdf <_sk_lerp_u8_avx+0x10> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -17299,7 +17237,7 @@ _sk_lerp_u8_avx: .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - .byte 233,252,254,255,255 // jmpq 1d1f <_sk_lerp_u8_avx+0x10> + .byte 233,252,254,255,255 // jmpq 1cdf <_sk_lerp_u8_avx+0x10> .byte 144 // nop .byte 140,255 // mov %?,%edi .byte 255 // (bad) @@ -17307,7 +17245,7 @@ _sk_lerp_u8_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf001e34 <_sk_callback_avx+0xffffffffdeffb6b6> + .byte 233,255,255,255,222 // jmpq ffffffffdf001df4 <_sk_callback_avx+0xffffffffdeffb6b6> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -17325,26 +17263,26 @@ _sk_lerp_565_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,208,0,0,0 // jne 1f1e <_sk_lerp_565_avx+0xde> + .byte 15,133,208,0,0,0 // jne 1ede <_sk_lerp_565_avx+0xde> .byte 196,65,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9 .byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8 .byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,114,75,0,0 // vbroadcastss 0x4b72(%rip),%ymm9 # 69e4 <_sk_callback_avx+0x266> + .byte 196,98,125,24,13,114,75,0,0 // vbroadcastss 0x4b72(%rip),%ymm9 # 69a4 <_sk_callback_avx+0x266> .byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9 .byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9 - .byte 196,98,125,24,21,99,75,0,0 // vbroadcastss 0x4b63(%rip),%ymm10 # 69e8 <_sk_callback_avx+0x26a> + .byte 196,98,125,24,21,99,75,0,0 // vbroadcastss 0x4b63(%rip),%ymm10 # 69a8 <_sk_callback_avx+0x26a> .byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,89,75,0,0 // vbroadcastss 0x4b59(%rip),%ymm10 # 69ec <_sk_callback_avx+0x26e> + .byte 196,98,125,24,21,89,75,0,0 // vbroadcastss 0x4b59(%rip),%ymm10 # 69ac <_sk_callback_avx+0x26e> .byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10 .byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10 - .byte 196,98,125,24,29,74,75,0,0 // vbroadcastss 0x4b4a(%rip),%ymm11 # 69f0 <_sk_callback_avx+0x272> + .byte 196,98,125,24,29,74,75,0,0 // vbroadcastss 0x4b4a(%rip),%ymm11 # 69b0 <_sk_callback_avx+0x272> .byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10 - .byte 196,98,125,24,29,64,75,0,0 // vbroadcastss 0x4b40(%rip),%ymm11 # 69f4 <_sk_callback_avx+0x276> + .byte 196,98,125,24,29,64,75,0,0 // vbroadcastss 0x4b40(%rip),%ymm11 # 69b4 <_sk_callback_avx+0x276> .byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8 .byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8 - .byte 196,98,125,24,29,49,75,0,0 // vbroadcastss 0x4b31(%rip),%ymm11 # 69f8 <_sk_callback_avx+0x27a> + .byte 196,98,125,24,29,49,75,0,0 // vbroadcastss 0x4b31(%rip),%ymm11 # 69b8 <_sk_callback_avx+0x27a> .byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8 .byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0 .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 @@ -17371,27 +17309,27 @@ _sk_lerp_565_avx: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,29,255,255,255 // ja 1e54 <_sk_lerp_565_avx+0x14> + .byte 15,135,29,255,255,255 // ja 1e14 <_sk_lerp_565_avx+0x14> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,102,0,0,0 // lea 0x66(%rip),%r10 # 1fa8 <_sk_lerp_565_avx+0x168> + .byte 76,141,21,102,0,0,0 // lea 0x66(%rip),%r10 # 1f68 <_sk_lerp_565_avx+0x168> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 233,251,254,255,255 // jmpq 1e54 <_sk_lerp_565_avx+0x14> + .byte 233,251,254,255,255 // jmpq 1e14 <_sk_lerp_565_avx+0x14> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,65,57,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8 .byte 196,65,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm9 .byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8 - .byte 233,221,254,255,255 // jmpq 1e54 <_sk_lerp_565_avx+0x14> + .byte 233,221,254,255,255 // jmpq 1e14 <_sk_lerp_565_avx+0x14> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,65,57,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm8,%xmm8 .byte 196,65,57,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm8,%xmm8 .byte 196,65,57,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm8,%xmm8 .byte 196,65,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm9 .byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - .byte 233,175,254,255,255 // jmpq 1e54 <_sk_lerp_565_avx+0x14> + .byte 233,175,254,255,255 // jmpq 1e14 <_sk_lerp_565_avx+0x14> .byte 15,31,0 // nopl (%rax) .byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff .byte 255 // (bad) @@ -17422,9 +17360,9 @@ _sk_load_tables_avx: .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,248,1,0,0 // jne 21dc <_sk_load_tables_avx+0x218> + .byte 15,133,248,1,0,0 // jne 219c <_sk_load_tables_avx+0x218> .byte 196,65,124,16,18 // vmovups (%r10),%ymm10 - .byte 197,124,40,13,47,78,0,0 // vmovaps 0x4e2f(%rip),%ymm9 # 6e20 <_sk_callback_avx+0x6a2> + .byte 197,124,40,13,47,78,0,0 // vmovaps 0x4e2f(%rip),%ymm9 # 6de0 <_sk_callback_avx+0x6a2> .byte 196,193,44,84,201 // vandps %ymm9,%ymm10,%ymm1 .byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0 .byte 196,193,249,126,195 // vmovq %xmm0,%r11 @@ -17516,7 +17454,7 @@ _sk_load_tables_avx: .byte 196,193,65,114,208,24 // vpsrld $0x18,%xmm8,%xmm7 .byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,226,125,24,61,50,72,0,0 // vbroadcastss 0x4832(%rip),%ymm7 # 69fc <_sk_callback_avx+0x27e> + .byte 196,226,125,24,61,50,72,0,0 // vbroadcastss 0x4832(%rip),%ymm7 # 69bc <_sk_callback_avx+0x27e> .byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,201 // mov %r9,%rcx @@ -17530,13 +17468,13 @@ _sk_load_tables_avx: .byte 73,211,235 // shr %cl,%r11 .byte 196,193,249,110,195 // vmovq %r11,%xmm0 .byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0 - .byte 196,226,121,0,13,60,75,0,0 // vpshufb 0x4b3c(%rip),%xmm0,%xmm1 # 6d40 <_sk_callback_avx+0x5c2> + .byte 196,226,121,0,13,60,75,0,0 // vpshufb 0x4b3c(%rip),%xmm0,%xmm1 # 6d00 <_sk_callback_avx+0x5c2> .byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1 - .byte 196,226,121,0,5,62,75,0,0 // vpshufb 0x4b3e(%rip),%xmm0,%xmm0 # 6d50 <_sk_callback_avx+0x5d2> + .byte 196,226,121,0,5,62,75,0,0 // vpshufb 0x4b3e(%rip),%xmm0,%xmm0 # 6d10 <_sk_callback_avx+0x5d2> .byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 196,66,125,44,18 // vmaskmovps (%r10),%ymm0,%ymm10 - .byte 233,194,253,255,255 // jmpq 1fe9 <_sk_load_tables_avx+0x25> + .byte 233,194,253,255,255 // jmpq 1fa9 <_sk_load_tables_avx+0x25> HIDDEN _sk_load_tables_u16_be_avx .globl _sk_load_tables_u16_be_avx @@ -17547,7 +17485,7 @@ _sk_load_tables_u16_be_avx: .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 77,133,192 // test %r8,%r8 .byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp) - .byte 15,133,84,2,0,0 // jne 2497 <_sk_load_tables_u16_be_avx+0x270> + .byte 15,133,84,2,0,0 // jne 2457 <_sk_load_tables_u16_be_avx+0x270> .byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8 .byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2 .byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3 @@ -17562,7 +17500,7 @@ _sk_load_tables_u16_be_avx: .byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11 .byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1 .byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12 - .byte 197,121,111,21,208,74,0,0 // vmovdqa 0x4ad0(%rip),%xmm10 # 6d60 <_sk_callback_avx+0x5e2> + .byte 197,121,111,21,208,74,0,0 // vmovdqa 0x4ad0(%rip),%xmm10 # 6d20 <_sk_callback_avx+0x5e2> .byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2 @@ -17660,7 +17598,7 @@ _sk_load_tables_u16_be_avx: .byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3 .byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,226,125,24,61,119,69,0,0 // vbroadcastss 0x4577(%rip),%ymm7 # 6a00 <_sk_callback_avx+0x282> + .byte 196,226,125,24,61,119,69,0,0 // vbroadcastss 0x4577(%rip),%ymm7 # 69c0 <_sk_callback_avx+0x282> .byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7 @@ -17668,29 +17606,29 @@ _sk_load_tables_u16_be_avx: .byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je 24fd <_sk_load_tables_u16_be_avx+0x2d6> + .byte 116,85 // je 24bd <_sk_load_tables_u16_be_avx+0x2d6> .byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb 24fd <_sk_load_tables_u16_be_avx+0x2d6> + .byte 114,72 // jb 24bd <_sk_load_tables_u16_be_avx+0x2d6> .byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je 250a <_sk_load_tables_u16_be_avx+0x2e3> + .byte 116,72 // je 24ca <_sk_load_tables_u16_be_avx+0x2e3> .byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb 250a <_sk_load_tables_u16_be_avx+0x2e3> + .byte 114,59 // jb 24ca <_sk_load_tables_u16_be_avx+0x2e3> .byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,126,253,255,255 // je 225e <_sk_load_tables_u16_be_avx+0x37> + .byte 15,132,126,253,255,255 // je 221e <_sk_load_tables_u16_be_avx+0x37> .byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,109,253,255,255 // jb 225e <_sk_load_tables_u16_be_avx+0x37> + .byte 15,130,109,253,255,255 // jb 221e <_sk_load_tables_u16_be_avx+0x37> .byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9 - .byte 233,97,253,255,255 // jmpq 225e <_sk_load_tables_u16_be_avx+0x37> + .byte 233,97,253,255,255 // jmpq 221e <_sk_load_tables_u16_be_avx+0x37> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,84,253,255,255 // jmpq 225e <_sk_load_tables_u16_be_avx+0x37> + .byte 233,84,253,255,255 // jmpq 221e <_sk_load_tables_u16_be_avx+0x37> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,75,253,255,255 // jmpq 225e <_sk_load_tables_u16_be_avx+0x37> + .byte 233,75,253,255,255 // jmpq 221e <_sk_load_tables_u16_be_avx+0x37> HIDDEN _sk_load_tables_rgb_u16_be_avx .globl _sk_load_tables_rgb_u16_be_avx @@ -17702,7 +17640,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 77,133,192 // test %r8,%r8 .byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp) .byte 197,252,17,116,36,168 // vmovups %ymm6,-0x58(%rsp) - .byte 15,133,71,2,0,0 // jne 2778 <_sk_load_tables_rgb_u16_be_avx+0x265> + .byte 15,133,71,2,0,0 // jne 2738 <_sk_load_tables_rgb_u16_be_avx+0x265> .byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0 .byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2 .byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1 @@ -17723,7 +17661,7 @@ _sk_load_tables_rgb_u16_be_avx: .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3 .byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11 .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8 - .byte 197,121,111,13,213,71,0,0 // vmovdqa 0x47d5(%rip),%xmm9 # 6d70 <_sk_callback_avx+0x5f2> + .byte 197,121,111,13,213,71,0,0 // vmovdqa 0x47d5(%rip),%xmm9 # 6d30 <_sk_callback_avx+0x5f2> .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0 .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10 .byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1 @@ -17813,50 +17751,50 @@ _sk_load_tables_rgb_u16_be_avx: .byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2 .byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,154,66,0,0 // vbroadcastss 0x429a(%rip),%ymm3 # 6a04 <_sk_callback_avx+0x286> + .byte 196,226,125,24,29,154,66,0,0 // vbroadcastss 0x429a(%rip),%ymm3 # 69c4 <_sk_callback_avx+0x286> .byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6 .byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7 .byte 255,224 // jmpq *%rax .byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0 .byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,5 // jne 2791 <_sk_load_tables_rgb_u16_be_avx+0x27e> - .byte 233,212,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 117,5 // jne 2751 <_sk_load_tables_rgb_u16_be_avx+0x27e> + .byte 233,212,253,255,255 // jmpq 2525 <_sk_load_tables_rgb_u16_be_avx+0x52> .byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1 .byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,26 // jb 27c0 <_sk_load_tables_rgb_u16_be_avx+0x2ad> + .byte 114,26 // jb 2780 <_sk_load_tables_rgb_u16_be_avx+0x2ad> .byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1 .byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 117,10 // jne 27c5 <_sk_load_tables_rgb_u16_be_avx+0x2b2> - .byte 233,165,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52> - .byte 233,160,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 117,10 // jne 2785 <_sk_load_tables_rgb_u16_be_avx+0x2b2> + .byte 233,165,253,255,255 // jmpq 2525 <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 233,160,253,255,255 // jmpq 2525 <_sk_load_tables_rgb_u16_be_avx+0x52> .byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1 .byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,26 // jb 27f4 <_sk_load_tables_rgb_u16_be_avx+0x2e1> + .byte 114,26 // jb 27b4 <_sk_load_tables_rgb_u16_be_avx+0x2e1> .byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1 .byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 117,10 // jne 27f9 <_sk_load_tables_rgb_u16_be_avx+0x2e6> - .byte 233,113,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52> - .byte 233,108,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 117,10 // jne 27b9 <_sk_load_tables_rgb_u16_be_avx+0x2e6> + .byte 233,113,253,255,255 // jmpq 2525 <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 233,108,253,255,255 // jmpq 2525 <_sk_load_tables_rgb_u16_be_avx+0x52> .byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3 .byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,20 // jb 2822 <_sk_load_tables_rgb_u16_be_avx+0x30f> + .byte 114,20 // jb 27e2 <_sk_load_tables_rgb_u16_be_avx+0x30f> .byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3 .byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3 - .byte 233,67,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52> - .byte 233,62,253,255,255 // jmpq 2565 <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 233,67,253,255,255 // jmpq 2525 <_sk_load_tables_rgb_u16_be_avx+0x52> + .byte 233,62,253,255,255 // jmpq 2525 <_sk_load_tables_rgb_u16_be_avx+0x52> HIDDEN _sk_byte_tables_avx .globl _sk_byte_tables_avx FUNCTION(_sk_byte_tables_avx) _sk_byte_tables_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,214,65,0,0 // vbroadcastss 0x41d6(%rip),%ymm8 # 6a08 <_sk_callback_avx+0x28a> + .byte 196,98,125,24,5,214,65,0,0 // vbroadcastss 0x41d6(%rip),%ymm8 # 69c8 <_sk_callback_avx+0x28a> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9 .byte 196,65,249,126,201 // vmovq %xmm9,%r9 @@ -17975,7 +17913,7 @@ _sk_byte_tables_avx: .byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1 .byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2 .byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 - .byte 196,98,125,24,13,128,63,0,0 // vbroadcastss 0x3f80(%rip),%ymm9 # 6a0c <_sk_callback_avx+0x28e> + .byte 196,98,125,24,13,128,63,0,0 // vbroadcastss 0x3f80(%rip),%ymm9 # 69cc <_sk_callback_avx+0x28e> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 .byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1 @@ -18091,7 +18029,7 @@ _sk_byte_tables_rgb_avx: .byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,97,61,0,0 // vbroadcastss 0x3d61(%rip),%ymm9 # 6a10 <_sk_callback_avx+0x292> + .byte 196,98,125,24,13,97,61,0,0 // vbroadcastss 0x3d61(%rip),%ymm9 # 69d0 <_sk_callback_avx+0x292> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1 .byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2 @@ -18296,36 +18234,36 @@ _sk_parametric_r_avx: .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11 - .byte 196,98,125,24,37,14,58,0,0 // vbroadcastss 0x3a0e(%rip),%ymm12 # 6a14 <_sk_callback_avx+0x296> + .byte 196,98,125,24,37,14,58,0,0 // vbroadcastss 0x3a0e(%rip),%ymm12 # 69d4 <_sk_callback_avx+0x296> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,4,58,0,0 // vbroadcastss 0x3a04(%rip),%ymm12 # 6a18 <_sk_callback_avx+0x29a> + .byte 196,98,125,24,37,4,58,0,0 // vbroadcastss 0x3a04(%rip),%ymm12 # 69d8 <_sk_callback_avx+0x29a> .byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,250,57,0,0 // vbroadcastss 0x39fa(%rip),%ymm12 # 6a1c <_sk_callback_avx+0x29e> + .byte 196,98,125,24,37,250,57,0,0 // vbroadcastss 0x39fa(%rip),%ymm12 # 69dc <_sk_callback_avx+0x29e> .byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,240,57,0,0 // vbroadcastss 0x39f0(%rip),%ymm12 # 6a20 <_sk_callback_avx+0x2a2> + .byte 196,98,125,24,37,240,57,0,0 // vbroadcastss 0x39f0(%rip),%ymm12 # 69e0 <_sk_callback_avx+0x2a2> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,230,57,0,0 // vbroadcastss 0x39e6(%rip),%ymm12 # 6a24 <_sk_callback_avx+0x2a6> + .byte 196,98,125,24,37,230,57,0,0 // vbroadcastss 0x39e6(%rip),%ymm12 # 69e4 <_sk_callback_avx+0x2a6> .byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,215,57,0,0 // vbroadcastss 0x39d7(%rip),%ymm12 # 6a28 <_sk_callback_avx+0x2aa> + .byte 196,98,125,24,37,215,57,0,0 // vbroadcastss 0x39d7(%rip),%ymm12 # 69e8 <_sk_callback_avx+0x2aa> .byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0 - .byte 196,98,125,24,37,205,57,0,0 // vbroadcastss 0x39cd(%rip),%ymm12 # 6a2c <_sk_callback_avx+0x2ae> + .byte 196,98,125,24,37,205,57,0,0 // vbroadcastss 0x39cd(%rip),%ymm12 # 69ec <_sk_callback_avx+0x2ae> .byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0 .byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0 .byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0 .byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10 .byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10 - .byte 196,98,125,24,29,177,57,0,0 // vbroadcastss 0x39b1(%rip),%ymm11 # 6a30 <_sk_callback_avx+0x2b2> + .byte 196,98,125,24,29,177,57,0,0 // vbroadcastss 0x39b1(%rip),%ymm11 # 69f0 <_sk_callback_avx+0x2b2> .byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,167,57,0,0 // vbroadcastss 0x39a7(%rip),%ymm11 # 6a34 <_sk_callback_avx+0x2b6> + .byte 196,98,125,24,29,167,57,0,0 // vbroadcastss 0x39a7(%rip),%ymm11 # 69f4 <_sk_callback_avx+0x2b6> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0 - .byte 196,98,125,24,29,152,57,0,0 // vbroadcastss 0x3998(%rip),%ymm11 # 6a38 <_sk_callback_avx+0x2ba> + .byte 196,98,125,24,29,152,57,0,0 // vbroadcastss 0x3998(%rip),%ymm11 # 69f8 <_sk_callback_avx+0x2ba> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,142,57,0,0 // vbroadcastss 0x398e(%rip),%ymm11 # 6a3c <_sk_callback_avx+0x2be> + .byte 196,98,125,24,29,142,57,0,0 // vbroadcastss 0x398e(%rip),%ymm11 # 69fc <_sk_callback_avx+0x2be> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0 - .byte 196,98,125,24,21,127,57,0,0 // vbroadcastss 0x397f(%rip),%ymm10 # 6a40 <_sk_callback_avx+0x2c2> + .byte 196,98,125,24,21,127,57,0,0 // vbroadcastss 0x397f(%rip),%ymm10 # 6a00 <_sk_callback_avx+0x2c2> .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0 .byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -18333,7 +18271,7 @@ _sk_parametric_r_avx: .byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,86,57,0,0 // vbroadcastss 0x3956(%rip),%ymm8 # 6a44 <_sk_callback_avx+0x2c6> + .byte 196,98,125,24,5,86,57,0,0 // vbroadcastss 0x3956(%rip),%ymm8 # 6a04 <_sk_callback_avx+0x2c6> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18355,36 +18293,36 @@ _sk_parametric_g_avx: .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11 - .byte 196,98,125,24,37,7,57,0,0 // vbroadcastss 0x3907(%rip),%ymm12 # 6a48 <_sk_callback_avx+0x2ca> + .byte 196,98,125,24,37,7,57,0,0 // vbroadcastss 0x3907(%rip),%ymm12 # 6a08 <_sk_callback_avx+0x2ca> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,253,56,0,0 // vbroadcastss 0x38fd(%rip),%ymm12 # 6a4c <_sk_callback_avx+0x2ce> + .byte 196,98,125,24,37,253,56,0,0 // vbroadcastss 0x38fd(%rip),%ymm12 # 6a0c <_sk_callback_avx+0x2ce> .byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,243,56,0,0 // vbroadcastss 0x38f3(%rip),%ymm12 # 6a50 <_sk_callback_avx+0x2d2> + .byte 196,98,125,24,37,243,56,0,0 // vbroadcastss 0x38f3(%rip),%ymm12 # 6a10 <_sk_callback_avx+0x2d2> .byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,233,56,0,0 // vbroadcastss 0x38e9(%rip),%ymm12 # 6a54 <_sk_callback_avx+0x2d6> + .byte 196,98,125,24,37,233,56,0,0 // vbroadcastss 0x38e9(%rip),%ymm12 # 6a14 <_sk_callback_avx+0x2d6> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,223,56,0,0 // vbroadcastss 0x38df(%rip),%ymm12 # 6a58 <_sk_callback_avx+0x2da> + .byte 196,98,125,24,37,223,56,0,0 // vbroadcastss 0x38df(%rip),%ymm12 # 6a18 <_sk_callback_avx+0x2da> .byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,208,56,0,0 // vbroadcastss 0x38d0(%rip),%ymm12 # 6a5c <_sk_callback_avx+0x2de> + .byte 196,98,125,24,37,208,56,0,0 // vbroadcastss 0x38d0(%rip),%ymm12 # 6a1c <_sk_callback_avx+0x2de> .byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1 - .byte 196,98,125,24,37,198,56,0,0 // vbroadcastss 0x38c6(%rip),%ymm12 # 6a60 <_sk_callback_avx+0x2e2> + .byte 196,98,125,24,37,198,56,0,0 // vbroadcastss 0x38c6(%rip),%ymm12 # 6a20 <_sk_callback_avx+0x2e2> .byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1 .byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1 .byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1 .byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10 .byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10 - .byte 196,98,125,24,29,170,56,0,0 // vbroadcastss 0x38aa(%rip),%ymm11 # 6a64 <_sk_callback_avx+0x2e6> + .byte 196,98,125,24,29,170,56,0,0 // vbroadcastss 0x38aa(%rip),%ymm11 # 6a24 <_sk_callback_avx+0x2e6> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,160,56,0,0 // vbroadcastss 0x38a0(%rip),%ymm11 # 6a68 <_sk_callback_avx+0x2ea> + .byte 196,98,125,24,29,160,56,0,0 // vbroadcastss 0x38a0(%rip),%ymm11 # 6a28 <_sk_callback_avx+0x2ea> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,29,145,56,0,0 // vbroadcastss 0x3891(%rip),%ymm11 # 6a6c <_sk_callback_avx+0x2ee> + .byte 196,98,125,24,29,145,56,0,0 // vbroadcastss 0x3891(%rip),%ymm11 # 6a2c <_sk_callback_avx+0x2ee> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,135,56,0,0 // vbroadcastss 0x3887(%rip),%ymm11 # 6a70 <_sk_callback_avx+0x2f2> + .byte 196,98,125,24,29,135,56,0,0 // vbroadcastss 0x3887(%rip),%ymm11 # 6a30 <_sk_callback_avx+0x2f2> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1 - .byte 196,98,125,24,21,120,56,0,0 // vbroadcastss 0x3878(%rip),%ymm10 # 6a74 <_sk_callback_avx+0x2f6> + .byte 196,98,125,24,21,120,56,0,0 // vbroadcastss 0x3878(%rip),%ymm10 # 6a34 <_sk_callback_avx+0x2f6> .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1 .byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -18392,7 +18330,7 @@ _sk_parametric_g_avx: .byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,5,79,56,0,0 // vbroadcastss 0x384f(%rip),%ymm8 # 6a78 <_sk_callback_avx+0x2fa> + .byte 196,98,125,24,5,79,56,0,0 // vbroadcastss 0x384f(%rip),%ymm8 # 6a38 <_sk_callback_avx+0x2fa> .byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18414,36 +18352,36 @@ _sk_parametric_b_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11 - .byte 196,98,125,24,37,0,56,0,0 // vbroadcastss 0x3800(%rip),%ymm12 # 6a7c <_sk_callback_avx+0x2fe> + .byte 196,98,125,24,37,0,56,0,0 // vbroadcastss 0x3800(%rip),%ymm12 # 6a3c <_sk_callback_avx+0x2fe> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,246,55,0,0 // vbroadcastss 0x37f6(%rip),%ymm12 # 6a80 <_sk_callback_avx+0x302> + .byte 196,98,125,24,37,246,55,0,0 // vbroadcastss 0x37f6(%rip),%ymm12 # 6a40 <_sk_callback_avx+0x302> .byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,236,55,0,0 // vbroadcastss 0x37ec(%rip),%ymm12 # 6a84 <_sk_callback_avx+0x306> + .byte 196,98,125,24,37,236,55,0,0 // vbroadcastss 0x37ec(%rip),%ymm12 # 6a44 <_sk_callback_avx+0x306> .byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,226,55,0,0 // vbroadcastss 0x37e2(%rip),%ymm12 # 6a88 <_sk_callback_avx+0x30a> + .byte 196,98,125,24,37,226,55,0,0 // vbroadcastss 0x37e2(%rip),%ymm12 # 6a48 <_sk_callback_avx+0x30a> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,216,55,0,0 // vbroadcastss 0x37d8(%rip),%ymm12 # 6a8c <_sk_callback_avx+0x30e> + .byte 196,98,125,24,37,216,55,0,0 // vbroadcastss 0x37d8(%rip),%ymm12 # 6a4c <_sk_callback_avx+0x30e> .byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,201,55,0,0 // vbroadcastss 0x37c9(%rip),%ymm12 # 6a90 <_sk_callback_avx+0x312> + .byte 196,98,125,24,37,201,55,0,0 // vbroadcastss 0x37c9(%rip),%ymm12 # 6a50 <_sk_callback_avx+0x312> .byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2 - .byte 196,98,125,24,37,191,55,0,0 // vbroadcastss 0x37bf(%rip),%ymm12 # 6a94 <_sk_callback_avx+0x316> + .byte 196,98,125,24,37,191,55,0,0 // vbroadcastss 0x37bf(%rip),%ymm12 # 6a54 <_sk_callback_avx+0x316> .byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2 .byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2 .byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2 .byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10 .byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10 - .byte 196,98,125,24,29,163,55,0,0 // vbroadcastss 0x37a3(%rip),%ymm11 # 6a98 <_sk_callback_avx+0x31a> + .byte 196,98,125,24,29,163,55,0,0 // vbroadcastss 0x37a3(%rip),%ymm11 # 6a58 <_sk_callback_avx+0x31a> .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,153,55,0,0 // vbroadcastss 0x3799(%rip),%ymm11 # 6a9c <_sk_callback_avx+0x31e> + .byte 196,98,125,24,29,153,55,0,0 // vbroadcastss 0x3799(%rip),%ymm11 # 6a5c <_sk_callback_avx+0x31e> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2 - .byte 196,98,125,24,29,138,55,0,0 // vbroadcastss 0x378a(%rip),%ymm11 # 6aa0 <_sk_callback_avx+0x322> + .byte 196,98,125,24,29,138,55,0,0 // vbroadcastss 0x378a(%rip),%ymm11 # 6a60 <_sk_callback_avx+0x322> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,128,55,0,0 // vbroadcastss 0x3780(%rip),%ymm11 # 6aa4 <_sk_callback_avx+0x326> + .byte 196,98,125,24,29,128,55,0,0 // vbroadcastss 0x3780(%rip),%ymm11 # 6a64 <_sk_callback_avx+0x326> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2 - .byte 196,98,125,24,21,113,55,0,0 // vbroadcastss 0x3771(%rip),%ymm10 # 6aa8 <_sk_callback_avx+0x32a> + .byte 196,98,125,24,21,113,55,0,0 // vbroadcastss 0x3771(%rip),%ymm10 # 6a68 <_sk_callback_avx+0x32a> .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2 .byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -18451,7 +18389,7 @@ _sk_parametric_b_avx: .byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,72,55,0,0 // vbroadcastss 0x3748(%rip),%ymm8 # 6aac <_sk_callback_avx+0x32e> + .byte 196,98,125,24,5,72,55,0,0 // vbroadcastss 0x3748(%rip),%ymm8 # 6a6c <_sk_callback_avx+0x32e> .byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18473,36 +18411,36 @@ _sk_parametric_a_avx: .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 .byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10 .byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11 - .byte 196,98,125,24,37,249,54,0,0 // vbroadcastss 0x36f9(%rip),%ymm12 # 6ab0 <_sk_callback_avx+0x332> + .byte 196,98,125,24,37,249,54,0,0 // vbroadcastss 0x36f9(%rip),%ymm12 # 6a70 <_sk_callback_avx+0x332> .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,239,54,0,0 // vbroadcastss 0x36ef(%rip),%ymm12 # 6ab4 <_sk_callback_avx+0x336> + .byte 196,98,125,24,37,239,54,0,0 // vbroadcastss 0x36ef(%rip),%ymm12 # 6a74 <_sk_callback_avx+0x336> .byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,229,54,0,0 // vbroadcastss 0x36e5(%rip),%ymm12 # 6ab8 <_sk_callback_avx+0x33a> + .byte 196,98,125,24,37,229,54,0,0 // vbroadcastss 0x36e5(%rip),%ymm12 # 6a78 <_sk_callback_avx+0x33a> .byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,219,54,0,0 // vbroadcastss 0x36db(%rip),%ymm12 # 6abc <_sk_callback_avx+0x33e> + .byte 196,98,125,24,37,219,54,0,0 // vbroadcastss 0x36db(%rip),%ymm12 # 6a7c <_sk_callback_avx+0x33e> .byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,209,54,0,0 // vbroadcastss 0x36d1(%rip),%ymm12 # 6ac0 <_sk_callback_avx+0x342> + .byte 196,98,125,24,37,209,54,0,0 // vbroadcastss 0x36d1(%rip),%ymm12 # 6a80 <_sk_callback_avx+0x342> .byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12 .byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11 - .byte 196,98,125,24,37,194,54,0,0 // vbroadcastss 0x36c2(%rip),%ymm12 # 6ac4 <_sk_callback_avx+0x346> + .byte 196,98,125,24,37,194,54,0,0 // vbroadcastss 0x36c2(%rip),%ymm12 # 6a84 <_sk_callback_avx+0x346> .byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3 - .byte 196,98,125,24,37,184,54,0,0 // vbroadcastss 0x36b8(%rip),%ymm12 # 6ac8 <_sk_callback_avx+0x34a> + .byte 196,98,125,24,37,184,54,0,0 // vbroadcastss 0x36b8(%rip),%ymm12 # 6a88 <_sk_callback_avx+0x34a> .byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3 .byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3 .byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3 .byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10 .byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10 - .byte 196,98,125,24,29,156,54,0,0 // vbroadcastss 0x369c(%rip),%ymm11 # 6acc <_sk_callback_avx+0x34e> + .byte 196,98,125,24,29,156,54,0,0 // vbroadcastss 0x369c(%rip),%ymm11 # 6a8c <_sk_callback_avx+0x34e> .byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,146,54,0,0 // vbroadcastss 0x3692(%rip),%ymm11 # 6ad0 <_sk_callback_avx+0x352> + .byte 196,98,125,24,29,146,54,0,0 // vbroadcastss 0x3692(%rip),%ymm11 # 6a90 <_sk_callback_avx+0x352> .byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11 .byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3 - .byte 196,98,125,24,29,131,54,0,0 // vbroadcastss 0x3683(%rip),%ymm11 # 6ad4 <_sk_callback_avx+0x356> + .byte 196,98,125,24,29,131,54,0,0 // vbroadcastss 0x3683(%rip),%ymm11 # 6a94 <_sk_callback_avx+0x356> .byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10 - .byte 196,98,125,24,29,121,54,0,0 // vbroadcastss 0x3679(%rip),%ymm11 # 6ad8 <_sk_callback_avx+0x35a> + .byte 196,98,125,24,29,121,54,0,0 // vbroadcastss 0x3679(%rip),%ymm11 # 6a98 <_sk_callback_avx+0x35a> .byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10 .byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3 - .byte 196,98,125,24,21,106,54,0,0 // vbroadcastss 0x366a(%rip),%ymm10 # 6adc <_sk_callback_avx+0x35e> + .byte 196,98,125,24,21,106,54,0,0 // vbroadcastss 0x366a(%rip),%ymm10 # 6a9c <_sk_callback_avx+0x35e> .byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3 .byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3 .byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10 @@ -18510,7 +18448,7 @@ _sk_parametric_a_avx: .byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3 .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3 - .byte 196,98,125,24,5,65,54,0,0 // vbroadcastss 0x3641(%rip),%ymm8 # 6ae0 <_sk_callback_avx+0x362> + .byte 196,98,125,24,5,65,54,0,0 // vbroadcastss 0x3641(%rip),%ymm8 # 6aa0 <_sk_callback_avx+0x362> .byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18519,31 +18457,31 @@ HIDDEN _sk_lab_to_xyz_avx .globl _sk_lab_to_xyz_avx FUNCTION(_sk_lab_to_xyz_avx) _sk_lab_to_xyz_avx: - .byte 196,98,125,24,5,51,54,0,0 // vbroadcastss 0x3633(%rip),%ymm8 # 6ae4 <_sk_callback_avx+0x366> + .byte 196,98,125,24,5,51,54,0,0 // vbroadcastss 0x3633(%rip),%ymm8 # 6aa4 <_sk_callback_avx+0x366> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,41,54,0,0 // vbroadcastss 0x3629(%rip),%ymm8 # 6ae8 <_sk_callback_avx+0x36a> + .byte 196,98,125,24,5,41,54,0,0 // vbroadcastss 0x3629(%rip),%ymm8 # 6aa8 <_sk_callback_avx+0x36a> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 - .byte 196,98,125,24,13,31,54,0,0 // vbroadcastss 0x361f(%rip),%ymm9 # 6aec <_sk_callback_avx+0x36e> + .byte 196,98,125,24,13,31,54,0,0 // vbroadcastss 0x361f(%rip),%ymm9 # 6aac <_sk_callback_avx+0x36e> .byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1 .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2 - .byte 196,98,125,24,5,11,54,0,0 // vbroadcastss 0x360b(%rip),%ymm8 # 6af0 <_sk_callback_avx+0x372> + .byte 196,98,125,24,5,11,54,0,0 // vbroadcastss 0x360b(%rip),%ymm8 # 6ab0 <_sk_callback_avx+0x372> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,1,54,0,0 // vbroadcastss 0x3601(%rip),%ymm8 # 6af4 <_sk_callback_avx+0x376> + .byte 196,98,125,24,5,1,54,0,0 // vbroadcastss 0x3601(%rip),%ymm8 # 6ab4 <_sk_callback_avx+0x376> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,5,247,53,0,0 // vbroadcastss 0x35f7(%rip),%ymm8 # 6af8 <_sk_callback_avx+0x37a> + .byte 196,98,125,24,5,247,53,0,0 // vbroadcastss 0x35f7(%rip),%ymm8 # 6ab8 <_sk_callback_avx+0x37a> .byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1 .byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1 - .byte 196,98,125,24,5,233,53,0,0 // vbroadcastss 0x35e9(%rip),%ymm8 # 6afc <_sk_callback_avx+0x37e> + .byte 196,98,125,24,5,233,53,0,0 // vbroadcastss 0x35e9(%rip),%ymm8 # 6abc <_sk_callback_avx+0x37e> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2 .byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8 .byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8 - .byte 196,98,125,24,13,210,53,0,0 // vbroadcastss 0x35d2(%rip),%ymm9 # 6b00 <_sk_callback_avx+0x382> + .byte 196,98,125,24,13,210,53,0,0 // vbroadcastss 0x35d2(%rip),%ymm9 # 6ac0 <_sk_callback_avx+0x382> .byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10 - .byte 196,98,125,24,29,199,53,0,0 // vbroadcastss 0x35c7(%rip),%ymm11 # 6b04 <_sk_callback_avx+0x386> + .byte 196,98,125,24,29,199,53,0,0 // vbroadcastss 0x35c7(%rip),%ymm11 # 6ac4 <_sk_callback_avx+0x386> .byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1 - .byte 196,98,125,24,37,189,53,0,0 // vbroadcastss 0x35bd(%rip),%ymm12 # 6b08 <_sk_callback_avx+0x38a> + .byte 196,98,125,24,37,189,53,0,0 // vbroadcastss 0x35bd(%rip),%ymm12 # 6ac8 <_sk_callback_avx+0x38a> .byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1 .byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8 .byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1 @@ -18558,9 +18496,9 @@ _sk_lab_to_xyz_avx: .byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2 .byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2 .byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2 - .byte 196,226,125,24,5,115,53,0,0 // vbroadcastss 0x3573(%rip),%ymm0 # 6b0c <_sk_callback_avx+0x38e> + .byte 196,226,125,24,5,115,53,0,0 // vbroadcastss 0x3573(%rip),%ymm0 # 6acc <_sk_callback_avx+0x38e> .byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,106,53,0,0 // vbroadcastss 0x356a(%rip),%ymm8 # 6b10 <_sk_callback_avx+0x392> + .byte 196,98,125,24,5,106,53,0,0 // vbroadcastss 0x356a(%rip),%ymm8 # 6ad0 <_sk_callback_avx+0x392> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18572,15 +18510,15 @@ _sk_load_a8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,66 // jne 35fb <_sk_load_a8_avx+0x4c> + .byte 117,66 // jne 35bb <_sk_load_a8_avx+0x4c> .byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0 - .byte 197,249,219,5,185,55,0,0 // vpand 0x37b9(%rip),%xmm0,%xmm0 # 6d80 <_sk_callback_avx+0x602> + .byte 197,249,219,5,185,55,0,0 // vpand 0x37b9(%rip),%xmm0,%xmm0 # 6d40 <_sk_callback_avx+0x602> .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,45,53,0,0 // vbroadcastss 0x352d(%rip),%ymm1 # 6b14 <_sk_callback_avx+0x396> + .byte 196,226,125,24,13,45,53,0,0 // vbroadcastss 0x352d(%rip),%ymm1 # 6ad4 <_sk_callback_avx+0x396> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -18592,15 +18530,15 @@ _sk_load_a8_avx: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,176 // ja 35bf <_sk_load_a8_avx+0x10> + .byte 119,176 // ja 357f <_sk_load_a8_avx+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 3694 <_sk_load_a8_avx+0xe5> + .byte 76,141,21,122,0,0,0 // lea 0x7a(%rip),%r10 # 3654 <_sk_load_a8_avx+0xe5> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,145 // jmp 35bf <_sk_load_a8_avx+0x10> + .byte 235,145 // jmp 357f <_sk_load_a8_avx+0x10> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -18608,7 +18546,7 @@ _sk_load_a8_avx: .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0 - .byte 233,105,255,255,255 // jmpq 35bf <_sk_load_a8_avx+0x10> + .byte 233,105,255,255,255 // jmpq 357f <_sk_load_a8_avx+0x10> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -18619,7 +18557,7 @@ _sk_load_a8_avx: .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - .byte 233,46,255,255,255 // jmpq 35bf <_sk_load_a8_avx+0x10> + .byte 233,46,255,255,255 // jmpq 357f <_sk_load_a8_avx+0x10> .byte 15,31,0 // nopl (%rax) .byte 143 // (bad) .byte 255 // (bad) @@ -18685,7 +18623,7 @@ _sk_gather_a8_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,156,51,0,0 // vbroadcastss 0x339c(%rip),%ymm1 # 6b18 <_sk_callback_avx+0x39a> + .byte 196,226,125,24,13,156,51,0,0 // vbroadcastss 0x339c(%rip),%ymm1 # 6ad8 <_sk_callback_avx+0x39a> .byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 @@ -18699,14 +18637,14 @@ FUNCTION(_sk_store_a8_avx) _sk_store_a8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,126,51,0,0 // vbroadcastss 0x337e(%rip),%ymm8 # 6b1c <_sk_callback_avx+0x39e> + .byte 196,98,125,24,5,126,51,0,0 // vbroadcastss 0x337e(%rip),%ymm8 # 6adc <_sk_callback_avx+0x39e> .byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8 .byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8 .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 37c7 <_sk_store_a8_avx+0x37> + .byte 117,10 // jne 3787 <_sk_store_a8_avx+0x37> .byte 196,65,123,17,4,19 // vmovsd %xmm8,(%r11,%rdx,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -18714,25 +18652,25 @@ _sk_store_a8_avx: .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,236 // ja 37c3 <_sk_store_a8_avx+0x33> + .byte 119,236 // ja 3783 <_sk_store_a8_avx+0x33> .byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8 .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,85,0,0,0 // lea 0x55(%rip),%r10 # 383c <_sk_store_a8_avx+0xac> + .byte 76,141,21,85,0,0,0 // lea 0x55(%rip),%r10 # 37fc <_sk_store_a8_avx+0xac> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,20,4,19,0 // vpextrb $0x0,%xmm8,(%r11,%rdx,1) - .byte 235,202 // jmp 37c3 <_sk_store_a8_avx+0x33> + .byte 235,202 // jmp 3783 <_sk_store_a8_avx+0x33> .byte 196,67,121,20,68,19,2,4 // vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1) - .byte 196,98,57,0,5,134,53,0,0 // vpshufb 0x3586(%rip),%xmm8,%xmm8 # 6d90 <_sk_callback_avx+0x612> + .byte 196,98,57,0,5,134,53,0,0 // vpshufb 0x3586(%rip),%xmm8,%xmm8 # 6d50 <_sk_callback_avx+0x612> .byte 196,67,121,21,4,19,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,1) - .byte 235,176 // jmp 37c3 <_sk_store_a8_avx+0x33> + .byte 235,176 // jmp 3783 <_sk_store_a8_avx+0x33> .byte 196,67,121,20,68,19,6,12 // vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1) .byte 196,67,121,20,68,19,5,10 // vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1) .byte 196,67,121,20,68,19,4,8 // vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1) - .byte 196,98,57,0,5,108,53,0,0 // vpshufb 0x356c(%rip),%xmm8,%xmm8 # 6da0 <_sk_callback_avx+0x622> + .byte 196,98,57,0,5,108,53,0,0 // vpshufb 0x356c(%rip),%xmm8,%xmm8 # 6d60 <_sk_callback_avx+0x622> .byte 196,65,121,126,4,19 // vmovd %xmm8,(%r11,%rdx,1) - .byte 235,135 // jmp 37c3 <_sk_store_a8_avx+0x33> + .byte 235,135 // jmp 3783 <_sk_store_a8_avx+0x33> .byte 180,255 // mov $0xff,%ah .byte 255 // (bad) .byte 255,197 // inc %ebp @@ -18760,18 +18698,18 @@ _sk_load_g8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,71 // jne 38a9 <_sk_load_g8_avx+0x51> + .byte 117,71 // jne 3869 <_sk_load_g8_avx+0x51> .byte 196,194,121,48,4,19 // vpmovzxbw (%r11,%rdx,1),%xmm0 - .byte 197,249,219,5,64,53,0,0 // vpand 0x3540(%rip),%xmm0,%xmm0 # 6db0 <_sk_callback_avx+0x632> + .byte 197,249,219,5,64,53,0,0 // vpand 0x3540(%rip),%xmm0,%xmm0 # 6d70 <_sk_callback_avx+0x632> .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,144,50,0,0 // vbroadcastss 0x3290(%rip),%ymm1 # 6b20 <_sk_callback_avx+0x3a2> + .byte 196,226,125,24,13,144,50,0,0 // vbroadcastss 0x3290(%rip),%ymm1 # 6ae0 <_sk_callback_avx+0x3a2> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,133,50,0,0 // vbroadcastss 0x3285(%rip),%ymm3 # 6b24 <_sk_callback_avx+0x3a6> + .byte 196,226,125,24,29,133,50,0,0 // vbroadcastss 0x3285(%rip),%ymm3 # 6ae4 <_sk_callback_avx+0x3a6> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -18780,15 +18718,15 @@ _sk_load_g8_avx: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,171 // ja 3868 <_sk_load_g8_avx+0x10> + .byte 119,171 // ja 3828 <_sk_load_g8_avx+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,120,0,0,0 // lea 0x78(%rip),%r10 # 3940 <_sk_load_g8_avx+0xe8> + .byte 76,141,21,120,0,0,0 // lea 0x78(%rip),%r10 # 3900 <_sk_load_g8_avx+0xe8> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,140 // jmp 3868 <_sk_load_g8_avx+0x10> + .byte 235,140 // jmp 3828 <_sk_load_g8_avx+0x10> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -18796,7 +18734,7 @@ _sk_load_g8_avx: .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0 - .byte 233,100,255,255,255 // jmpq 3868 <_sk_load_g8_avx+0x10> + .byte 233,100,255,255,255 // jmpq 3828 <_sk_load_g8_avx+0x10> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -18807,7 +18745,7 @@ _sk_load_g8_avx: .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1 .byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1 .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - .byte 233,41,255,255,255 // jmpq 3868 <_sk_load_g8_avx+0x10> + .byte 233,41,255,255,255 // jmpq 3828 <_sk_load_g8_avx+0x10> .byte 144 // nop .byte 145 // xchg %eax,%ecx .byte 255 // (bad) @@ -18816,7 +18754,7 @@ _sk_load_g8_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 233,255,255,255,222 // jmpq ffffffffdf003950 <_sk_callback_avx+0xffffffffdeffd1d2> + .byte 233,255,255,255,222 // jmpq ffffffffdf003910 <_sk_callback_avx+0xffffffffdeffd1d2> .byte 255 // (bad) .byte 255 // (bad) .byte 255,211 // callq *%rbx @@ -18871,10 +18809,10 @@ _sk_gather_g8_avx: .byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,0,49,0,0 // vbroadcastss 0x3100(%rip),%ymm1 # 6b28 <_sk_callback_avx+0x3aa> + .byte 196,226,125,24,13,0,49,0,0 // vbroadcastss 0x3100(%rip),%ymm1 # 6ae8 <_sk_callback_avx+0x3aa> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,245,48,0,0 // vbroadcastss 0x30f5(%rip),%ymm3 # 6b2c <_sk_callback_avx+0x3ae> + .byte 196,226,125,24,29,245,48,0,0 // vbroadcastss 0x30f5(%rip),%ymm3 # 6aec <_sk_callback_avx+0x3ae> .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 .byte 197,252,40,208 // vmovaps %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -18886,9 +18824,9 @@ _sk_gather_i8_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,137,193 // mov %rax,%r9 .byte 77,133,201 // test %r9,%r9 - .byte 116,5 // je 3a50 <_sk_gather_i8_avx+0xf> + .byte 116,5 // je 3a10 <_sk_gather_i8_avx+0xf> .byte 76,137,200 // mov %r9,%rax - .byte 235,2 // jmp 3a52 <_sk_gather_i8_avx+0x11> + .byte 235,2 // jmp 3a12 <_sk_gather_i8_avx+0x11> .byte 72,173 // lods %ds:(%rsi),%rax .byte 83 // push %rbx .byte 76,139,16 // mov (%rax),%r10 @@ -18946,10 +18884,10 @@ _sk_gather_i8_avx: .byte 72,193,235,30 // shr $0x1e,%rbx .byte 196,195,121,34,28,27,3 // vpinsrd $0x3,(%r11,%rbx,1),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,21,208,50,0,0 // vmovaps 0x32d0(%rip),%ymm10 # 6e40 <_sk_callback_avx+0x6c2> + .byte 197,124,40,21,208,50,0,0 // vmovaps 0x32d0(%rip),%ymm10 # 6e00 <_sk_callback_avx+0x6c2> .byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,174,47,0,0 // vbroadcastss 0x2fae(%rip),%ymm9 # 6b30 <_sk_callback_avx+0x3b2> + .byte 196,98,125,24,13,174,47,0,0 // vbroadcastss 0x2fae(%rip),%ymm9 # 6af0 <_sk_callback_avx+0x3b2> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1 .byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2 @@ -18979,56 +18917,56 @@ _sk_load_565_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,128,0,0,0 // jne 3c72 <_sk_load_565_avx+0x8e> + .byte 15,133,128,0,0,0 // jne 3c32 <_sk_load_565_avx+0x8e> .byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0 .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,32,47,0,0 // vbroadcastss 0x2f20(%rip),%ymm0 # 6b34 <_sk_callback_avx+0x3b6> + .byte 196,226,125,24,5,32,47,0,0 // vbroadcastss 0x2f20(%rip),%ymm0 # 6af4 <_sk_callback_avx+0x3b6> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,19,47,0,0 // vbroadcastss 0x2f13(%rip),%ymm1 # 6b38 <_sk_callback_avx+0x3ba> + .byte 196,226,125,24,13,19,47,0,0 // vbroadcastss 0x2f13(%rip),%ymm1 # 6af8 <_sk_callback_avx+0x3ba> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,10,47,0,0 // vbroadcastss 0x2f0a(%rip),%ymm1 # 6b3c <_sk_callback_avx+0x3be> + .byte 196,226,125,24,13,10,47,0,0 // vbroadcastss 0x2f0a(%rip),%ymm1 # 6afc <_sk_callback_avx+0x3be> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,253,46,0,0 // vbroadcastss 0x2efd(%rip),%ymm3 # 6b40 <_sk_callback_avx+0x3c2> + .byte 196,226,125,24,29,253,46,0,0 // vbroadcastss 0x2efd(%rip),%ymm3 # 6b00 <_sk_callback_avx+0x3c2> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,244,46,0,0 // vbroadcastss 0x2ef4(%rip),%ymm3 # 6b44 <_sk_callback_avx+0x3c6> + .byte 196,226,125,24,29,244,46,0,0 // vbroadcastss 0x2ef4(%rip),%ymm3 # 6b04 <_sk_callback_avx+0x3c6> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,231,46,0,0 // vbroadcastss 0x2ee7(%rip),%ymm3 # 6b48 <_sk_callback_avx+0x3ca> + .byte 196,226,125,24,29,231,46,0,0 // vbroadcastss 0x2ee7(%rip),%ymm3 # 6b08 <_sk_callback_avx+0x3ca> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,220,46,0,0 // vbroadcastss 0x2edc(%rip),%ymm3 # 6b4c <_sk_callback_avx+0x3ce> + .byte 196,226,125,24,29,220,46,0,0 // vbroadcastss 0x2edc(%rip),%ymm3 # 6b0c <_sk_callback_avx+0x3ce> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,7 // and $0x7,%r9b .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,110,255,255,255 // ja 3bf8 <_sk_load_565_avx+0x14> + .byte 15,135,110,255,255,255 // ja 3bb8 <_sk_load_565_avx+0x14> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 3cf8 <_sk_load_565_avx+0x114> + .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 3cb8 <_sk_load_565_avx+0x114> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 233,76,255,255,255 // jmpq 3bf8 <_sk_load_565_avx+0x14> + .byte 233,76,255,255,255 // jmpq 3bb8 <_sk_load_565_avx+0x14> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm1 .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0 - .byte 233,47,255,255,255 // jmpq 3bf8 <_sk_load_565_avx+0x14> + .byte 233,47,255,255,255 // jmpq 3bb8 <_sk_load_565_avx+0x14> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm1 .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - .byte 233,2,255,255,255 // jmpq 3bf8 <_sk_load_565_avx+0x14> + .byte 233,2,255,255,255 // jmpq 3bb8 <_sk_load_565_avx+0x14> .byte 102,144 // xchg %ax,%ax .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi) .byte 255 // (bad) @@ -19097,23 +19035,23 @@ _sk_gather_565_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - .byte 196,226,125,24,5,106,45,0,0 // vbroadcastss 0x2d6a(%rip),%ymm0 # 6b50 <_sk_callback_avx+0x3d2> + .byte 196,226,125,24,5,106,45,0,0 // vbroadcastss 0x2d6a(%rip),%ymm0 # 6b10 <_sk_callback_avx+0x3d2> .byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,93,45,0,0 // vbroadcastss 0x2d5d(%rip),%ymm1 # 6b54 <_sk_callback_avx+0x3d6> + .byte 196,226,125,24,13,93,45,0,0 // vbroadcastss 0x2d5d(%rip),%ymm1 # 6b14 <_sk_callback_avx+0x3d6> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,84,45,0,0 // vbroadcastss 0x2d54(%rip),%ymm1 # 6b58 <_sk_callback_avx+0x3da> + .byte 196,226,125,24,13,84,45,0,0 // vbroadcastss 0x2d54(%rip),%ymm1 # 6b18 <_sk_callback_avx+0x3da> .byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,29,71,45,0,0 // vbroadcastss 0x2d47(%rip),%ymm3 # 6b5c <_sk_callback_avx+0x3de> + .byte 196,226,125,24,29,71,45,0,0 // vbroadcastss 0x2d47(%rip),%ymm3 # 6b1c <_sk_callback_avx+0x3de> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 - .byte 196,226,125,24,29,62,45,0,0 // vbroadcastss 0x2d3e(%rip),%ymm3 # 6b60 <_sk_callback_avx+0x3e2> + .byte 196,226,125,24,29,62,45,0,0 // vbroadcastss 0x2d3e(%rip),%ymm3 # 6b20 <_sk_callback_avx+0x3e2> .byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,226,125,24,29,49,45,0,0 // vbroadcastss 0x2d31(%rip),%ymm3 # 6b64 <_sk_callback_avx+0x3e6> + .byte 196,226,125,24,29,49,45,0,0 // vbroadcastss 0x2d31(%rip),%ymm3 # 6b24 <_sk_callback_avx+0x3e6> .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,38,45,0,0 // vbroadcastss 0x2d26(%rip),%ymm3 # 6b68 <_sk_callback_avx+0x3ea> + .byte 196,226,125,24,29,38,45,0,0 // vbroadcastss 0x2d26(%rip),%ymm3 # 6b28 <_sk_callback_avx+0x3ea> .byte 255,224 // jmpq *%rax HIDDEN _sk_store_565_avx @@ -19122,14 +19060,14 @@ FUNCTION(_sk_store_565_avx) _sk_store_565_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,26,45,0,0 // vbroadcastss 0x2d1a(%rip),%ymm8 # 6b6c <_sk_callback_avx+0x3ee> + .byte 196,98,125,24,5,26,45,0,0 // vbroadcastss 0x2d1a(%rip),%ymm8 # 6b2c <_sk_callback_avx+0x3ee> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10 .byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9 .byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 - .byte 196,98,125,24,21,243,44,0,0 // vbroadcastss 0x2cf3(%rip),%ymm10 # 6b70 <_sk_callback_avx+0x3f2> + .byte 196,98,125,24,21,243,44,0,0 // vbroadcastss 0x2cf3(%rip),%ymm10 # 6b30 <_sk_callback_avx+0x3f2> .byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10 .byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10 .byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11 @@ -19143,7 +19081,7 @@ _sk_store_565_avx: .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 3ecd <_sk_store_565_avx+0x89> + .byte 117,10 // jne 3e8d <_sk_store_565_avx+0x89> .byte 196,65,122,127,4,83 // vmovdqu %xmm8,(%r11,%rdx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19151,22 +19089,22 @@ _sk_store_565_avx: .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,236 // ja 3ec9 <_sk_store_565_avx+0x85> + .byte 119,236 // ja 3e89 <_sk_store_565_avx+0x85> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,68,0,0,0 // lea 0x44(%rip),%r10 # 3f2c <_sk_store_565_avx+0xe8> + .byte 76,141,21,68,0,0,0 // lea 0x44(%rip),%r10 # 3eec <_sk_store_565_avx+0xe8> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2) - .byte 235,207 // jmp 3ec9 <_sk_store_565_avx+0x85> + .byte 235,207 // jmp 3e89 <_sk_store_565_avx+0x85> .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2) .byte 196,65,121,126,4,83 // vmovd %xmm8,(%r11,%rdx,2) - .byte 235,191 // jmp 3ec9 <_sk_store_565_avx+0x85> + .byte 235,191 // jmp 3e89 <_sk_store_565_avx+0x85> .byte 196,67,121,21,68,83,12,6 // vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2) .byte 196,67,121,21,68,83,10,5 // vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2) .byte 196,67,121,21,68,83,8,4 // vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2) .byte 196,65,121,214,4,83 // vmovq %xmm8,(%r11,%rdx,2) - .byte 235,159 // jmp 3ec9 <_sk_store_565_avx+0x85> + .byte 235,159 // jmp 3e89 <_sk_store_565_avx+0x85> .byte 102,144 // xchg %ax,%ax .byte 197,255,255 // (bad) .byte 255,214 // callq *%rsi @@ -19197,31 +19135,31 @@ _sk_load_4444_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,152,0,0,0 // jne 3fee <_sk_load_4444_avx+0xa6> + .byte 15,133,152,0,0,0 // jne 3fae <_sk_load_4444_avx+0xa6> .byte 196,193,122,111,4,83 // vmovdqu (%r11,%rdx,2),%xmm0 .byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1 .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,252,43,0,0 // vbroadcastss 0x2bfc(%rip),%ymm0 # 6b74 <_sk_callback_avx+0x3f6> + .byte 196,226,125,24,5,252,43,0,0 // vbroadcastss 0x2bfc(%rip),%ymm0 # 6b34 <_sk_callback_avx+0x3f6> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,239,43,0,0 // vbroadcastss 0x2bef(%rip),%ymm1 # 6b78 <_sk_callback_avx+0x3fa> + .byte 196,226,125,24,13,239,43,0,0 // vbroadcastss 0x2bef(%rip),%ymm1 # 6b38 <_sk_callback_avx+0x3fa> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,230,43,0,0 // vbroadcastss 0x2be6(%rip),%ymm1 # 6b7c <_sk_callback_avx+0x3fe> + .byte 196,226,125,24,13,230,43,0,0 // vbroadcastss 0x2be6(%rip),%ymm1 # 6b3c <_sk_callback_avx+0x3fe> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,217,43,0,0 // vbroadcastss 0x2bd9(%rip),%ymm2 # 6b80 <_sk_callback_avx+0x402> + .byte 196,226,125,24,21,217,43,0,0 // vbroadcastss 0x2bd9(%rip),%ymm2 # 6b40 <_sk_callback_avx+0x402> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,208,43,0,0 // vbroadcastss 0x2bd0(%rip),%ymm2 # 6b84 <_sk_callback_avx+0x406> + .byte 196,226,125,24,21,208,43,0,0 // vbroadcastss 0x2bd0(%rip),%ymm2 # 6b44 <_sk_callback_avx+0x406> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,195,43,0,0 // vbroadcastss 0x2bc3(%rip),%ymm8 # 6b88 <_sk_callback_avx+0x40a> + .byte 196,98,125,24,5,195,43,0,0 // vbroadcastss 0x2bc3(%rip),%ymm8 # 6b48 <_sk_callback_avx+0x40a> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,185,43,0,0 // vbroadcastss 0x2bb9(%rip),%ymm8 # 6b8c <_sk_callback_avx+0x40e> + .byte 196,98,125,24,5,185,43,0,0 // vbroadcastss 0x2bb9(%rip),%ymm8 # 6b4c <_sk_callback_avx+0x40e> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,171,43,0,0 // vbroadcastss 0x2bab(%rip),%ymm8 # 6b90 <_sk_callback_avx+0x412> + .byte 196,98,125,24,5,171,43,0,0 // vbroadcastss 0x2bab(%rip),%ymm8 # 6b50 <_sk_callback_avx+0x412> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19230,27 +19168,27 @@ _sk_load_4444_avx: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,86,255,255,255 // ja 3f5c <_sk_load_4444_avx+0x14> + .byte 15,135,86,255,255,255 // ja 3f1c <_sk_load_4444_avx+0x14> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 4074 <_sk_load_4444_avx+0x12c> + .byte 76,141,21,99,0,0,0 // lea 0x63(%rip),%r10 # 4034 <_sk_load_4444_avx+0x12c> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,183,4,83 // movzwl (%r11,%rdx,2),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 233,52,255,255,255 // jmpq 3f5c <_sk_load_4444_avx+0x14> + .byte 233,52,255,255,255 // jmpq 3f1c <_sk_load_4444_avx+0x14> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,83,4,2 // vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,110,12,83 // vmovd (%r11,%rdx,2),%xmm1 .byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0 - .byte 233,23,255,255,255 // jmpq 3f5c <_sk_load_4444_avx+0x14> + .byte 233,23,255,255,255 // jmpq 3f1c <_sk_load_4444_avx+0x14> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,193,121,196,68,83,12,6 // vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,83,10,5 // vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,121,196,68,83,8,4 // vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0 .byte 196,193,122,126,12,83 // vmovq (%r11,%rdx,2),%xmm1 .byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - .byte 233,234,254,255,255 // jmpq 3f5c <_sk_load_4444_avx+0x14> + .byte 233,234,254,255,255 // jmpq 3f1c <_sk_load_4444_avx+0x14> .byte 102,144 // xchg %ax,%ax .byte 166 // cmpsb %es:(%rdi),%ds:(%rsi) .byte 255 // (bad) @@ -19319,25 +19257,25 @@ _sk_gather_4444_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - .byte 196,226,125,24,5,50,42,0,0 // vbroadcastss 0x2a32(%rip),%ymm0 # 6b94 <_sk_callback_avx+0x416> + .byte 196,226,125,24,5,50,42,0,0 // vbroadcastss 0x2a32(%rip),%ymm0 # 6b54 <_sk_callback_avx+0x416> .byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,226,125,24,13,37,42,0,0 // vbroadcastss 0x2a25(%rip),%ymm1 # 6b98 <_sk_callback_avx+0x41a> + .byte 196,226,125,24,13,37,42,0,0 // vbroadcastss 0x2a25(%rip),%ymm1 # 6b58 <_sk_callback_avx+0x41a> .byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,28,42,0,0 // vbroadcastss 0x2a1c(%rip),%ymm1 # 6b9c <_sk_callback_avx+0x41e> + .byte 196,226,125,24,13,28,42,0,0 // vbroadcastss 0x2a1c(%rip),%ymm1 # 6b5c <_sk_callback_avx+0x41e> .byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1 .byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1 - .byte 196,226,125,24,21,15,42,0,0 // vbroadcastss 0x2a0f(%rip),%ymm2 # 6ba0 <_sk_callback_avx+0x422> + .byte 196,226,125,24,21,15,42,0,0 // vbroadcastss 0x2a0f(%rip),%ymm2 # 6b60 <_sk_callback_avx+0x422> .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1 - .byte 196,226,125,24,21,6,42,0,0 // vbroadcastss 0x2a06(%rip),%ymm2 # 6ba4 <_sk_callback_avx+0x426> + .byte 196,226,125,24,21,6,42,0,0 // vbroadcastss 0x2a06(%rip),%ymm2 # 6b64 <_sk_callback_avx+0x426> .byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2 .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 - .byte 196,98,125,24,5,249,41,0,0 // vbroadcastss 0x29f9(%rip),%ymm8 # 6ba8 <_sk_callback_avx+0x42a> + .byte 196,98,125,24,5,249,41,0,0 // vbroadcastss 0x29f9(%rip),%ymm8 # 6b68 <_sk_callback_avx+0x42a> .byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2 - .byte 196,98,125,24,5,239,41,0,0 // vbroadcastss 0x29ef(%rip),%ymm8 # 6bac <_sk_callback_avx+0x42e> + .byte 196,98,125,24,5,239,41,0,0 // vbroadcastss 0x29ef(%rip),%ymm8 # 6b6c <_sk_callback_avx+0x42e> .byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3 .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3 - .byte 196,98,125,24,5,225,41,0,0 // vbroadcastss 0x29e1(%rip),%ymm8 # 6bb0 <_sk_callback_avx+0x432> + .byte 196,98,125,24,5,225,41,0,0 // vbroadcastss 0x29e1(%rip),%ymm8 # 6b70 <_sk_callback_avx+0x432> .byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19348,7 +19286,7 @@ FUNCTION(_sk_store_4444_avx) _sk_store_4444_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 - .byte 196,98,125,24,5,206,41,0,0 // vbroadcastss 0x29ce(%rip),%ymm8 # 6bb4 <_sk_callback_avx+0x436> + .byte 196,98,125,24,5,206,41,0,0 // vbroadcastss 0x29ce(%rip),%ymm8 # 6b74 <_sk_callback_avx+0x436> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10 @@ -19375,7 +19313,7 @@ _sk_store_4444_avx: .byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9 .byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 427f <_sk_store_4444_avx+0xa7> + .byte 117,10 // jne 423f <_sk_store_4444_avx+0xa7> .byte 196,65,122,127,4,83 // vmovdqu %xmm8,(%r11,%rdx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -19383,22 +19321,22 @@ _sk_store_4444_avx: .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,236 // ja 427b <_sk_store_4444_avx+0xa3> + .byte 119,236 // ja 423b <_sk_store_4444_avx+0xa3> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,66,0,0,0 // lea 0x42(%rip),%r10 # 42dc <_sk_store_4444_avx+0x104> + .byte 76,141,21,66,0,0,0 // lea 0x42(%rip),%r10 # 429c <_sk_store_4444_avx+0x104> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,21,4,83,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,2) - .byte 235,207 // jmp 427b <_sk_store_4444_avx+0xa3> + .byte 235,207 // jmp 423b <_sk_store_4444_avx+0xa3> .byte 196,67,121,21,68,83,4,2 // vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2) .byte 196,65,121,126,4,83 // vmovd %xmm8,(%r11,%rdx,2) - .byte 235,191 // jmp 427b <_sk_store_4444_avx+0xa3> + .byte 235,191 // jmp 423b <_sk_store_4444_avx+0xa3> .byte 196,67,121,21,68,83,12,6 // vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2) .byte 196,67,121,21,68,83,10,5 // vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2) .byte 196,67,121,21,68,83,8,4 // vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2) .byte 196,65,121,214,4,83 // vmovq %xmm8,(%r11,%rdx,2) - .byte 235,159 // jmp 427b <_sk_store_4444_avx+0xa3> + .byte 235,159 // jmp 423b <_sk_store_4444_avx+0xa3> .byte 199 // (bad) .byte 255 // (bad) .byte 255 // (bad) @@ -19416,7 +19354,7 @@ _sk_store_4444_avx: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 232,255,255,255,224 // callq ffffffffe10042f4 <_sk_callback_avx+0xffffffffe0ffdb76> + .byte 232,255,255,255,224 // callq ffffffffe10042b4 <_sk_callback_avx+0xffffffffe0ffdb76> .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -19430,12 +19368,12 @@ _sk_load_8888_avx: .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,137,0,0,0 // jne 439a <_sk_load_8888_avx+0xa2> + .byte 15,133,137,0,0,0 // jne 435a <_sk_load_8888_avx+0xa2> .byte 196,193,124,16,26 // vmovups (%r10),%ymm3 - .byte 197,124,40,21,66,43,0,0 // vmovaps 0x2b42(%rip),%ymm10 # 6e60 <_sk_callback_avx+0x6e2> + .byte 197,124,40,21,66,43,0,0 // vmovaps 0x2b42(%rip),%ymm10 # 6e20 <_sk_callback_avx+0x6e2> .byte 196,193,100,84,194 // vandps %ymm10,%ymm3,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,5,136,40,0,0 // vbroadcastss 0x2888(%rip),%ymm8 # 6bb8 <_sk_callback_avx+0x43a> + .byte 196,98,125,24,5,136,40,0,0 // vbroadcastss 0x2888(%rip),%ymm8 # 6b78 <_sk_callback_avx+0x43a> .byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0 .byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1 .byte 196,195,125,25,217,1 // vextractf128 $0x1,%ymm3,%xmm9 @@ -19465,13 +19403,13 @@ _sk_load_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,225,249,110,192 // vmovq %rax,%xmm0 .byte 196,226,121,48,192 // vpmovzxbw %xmm0,%xmm0 - .byte 196,226,121,0,13,254,41,0,0 // vpshufb 0x29fe(%rip),%xmm0,%xmm1 # 6dc0 <_sk_callback_avx+0x642> + .byte 196,226,121,0,13,254,41,0,0 // vpshufb 0x29fe(%rip),%xmm0,%xmm1 # 6d80 <_sk_callback_avx+0x642> .byte 196,226,121,33,201 // vpmovsxbd %xmm1,%xmm1 - .byte 196,226,121,0,5,0,42,0,0 // vpshufb 0x2a00(%rip),%xmm0,%xmm0 # 6dd0 <_sk_callback_avx+0x652> + .byte 196,226,121,0,5,0,42,0,0 // vpshufb 0x2a00(%rip),%xmm0,%xmm0 # 6d90 <_sk_callback_avx+0x652> .byte 196,226,121,33,192 // vpmovsxbd %xmm0,%xmm0 .byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 .byte 196,194,125,44,26 // vmaskmovps (%r10),%ymm0,%ymm3 - .byte 233,49,255,255,255 // jmpq 4316 <_sk_load_8888_avx+0x1e> + .byte 233,49,255,255,255 // jmpq 42d6 <_sk_load_8888_avx+0x1e> HIDDEN _sk_gather_8888_avx .globl _sk_gather_8888_avx @@ -19510,10 +19448,10 @@ _sk_gather_8888_avx: .byte 73,193,234,32 // shr $0x20,%r10 .byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 .byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - .byte 197,124,40,21,240,41,0,0 // vmovaps 0x29f0(%rip),%ymm10 # 6e80 <_sk_callback_avx+0x702> + .byte 197,124,40,21,240,41,0,0 // vmovaps 0x29f0(%rip),%ymm10 # 6e40 <_sk_callback_avx+0x702> .byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,13,26,39,0,0 // vbroadcastss 0x271a(%rip),%ymm9 # 6bbc <_sk_callback_avx+0x43e> + .byte 196,98,125,24,13,26,39,0,0 // vbroadcastss 0x271a(%rip),%ymm9 # 6b7c <_sk_callback_avx+0x43e> .byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0 .byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1 .byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2 @@ -19543,7 +19481,7 @@ _sk_store_8888_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 76,3,16 // add (%rax),%r10 - .byte 196,98,125,24,5,164,38,0,0 // vbroadcastss 0x26a4(%rip),%ymm8 # 6bc0 <_sk_callback_avx+0x442> + .byte 196,98,125,24,5,164,38,0,0 // vbroadcastss 0x26a4(%rip),%ymm8 # 6b80 <_sk_callback_avx+0x442> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10 @@ -19568,7 +19506,7 @@ _sk_store_8888_avx: .byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8 .byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,12 // jne 45ac <_sk_store_8888_avx+0xa9> + .byte 117,12 // jne 456c <_sk_store_8888_avx+0xa9> .byte 196,65,124,17,2 // vmovups %ymm8,(%r10) .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,137,201 // mov %r9,%rcx @@ -19580,13 +19518,13 @@ _sk_store_8888_avx: .byte 72,211,232 // shr %cl,%rax .byte 196,97,249,110,200 // vmovq %rax,%xmm9 .byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9 - .byte 196,98,49,0,21,12,40,0,0 // vpshufb 0x280c(%rip),%xmm9,%xmm10 # 6de0 <_sk_callback_avx+0x662> + .byte 196,98,49,0,21,12,40,0,0 // vpshufb 0x280c(%rip),%xmm9,%xmm10 # 6da0 <_sk_callback_avx+0x662> .byte 196,66,121,33,210 // vpmovsxbd %xmm10,%xmm10 - .byte 196,98,49,0,13,14,40,0,0 // vpshufb 0x280e(%rip),%xmm9,%xmm9 # 6df0 <_sk_callback_avx+0x672> + .byte 196,98,49,0,13,14,40,0,0 // vpshufb 0x280e(%rip),%xmm9,%xmm9 # 6db0 <_sk_callback_avx+0x672> .byte 196,66,121,33,201 // vpmovsxbd %xmm9,%xmm9 .byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 .byte 196,66,53,46,2 // vmaskmovps %ymm8,%ymm9,(%r10) - .byte 235,177 // jmp 45a5 <_sk_store_8888_avx+0xa2> + .byte 235,177 // jmp 4565 <_sk_store_8888_avx+0xa2> HIDDEN _sk_load_f16_avx .globl _sk_load_f16_avx @@ -19600,7 +19538,7 @@ _sk_load_f16_avx: .byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp) .byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp) .byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp) - .byte 15,133,141,2,0,0 // jne 48ab <_sk_load_f16_avx+0x2b7> + .byte 15,133,141,2,0,0 // jne 486b <_sk_load_f16_avx+0x2b7> .byte 197,121,16,4,208 // vmovupd (%rax,%rdx,8),%xmm8 .byte 197,249,16,84,208,16 // vmovupd 0x10(%rax,%rdx,8),%xmm2 .byte 197,249,16,76,208,32 // vmovupd 0x20(%rax,%rdx,8),%xmm1 @@ -19618,13 +19556,13 @@ _sk_load_f16_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - .byte 196,98,125,24,37,77,37,0,0 // vbroadcastss 0x254d(%rip),%ymm12 # 6bc4 <_sk_callback_avx+0x446> + .byte 196,98,125,24,37,77,37,0,0 // vbroadcastss 0x254d(%rip),%ymm12 # 6b84 <_sk_callback_avx+0x446> .byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1 .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,57,37,0,0 // vbroadcastss 0x2539(%rip),%xmm11 # 6bc8 <_sk_callback_avx+0x44a> + .byte 196,98,121,24,29,57,37,0,0 // vbroadcastss 0x2539(%rip),%xmm11 # 6b88 <_sk_callback_avx+0x44a> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,47,37,0,0 // vbroadcastss 0x252f(%rip),%xmm13 # 6bcc <_sk_callback_avx+0x44e> + .byte 196,98,121,24,45,47,37,0,0 // vbroadcastss 0x252f(%rip),%xmm13 # 6b8c <_sk_callback_avx+0x44e> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -19638,7 +19576,7 @@ _sk_load_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0 .byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1 - .byte 196,226,121,24,29,229,36,0,0 // vbroadcastss 0x24e5(%rip),%xmm3 # 6bd0 <_sk_callback_avx+0x452> + .byte 196,226,121,24,29,229,36,0,0 // vbroadcastss 0x24e5(%rip),%xmm3 # 6b90 <_sk_callback_avx+0x452> .byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -19731,29 +19669,29 @@ _sk_load_f16_avx: .byte 197,123,16,4,208 // vmovsd (%rax,%rdx,8),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,79 // je 490a <_sk_load_f16_avx+0x316> + .byte 116,79 // je 48ca <_sk_load_f16_avx+0x316> .byte 197,57,22,68,208,8 // vmovhpd 0x8(%rax,%rdx,8),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,67 // jb 490a <_sk_load_f16_avx+0x316> + .byte 114,67 // jb 48ca <_sk_load_f16_avx+0x316> .byte 197,251,16,84,208,16 // vmovsd 0x10(%rax,%rdx,8),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,68 // je 4917 <_sk_load_f16_avx+0x323> + .byte 116,68 // je 48d7 <_sk_load_f16_avx+0x323> .byte 197,233,22,84,208,24 // vmovhpd 0x18(%rax,%rdx,8),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,56 // jb 4917 <_sk_load_f16_avx+0x323> + .byte 114,56 // jb 48d7 <_sk_load_f16_avx+0x323> .byte 197,251,16,76,208,32 // vmovsd 0x20(%rax,%rdx,8),%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,70,253,255,255 // je 4635 <_sk_load_f16_avx+0x41> + .byte 15,132,70,253,255,255 // je 45f5 <_sk_load_f16_avx+0x41> .byte 197,241,22,76,208,40 // vmovhpd 0x28(%rax,%rdx,8),%xmm1,%xmm1 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,54,253,255,255 // jb 4635 <_sk_load_f16_avx+0x41> + .byte 15,130,54,253,255,255 // jb 45f5 <_sk_load_f16_avx+0x41> .byte 197,122,126,76,208,48 // vmovq 0x30(%rax,%rdx,8),%xmm9 - .byte 233,43,253,255,255 // jmpq 4635 <_sk_load_f16_avx+0x41> + .byte 233,43,253,255,255 // jmpq 45f5 <_sk_load_f16_avx+0x41> .byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,30,253,255,255 // jmpq 4635 <_sk_load_f16_avx+0x41> + .byte 233,30,253,255,255 // jmpq 45f5 <_sk_load_f16_avx+0x41> .byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1 - .byte 233,21,253,255,255 // jmpq 4635 <_sk_load_f16_avx+0x41> + .byte 233,21,253,255,255 // jmpq 45f5 <_sk_load_f16_avx+0x41> HIDDEN _sk_gather_f16_avx .globl _sk_gather_f16_avx @@ -19814,13 +19752,13 @@ _sk_gather_f16_avx: .byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1 .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - .byte 196,98,125,24,37,170,33,0,0 // vbroadcastss 0x21aa(%rip),%ymm12 # 6bd4 <_sk_callback_avx+0x456> + .byte 196,98,125,24,37,170,33,0,0 // vbroadcastss 0x21aa(%rip),%ymm12 # 6b94 <_sk_callback_avx+0x456> .byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1 .byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0 .byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14 - .byte 196,98,121,24,29,150,33,0,0 // vbroadcastss 0x2196(%rip),%xmm11 # 6bd8 <_sk_callback_avx+0x45a> + .byte 196,98,121,24,29,150,33,0,0 // vbroadcastss 0x2196(%rip),%xmm11 # 6b98 <_sk_callback_avx+0x45a> .byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3 - .byte 196,98,121,24,45,140,33,0,0 // vbroadcastss 0x218c(%rip),%xmm13 # 6bdc <_sk_callback_avx+0x45e> + .byte 196,98,121,24,45,140,33,0,0 // vbroadcastss 0x218c(%rip),%xmm13 # 6b9c <_sk_callback_avx+0x45e> .byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3 .byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10 .byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -19834,7 +19772,7 @@ _sk_gather_f16_avx: .byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 .byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0 .byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1 - .byte 196,226,121,24,29,66,33,0,0 // vbroadcastss 0x2142(%rip),%xmm3 # 6be0 <_sk_callback_avx+0x462> + .byte 196,226,121,24,29,66,33,0,0 // vbroadcastss 0x2142(%rip),%xmm3 # 6ba0 <_sk_callback_avx+0x462> .byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1 .byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -19934,12 +19872,12 @@ _sk_store_f16_avx: .byte 197,252,17,52,36 // vmovups %ymm6,(%rsp) .byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp) .byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp) - .byte 196,98,125,24,13,98,31,0,0 // vbroadcastss 0x1f62(%rip),%ymm9 # 6be4 <_sk_callback_avx+0x466> + .byte 196,98,125,24,13,98,31,0,0 // vbroadcastss 0x1f62(%rip),%ymm9 # 6ba4 <_sk_callback_avx+0x466> .byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10 .byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp) .byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11 .byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12 - .byte 196,98,121,24,5,71,31,0,0 // vbroadcastss 0x1f47(%rip),%xmm8 # 6be8 <_sk_callback_avx+0x46a> + .byte 196,98,121,24,5,71,31,0,0 // vbroadcastss 0x1f47(%rip),%xmm8 # 6ba8 <_sk_callback_avx+0x46a> .byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13 .byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14 .byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13 @@ -19949,7 +19887,7 @@ _sk_store_f16_avx: .byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14 .byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11 .byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12 - .byte 196,98,125,24,21,14,31,0,0 // vbroadcastss 0x1f0e(%rip),%ymm10 # 6bec <_sk_callback_avx+0x46e> + .byte 196,98,125,24,21,14,31,0,0 // vbroadcastss 0x1f0e(%rip),%ymm10 # 6bac <_sk_callback_avx+0x46e> .byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14 .byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15 .byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12 @@ -20031,7 +19969,7 @@ _sk_store_f16_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,66 // jne 4ebc <_sk_store_f16_avx+0x25e> + .byte 117,66 // jne 4e7c <_sk_store_f16_avx+0x25e> .byte 197,120,17,28,208 // vmovups %xmm11,(%rax,%rdx,8) .byte 197,120,17,84,208,16 // vmovups %xmm10,0x10(%rax,%rdx,8) .byte 197,120,17,76,208,32 // vmovups %xmm9,0x20(%rax,%rdx,8) @@ -20047,22 +19985,22 @@ _sk_store_f16_avx: .byte 255,224 // jmpq *%rax .byte 197,121,214,28,208 // vmovq %xmm11,(%rax,%rdx,8) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,202 // je 4e91 <_sk_store_f16_avx+0x233> + .byte 116,202 // je 4e51 <_sk_store_f16_avx+0x233> .byte 197,121,23,92,208,8 // vmovhpd %xmm11,0x8(%rax,%rdx,8) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,190 // jb 4e91 <_sk_store_f16_avx+0x233> + .byte 114,190 // jb 4e51 <_sk_store_f16_avx+0x233> .byte 197,121,214,84,208,16 // vmovq %xmm10,0x10(%rax,%rdx,8) - .byte 116,182 // je 4e91 <_sk_store_f16_avx+0x233> + .byte 116,182 // je 4e51 <_sk_store_f16_avx+0x233> .byte 197,121,23,84,208,24 // vmovhpd %xmm10,0x18(%rax,%rdx,8) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,170 // jb 4e91 <_sk_store_f16_avx+0x233> + .byte 114,170 // jb 4e51 <_sk_store_f16_avx+0x233> .byte 197,121,214,76,208,32 // vmovq %xmm9,0x20(%rax,%rdx,8) - .byte 116,162 // je 4e91 <_sk_store_f16_avx+0x233> + .byte 116,162 // je 4e51 <_sk_store_f16_avx+0x233> .byte 197,121,23,76,208,40 // vmovhpd %xmm9,0x28(%rax,%rdx,8) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,150 // jb 4e91 <_sk_store_f16_avx+0x233> + .byte 114,150 // jb 4e51 <_sk_store_f16_avx+0x233> .byte 197,121,214,68,208,48 // vmovq %xmm8,0x30(%rax,%rdx,8) - .byte 235,142 // jmp 4e91 <_sk_store_f16_avx+0x233> + .byte 235,142 // jmp 4e51 <_sk_store_f16_avx+0x233> HIDDEN _sk_load_u16_be_avx .globl _sk_load_u16_be_avx @@ -20072,7 +20010,7 @@ _sk_load_u16_be_avx: .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,253,0,0,0 // jne 5016 <_sk_load_u16_be_avx+0x113> + .byte 15,133,253,0,0,0 // jne 4fd6 <_sk_load_u16_be_avx+0x113> .byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8 .byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2 .byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3 @@ -20094,7 +20032,7 @@ _sk_load_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,102,28,0,0 // vbroadcastss 0x1c66(%rip),%ymm11 # 6bf0 <_sk_callback_avx+0x472> + .byte 196,98,125,24,29,102,28,0,0 // vbroadcastss 0x1c66(%rip),%ymm11 # 6bb0 <_sk_callback_avx+0x472> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -20128,29 +20066,29 @@ _sk_load_u16_be_avx: .byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8 .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,85 // je 507c <_sk_load_u16_be_avx+0x179> + .byte 116,85 // je 503c <_sk_load_u16_be_avx+0x179> .byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,72 // jb 507c <_sk_load_u16_be_avx+0x179> + .byte 114,72 // jb 503c <_sk_load_u16_be_avx+0x179> .byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 116,72 // je 5089 <_sk_load_u16_be_avx+0x186> + .byte 116,72 // je 5049 <_sk_load_u16_be_avx+0x186> .byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,59 // jb 5089 <_sk_load_u16_be_avx+0x186> + .byte 114,59 // jb 5049 <_sk_load_u16_be_avx+0x186> .byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 15,132,213,254,255,255 // je 4f34 <_sk_load_u16_be_avx+0x31> + .byte 15,132,213,254,255,255 // je 4ef4 <_sk_load_u16_be_avx+0x31> .byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 15,130,196,254,255,255 // jb 4f34 <_sk_load_u16_be_avx+0x31> + .byte 15,130,196,254,255,255 // jb 4ef4 <_sk_load_u16_be_avx+0x31> .byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9 - .byte 233,184,254,255,255 // jmpq 4f34 <_sk_load_u16_be_avx+0x31> + .byte 233,184,254,255,255 // jmpq 4ef4 <_sk_load_u16_be_avx+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 .byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2 - .byte 233,171,254,255,255 // jmpq 4f34 <_sk_load_u16_be_avx+0x31> + .byte 233,171,254,255,255 // jmpq 4ef4 <_sk_load_u16_be_avx+0x31> .byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3 - .byte 233,162,254,255,255 // jmpq 4f34 <_sk_load_u16_be_avx+0x31> + .byte 233,162,254,255,255 // jmpq 4ef4 <_sk_load_u16_be_avx+0x31> HIDDEN _sk_load_rgb_u16_be_avx .globl _sk_load_rgb_u16_be_avx @@ -20160,7 +20098,7 @@ _sk_load_rgb_u16_be_avx: .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,82 // lea (%rdx,%rdx,2),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,243,0,0,0 // jne 5197 <_sk_load_rgb_u16_be_avx+0x105> + .byte 15,133,243,0,0,0 // jne 5157 <_sk_load_rgb_u16_be_avx+0x105> .byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0 .byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2 .byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1 @@ -20187,7 +20125,7 @@ _sk_load_rgb_u16_be_avx: .byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0 .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 .byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0 - .byte 196,98,125,24,29,198,26,0,0 // vbroadcastss 0x1ac6(%rip),%ymm11 # 6bf4 <_sk_callback_avx+0x476> + .byte 196,98,125,24,29,198,26,0,0 // vbroadcastss 0x1ac6(%rip),%ymm11 # 6bb4 <_sk_callback_avx+0x476> .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0 .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1 .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2 @@ -20208,41 +20146,41 @@ _sk_load_rgb_u16_be_avx: .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2 .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,29,99,26,0,0 // vbroadcastss 0x1a63(%rip),%ymm3 # 6bf8 <_sk_callback_avx+0x47a> + .byte 196,226,125,24,29,99,26,0,0 // vbroadcastss 0x1a63(%rip),%ymm3 # 6bb8 <_sk_callback_avx+0x47a> .byte 255,224 // jmpq *%rax .byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0 .byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,5 // jne 51b0 <_sk_load_rgb_u16_be_avx+0x11e> - .byte 233,40,255,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46> + .byte 117,5 // jne 5170 <_sk_load_rgb_u16_be_avx+0x11e> + .byte 233,40,255,255,255 // jmpq 5098 <_sk_load_rgb_u16_be_avx+0x46> .byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1 .byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,26 // jb 51df <_sk_load_rgb_u16_be_avx+0x14d> + .byte 114,26 // jb 519f <_sk_load_rgb_u16_be_avx+0x14d> .byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1 .byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 117,10 // jne 51e4 <_sk_load_rgb_u16_be_avx+0x152> - .byte 233,249,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46> - .byte 233,244,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46> + .byte 117,10 // jne 51a4 <_sk_load_rgb_u16_be_avx+0x152> + .byte 233,249,254,255,255 // jmpq 5098 <_sk_load_rgb_u16_be_avx+0x46> + .byte 233,244,254,255,255 // jmpq 5098 <_sk_load_rgb_u16_be_avx+0x46> .byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1 .byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,26 // jb 5213 <_sk_load_rgb_u16_be_avx+0x181> + .byte 114,26 // jb 51d3 <_sk_load_rgb_u16_be_avx+0x181> .byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1 .byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1 .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 117,10 // jne 5218 <_sk_load_rgb_u16_be_avx+0x186> - .byte 233,197,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46> - .byte 233,192,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46> + .byte 117,10 // jne 51d8 <_sk_load_rgb_u16_be_avx+0x186> + .byte 233,197,254,255,255 // jmpq 5098 <_sk_load_rgb_u16_be_avx+0x46> + .byte 233,192,254,255,255 // jmpq 5098 <_sk_load_rgb_u16_be_avx+0x46> .byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3 .byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11 .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,20 // jb 5241 <_sk_load_rgb_u16_be_avx+0x1af> + .byte 114,20 // jb 5201 <_sk_load_rgb_u16_be_avx+0x1af> .byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3 .byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3 - .byte 233,151,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46> - .byte 233,146,254,255,255 // jmpq 50d8 <_sk_load_rgb_u16_be_avx+0x46> + .byte 233,151,254,255,255 // jmpq 5098 <_sk_load_rgb_u16_be_avx+0x46> + .byte 233,146,254,255,255 // jmpq 5098 <_sk_load_rgb_u16_be_avx+0x46> HIDDEN _sk_store_u16_be_avx .globl _sk_store_u16_be_avx @@ -20251,7 +20189,7 @@ _sk_store_u16_be_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax - .byte 196,98,125,24,5,160,25,0,0 // vbroadcastss 0x19a0(%rip),%ymm8 # 6bfc <_sk_callback_avx+0x47e> + .byte 196,98,125,24,5,160,25,0,0 // vbroadcastss 0x19a0(%rip),%ymm8 # 6bbc <_sk_callback_avx+0x47e> .byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9 .byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9 .byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10 @@ -20289,7 +20227,7 @@ _sk_store_u16_be_avx: .byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9 .byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,31 // jne 5340 <_sk_store_u16_be_avx+0xfa> + .byte 117,31 // jne 5300 <_sk_store_u16_be_avx+0xfa> .byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2) .byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2) .byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2) @@ -20298,22 +20236,22 @@ _sk_store_u16_be_avx: .byte 255,224 // jmpq *%rax .byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 533c <_sk_store_u16_be_avx+0xf6> + .byte 116,240 // je 52fc <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 533c <_sk_store_u16_be_avx+0xf6> + .byte 114,227 // jb 52fc <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2) - .byte 116,218 // je 533c <_sk_store_u16_be_avx+0xf6> + .byte 116,218 // je 52fc <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,205 // jb 533c <_sk_store_u16_be_avx+0xf6> + .byte 114,205 // jb 52fc <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2) - .byte 116,196 // je 533c <_sk_store_u16_be_avx+0xf6> + .byte 116,196 // je 52fc <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,183 // jb 533c <_sk_store_u16_be_avx+0xf6> + .byte 114,183 // jb 52fc <_sk_store_u16_be_avx+0xf6> .byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2) - .byte 235,174 // jmp 533c <_sk_store_u16_be_avx+0xf6> + .byte 235,174 // jmp 52fc <_sk_store_u16_be_avx+0xf6> HIDDEN _sk_load_f32_avx .globl _sk_load_f32_avx @@ -20321,10 +20259,10 @@ FUNCTION(_sk_load_f32_avx) _sk_load_f32_avx: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 119,110 // ja 5404 <_sk_load_f32_avx+0x76> + .byte 119,110 // ja 53c4 <_sk_load_f32_avx+0x76> .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 - .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 542c <_sk_load_f32_avx+0x9e> + .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 53ec <_sk_load_f32_avx+0x9e> .byte 75,99,4,131 // movslq (%r11,%r8,4),%rax .byte 76,1,216 // add %r11,%rax .byte 255,224 // jmpq *%rax @@ -20383,7 +20321,7 @@ _sk_store_f32_avx: .byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8 .byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11 .byte 77,133,192 // test %r8,%r8 - .byte 117,55 // jne 54b9 <_sk_store_f32_avx+0x6d> + .byte 117,55 // jne 5479 <_sk_store_f32_avx+0x6d> .byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 .byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 .byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -20396,22 +20334,22 @@ _sk_store_f32_avx: .byte 255,224 // jmpq *%rax .byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 54b5 <_sk_store_f32_avx+0x69> + .byte 116,240 // je 5475 <_sk_store_f32_avx+0x69> .byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 54b5 <_sk_store_f32_avx+0x69> + .byte 114,227 // jb 5475 <_sk_store_f32_avx+0x69> .byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4) - .byte 116,218 // je 54b5 <_sk_store_f32_avx+0x69> + .byte 116,218 // je 5475 <_sk_store_f32_avx+0x69> .byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4) .byte 73,131,248,5 // cmp $0x5,%r8 - .byte 114,205 // jb 54b5 <_sk_store_f32_avx+0x69> + .byte 114,205 // jb 5475 <_sk_store_f32_avx+0x69> .byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4) - .byte 116,195 // je 54b5 <_sk_store_f32_avx+0x69> + .byte 116,195 // je 5475 <_sk_store_f32_avx+0x69> .byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4) .byte 73,131,248,7 // cmp $0x7,%r8 - .byte 114,181 // jb 54b5 <_sk_store_f32_avx+0x69> + .byte 114,181 // jb 5475 <_sk_store_f32_avx+0x69> .byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4) - .byte 235,171 // jmp 54b5 <_sk_store_f32_avx+0x69> + .byte 235,171 // jmp 5475 <_sk_store_f32_avx+0x69> HIDDEN _sk_clamp_x_avx .globl _sk_clamp_x_avx @@ -20500,7 +20438,7 @@ _sk_mirror_x_avx: .byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0 .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8 - .byte 197,178,89,5,211,21,0,0 // vmulss 0x15d3(%rip),%xmm9,%xmm0 # 6c00 <_sk_callback_avx+0x482> + .byte 197,178,89,5,211,21,0,0 // vmulss 0x15d3(%rip),%xmm9,%xmm0 # 6bc0 <_sk_callback_avx+0x482> .byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0 .byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 .byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0 @@ -20533,7 +20471,7 @@ _sk_mirror_y_avx: .byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1 .byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1 .byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8 - .byte 197,178,89,13,78,21,0,0 // vmulss 0x154e(%rip),%xmm9,%xmm1 # 6c04 <_sk_callback_avx+0x486> + .byte 197,178,89,13,78,21,0,0 // vmulss 0x154e(%rip),%xmm9,%xmm1 # 6bc4 <_sk_callback_avx+0x486> .byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1 .byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 .byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1 @@ -20559,7 +20497,7 @@ FUNCTION(_sk_clamp_x_1_avx) _sk_clamp_x_1_avx: .byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8 .byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0 - .byte 196,98,125,24,5,236,20,0,0 // vbroadcastss 0x14ec(%rip),%ymm8 # 6c08 <_sk_callback_avx+0x48a> + .byte 196,98,125,24,5,236,20,0,0 // vbroadcastss 0x14ec(%rip),%ymm8 # 6bc8 <_sk_callback_avx+0x48a> .byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -20577,9 +20515,9 @@ HIDDEN _sk_mirror_x_1_avx .globl _sk_mirror_x_1_avx FUNCTION(_sk_mirror_x_1_avx) _sk_mirror_x_1_avx: - .byte 196,98,125,24,5,207,20,0,0 // vbroadcastss 0x14cf(%rip),%ymm8 # 6c0c <_sk_callback_avx+0x48e> + .byte 196,98,125,24,5,207,20,0,0 // vbroadcastss 0x14cf(%rip),%ymm8 # 6bcc <_sk_callback_avx+0x48e> .byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,13,197,20,0,0 // vbroadcastss 0x14c5(%rip),%ymm9 # 6c10 <_sk_callback_avx+0x492> + .byte 196,98,125,24,13,197,20,0,0 // vbroadcastss 0x14c5(%rip),%ymm9 # 6bd0 <_sk_callback_avx+0x492> .byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9 .byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9 .byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9 @@ -20595,12 +20533,12 @@ HIDDEN _sk_luminance_to_alpha_avx .globl _sk_luminance_to_alpha_avx FUNCTION(_sk_luminance_to_alpha_avx) _sk_luminance_to_alpha_avx: - .byte 196,226,125,24,29,149,20,0,0 // vbroadcastss 0x1495(%rip),%ymm3 # 6c14 <_sk_callback_avx+0x496> + .byte 196,226,125,24,29,149,20,0,0 // vbroadcastss 0x1495(%rip),%ymm3 # 6bd4 <_sk_callback_avx+0x496> .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,29,140,20,0,0 // vbroadcastss 0x148c(%rip),%ymm3 # 6c18 <_sk_callback_avx+0x49a> + .byte 196,226,125,24,29,140,20,0,0 // vbroadcastss 0x148c(%rip),%ymm3 # 6bd8 <_sk_callback_avx+0x49a> .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1 .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 - .byte 196,226,125,24,13,127,20,0,0 // vbroadcastss 0x147f(%rip),%ymm1 # 6c1c <_sk_callback_avx+0x49e> + .byte 196,226,125,24,13,127,20,0,0 // vbroadcastss 0x147f(%rip),%ymm1 # 6bdc <_sk_callback_avx+0x49e> .byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1 .byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax @@ -20820,9 +20758,9 @@ _sk_evenly_spaced_gradient_avx: .byte 72,139,24 // mov (%rax),%rbx .byte 72,139,104,8 // mov 0x8(%rax),%rbp .byte 72,255,203 // dec %rbx - .byte 120,7 // js 5af9 <_sk_evenly_spaced_gradient_avx+0x25> + .byte 120,7 // js 5ab9 <_sk_evenly_spaced_gradient_avx+0x25> .byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1 - .byte 235,21 // jmp 5b0e <_sk_evenly_spaced_gradient_avx+0x3a> + .byte 235,21 // jmp 5ace <_sk_evenly_spaced_gradient_avx+0x3a> .byte 73,137,217 // mov %rbx,%r9 .byte 73,209,233 // shr %r9 .byte 131,227,1 // and $0x1,%ebx @@ -20980,18 +20918,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx .globl _sk_gauss_a_to_rgba_avx FUNCTION(_sk_gauss_a_to_rgba_avx) _sk_gauss_a_to_rgba_avx: - .byte 196,226,125,24,5,174,13,0,0 // vbroadcastss 0xdae(%rip),%ymm0 # 6c20 <_sk_callback_avx+0x4a2> + .byte 196,226,125,24,5,174,13,0,0 // vbroadcastss 0xdae(%rip),%ymm0 # 6be0 <_sk_callback_avx+0x4a2> .byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0 - .byte 196,226,125,24,13,165,13,0,0 // vbroadcastss 0xda5(%rip),%ymm1 # 6c24 <_sk_callback_avx+0x4a6> + .byte 196,226,125,24,13,165,13,0,0 // vbroadcastss 0xda5(%rip),%ymm1 # 6be4 <_sk_callback_avx+0x4a6> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,152,13,0,0 // vbroadcastss 0xd98(%rip),%ymm1 # 6c28 <_sk_callback_avx+0x4aa> + .byte 196,226,125,24,13,152,13,0,0 // vbroadcastss 0xd98(%rip),%ymm1 # 6be8 <_sk_callback_avx+0x4aa> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,139,13,0,0 // vbroadcastss 0xd8b(%rip),%ymm1 # 6c2c <_sk_callback_avx+0x4ae> + .byte 196,226,125,24,13,139,13,0,0 // vbroadcastss 0xd8b(%rip),%ymm1 # 6bec <_sk_callback_avx+0x4ae> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0 - .byte 196,226,125,24,13,126,13,0,0 // vbroadcastss 0xd7e(%rip),%ymm1 # 6c30 <_sk_callback_avx+0x4b2> + .byte 196,226,125,24,13,126,13,0,0 // vbroadcastss 0xd7e(%rip),%ymm1 # 6bf0 <_sk_callback_avx+0x4b2> .byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,252,40,200 // vmovaps %ymm0,%ymm1 @@ -21014,12 +20952,12 @@ _sk_gradient_avx: .byte 76,139,8 // mov (%rax),%r9 .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 73,131,249,2 // cmp $0x2,%r9 - .byte 114,80 // jb 5f35 <_sk_gradient_avx+0x6f> + .byte 114,80 // jb 5ef5 <_sk_gradient_avx+0x6f> .byte 72,139,88,72 // mov 0x48(%rax),%rbx .byte 73,255,201 // dec %r9 .byte 72,131,195,4 // add $0x4,%rbx .byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9 - .byte 196,98,125,24,21,54,13,0,0 // vbroadcastss 0xd36(%rip),%ymm10 # 6c34 <_sk_callback_avx+0x4b6> + .byte 196,98,125,24,21,54,13,0,0 // vbroadcastss 0xd36(%rip),%ymm10 # 6bf4 <_sk_callback_avx+0x4b6> .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 .byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8 .byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8 @@ -21031,7 +20969,7 @@ _sk_gradient_avx: .byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 .byte 72,131,195,4 // add $0x4,%rbx .byte 73,255,201 // dec %r9 - .byte 117,205 // jne 5f02 <_sk_gradient_avx+0x3c> + .byte 117,205 // jne 5ec2 <_sk_gradient_avx+0x3c> .byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9 .byte 69,137,202 // mov %r9d,%r10d .byte 73,193,233,32 // shr $0x20,%r9 @@ -21214,27 +21152,27 @@ _sk_xy_to_unit_angle_avx: .byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12 .byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11 .byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12 - .byte 196,98,125,24,45,44,9,0,0 // vbroadcastss 0x92c(%rip),%ymm13 # 6c38 <_sk_callback_avx+0x4ba> + .byte 196,98,125,24,45,44,9,0,0 // vbroadcastss 0x92c(%rip),%ymm13 # 6bf8 <_sk_callback_avx+0x4ba> .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,34,9,0,0 // vbroadcastss 0x922(%rip),%ymm14 # 6c3c <_sk_callback_avx+0x4be> + .byte 196,98,125,24,53,34,9,0,0 // vbroadcastss 0x922(%rip),%ymm14 # 6bfc <_sk_callback_avx+0x4be> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13 - .byte 196,98,125,24,53,19,9,0,0 // vbroadcastss 0x913(%rip),%ymm14 # 6c40 <_sk_callback_avx+0x4c2> + .byte 196,98,125,24,53,19,9,0,0 // vbroadcastss 0x913(%rip),%ymm14 # 6c00 <_sk_callback_avx+0x4c2> .byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13 .byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12 - .byte 196,98,125,24,45,4,9,0,0 // vbroadcastss 0x904(%rip),%ymm13 # 6c44 <_sk_callback_avx+0x4c6> + .byte 196,98,125,24,45,4,9,0,0 // vbroadcastss 0x904(%rip),%ymm13 # 6c04 <_sk_callback_avx+0x4c6> .byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12 .byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11 .byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9 - .byte 196,98,125,24,21,239,8,0,0 // vbroadcastss 0x8ef(%rip),%ymm10 # 6c48 <_sk_callback_avx+0x4ca> + .byte 196,98,125,24,21,239,8,0,0 // vbroadcastss 0x8ef(%rip),%ymm10 # 6c08 <_sk_callback_avx+0x4ca> .byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10 .byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9 .byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0 - .byte 196,98,125,24,21,217,8,0,0 // vbroadcastss 0x8d9(%rip),%ymm10 # 6c4c <_sk_callback_avx+0x4ce> + .byte 196,98,125,24,21,217,8,0,0 // vbroadcastss 0x8d9(%rip),%ymm10 # 6c0c <_sk_callback_avx+0x4ce> .byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10 .byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0 .byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9 - .byte 196,98,125,24,21,195,8,0,0 // vbroadcastss 0x8c3(%rip),%ymm10 # 6c50 <_sk_callback_avx+0x4d2> + .byte 196,98,125,24,21,195,8,0,0 // vbroadcastss 0x8c3(%rip),%ymm10 # 6c10 <_sk_callback_avx+0x4d2> .byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10 .byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0 .byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9 @@ -21258,7 +21196,7 @@ HIDDEN _sk_save_xy_avx FUNCTION(_sk_save_xy_avx) _sk_save_xy_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,141,8,0,0 // vbroadcastss 0x88d(%rip),%ymm8 # 6c54 <_sk_callback_avx+0x4d6> + .byte 196,98,125,24,5,141,8,0,0 // vbroadcastss 0x88d(%rip),%ymm8 # 6c14 <_sk_callback_avx+0x4d6> .byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9 .byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10 .byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9 @@ -21295,9 +21233,9 @@ HIDDEN _sk_bilinear_nx_avx FUNCTION(_sk_bilinear_nx_avx) _sk_bilinear_nx_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,25,8,0,0 // vbroadcastss 0x819(%rip),%ymm0 # 6c58 <_sk_callback_avx+0x4da> + .byte 196,226,125,24,5,25,8,0,0 // vbroadcastss 0x819(%rip),%ymm0 # 6c18 <_sk_callback_avx+0x4da> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,16,8,0,0 // vbroadcastss 0x810(%rip),%ymm8 # 6c5c <_sk_callback_avx+0x4de> + .byte 196,98,125,24,5,16,8,0,0 // vbroadcastss 0x810(%rip),%ymm8 # 6c1c <_sk_callback_avx+0x4de> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -21308,7 +21246,7 @@ HIDDEN _sk_bilinear_px_avx FUNCTION(_sk_bilinear_px_avx) _sk_bilinear_px_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,248,7,0,0 // vbroadcastss 0x7f8(%rip),%ymm0 # 6c60 <_sk_callback_avx+0x4e2> + .byte 196,226,125,24,5,248,7,0,0 // vbroadcastss 0x7f8(%rip),%ymm0 # 6c20 <_sk_callback_avx+0x4e2> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -21320,9 +21258,9 @@ HIDDEN _sk_bilinear_ny_avx FUNCTION(_sk_bilinear_ny_avx) _sk_bilinear_ny_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,220,7,0,0 // vbroadcastss 0x7dc(%rip),%ymm1 # 6c64 <_sk_callback_avx+0x4e6> + .byte 196,226,125,24,13,220,7,0,0 // vbroadcastss 0x7dc(%rip),%ymm1 # 6c24 <_sk_callback_avx+0x4e6> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,210,7,0,0 // vbroadcastss 0x7d2(%rip),%ymm8 # 6c68 <_sk_callback_avx+0x4ea> + .byte 196,98,125,24,5,210,7,0,0 // vbroadcastss 0x7d2(%rip),%ymm8 # 6c28 <_sk_callback_avx+0x4ea> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -21333,7 +21271,7 @@ HIDDEN _sk_bilinear_py_avx FUNCTION(_sk_bilinear_py_avx) _sk_bilinear_py_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,186,7,0,0 // vbroadcastss 0x7ba(%rip),%ymm1 # 6c6c <_sk_callback_avx+0x4ee> + .byte 196,226,125,24,13,186,7,0,0 // vbroadcastss 0x7ba(%rip),%ymm1 # 6c2c <_sk_callback_avx+0x4ee> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -21345,14 +21283,14 @@ HIDDEN _sk_bicubic_n3x_avx FUNCTION(_sk_bicubic_n3x_avx) _sk_bicubic_n3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,157,7,0,0 // vbroadcastss 0x79d(%rip),%ymm0 # 6c70 <_sk_callback_avx+0x4f2> + .byte 196,226,125,24,5,157,7,0,0 // vbroadcastss 0x79d(%rip),%ymm0 # 6c30 <_sk_callback_avx+0x4f2> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,148,7,0,0 // vbroadcastss 0x794(%rip),%ymm8 # 6c74 <_sk_callback_avx+0x4f6> + .byte 196,98,125,24,5,148,7,0,0 // vbroadcastss 0x794(%rip),%ymm8 # 6c34 <_sk_callback_avx+0x4f6> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,133,7,0,0 // vbroadcastss 0x785(%rip),%ymm10 # 6c78 <_sk_callback_avx+0x4fa> + .byte 196,98,125,24,21,133,7,0,0 // vbroadcastss 0x785(%rip),%ymm10 # 6c38 <_sk_callback_avx+0x4fa> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,123,7,0,0 // vbroadcastss 0x77b(%rip),%ymm10 # 6c7c <_sk_callback_avx+0x4fe> + .byte 196,98,125,24,21,123,7,0,0 // vbroadcastss 0x77b(%rip),%ymm10 # 6c3c <_sk_callback_avx+0x4fe> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -21364,19 +21302,19 @@ HIDDEN _sk_bicubic_n1x_avx FUNCTION(_sk_bicubic_n1x_avx) _sk_bicubic_n1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,94,7,0,0 // vbroadcastss 0x75e(%rip),%ymm0 # 6c80 <_sk_callback_avx+0x502> + .byte 196,226,125,24,5,94,7,0,0 // vbroadcastss 0x75e(%rip),%ymm0 # 6c40 <_sk_callback_avx+0x502> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 - .byte 196,98,125,24,5,85,7,0,0 // vbroadcastss 0x755(%rip),%ymm8 # 6c84 <_sk_callback_avx+0x506> + .byte 196,98,125,24,5,85,7,0,0 // vbroadcastss 0x755(%rip),%ymm8 # 6c44 <_sk_callback_avx+0x506> .byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,75,7,0,0 // vbroadcastss 0x74b(%rip),%ymm9 # 6c88 <_sk_callback_avx+0x50a> + .byte 196,98,125,24,13,75,7,0,0 // vbroadcastss 0x74b(%rip),%ymm9 # 6c48 <_sk_callback_avx+0x50a> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,65,7,0,0 // vbroadcastss 0x741(%rip),%ymm10 # 6c8c <_sk_callback_avx+0x50e> + .byte 196,98,125,24,21,65,7,0,0 // vbroadcastss 0x741(%rip),%ymm10 # 6c4c <_sk_callback_avx+0x50e> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,50,7,0,0 // vbroadcastss 0x732(%rip),%ymm10 # 6c90 <_sk_callback_avx+0x512> + .byte 196,98,125,24,21,50,7,0,0 // vbroadcastss 0x732(%rip),%ymm10 # 6c50 <_sk_callback_avx+0x512> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,35,7,0,0 // vbroadcastss 0x723(%rip),%ymm9 # 6c94 <_sk_callback_avx+0x516> + .byte 196,98,125,24,13,35,7,0,0 // vbroadcastss 0x723(%rip),%ymm9 # 6c54 <_sk_callback_avx+0x516> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -21387,17 +21325,17 @@ HIDDEN _sk_bicubic_p1x_avx FUNCTION(_sk_bicubic_p1x_avx) _sk_bicubic_p1x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,11,7,0,0 // vbroadcastss 0x70b(%rip),%ymm8 # 6c98 <_sk_callback_avx+0x51a> + .byte 196,98,125,24,5,11,7,0,0 // vbroadcastss 0x70b(%rip),%ymm8 # 6c58 <_sk_callback_avx+0x51a> .byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0 .byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9 - .byte 196,98,125,24,21,253,6,0,0 // vbroadcastss 0x6fd(%rip),%ymm10 # 6c9c <_sk_callback_avx+0x51e> + .byte 196,98,125,24,21,253,6,0,0 // vbroadcastss 0x6fd(%rip),%ymm10 # 6c5c <_sk_callback_avx+0x51e> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm11 # 6ca0 <_sk_callback_avx+0x522> + .byte 196,98,125,24,29,243,6,0,0 // vbroadcastss 0x6f3(%rip),%ymm11 # 6c60 <_sk_callback_avx+0x522> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm9 # 6ca4 <_sk_callback_avx+0x526> + .byte 196,98,125,24,13,218,6,0,0 // vbroadcastss 0x6da(%rip),%ymm9 # 6c64 <_sk_callback_avx+0x526> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -21408,13 +21346,13 @@ HIDDEN _sk_bicubic_p3x_avx FUNCTION(_sk_bicubic_p3x_avx) _sk_bicubic_p3x_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,5,194,6,0,0 // vbroadcastss 0x6c2(%rip),%ymm0 # 6ca8 <_sk_callback_avx+0x52a> + .byte 196,226,125,24,5,194,6,0,0 // vbroadcastss 0x6c2(%rip),%ymm0 # 6c68 <_sk_callback_avx+0x52a> .byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0 .byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,175,6,0,0 // vbroadcastss 0x6af(%rip),%ymm10 # 6cac <_sk_callback_avx+0x52e> + .byte 196,98,125,24,21,175,6,0,0 // vbroadcastss 0x6af(%rip),%ymm10 # 6c6c <_sk_callback_avx+0x52e> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,165,6,0,0 // vbroadcastss 0x6a5(%rip),%ymm10 # 6cb0 <_sk_callback_avx+0x532> + .byte 196,98,125,24,21,165,6,0,0 // vbroadcastss 0x6a5(%rip),%ymm10 # 6c70 <_sk_callback_avx+0x532> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax) @@ -21426,14 +21364,14 @@ HIDDEN _sk_bicubic_n3y_avx FUNCTION(_sk_bicubic_n3y_avx) _sk_bicubic_n3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,136,6,0,0 // vbroadcastss 0x688(%rip),%ymm1 # 6cb4 <_sk_callback_avx+0x536> + .byte 196,226,125,24,13,136,6,0,0 // vbroadcastss 0x688(%rip),%ymm1 # 6c74 <_sk_callback_avx+0x536> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,126,6,0,0 // vbroadcastss 0x67e(%rip),%ymm8 # 6cb8 <_sk_callback_avx+0x53a> + .byte 196,98,125,24,5,126,6,0,0 // vbroadcastss 0x67e(%rip),%ymm8 # 6c78 <_sk_callback_avx+0x53a> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,111,6,0,0 // vbroadcastss 0x66f(%rip),%ymm10 # 6cbc <_sk_callback_avx+0x53e> + .byte 196,98,125,24,21,111,6,0,0 // vbroadcastss 0x66f(%rip),%ymm10 # 6c7c <_sk_callback_avx+0x53e> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,101,6,0,0 // vbroadcastss 0x665(%rip),%ymm10 # 6cc0 <_sk_callback_avx+0x542> + .byte 196,98,125,24,21,101,6,0,0 // vbroadcastss 0x665(%rip),%ymm10 # 6c80 <_sk_callback_avx+0x542> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -21445,19 +21383,19 @@ HIDDEN _sk_bicubic_n1y_avx FUNCTION(_sk_bicubic_n1y_avx) _sk_bicubic_n1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,72,6,0,0 // vbroadcastss 0x648(%rip),%ymm1 # 6cc4 <_sk_callback_avx+0x546> + .byte 196,226,125,24,13,72,6,0,0 // vbroadcastss 0x648(%rip),%ymm1 # 6c84 <_sk_callback_avx+0x546> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 - .byte 196,98,125,24,5,62,6,0,0 // vbroadcastss 0x63e(%rip),%ymm8 # 6cc8 <_sk_callback_avx+0x54a> + .byte 196,98,125,24,5,62,6,0,0 // vbroadcastss 0x63e(%rip),%ymm8 # 6c88 <_sk_callback_avx+0x54a> .byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8 - .byte 196,98,125,24,13,52,6,0,0 // vbroadcastss 0x634(%rip),%ymm9 # 6ccc <_sk_callback_avx+0x54e> + .byte 196,98,125,24,13,52,6,0,0 // vbroadcastss 0x634(%rip),%ymm9 # 6c8c <_sk_callback_avx+0x54e> .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,42,6,0,0 // vbroadcastss 0x62a(%rip),%ymm10 # 6cd0 <_sk_callback_avx+0x552> + .byte 196,98,125,24,21,42,6,0,0 // vbroadcastss 0x62a(%rip),%ymm10 # 6c90 <_sk_callback_avx+0x552> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9 - .byte 196,98,125,24,21,27,6,0,0 // vbroadcastss 0x61b(%rip),%ymm10 # 6cd4 <_sk_callback_avx+0x556> + .byte 196,98,125,24,21,27,6,0,0 // vbroadcastss 0x61b(%rip),%ymm10 # 6c94 <_sk_callback_avx+0x556> .byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9 .byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8 - .byte 196,98,125,24,13,12,6,0,0 // vbroadcastss 0x60c(%rip),%ymm9 # 6cd8 <_sk_callback_avx+0x55a> + .byte 196,98,125,24,13,12,6,0,0 // vbroadcastss 0x60c(%rip),%ymm9 # 6c98 <_sk_callback_avx+0x55a> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -21468,17 +21406,17 @@ HIDDEN _sk_bicubic_p1y_avx FUNCTION(_sk_bicubic_p1y_avx) _sk_bicubic_p1y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,98,125,24,5,244,5,0,0 // vbroadcastss 0x5f4(%rip),%ymm8 # 6cdc <_sk_callback_avx+0x55e> + .byte 196,98,125,24,5,244,5,0,0 // vbroadcastss 0x5f4(%rip),%ymm8 # 6c9c <_sk_callback_avx+0x55e> .byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1 .byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9 - .byte 196,98,125,24,21,229,5,0,0 // vbroadcastss 0x5e5(%rip),%ymm10 # 6ce0 <_sk_callback_avx+0x562> + .byte 196,98,125,24,21,229,5,0,0 // vbroadcastss 0x5e5(%rip),%ymm10 # 6ca0 <_sk_callback_avx+0x562> .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 - .byte 196,98,125,24,29,219,5,0,0 // vbroadcastss 0x5db(%rip),%ymm11 # 6ce4 <_sk_callback_avx+0x566> + .byte 196,98,125,24,29,219,5,0,0 // vbroadcastss 0x5db(%rip),%ymm11 # 6ca4 <_sk_callback_avx+0x566> .byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10 .byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10 .byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 - .byte 196,98,125,24,13,194,5,0,0 // vbroadcastss 0x5c2(%rip),%ymm9 # 6ce8 <_sk_callback_avx+0x56a> + .byte 196,98,125,24,13,194,5,0,0 // vbroadcastss 0x5c2(%rip),%ymm9 # 6ca8 <_sk_callback_avx+0x56a> .byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -21489,13 +21427,13 @@ HIDDEN _sk_bicubic_p3y_avx FUNCTION(_sk_bicubic_p3y_avx) _sk_bicubic_p3y_avx: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,24,13,170,5,0,0 // vbroadcastss 0x5aa(%rip),%ymm1 # 6cec <_sk_callback_avx+0x56e> + .byte 196,226,125,24,13,170,5,0,0 // vbroadcastss 0x5aa(%rip),%ymm1 # 6cac <_sk_callback_avx+0x56e> .byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1 .byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8 .byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9 - .byte 196,98,125,24,21,150,5,0,0 // vbroadcastss 0x596(%rip),%ymm10 # 6cf0 <_sk_callback_avx+0x572> + .byte 196,98,125,24,21,150,5,0,0 // vbroadcastss 0x596(%rip),%ymm10 # 6cb0 <_sk_callback_avx+0x572> .byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8 - .byte 196,98,125,24,21,140,5,0,0 // vbroadcastss 0x58c(%rip),%ymm10 # 6cf4 <_sk_callback_avx+0x576> + .byte 196,98,125,24,21,140,5,0,0 // vbroadcastss 0x58c(%rip),%ymm10 # 6cb4 <_sk_callback_avx+0x576> .byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8 .byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8 .byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax) @@ -21625,25 +21563,25 @@ BALIGN4 .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 6971 <.literal4+0xb1> + .byte 71,225,61 // rex.RXB loope 6931 <.literal4+0xb1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 6981 <.literal4+0xc1> + .byte 71,225,61 // rex.RXB loope 6941 <.literal4+0xc1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 6991 <.literal4+0xd1> + .byte 71,225,61 // rex.RXB loope 6951 <.literal4+0xd1> .byte 0,0 // add %al,(%rax) .byte 128,63,154 // cmpb $0x9a,(%rdi) .byte 153 // cltd .byte 153 // cltd .byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax - .byte 71,225,61 // rex.RXB loope 69a1 <.literal4+0xe1> + .byte 71,225,61 // rex.RXB loope 6961 <.literal4+0xe1> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) @@ -21695,7 +21633,7 @@ BALIGN4 .byte 190,129,128,128,59 // mov $0x3b808081,%esi .byte 129,128,128,59,0,248,0,0,8,33 // addl $0x21080000,-0x7ffc480(%rax) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 69f5 <.literal4+0x135> + .byte 224,7 // loopne 69b5 <.literal4+0x135> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -21711,10 +21649,10 @@ BALIGN4 .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) .byte 0,52,255 // add %dh,(%rdi,%rdi,8) .byte 255 // (bad) - .byte 127,0 // jg 6a1c <.literal4+0x15c> + .byte 127,0 // jg 69dc <.literal4+0x15c> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6a95 <.literal4+0x1d5> + .byte 119,115 // ja 6a55 <.literal4+0x1d5> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -21728,10 +21666,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 6a50 <.literal4+0x190> + .byte 127,0 // jg 6a10 <.literal4+0x190> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6ac9 <.literal4+0x209> + .byte 119,115 // ja 6a89 <.literal4+0x209> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -21745,10 +21683,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 6a84 <.literal4+0x1c4> + .byte 127,0 // jg 6a44 <.literal4+0x1c4> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6afd <.literal4+0x23d> + .byte 119,115 // ja 6abd <.literal4+0x23d> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -21762,10 +21700,10 @@ BALIGN4 .byte 0,128,63,0,0,0 // add %al,0x3f(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 6ab8 <.literal4+0x1f8> + .byte 127,0 // jg 6a78 <.literal4+0x1f8> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 6b31 <.literal4+0x271> + .byte 119,115 // ja 6af1 <.literal4+0x271> .byte 248 // clc .byte 194,117,191 // retq $0xbf75 .byte 191,63,249,68,180 // mov $0xb444f93f,%edi @@ -21778,7 +21716,7 @@ BALIGN4 .byte 0,75,0 // add %cl,0x0(%rbx) .byte 0,128,63,0,0,200 // add %al,-0x37ffffc1(%rax) .byte 66,0,0 // rex.X add %al,(%rax) - .byte 127,67 // jg 6b2f <.literal4+0x26f> + .byte 127,67 // jg 6aef <.literal4+0x26f> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -21790,10 +21728,10 @@ BALIGN4 .byte 190,80,128,3,62 // mov $0x3e038050,%esi .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 6b4f <.literal4+0x28f> + .byte 118,63 // jbe 6b0f <.literal4+0x28f> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 6b63 <.literal4+0x2a3> + .byte 127,67 // jg 6b23 <.literal4+0x2a3> .byte 129,128,128,59,0,0,128,63,129,128 // addl $0x80813f80,0x3b80(%rax) .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,128,63,129,128,128 // add %al,-0x7f7f7ec1(%rax) @@ -21802,7 +21740,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6b45 <.literal4+0x285> + .byte 224,7 // loopne 6b05 <.literal4+0x285> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -21814,7 +21752,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6b61 <.literal4+0x2a1> + .byte 224,7 // loopne 6b21 <.literal4+0x2a1> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -21825,7 +21763,7 @@ BALIGN4 .byte 0,0 // add %al,(%rax) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 6bb6 <.literal4+0x2f6> + .byte 124,66 // jl 6b76 <.literal4+0x2f6> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax) @@ -21843,9 +21781,9 @@ BALIGN4 .byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax) .byte 0,0 // add %al,(%rax) .byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax) - .byte 112,65 // jo 6bf9 <.literal4+0x339> + .byte 112,65 // jo 6bb9 <.literal4+0x339> .byte 129,128,128,59,129,128,128,59,0,0 // addl $0x3b80,-0x7f7ec480(%rax) - .byte 127,67 // jg 6c07 <.literal4+0x347> + .byte 127,67 // jg 6bc7 <.literal4+0x347> .byte 0,128,0,0,0,0 // add %al,0x0(%rax) .byte 0,128,0,4,0,128 // add %al,-0x7ffffc00(%rax) .byte 0,0 // add %al,(%rax) @@ -21861,7 +21799,7 @@ BALIGN4 .byte 0,128,55,0,0,128 // add %al,-0x7fffffc9(%rax) .byte 63 // (bad) .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 6c47 <.literal4+0x387> + .byte 127,71 // jg 6c07 <.literal4+0x387> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -22186,9 +22124,9 @@ _sk_start_pipeline_sse41: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 80 // push %rax - .byte 77,137,199 // mov %r8,%r15 + .byte 77,137,196 // mov %r8,%r12 .byte 73,137,208 // mov %rdx,%r8 - .byte 73,137,244 // mov %rsi,%r12 + .byte 73,137,247 // mov %rsi,%r15 .byte 72,137,251 // mov %rdi,%rbx .byte 72,137,206 // mov %rcx,%rsi .byte 72,173 // lods %ds:(%rsi),%rax @@ -22197,21 +22135,13 @@ _sk_start_pipeline_sse41: .byte 76,57,193 // cmp %r8,%rcx .byte 118,5 // jbe 30 <_sk_start_pipeline_sse41+0x30> .byte 72,137,218 // mov %rbx,%rdx - .byte 235,75 // jmp 7b <_sk_start_pipeline_sse41+0x7b> + .byte 235,48 // jmp 60 <_sk_start_pipeline_sse41+0x60> .byte 76,137,69,208 // mov %r8,-0x30(%rbp) - .byte 65,184,0,0,0,0 // mov $0x0,%r8d - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,87,201 // xorps %xmm1,%xmm1 - .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 15,87,228 // xorps %xmm4,%xmm4 - .byte 15,87,237 // xorps %xmm5,%xmm5 - .byte 15,87,246 // xorps %xmm6,%xmm6 - .byte 15,87,255 // xorps %xmm7,%xmm7 - .byte 76,137,255 // mov %r15,%rdi + .byte 69,49,192 // xor %r8d,%r8d + .byte 76,137,231 // mov %r12,%rdi .byte 76,137,238 // mov %r13,%rsi .byte 72,137,218 // mov %rbx,%rdx - .byte 76,137,225 // mov %r12,%rcx + .byte 76,137,249 // mov %r15,%rcx .byte 73,137,198 // mov %rax,%r14 .byte 65,255,214 // callq *%r14 .byte 76,139,69,208 // mov -0x30(%rbp),%r8 @@ -22220,20 +22150,12 @@ _sk_start_pipeline_sse41: .byte 72,131,195,8 // add $0x8,%rbx .byte 76,57,195 // cmp %r8,%rbx .byte 72,137,211 // mov %rdx,%rbx - .byte 118,185 // jbe 34 <_sk_start_pipeline_sse41+0x34> + .byte 118,212 // jbe 34 <_sk_start_pipeline_sse41+0x34> .byte 73,41,208 // sub %rdx,%r8 - .byte 116,49 // je b1 <_sk_start_pipeline_sse41+0xb1> - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,87,201 // xorps %xmm1,%xmm1 - .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 15,87,228 // xorps %xmm4,%xmm4 - .byte 15,87,237 // xorps %xmm5,%xmm5 - .byte 15,87,246 // xorps %xmm6,%xmm6 - .byte 15,87,255 // xorps %xmm7,%xmm7 - .byte 76,137,255 // mov %r15,%rdi + .byte 116,25 // je 7e <_sk_start_pipeline_sse41+0x7e> + .byte 76,137,231 // mov %r12,%rdi .byte 76,137,238 // mov %r13,%rsi - .byte 76,137,225 // mov %r12,%rcx + .byte 76,137,249 // mov %r15,%rcx .byte 72,131,196,8 // add $0x8,%rsp .byte 91 // pop %rbx .byte 65,92 // pop %r12 @@ -22264,7 +22186,7 @@ _sk_seed_shader_sse41: .byte 102,15,110,194 // movd %edx,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,236,80,0,0 // movaps 0x50ec(%rip),%xmm2 # 51c0 <_sk_callback_sse41+0xfd> + .byte 15,40,21,239,80,0,0 // movaps 0x50ef(%rip),%xmm2 # 5190 <_sk_callback_sse41+0x100> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,7 // movups (%rdi),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -22273,7 +22195,7 @@ _sk_seed_shader_sse41: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,219,80,0,0 // movaps 0x50db(%rip),%xmm2 # 51d0 <_sk_callback_sse41+0x10d> + .byte 15,40,21,222,80,0,0 // movaps 0x50de(%rip),%xmm2 # 51a0 <_sk_callback_sse41+0x110> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -22293,14 +22215,14 @@ _sk_dither_sse41: .byte 102,68,15,110,193 // movd %ecx,%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,169,80,0,0 // movdqa 0x50a9(%rip),%xmm10 # 51e0 <_sk_callback_sse41+0x11d> + .byte 102,68,15,111,21,172,80,0,0 // movdqa 0x50ac(%rip),%xmm10 # 51b0 <_sk_callback_sse41+0x120> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,149,80,0,0 // movdqa 0x5095(%rip),%xmm12 # 51f0 <_sk_callback_sse41+0x12d> - .byte 102,68,15,111,45,156,80,0,0 // movdqa 0x509c(%rip),%xmm13 # 5200 <_sk_callback_sse41+0x13d> + .byte 102,68,15,111,37,152,80,0,0 // movdqa 0x5098(%rip),%xmm12 # 51c0 <_sk_callback_sse41+0x130> + .byte 102,68,15,111,45,159,80,0,0 // movdqa 0x509f(%rip),%xmm13 # 51d0 <_sk_callback_sse41+0x140> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -22316,8 +22238,8 @@ _sk_dither_sse41: .byte 102,69,15,235,245 // por %xmm13,%xmm14 .byte 102,69,15,235,240 // por %xmm8,%xmm14 .byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8 - .byte 68,15,89,5,87,80,0,0 // mulps 0x5057(%rip),%xmm8 # 5210 <_sk_callback_sse41+0x14d> - .byte 68,15,88,5,95,80,0,0 // addps 0x505f(%rip),%xmm8 # 5220 <_sk_callback_sse41+0x15d> + .byte 68,15,89,5,90,80,0,0 // mulps 0x505a(%rip),%xmm8 # 51e0 <_sk_callback_sse41+0x150> + .byte 68,15,88,5,98,80,0,0 // addps 0x5062(%rip),%xmm8 # 51f0 <_sk_callback_sse41+0x160> .byte 243,68,15,16,16 // movss (%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -22394,7 +22316,7 @@ HIDDEN _sk_srcatop_sse41 FUNCTION(_sk_srcatop_sse41) _sk_srcatop_sse41: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,185,79,0,0 // movaps 0x4fb9(%rip),%xmm8 # 5230 <_sk_callback_sse41+0x16d> + .byte 68,15,40,5,188,79,0,0 // movaps 0x4fbc(%rip),%xmm8 # 5200 <_sk_callback_sse41+0x170> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -22419,7 +22341,7 @@ FUNCTION(_sk_dstatop_sse41) _sk_dstatop_sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,124,79,0,0 // movaps 0x4f7c(%rip),%xmm9 # 5240 <_sk_callback_sse41+0x17d> + .byte 68,15,40,13,127,79,0,0 // movaps 0x4f7f(%rip),%xmm9 # 5210 <_sk_callback_sse41+0x180> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -22466,7 +22388,7 @@ HIDDEN _sk_srcout_sse41 .globl _sk_srcout_sse41 FUNCTION(_sk_srcout_sse41) _sk_srcout_sse41: - .byte 68,15,40,5,32,79,0,0 // movaps 0x4f20(%rip),%xmm8 # 5250 <_sk_callback_sse41+0x18d> + .byte 68,15,40,5,35,79,0,0 // movaps 0x4f23(%rip),%xmm8 # 5220 <_sk_callback_sse41+0x190> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -22479,7 +22401,7 @@ HIDDEN _sk_dstout_sse41 .globl _sk_dstout_sse41 FUNCTION(_sk_dstout_sse41) _sk_dstout_sse41: - .byte 68,15,40,5,16,79,0,0 // movaps 0x4f10(%rip),%xmm8 # 5260 <_sk_callback_sse41+0x19d> + .byte 68,15,40,5,19,79,0,0 // movaps 0x4f13(%rip),%xmm8 # 5230 <_sk_callback_sse41+0x1a0> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -22496,7 +22418,7 @@ HIDDEN _sk_srcover_sse41 .globl _sk_srcover_sse41 FUNCTION(_sk_srcover_sse41) _sk_srcover_sse41: - .byte 68,15,40,5,243,78,0,0 // movaps 0x4ef3(%rip),%xmm8 # 5270 <_sk_callback_sse41+0x1ad> + .byte 68,15,40,5,246,78,0,0 // movaps 0x4ef6(%rip),%xmm8 # 5240 <_sk_callback_sse41+0x1b0> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -22516,7 +22438,7 @@ HIDDEN _sk_dstover_sse41 .globl _sk_dstover_sse41 FUNCTION(_sk_dstover_sse41) _sk_dstover_sse41: - .byte 68,15,40,5,199,78,0,0 // movaps 0x4ec7(%rip),%xmm8 # 5280 <_sk_callback_sse41+0x1bd> + .byte 68,15,40,5,202,78,0,0 // movaps 0x4eca(%rip),%xmm8 # 5250 <_sk_callback_sse41+0x1c0> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -22544,7 +22466,7 @@ HIDDEN _sk_multiply_sse41 .globl _sk_multiply_sse41 FUNCTION(_sk_multiply_sse41) _sk_multiply_sse41: - .byte 68,15,40,5,155,78,0,0 // movaps 0x4e9b(%rip),%xmm8 # 5290 <_sk_callback_sse41+0x1cd> + .byte 68,15,40,5,158,78,0,0 // movaps 0x4e9e(%rip),%xmm8 # 5260 <_sk_callback_sse41+0x1d0> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -22619,7 +22541,7 @@ HIDDEN _sk_xor__sse41 FUNCTION(_sk_xor__sse41) _sk_xor__sse41: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,208,77,0,0 // movaps 0x4dd0(%rip),%xmm3 # 52a0 <_sk_callback_sse41+0x1dd> + .byte 15,40,29,211,77,0,0 // movaps 0x4dd3(%rip),%xmm3 # 5270 <_sk_callback_sse41+0x1e0> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -22667,7 +22589,7 @@ _sk_darken_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,59,77,0,0 // movaps 0x4d3b(%rip),%xmm2 # 52b0 <_sk_callback_sse41+0x1ed> + .byte 15,40,21,62,77,0,0 // movaps 0x4d3e(%rip),%xmm2 # 5280 <_sk_callback_sse41+0x1f0> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -22701,7 +22623,7 @@ _sk_lighten_sse41: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,224,76,0,0 // movaps 0x4ce0(%rip),%xmm2 # 52c0 <_sk_callback_sse41+0x1fd> + .byte 15,40,21,227,76,0,0 // movaps 0x4ce3(%rip),%xmm2 # 5290 <_sk_callback_sse41+0x200> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -22738,7 +22660,7 @@ _sk_difference_sse41: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,122,76,0,0 // movaps 0x4c7a(%rip),%xmm2 # 52d0 <_sk_callback_sse41+0x20d> + .byte 15,40,21,125,76,0,0 // movaps 0x4c7d(%rip),%xmm2 # 52a0 <_sk_callback_sse41+0x210> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -22766,7 +22688,7 @@ _sk_exclusion_sse41: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,58,76,0,0 // movaps 0x4c3a(%rip),%xmm2 # 52e0 <_sk_callback_sse41+0x21d> + .byte 15,40,21,61,76,0,0 // movaps 0x4c3d(%rip),%xmm2 # 52b0 <_sk_callback_sse41+0x220> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -22779,7 +22701,7 @@ HIDDEN _sk_colorburn_sse41 FUNCTION(_sk_colorburn_sse41) _sk_colorburn_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,45,76,0,0 // movaps 0x4c2d(%rip),%xmm10 # 52f0 <_sk_callback_sse41+0x22d> + .byte 68,15,40,21,48,76,0,0 // movaps 0x4c30(%rip),%xmm10 # 52c0 <_sk_callback_sse41+0x230> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,203 // movaps %xmm11,%xmm9 @@ -22861,7 +22783,7 @@ HIDDEN _sk_colordodge_sse41 FUNCTION(_sk_colordodge_sse41) _sk_colordodge_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,11,75,0,0 // movaps 0x4b0b(%rip),%xmm10 # 5300 <_sk_callback_sse41+0x23d> + .byte 68,15,40,21,14,75,0,0 // movaps 0x4b0e(%rip),%xmm10 # 52d0 <_sk_callback_sse41+0x240> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 @@ -22943,7 +22865,7 @@ _sk_hardlight_sse41: .byte 15,40,244 // movaps %xmm4,%xmm6 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,228,73,0,0 // movaps 0x49e4(%rip),%xmm10 # 5310 <_sk_callback_sse41+0x24d> + .byte 68,15,40,21,231,73,0,0 // movaps 0x49e7(%rip),%xmm10 # 52e0 <_sk_callback_sse41+0x250> .byte 65,15,40,234 // movaps %xmm10,%xmm5 .byte 15,92,239 // subps %xmm7,%xmm5 .byte 15,40,197 // movaps %xmm5,%xmm0 @@ -23026,7 +22948,7 @@ FUNCTION(_sk_overlay_sse41) _sk_overlay_sse41: .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,40,240 // movaps %xmm0,%xmm14 - .byte 68,15,40,21,201,72,0,0 // movaps 0x48c9(%rip),%xmm10 # 5320 <_sk_callback_sse41+0x25d> + .byte 68,15,40,21,204,72,0,0 // movaps 0x48cc(%rip),%xmm10 # 52f0 <_sk_callback_sse41+0x260> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 65,15,40,195 // movaps %xmm11,%xmm0 @@ -23111,7 +23033,7 @@ _sk_softlight_sse41: .byte 15,40,198 // movaps %xmm6,%xmm0 .byte 15,94,199 // divps %xmm7,%xmm0 .byte 65,15,84,193 // andps %xmm9,%xmm0 - .byte 15,40,13,160,71,0,0 // movaps 0x47a0(%rip),%xmm1 # 5330 <_sk_callback_sse41+0x26d> + .byte 15,40,13,163,71,0,0 // movaps 0x47a3(%rip),%xmm1 # 5300 <_sk_callback_sse41+0x270> .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 68,15,40,240 // movaps %xmm0,%xmm14 @@ -23124,10 +23046,10 @@ _sk_softlight_sse41: .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,89,210 // mulps %xmm2,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,40,45,126,71,0,0 // movaps 0x477e(%rip),%xmm13 # 5340 <_sk_callback_sse41+0x27d> + .byte 68,15,40,45,129,71,0,0 // movaps 0x4781(%rip),%xmm13 # 5310 <_sk_callback_sse41+0x280> .byte 69,15,88,245 // addps %xmm13,%xmm14 .byte 68,15,89,242 // mulps %xmm2,%xmm14 - .byte 68,15,40,37,126,71,0,0 // movaps 0x477e(%rip),%xmm12 # 5350 <_sk_callback_sse41+0x28d> + .byte 68,15,40,37,129,71,0,0 // movaps 0x4781(%rip),%xmm12 # 5320 <_sk_callback_sse41+0x290> .byte 69,15,89,252 // mulps %xmm12,%xmm15 .byte 69,15,88,254 // addps %xmm14,%xmm15 .byte 15,40,198 // movaps %xmm6,%xmm0 @@ -23313,12 +23235,12 @@ _sk_hue_sse41: .byte 68,15,84,208 // andps %xmm0,%xmm10 .byte 15,84,200 // andps %xmm0,%xmm1 .byte 68,15,84,232 // andps %xmm0,%xmm13 - .byte 15,40,5,233,68,0,0 // movaps 0x44e9(%rip),%xmm0 # 5360 <_sk_callback_sse41+0x29d> + .byte 15,40,5,236,68,0,0 // movaps 0x44ec(%rip),%xmm0 # 5330 <_sk_callback_sse41+0x2a0> .byte 68,15,89,224 // mulps %xmm0,%xmm12 - .byte 15,40,21,238,68,0,0 // movaps 0x44ee(%rip),%xmm2 # 5370 <_sk_callback_sse41+0x2ad> + .byte 15,40,21,241,68,0,0 // movaps 0x44f1(%rip),%xmm2 # 5340 <_sk_callback_sse41+0x2b0> .byte 15,89,250 // mulps %xmm2,%xmm7 .byte 65,15,88,252 // addps %xmm12,%xmm7 - .byte 68,15,40,53,239,68,0,0 // movaps 0x44ef(%rip),%xmm14 # 5380 <_sk_callback_sse41+0x2bd> + .byte 68,15,40,53,242,68,0,0 // movaps 0x44f2(%rip),%xmm14 # 5350 <_sk_callback_sse41+0x2c0> .byte 68,15,40,252 // movaps %xmm4,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,255 // addps %xmm7,%xmm15 @@ -23401,7 +23323,7 @@ _sk_hue_sse41: .byte 65,15,88,214 // addps %xmm14,%xmm2 .byte 15,40,196 // movaps %xmm4,%xmm0 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,40,13,179,67,0,0 // movaps 0x43b3(%rip),%xmm9 # 5390 <_sk_callback_sse41+0x2cd> + .byte 68,15,40,13,182,67,0,0 // movaps 0x43b6(%rip),%xmm9 # 5360 <_sk_callback_sse41+0x2d0> .byte 65,15,40,225 // movaps %xmm9,%xmm4 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0 @@ -23495,14 +23417,14 @@ _sk_saturation_sse41: .byte 68,15,84,215 // andps %xmm7,%xmm10 .byte 68,15,84,223 // andps %xmm7,%xmm11 .byte 68,15,84,199 // andps %xmm7,%xmm8 - .byte 15,40,21,109,66,0,0 // movaps 0x426d(%rip),%xmm2 # 53a0 <_sk_callback_sse41+0x2dd> + .byte 15,40,21,112,66,0,0 // movaps 0x4270(%rip),%xmm2 # 5370 <_sk_callback_sse41+0x2e0> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,218 // mulps %xmm2,%xmm3 - .byte 15,40,13,112,66,0,0 // movaps 0x4270(%rip),%xmm1 # 53b0 <_sk_callback_sse41+0x2ed> + .byte 15,40,13,115,66,0,0 // movaps 0x4273(%rip),%xmm1 # 5380 <_sk_callback_sse41+0x2f0> .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,89,249 // mulps %xmm1,%xmm7 .byte 15,88,251 // addps %xmm3,%xmm7 - .byte 68,15,40,45,111,66,0,0 // movaps 0x426f(%rip),%xmm13 # 53c0 <_sk_callback_sse41+0x2fd> + .byte 68,15,40,45,114,66,0,0 // movaps 0x4272(%rip),%xmm13 # 5390 <_sk_callback_sse41+0x300> .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 68,15,88,247 // addps %xmm7,%xmm14 .byte 65,15,40,218 // movaps %xmm10,%xmm3 @@ -23583,7 +23505,7 @@ _sk_saturation_sse41: .byte 65,15,88,253 // addps %xmm13,%xmm7 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11 - .byte 68,15,40,13,53,65,0,0 // movaps 0x4135(%rip),%xmm9 # 53d0 <_sk_callback_sse41+0x30d> + .byte 68,15,40,13,56,65,0,0 // movaps 0x4138(%rip),%xmm9 # 53a0 <_sk_callback_sse41+0x310> .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 68,15,92,204 // subps %xmm4,%xmm9 .byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7 @@ -23638,14 +23560,14 @@ _sk_color_sse41: .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 68,15,89,244 // mulps %xmm4,%xmm14 .byte 15,89,204 // mulps %xmm4,%xmm1 - .byte 68,15,40,13,128,64,0,0 // movaps 0x4080(%rip),%xmm9 # 53e0 <_sk_callback_sse41+0x31d> + .byte 68,15,40,13,131,64,0,0 // movaps 0x4083(%rip),%xmm9 # 53b0 <_sk_callback_sse41+0x320> .byte 65,15,40,250 // movaps %xmm10,%xmm7 .byte 65,15,89,249 // mulps %xmm9,%xmm7 - .byte 68,15,40,21,128,64,0,0 // movaps 0x4080(%rip),%xmm10 # 53f0 <_sk_callback_sse41+0x32d> + .byte 68,15,40,21,131,64,0,0 // movaps 0x4083(%rip),%xmm10 # 53c0 <_sk_callback_sse41+0x330> .byte 65,15,40,219 // movaps %xmm11,%xmm3 .byte 65,15,89,218 // mulps %xmm10,%xmm3 .byte 15,88,223 // addps %xmm7,%xmm3 - .byte 68,15,40,29,125,64,0,0 // movaps 0x407d(%rip),%xmm11 # 5400 <_sk_callback_sse41+0x33d> + .byte 68,15,40,29,128,64,0,0 // movaps 0x4080(%rip),%xmm11 # 53d0 <_sk_callback_sse41+0x340> .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 @@ -23730,7 +23652,7 @@ _sk_color_sse41: .byte 65,15,88,251 // addps %xmm11,%xmm7 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1 - .byte 68,15,40,13,57,63,0,0 // movaps 0x3f39(%rip),%xmm9 # 5410 <_sk_callback_sse41+0x34d> + .byte 68,15,40,13,60,63,0,0 // movaps 0x3f3c(%rip),%xmm9 # 53e0 <_sk_callback_sse41+0x350> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,92,196 // subps %xmm4,%xmm0 .byte 68,15,89,192 // mulps %xmm0,%xmm8 @@ -23782,13 +23704,13 @@ _sk_luminosity_sse41: .byte 69,15,89,216 // mulps %xmm8,%xmm11 .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,89,205 // mulps %xmm5,%xmm9 - .byte 68,15,40,5,145,62,0,0 // movaps 0x3e91(%rip),%xmm8 # 5420 <_sk_callback_sse41+0x35d> + .byte 68,15,40,5,148,62,0,0 // movaps 0x3e94(%rip),%xmm8 # 53f0 <_sk_callback_sse41+0x360> .byte 65,15,89,192 // mulps %xmm8,%xmm0 - .byte 68,15,40,21,149,62,0,0 // movaps 0x3e95(%rip),%xmm10 # 5430 <_sk_callback_sse41+0x36d> + .byte 68,15,40,21,152,62,0,0 // movaps 0x3e98(%rip),%xmm10 # 5400 <_sk_callback_sse41+0x370> .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 65,15,89,234 // mulps %xmm10,%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 68,15,40,37,147,62,0,0 // movaps 0x3e93(%rip),%xmm12 # 5440 <_sk_callback_sse41+0x37d> + .byte 68,15,40,37,150,62,0,0 // movaps 0x3e96(%rip),%xmm12 # 5410 <_sk_callback_sse41+0x380> .byte 68,15,40,242 // movaps %xmm2,%xmm14 .byte 69,15,89,244 // mulps %xmm12,%xmm14 .byte 68,15,88,245 // addps %xmm5,%xmm14 @@ -23873,7 +23795,7 @@ _sk_luminosity_sse41: .byte 65,15,88,244 // addps %xmm12,%xmm6 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9 - .byte 15,40,5,73,61,0,0 // movaps 0x3d49(%rip),%xmm0 # 5450 <_sk_callback_sse41+0x38d> + .byte 15,40,5,76,61,0,0 // movaps 0x3d4c(%rip),%xmm0 # 5420 <_sk_callback_sse41+0x390> .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,92,215 // subps %xmm7,%xmm2 .byte 15,89,226 // mulps %xmm2,%xmm4 @@ -23913,23 +23835,23 @@ _sk_srcover_rgba_8888_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,217,0,0,0 // jne 185b <_sk_srcover_rgba_8888_sse41+0xe7> + .byte 15,133,217,0,0,0 // jne 1828 <_sk_srcover_rgba_8888_sse41+0xe7> .byte 243,15,111,60,144 // movdqu (%rax,%rdx,4),%xmm7 .byte 77,133,192 // test %r8,%r8 - .byte 102,15,111,37,206,60,0,0 // movdqa 0x3cce(%rip),%xmm4 # 5460 <_sk_callback_sse41+0x39d> + .byte 102,15,111,37,209,60,0,0 // movdqa 0x3cd1(%rip),%xmm4 # 5430 <_sk_callback_sse41+0x3a0> .byte 102,15,219,231 // pand %xmm7,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 .byte 102,15,111,239 // movdqa %xmm7,%xmm5 - .byte 102,15,56,0,45,202,60,0,0 // pshufb 0x3cca(%rip),%xmm5 # 5470 <_sk_callback_sse41+0x3ad> + .byte 102,15,56,0,45,205,60,0,0 // pshufb 0x3ccd(%rip),%xmm5 # 5440 <_sk_callback_sse41+0x3b0> .byte 15,91,237 // cvtdq2ps %xmm5,%xmm5 .byte 102,15,111,247 // movdqa %xmm7,%xmm6 - .byte 102,15,56,0,53,202,60,0,0 // pshufb 0x3cca(%rip),%xmm6 # 5480 <_sk_callback_sse41+0x3bd> + .byte 102,15,56,0,53,205,60,0,0 // pshufb 0x3ccd(%rip),%xmm6 # 5450 <_sk_callback_sse41+0x3c0> .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 102,15,114,215,24 // psrld $0x18,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 68,15,40,5,199,60,0,0 // movaps 0x3cc7(%rip),%xmm8 # 5490 <_sk_callback_sse41+0x3cd> + .byte 68,15,40,5,202,60,0,0 // movaps 0x3cca(%rip),%xmm8 # 5460 <_sk_callback_sse41+0x3d0> .byte 68,15,92,195 // subps %xmm3,%xmm8 - .byte 68,15,40,37,203,60,0,0 // movaps 0x3ccb(%rip),%xmm12 # 54a0 <_sk_callback_sse41+0x3dd> + .byte 68,15,40,37,206,60,0,0 // movaps 0x3cce(%rip),%xmm12 # 5470 <_sk_callback_sse41+0x3e0> .byte 65,15,89,196 // mulps %xmm12,%xmm0 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -23955,7 +23877,7 @@ _sk_srcover_rgba_8888_sse41: .byte 102,15,114,240,24 // pslld $0x18,%xmm0 .byte 102,15,235,194 // por %xmm2,%xmm0 .byte 102,15,235,193 // por %xmm1,%xmm0 - .byte 117,85 // jne 1897 <_sk_srcover_rgba_8888_sse41+0x123> + .byte 117,85 // jne 1864 <_sk_srcover_rgba_8888_sse41+0x123> .byte 243,15,127,4,144 // movdqu %xmm0,(%rax,%rdx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,193 // movaps %xmm9,%xmm0 @@ -23966,32 +23888,32 @@ _sk_srcover_rgba_8888_sse41: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,87 // je 18bf <_sk_srcover_rgba_8888_sse41+0x14b> + .byte 116,87 // je 188c <_sk_srcover_rgba_8888_sse41+0x14b> .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,21 // je 1887 <_sk_srcover_rgba_8888_sse41+0x113> + .byte 116,21 // je 1854 <_sk_srcover_rgba_8888_sse41+0x113> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 15,133,11,255,255,255 // jne 1787 <_sk_srcover_rgba_8888_sse41+0x13> + .byte 15,133,11,255,255,255 // jne 1754 <_sk_srcover_rgba_8888_sse41+0x13> .byte 102,15,110,100,144,8 // movd 0x8(%rax,%rdx,4),%xmm4 .byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7 .byte 243,15,126,36,144 // movq (%rax,%rdx,4),%xmm4 .byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7 - .byte 233,240,254,255,255 // jmpq 1787 <_sk_srcover_rgba_8888_sse41+0x13> + .byte 233,240,254,255,255 // jmpq 1754 <_sk_srcover_rgba_8888_sse41+0x13> .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,37 // je 18c9 <_sk_srcover_rgba_8888_sse41+0x155> + .byte 116,37 // je 1896 <_sk_srcover_rgba_8888_sse41+0x155> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,14 // je 18b8 <_sk_srcover_rgba_8888_sse41+0x144> + .byte 116,14 // je 1885 <_sk_srcover_rgba_8888_sse41+0x144> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,151 // jne 1847 <_sk_srcover_rgba_8888_sse41+0xd3> + .byte 117,151 // jne 1814 <_sk_srcover_rgba_8888_sse41+0xd3> .byte 102,15,58,22,68,144,8,2 // pextrd $0x2,%xmm0,0x8(%rax,%rdx,4) .byte 102,15,214,4,144 // movq %xmm0,(%rax,%rdx,4) - .byte 235,136 // jmp 1847 <_sk_srcover_rgba_8888_sse41+0xd3> + .byte 235,136 // jmp 1814 <_sk_srcover_rgba_8888_sse41+0xd3> .byte 102,15,110,60,144 // movd (%rax,%rdx,4),%xmm7 - .byte 233,190,254,255,255 // jmpq 1787 <_sk_srcover_rgba_8888_sse41+0x13> + .byte 233,190,254,255,255 // jmpq 1754 <_sk_srcover_rgba_8888_sse41+0x13> .byte 102,15,126,4,144 // movd %xmm0,(%rax,%rdx,4) - .byte 233,116,255,255,255 // jmpq 1847 <_sk_srcover_rgba_8888_sse41+0xd3> + .byte 233,116,255,255,255 // jmpq 1814 <_sk_srcover_rgba_8888_sse41+0xd3> HIDDEN _sk_clamp_0_sse41 .globl _sk_clamp_0_sse41 @@ -24009,7 +23931,7 @@ HIDDEN _sk_clamp_1_sse41 .globl _sk_clamp_1_sse41 FUNCTION(_sk_clamp_1_sse41) _sk_clamp_1_sse41: - .byte 68,15,40,5,189,59,0,0 // movaps 0x3bbd(%rip),%xmm8 # 54b0 <_sk_callback_sse41+0x3ed> + .byte 68,15,40,5,192,59,0,0 // movaps 0x3bc0(%rip),%xmm8 # 5480 <_sk_callback_sse41+0x3f0> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -24021,7 +23943,7 @@ HIDDEN _sk_clamp_a_sse41 .globl _sk_clamp_a_sse41 FUNCTION(_sk_clamp_a_sse41) _sk_clamp_a_sse41: - .byte 15,93,29,178,59,0,0 // minps 0x3bb2(%rip),%xmm3 # 54c0 <_sk_callback_sse41+0x3fd> + .byte 15,93,29,181,59,0,0 // minps 0x3bb5(%rip),%xmm3 # 5490 <_sk_callback_sse41+0x400> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -24108,7 +24030,7 @@ HIDDEN _sk_unpremul_sse41 FUNCTION(_sk_unpremul_sse41) _sk_unpremul_sse41: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,29,59,0,0 // movaps 0x3b1d(%rip),%xmm9 # 54d0 <_sk_callback_sse41+0x40d> + .byte 68,15,40,13,32,59,0,0 // movaps 0x3b20(%rip),%xmm9 # 54a0 <_sk_callback_sse41+0x410> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -24122,20 +24044,20 @@ HIDDEN _sk_from_srgb_sse41 .globl _sk_from_srgb_sse41 FUNCTION(_sk_from_srgb_sse41) _sk_from_srgb_sse41: - .byte 68,15,40,29,8,59,0,0 // movaps 0x3b08(%rip),%xmm11 # 54e0 <_sk_callback_sse41+0x41d> + .byte 68,15,40,29,11,59,0,0 // movaps 0x3b0b(%rip),%xmm11 # 54b0 <_sk_callback_sse41+0x420> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 .byte 68,15,40,208 // movaps %xmm0,%xmm10 .byte 69,15,89,210 // mulps %xmm10,%xmm10 - .byte 68,15,40,37,0,59,0,0 // movaps 0x3b00(%rip),%xmm12 # 54f0 <_sk_callback_sse41+0x42d> + .byte 68,15,40,37,3,59,0,0 // movaps 0x3b03(%rip),%xmm12 # 54c0 <_sk_callback_sse41+0x430> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,0,59,0,0 // movaps 0x3b00(%rip),%xmm13 # 5500 <_sk_callback_sse41+0x43d> + .byte 68,15,40,45,3,59,0,0 // movaps 0x3b03(%rip),%xmm13 # 54d0 <_sk_callback_sse41+0x440> .byte 69,15,88,197 // addps %xmm13,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 - .byte 68,15,40,53,0,59,0,0 // movaps 0x3b00(%rip),%xmm14 # 5510 <_sk_callback_sse41+0x44d> + .byte 68,15,40,53,3,59,0,0 // movaps 0x3b03(%rip),%xmm14 # 54e0 <_sk_callback_sse41+0x450> .byte 69,15,88,198 // addps %xmm14,%xmm8 - .byte 68,15,40,61,4,59,0,0 // movaps 0x3b04(%rip),%xmm15 # 5520 <_sk_callback_sse41+0x45d> + .byte 68,15,40,61,7,59,0,0 // movaps 0x3b07(%rip),%xmm15 # 54f0 <_sk_callback_sse41+0x460> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,40,209 // movaps %xmm1,%xmm10 @@ -24178,22 +24100,22 @@ _sk_to_srgb_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 68,15,82,192 // rsqrtps %xmm0,%xmm8 - .byte 68,15,40,29,124,58,0,0 // movaps 0x3a7c(%rip),%xmm11 # 5530 <_sk_callback_sse41+0x46d> + .byte 68,15,40,29,127,58,0,0 // movaps 0x3a7f(%rip),%xmm11 # 5500 <_sk_callback_sse41+0x470> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 - .byte 68,15,40,37,124,58,0,0 // movaps 0x3a7c(%rip),%xmm12 # 5540 <_sk_callback_sse41+0x47d> + .byte 68,15,40,37,127,58,0,0 // movaps 0x3a7f(%rip),%xmm12 # 5510 <_sk_callback_sse41+0x480> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 69,15,89,252 // mulps %xmm12,%xmm15 - .byte 68,15,40,21,124,58,0,0 // movaps 0x3a7c(%rip),%xmm10 # 5550 <_sk_callback_sse41+0x48d> + .byte 68,15,40,21,127,58,0,0 // movaps 0x3a7f(%rip),%xmm10 # 5520 <_sk_callback_sse41+0x490> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,248 // mulps %xmm8,%xmm15 - .byte 68,15,40,45,124,58,0,0 // movaps 0x3a7c(%rip),%xmm13 # 5560 <_sk_callback_sse41+0x49d> + .byte 68,15,40,45,127,58,0,0 // movaps 0x3a7f(%rip),%xmm13 # 5530 <_sk_callback_sse41+0x4a0> .byte 69,15,88,253 // addps %xmm13,%xmm15 - .byte 68,15,40,53,128,58,0,0 // movaps 0x3a80(%rip),%xmm14 # 5570 <_sk_callback_sse41+0x4ad> + .byte 68,15,40,53,131,58,0,0 // movaps 0x3a83(%rip),%xmm14 # 5540 <_sk_callback_sse41+0x4b0> .byte 69,15,88,198 // addps %xmm14,%xmm8 .byte 69,15,83,192 // rcpps %xmm8,%xmm8 .byte 69,15,89,199 // mulps %xmm15,%xmm8 - .byte 68,15,40,61,124,58,0,0 // movaps 0x3a7c(%rip),%xmm15 # 5580 <_sk_callback_sse41+0x4bd> + .byte 68,15,40,61,127,58,0,0 // movaps 0x3a7f(%rip),%xmm15 # 5550 <_sk_callback_sse41+0x4c0> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 68,15,82,202 // rsqrtps %xmm2,%xmm9 @@ -24246,7 +24168,7 @@ _sk_rgb_to_hsl_sse41: .byte 68,15,93,226 // minps %xmm2,%xmm12 .byte 65,15,40,203 // movaps %xmm11,%xmm1 .byte 65,15,92,204 // subps %xmm12,%xmm1 - .byte 68,15,40,53,201,57,0,0 // movaps 0x39c9(%rip),%xmm14 # 5590 <_sk_callback_sse41+0x4cd> + .byte 68,15,40,53,204,57,0,0 // movaps 0x39cc(%rip),%xmm14 # 5560 <_sk_callback_sse41+0x4d0> .byte 68,15,94,241 // divps %xmm1,%xmm14 .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10 @@ -24255,27 +24177,27 @@ _sk_rgb_to_hsl_sse41: .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15 - .byte 68,15,84,61,176,57,0,0 // andps 0x39b0(%rip),%xmm15 # 55a0 <_sk_callback_sse41+0x4dd> + .byte 68,15,84,61,179,57,0,0 // andps 0x39b3(%rip),%xmm15 # 5570 <_sk_callback_sse41+0x4e0> .byte 68,15,88,248 // addps %xmm0,%xmm15 .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,214 // mulps %xmm14,%xmm2 - .byte 68,15,40,45,163,57,0,0 // movaps 0x39a3(%rip),%xmm13 # 55b0 <_sk_callback_sse41+0x4ed> + .byte 68,15,40,45,166,57,0,0 // movaps 0x39a6(%rip),%xmm13 # 5580 <_sk_callback_sse41+0x4f0> .byte 65,15,88,213 // addps %xmm13,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,198 // mulps %xmm14,%xmm8 - .byte 68,15,88,5,159,57,0,0 // addps 0x399f(%rip),%xmm8 # 55c0 <_sk_callback_sse41+0x4fd> + .byte 68,15,88,5,162,57,0,0 // addps 0x39a2(%rip),%xmm8 # 5590 <_sk_callback_sse41+0x500> .byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8 - .byte 68,15,89,5,151,57,0,0 // mulps 0x3997(%rip),%xmm8 # 55d0 <_sk_callback_sse41+0x50d> + .byte 68,15,89,5,154,57,0,0 // mulps 0x399a(%rip),%xmm8 # 55a0 <_sk_callback_sse41+0x510> .byte 69,15,40,203 // movaps %xmm11,%xmm9 .byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9 .byte 69,15,84,193 // andps %xmm9,%xmm8 .byte 69,15,92,235 // subps %xmm11,%xmm13 .byte 69,15,88,220 // addps %xmm12,%xmm11 - .byte 15,40,5,139,57,0,0 // movaps 0x398b(%rip),%xmm0 # 55e0 <_sk_callback_sse41+0x51d> + .byte 15,40,5,142,57,0,0 // movaps 0x398e(%rip),%xmm0 # 55b0 <_sk_callback_sse41+0x520> .byte 65,15,40,211 // movaps %xmm11,%xmm2 .byte 15,89,208 // mulps %xmm0,%xmm2 .byte 15,194,194,1 // cmpltps %xmm2,%xmm0 @@ -24297,7 +24219,7 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp) .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,208 // movaps %xmm0,%xmm10 - .byte 68,15,40,13,81,57,0,0 // movaps 0x3951(%rip),%xmm9 # 55f0 <_sk_callback_sse41+0x52d> + .byte 68,15,40,13,84,57,0,0 // movaps 0x3954(%rip),%xmm9 # 55c0 <_sk_callback_sse41+0x530> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 15,194,194,2 // cmpleps %xmm2,%xmm0 .byte 15,40,217 // movaps %xmm1,%xmm3 @@ -24310,19 +24232,19 @@ _sk_hsl_to_rgb_sse41: .byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp) .byte 69,15,88,192 // addps %xmm8,%xmm8 .byte 68,15,92,197 // subps %xmm5,%xmm8 - .byte 68,15,40,53,44,57,0,0 // movaps 0x392c(%rip),%xmm14 # 5600 <_sk_callback_sse41+0x53d> + .byte 68,15,40,53,47,57,0,0 // movaps 0x392f(%rip),%xmm14 # 55d0 <_sk_callback_sse41+0x540> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0 .byte 68,15,92,240 // subps %xmm0,%xmm14 - .byte 68,15,40,29,37,57,0,0 // movaps 0x3925(%rip),%xmm11 # 5610 <_sk_callback_sse41+0x54d> + .byte 68,15,40,29,40,57,0,0 // movaps 0x3928(%rip),%xmm11 # 55e0 <_sk_callback_sse41+0x550> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 65,15,92,240 // subps %xmm8,%xmm6 - .byte 15,40,61,30,57,0,0 // movaps 0x391e(%rip),%xmm7 # 5620 <_sk_callback_sse41+0x55d> + .byte 15,40,61,33,57,0,0 // movaps 0x3921(%rip),%xmm7 # 55f0 <_sk_callback_sse41+0x560> .byte 69,15,40,238 // movaps %xmm14,%xmm13 .byte 68,15,89,239 // mulps %xmm7,%xmm13 - .byte 15,40,29,31,57,0,0 // movaps 0x391f(%rip),%xmm3 # 5630 <_sk_callback_sse41+0x56d> + .byte 15,40,29,34,57,0,0 // movaps 0x3922(%rip),%xmm3 # 5600 <_sk_callback_sse41+0x570> .byte 68,15,40,227 // movaps %xmm3,%xmm12 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 68,15,89,230 // mulps %xmm6,%xmm12 @@ -24332,7 +24254,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,40,253 // movaps %xmm5,%xmm15 .byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15 - .byte 68,15,40,37,254,56,0,0 // movaps 0x38fe(%rip),%xmm12 # 5640 <_sk_callback_sse41+0x57d> + .byte 68,15,40,37,1,57,0,0 // movaps 0x3901(%rip),%xmm12 # 5610 <_sk_callback_sse41+0x580> .byte 65,15,40,196 // movaps %xmm12,%xmm0 .byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0 .byte 68,15,89,238 // mulps %xmm6,%xmm13 @@ -24366,7 +24288,7 @@ _sk_hsl_to_rgb_sse41: .byte 65,15,40,198 // movaps %xmm14,%xmm0 .byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2 .byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1 - .byte 68,15,88,21,118,56,0,0 // addps 0x3876(%rip),%xmm10 # 5650 <_sk_callback_sse41+0x58d> + .byte 68,15,88,21,121,56,0,0 // addps 0x3879(%rip),%xmm10 # 5620 <_sk_callback_sse41+0x590> .byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0 .byte 68,15,92,208 // subps %xmm0,%xmm10 .byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11 @@ -24417,11 +24339,11 @@ _sk_scale_u8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,52 // jne 1eb3 <_sk_scale_u8_sse41+0x3e> + .byte 117,52 // jne 1e80 <_sk_scale_u8_sse41+0x3e> .byte 102,69,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm8 - .byte 102,68,15,219,5,209,55,0,0 // pand 0x37d1(%rip),%xmm8 # 5660 <_sk_callback_sse41+0x59d> + .byte 102,68,15,219,5,212,55,0,0 // pand 0x37d4(%rip),%xmm8 # 5630 <_sk_callback_sse41+0x5a0> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,213,55,0,0 // mulps 0x37d5(%rip),%xmm8 # 5670 <_sk_callback_sse41+0x5ad> + .byte 68,15,89,5,216,55,0,0 // mulps 0x37d8(%rip),%xmm8 # 5640 <_sk_callback_sse41+0x5b0> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -24432,12 +24354,12 @@ _sk_scale_u8_sse41: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,59 // je 1efb <_sk_scale_u8_sse41+0x86> + .byte 116,59 // je 1ec8 <_sk_scale_u8_sse41+0x86> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,23 // je 1ee2 <_sk_scale_u8_sse41+0x6d> + .byte 116,23 // je 1eaf <_sk_scale_u8_sse41+0x6d> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,181 // jne 1e86 <_sk_scale_u8_sse41+0x11> + .byte 117,181 // jne 1e53 <_sk_scale_u8_sse41+0x11> .byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8 @@ -24445,10 +24367,10 @@ _sk_scale_u8_sse41: .byte 102,68,15,110,200 // movd %eax,%xmm9 .byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9 .byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8 - .byte 235,139 // jmp 1e86 <_sk_scale_u8_sse41+0x11> + .byte 235,139 // jmp 1e53 <_sk_scale_u8_sse41+0x11> .byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 233,124,255,255,255 // jmpq 1e86 <_sk_scale_u8_sse41+0x11> + .byte 233,124,255,255,255 // jmpq 1e53 <_sk_scale_u8_sse41+0x11> HIDDEN _sk_lerp_1_float_sse41 .globl _sk_lerp_1_float_sse41 @@ -24479,11 +24401,11 @@ _sk_lerp_u8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,72 // jne 1f94 <_sk_lerp_u8_sse41+0x52> + .byte 117,72 // jne 1f61 <_sk_lerp_u8_sse41+0x52> .byte 102,69,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm8 - .byte 102,68,15,219,5,36,55,0,0 // pand 0x3724(%rip),%xmm8 # 5680 <_sk_callback_sse41+0x5bd> + .byte 102,68,15,219,5,39,55,0,0 // pand 0x3727(%rip),%xmm8 # 5650 <_sk_callback_sse41+0x5c0> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,40,55,0,0 // mulps 0x3728(%rip),%xmm8 # 5690 <_sk_callback_sse41+0x5cd> + .byte 68,15,89,5,43,55,0,0 // mulps 0x372b(%rip),%xmm8 # 5660 <_sk_callback_sse41+0x5d0> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -24501,12 +24423,12 @@ _sk_lerp_u8_sse41: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,62 // je 1fdf <_sk_lerp_u8_sse41+0x9d> + .byte 116,62 // je 1fac <_sk_lerp_u8_sse41+0x9d> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,23 // je 1fc3 <_sk_lerp_u8_sse41+0x81> + .byte 116,23 // je 1f90 <_sk_lerp_u8_sse41+0x81> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,161 // jne 1f53 <_sk_lerp_u8_sse41+0x11> + .byte 117,161 // jne 1f20 <_sk_lerp_u8_sse41+0x11> .byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8 @@ -24514,10 +24436,10 @@ _sk_lerp_u8_sse41: .byte 102,68,15,110,200 // movd %eax,%xmm9 .byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9 .byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8 - .byte 233,116,255,255,255 // jmpq 1f53 <_sk_lerp_u8_sse41+0x11> + .byte 233,116,255,255,255 // jmpq 1f20 <_sk_lerp_u8_sse41+0x11> .byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 233,101,255,255,255 // jmpq 1f53 <_sk_lerp_u8_sse41+0x11> + .byte 233,101,255,255,255 // jmpq 1f20 <_sk_lerp_u8_sse41+0x11> HIDDEN _sk_lerp_565_sse41 .globl _sk_lerp_565_sse41 @@ -24526,19 +24448,19 @@ _sk_lerp_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,152,0,0,0 // jne 2094 <_sk_lerp_565_sse41+0xa6> + .byte 15,133,152,0,0,0 // jne 2061 <_sk_lerp_565_sse41+0xa6> .byte 102,69,15,56,51,20,82 // pmovzxwd (%r10,%rdx,2),%xmm10 - .byte 102,68,15,111,5,148,54,0,0 // movdqa 0x3694(%rip),%xmm8 # 56a0 <_sk_callback_sse41+0x5dd> + .byte 102,68,15,111,5,151,54,0,0 // movdqa 0x3697(%rip),%xmm8 # 5670 <_sk_callback_sse41+0x5e0> .byte 102,69,15,219,194 // pand %xmm10,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,147,54,0,0 // mulps 0x3693(%rip),%xmm8 # 56b0 <_sk_callback_sse41+0x5ed> - .byte 102,68,15,111,13,154,54,0,0 // movdqa 0x369a(%rip),%xmm9 # 56c0 <_sk_callback_sse41+0x5fd> + .byte 68,15,89,5,150,54,0,0 // mulps 0x3696(%rip),%xmm8 # 5680 <_sk_callback_sse41+0x5f0> + .byte 102,68,15,111,13,157,54,0,0 // movdqa 0x369d(%rip),%xmm9 # 5690 <_sk_callback_sse41+0x600> .byte 102,69,15,219,202 // pand %xmm10,%xmm9 .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,153,54,0,0 // mulps 0x3699(%rip),%xmm9 # 56d0 <_sk_callback_sse41+0x60d> - .byte 102,68,15,219,21,160,54,0,0 // pand 0x36a0(%rip),%xmm10 # 56e0 <_sk_callback_sse41+0x61d> + .byte 68,15,89,13,156,54,0,0 // mulps 0x369c(%rip),%xmm9 # 56a0 <_sk_callback_sse41+0x610> + .byte 102,68,15,219,21,163,54,0,0 // pand 0x36a3(%rip),%xmm10 # 56b0 <_sk_callback_sse41+0x620> .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,164,54,0,0 // mulps 0x36a4(%rip),%xmm10 # 56f0 <_sk_callback_sse41+0x62d> + .byte 68,15,89,21,167,54,0,0 // mulps 0x36a7(%rip),%xmm10 # 56c0 <_sk_callback_sse41+0x630> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -24563,22 +24485,22 @@ _sk_lerp_565_sse41: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,62 // je 20df <_sk_lerp_565_sse41+0xf1> + .byte 116,62 // je 20ac <_sk_lerp_565_sse41+0xf1> .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,27 // je 20c7 <_sk_lerp_565_sse41+0xd9> + .byte 116,27 // je 2094 <_sk_lerp_565_sse41+0xd9> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 15,133,77,255,255,255 // jne 2003 <_sk_lerp_565_sse41+0x15> + .byte 15,133,77,255,255,255 // jne 1fd0 <_sk_lerp_565_sse41+0x15> .byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10 .byte 102,69,15,110,4,82 // movd (%r10,%rdx,2),%xmm8 .byte 102,69,15,56,51,192 // pmovzxwd %xmm8,%xmm8 .byte 102,69,15,58,14,208,15 // pblendw $0xf,%xmm8,%xmm10 - .byte 233,36,255,255,255 // jmpq 2003 <_sk_lerp_565_sse41+0x15> + .byte 233,36,255,255,255 // jmpq 1fd0 <_sk_lerp_565_sse41+0x15> .byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax .byte 102,68,15,110,208 // movd %eax,%xmm10 - .byte 233,21,255,255,255 // jmpq 2003 <_sk_lerp_565_sse41+0x15> + .byte 233,21,255,255,255 // jmpq 1fd0 <_sk_lerp_565_sse41+0x15> HIDDEN _sk_load_tables_sse41 .globl _sk_load_tables_sse41 @@ -24587,12 +24509,12 @@ _sk_load_tables_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,24,1,0,0 // jne 2214 <_sk_load_tables_sse41+0x126> + .byte 15,133,24,1,0,0 // jne 21e1 <_sk_load_tables_sse41+0x126> .byte 243,69,15,111,4,145 // movdqu (%r9,%rdx,4),%xmm8 .byte 65,87 // push %r15 .byte 65,86 // push %r14 .byte 83 // push %rbx - .byte 102,15,111,5,241,53,0,0 // movdqa 0x35f1(%rip),%xmm0 # 5700 <_sk_callback_sse41+0x63d> + .byte 102,15,111,5,244,53,0,0 // movdqa 0x35f4(%rip),%xmm0 # 56d0 <_sk_callback_sse41+0x640> .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9 .byte 102,73,15,126,194 // movq %xmm0,%r10 @@ -24607,7 +24529,7 @@ _sk_load_tables_sse41: .byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0 .byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0 .byte 102,65,15,111,200 // movdqa %xmm8,%xmm1 - .byte 102,15,56,0,13,172,53,0,0 // pshufb 0x35ac(%rip),%xmm1 # 5710 <_sk_callback_sse41+0x64d> + .byte 102,15,56,0,13,175,53,0,0 // pshufb 0x35af(%rip),%xmm1 # 56e0 <_sk_callback_sse41+0x650> .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,203 // movq %xmm1,%rbx .byte 68,15,182,211 // movzbl %bl,%r10d @@ -24622,7 +24544,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1 .byte 76,139,72,24 // mov 0x18(%rax),%r9 .byte 102,65,15,111,208 // movdqa %xmm8,%xmm2 - .byte 102,15,56,0,21,104,53,0,0 // pshufb 0x3568(%rip),%xmm2 # 5720 <_sk_callback_sse41+0x65d> + .byte 102,15,56,0,21,107,53,0,0 // pshufb 0x356b(%rip),%xmm2 # 56f0 <_sk_callback_sse41+0x660> .byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx .byte 102,72,15,126,208 // movq %xmm2,%rax .byte 68,15,182,208 // movzbl %al,%r10d @@ -24637,7 +24559,7 @@ _sk_load_tables_sse41: .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 102,65,15,114,208,24 // psrld $0x18,%xmm8 .byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3 - .byte 15,89,29,37,53,0,0 // mulps 0x3525(%rip),%xmm3 # 5730 <_sk_callback_sse41+0x66d> + .byte 15,89,29,40,53,0,0 // mulps 0x3528(%rip),%xmm3 # 5700 <_sk_callback_sse41+0x670> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -24646,19 +24568,19 @@ _sk_load_tables_sse41: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,52 // je 2255 <_sk_load_tables_sse41+0x167> + .byte 116,52 // je 2222 <_sk_load_tables_sse41+0x167> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,23 // je 2243 <_sk_load_tables_sse41+0x155> + .byte 116,23 // je 2210 <_sk_load_tables_sse41+0x155> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 15,133,204,254,255,255 // jne 2102 <_sk_load_tables_sse41+0x14> + .byte 15,133,204,254,255,255 // jne 20cf <_sk_load_tables_sse41+0x14> .byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0 .byte 102,68,15,112,192,69 // pshufd $0x45,%xmm0,%xmm8 .byte 243,65,15,126,4,145 // movq (%r9,%rdx,4),%xmm0 .byte 102,68,15,58,14,192,15 // pblendw $0xf,%xmm0,%xmm8 - .byte 233,173,254,255,255 // jmpq 2102 <_sk_load_tables_sse41+0x14> + .byte 233,173,254,255,255 // jmpq 20cf <_sk_load_tables_sse41+0x14> .byte 102,69,15,110,4,145 // movd (%r9,%rdx,4),%xmm8 - .byte 233,162,254,255,255 // jmpq 2102 <_sk_load_tables_sse41+0x14> + .byte 233,162,254,255,255 // jmpq 20cf <_sk_load_tables_sse41+0x14> HIDDEN _sk_load_tables_u16_be_sse41 .globl _sk_load_tables_u16_be_sse41 @@ -24668,7 +24590,7 @@ _sk_load_tables_u16_be_sse41: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,99,1,0,0 // jne 23d9 <_sk_load_tables_u16_be_sse41+0x179> + .byte 15,133,99,1,0,0 // jne 23a6 <_sk_load_tables_u16_be_sse41+0x179> .byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0 .byte 243,67,15,111,76,81,16 // movdqu 0x10(%r9,%r10,2),%xmm1 .byte 65,87 // push %r15 @@ -24680,7 +24602,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,5,147,52,0,0 // movdqa 0x3493(%rip),%xmm8 # 5740 <_sk_callback_sse41+0x67d> + .byte 102,68,15,111,5,150,52,0,0 // movdqa 0x3496(%rip),%xmm8 # 5710 <_sk_callback_sse41+0x680> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -24698,7 +24620,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0 .byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2 .byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0 - .byte 102,15,56,0,13,66,52,0,0 // pshufb 0x3442(%rip),%xmm1 # 5750 <_sk_callback_sse41+0x68d> + .byte 102,15,56,0,13,69,52,0,0 // pshufb 0x3445(%rip),%xmm1 # 5720 <_sk_callback_sse41+0x690> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,203 // movq %xmm1,%rbx @@ -24734,7 +24656,7 @@ _sk_load_tables_u16_be_sse41: .byte 102,65,15,235,216 // por %xmm8,%xmm3 .byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,144,51,0,0 // mulps 0x3390(%rip),%xmm3 # 5760 <_sk_callback_sse41+0x69d> + .byte 15,89,29,147,51,0,0 // mulps 0x3393(%rip),%xmm3 # 5730 <_sk_callback_sse41+0x6a0> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -24742,16 +24664,16 @@ _sk_load_tables_u16_be_sse41: .byte 255,224 // jmpq *%rax .byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 23f2 <_sk_load_tables_u16_be_sse41+0x192> + .byte 117,13 // jne 23bf <_sk_load_tables_u16_be_sse41+0x192> .byte 243,15,126,192 // movq %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,145,254,255,255 // jmpq 2283 <_sk_load_tables_u16_be_sse41+0x23> + .byte 233,145,254,255,255 // jmpq 2250 <_sk_load_tables_u16_be_sse41+0x23> .byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,124,254,255,255 // jb 2283 <_sk_load_tables_u16_be_sse41+0x23> + .byte 15,130,124,254,255,255 // jb 2250 <_sk_load_tables_u16_be_sse41+0x23> .byte 243,67,15,126,76,81,16 // movq 0x10(%r9,%r10,2),%xmm1 - .byte 233,112,254,255,255 // jmpq 2283 <_sk_load_tables_u16_be_sse41+0x23> + .byte 233,112,254,255,255 // jmpq 2250 <_sk_load_tables_u16_be_sse41+0x23> HIDDEN _sk_load_tables_rgb_u16_be_sse41 .globl _sk_load_tables_rgb_u16_be_sse41 @@ -24761,7 +24683,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,83,1,0,0 // jne 2578 <_sk_load_tables_rgb_u16_be_sse41+0x165> + .byte 15,133,83,1,0,0 // jne 2545 <_sk_load_tables_rgb_u16_be_sse41+0x165> .byte 243,67,15,111,20,81 // movdqu (%r9,%r10,2),%xmm2 .byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1 .byte 102,15,115,217,4 // psrldq $0x4,%xmm1 @@ -24776,7 +24698,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 .byte 102,15,111,202 // movdqa %xmm2,%xmm1 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 - .byte 102,68,15,111,5,5,51,0,0 // movdqa 0x3305(%rip),%xmm8 # 5770 <_sk_callback_sse41+0x6ad> + .byte 102,68,15,111,5,8,51,0,0 // movdqa 0x3308(%rip),%xmm8 # 5740 <_sk_callback_sse41+0x6b0> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 @@ -24794,7 +24716,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0 .byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3 .byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0 - .byte 102,15,56,0,13,180,50,0,0 // pshufb 0x32b4(%rip),%xmm1 # 5780 <_sk_callback_sse41+0x6bd> + .byte 102,15,56,0,13,183,50,0,0 // pshufb 0x32b7(%rip),%xmm1 # 5750 <_sk_callback_sse41+0x6c0> .byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1 .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 102,72,15,126,203 // movq %xmm1,%rbx @@ -24825,7 +24747,7 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3 .byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,31,50,0,0 // movaps 0x321f(%rip),%xmm3 # 5790 <_sk_callback_sse41+0x6cd> + .byte 15,40,29,34,50,0,0 // movaps 0x3222(%rip),%xmm3 # 5760 <_sk_callback_sse41+0x6d0> .byte 91 // pop %rbx .byte 65,94 // pop %r14 .byte 65,95 // pop %r15 @@ -24834,21 +24756,21 @@ _sk_load_tables_rgb_u16_be_sse41: .byte 102,67,15,196,84,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,14 // jne 259e <_sk_load_tables_rgb_u16_be_sse41+0x18b> + .byte 117,14 // jne 256b <_sk_load_tables_rgb_u16_be_sse41+0x18b> .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 - .byte 233,173,254,255,255 // jmpq 244b <_sk_load_tables_rgb_u16_be_sse41+0x38> + .byte 233,173,254,255,255 // jmpq 2418 <_sk_load_tables_rgb_u16_be_sse41+0x38> .byte 102,71,15,110,76,81,6 // movd 0x6(%r9,%r10,2),%xmm9 .byte 102,71,15,196,76,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm9 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,24 // jb 25cf <_sk_load_tables_rgb_u16_be_sse41+0x1bc> + .byte 114,24 // jb 259c <_sk_load_tables_rgb_u16_be_sse41+0x1bc> .byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1 .byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,124,254,255,255 // jmpq 244b <_sk_load_tables_rgb_u16_be_sse41+0x38> + .byte 233,124,254,255,255 // jmpq 2418 <_sk_load_tables_rgb_u16_be_sse41+0x38> .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,115,254,255,255 // jmpq 244b <_sk_load_tables_rgb_u16_be_sse41+0x38> + .byte 233,115,254,255,255 // jmpq 2418 <_sk_load_tables_rgb_u16_be_sse41+0x38> HIDDEN _sk_byte_tables_sse41 .globl _sk_byte_tables_sse41 @@ -24859,7 +24781,7 @@ _sk_byte_tables_sse41: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,183,49,0,0 // movaps 0x31b7(%rip),%xmm8 # 57a0 <_sk_callback_sse41+0x6dd> + .byte 68,15,40,5,186,49,0,0 // movaps 0x31ba(%rip),%xmm8 # 5770 <_sk_callback_sse41+0x6e0> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9 @@ -24878,7 +24800,7 @@ _sk_byte_tables_sse41: .byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,104,49,0,0 // movaps 0x3168(%rip),%xmm9 # 57b0 <_sk_callback_sse41+0x6ed> + .byte 68,15,40,13,107,49,0,0 // movaps 0x316b(%rip),%xmm9 # 5780 <_sk_callback_sse41+0x6f0> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -24974,7 +24896,7 @@ _sk_byte_tables_rgb_sse41: .byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,13,224,47,0,0 // movaps 0x2fe0(%rip),%xmm9 # 57c0 <_sk_callback_sse41+0x6fd> + .byte 68,15,40,13,227,47,0,0 // movaps 0x2fe3(%rip),%xmm9 # 5790 <_sk_callback_sse41+0x700> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -25161,31 +25083,31 @@ _sk_parametric_r_sse41: .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8 - .byte 68,15,89,5,40,45,0,0 // mulps 0x2d28(%rip),%xmm8 # 57d0 <_sk_callback_sse41+0x70d> - .byte 68,15,84,21,48,45,0,0 // andps 0x2d30(%rip),%xmm10 # 57e0 <_sk_callback_sse41+0x71d> - .byte 68,15,86,21,56,45,0,0 // orps 0x2d38(%rip),%xmm10 # 57f0 <_sk_callback_sse41+0x72d> - .byte 68,15,88,5,64,45,0,0 // addps 0x2d40(%rip),%xmm8 # 5800 <_sk_callback_sse41+0x73d> - .byte 68,15,40,37,72,45,0,0 // movaps 0x2d48(%rip),%xmm12 # 5810 <_sk_callback_sse41+0x74d> + .byte 68,15,89,5,43,45,0,0 // mulps 0x2d2b(%rip),%xmm8 # 57a0 <_sk_callback_sse41+0x710> + .byte 68,15,84,21,51,45,0,0 // andps 0x2d33(%rip),%xmm10 # 57b0 <_sk_callback_sse41+0x720> + .byte 68,15,86,21,59,45,0,0 // orps 0x2d3b(%rip),%xmm10 # 57c0 <_sk_callback_sse41+0x730> + .byte 68,15,88,5,67,45,0,0 // addps 0x2d43(%rip),%xmm8 # 57d0 <_sk_callback_sse41+0x740> + .byte 68,15,40,37,75,45,0,0 // movaps 0x2d4b(%rip),%xmm12 # 57e0 <_sk_callback_sse41+0x750> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 - .byte 68,15,88,21,72,45,0,0 // addps 0x2d48(%rip),%xmm10 # 5820 <_sk_callback_sse41+0x75d> - .byte 68,15,40,37,80,45,0,0 // movaps 0x2d50(%rip),%xmm12 # 5830 <_sk_callback_sse41+0x76d> + .byte 68,15,88,21,75,45,0,0 // addps 0x2d4b(%rip),%xmm10 # 57f0 <_sk_callback_sse41+0x760> + .byte 68,15,40,37,83,45,0,0 // movaps 0x2d53(%rip),%xmm12 # 5800 <_sk_callback_sse41+0x770> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,196 // subps %xmm12,%xmm8 .byte 69,15,89,195 // mulps %xmm11,%xmm8 .byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10 .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,5,61,45,0,0 // addps 0x2d3d(%rip),%xmm8 # 5840 <_sk_callback_sse41+0x77d> - .byte 68,15,40,21,69,45,0,0 // movaps 0x2d45(%rip),%xmm10 # 5850 <_sk_callback_sse41+0x78d> + .byte 68,15,88,5,64,45,0,0 // addps 0x2d40(%rip),%xmm8 # 5810 <_sk_callback_sse41+0x780> + .byte 68,15,40,21,72,45,0,0 // movaps 0x2d48(%rip),%xmm10 # 5820 <_sk_callback_sse41+0x790> .byte 69,15,89,211 // mulps %xmm11,%xmm10 .byte 69,15,92,194 // subps %xmm10,%xmm8 - .byte 68,15,40,21,69,45,0,0 // movaps 0x2d45(%rip),%xmm10 # 5860 <_sk_callback_sse41+0x79d> + .byte 68,15,40,21,72,45,0,0 // movaps 0x2d48(%rip),%xmm10 # 5830 <_sk_callback_sse41+0x7a0> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 68,15,40,29,73,45,0,0 // movaps 0x2d49(%rip),%xmm11 # 5870 <_sk_callback_sse41+0x7ad> + .byte 68,15,40,29,76,45,0,0 // movaps 0x2d4c(%rip),%xmm11 # 5840 <_sk_callback_sse41+0x7b0> .byte 69,15,94,218 // divps %xmm10,%xmm11 .byte 69,15,88,216 // addps %xmm8,%xmm11 - .byte 68,15,89,29,73,45,0,0 // mulps 0x2d49(%rip),%xmm11 # 5880 <_sk_callback_sse41+0x7bd> + .byte 68,15,89,29,76,45,0,0 // mulps 0x2d4c(%rip),%xmm11 # 5850 <_sk_callback_sse41+0x7c0> .byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10 .byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 @@ -25193,7 +25115,7 @@ _sk_parametric_r_sse41: .byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,48,45,0,0 // minps 0x2d30(%rip),%xmm8 # 5890 <_sk_callback_sse41+0x7cd> + .byte 68,15,93,5,51,45,0,0 // minps 0x2d33(%rip),%xmm8 # 5860 <_sk_callback_sse41+0x7d0> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -25223,31 +25145,31 @@ _sk_parametric_g_sse41: .byte 68,15,88,217 // addps %xmm1,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,209,44,0,0 // mulps 0x2cd1(%rip),%xmm12 # 58a0 <_sk_callback_sse41+0x7dd> - .byte 68,15,84,29,217,44,0,0 // andps 0x2cd9(%rip),%xmm11 # 58b0 <_sk_callback_sse41+0x7ed> - .byte 68,15,86,29,225,44,0,0 // orps 0x2ce1(%rip),%xmm11 # 58c0 <_sk_callback_sse41+0x7fd> - .byte 68,15,88,37,233,44,0,0 // addps 0x2ce9(%rip),%xmm12 # 58d0 <_sk_callback_sse41+0x80d> - .byte 15,40,13,242,44,0,0 // movaps 0x2cf2(%rip),%xmm1 # 58e0 <_sk_callback_sse41+0x81d> + .byte 68,15,89,37,212,44,0,0 // mulps 0x2cd4(%rip),%xmm12 # 5870 <_sk_callback_sse41+0x7e0> + .byte 68,15,84,29,220,44,0,0 // andps 0x2cdc(%rip),%xmm11 # 5880 <_sk_callback_sse41+0x7f0> + .byte 68,15,86,29,228,44,0,0 // orps 0x2ce4(%rip),%xmm11 # 5890 <_sk_callback_sse41+0x800> + .byte 68,15,88,37,236,44,0,0 // addps 0x2cec(%rip),%xmm12 # 58a0 <_sk_callback_sse41+0x810> + .byte 15,40,13,245,44,0,0 // movaps 0x2cf5(%rip),%xmm1 # 58b0 <_sk_callback_sse41+0x820> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,88,29,242,44,0,0 // addps 0x2cf2(%rip),%xmm11 # 58f0 <_sk_callback_sse41+0x82d> - .byte 15,40,13,251,44,0,0 // movaps 0x2cfb(%rip),%xmm1 # 5900 <_sk_callback_sse41+0x83d> + .byte 68,15,88,29,245,44,0,0 // addps 0x2cf5(%rip),%xmm11 # 58c0 <_sk_callback_sse41+0x830> + .byte 15,40,13,254,44,0,0 // movaps 0x2cfe(%rip),%xmm1 # 58d0 <_sk_callback_sse41+0x840> .byte 65,15,94,203 // divps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,232,44,0,0 // addps 0x2ce8(%rip),%xmm12 # 5910 <_sk_callback_sse41+0x84d> - .byte 15,40,13,241,44,0,0 // movaps 0x2cf1(%rip),%xmm1 # 5920 <_sk_callback_sse41+0x85d> + .byte 68,15,88,37,235,44,0,0 // addps 0x2ceb(%rip),%xmm12 # 58e0 <_sk_callback_sse41+0x850> + .byte 15,40,13,244,44,0,0 // movaps 0x2cf4(%rip),%xmm1 # 58f0 <_sk_callback_sse41+0x860> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 68,15,92,225 // subps %xmm1,%xmm12 - .byte 68,15,40,21,241,44,0,0 // movaps 0x2cf1(%rip),%xmm10 # 5930 <_sk_callback_sse41+0x86d> + .byte 68,15,40,21,244,44,0,0 // movaps 0x2cf4(%rip),%xmm10 # 5900 <_sk_callback_sse41+0x870> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,13,246,44,0,0 // movaps 0x2cf6(%rip),%xmm1 # 5940 <_sk_callback_sse41+0x87d> + .byte 15,40,13,249,44,0,0 // movaps 0x2cf9(%rip),%xmm1 # 5910 <_sk_callback_sse41+0x880> .byte 65,15,94,202 // divps %xmm10,%xmm1 .byte 65,15,88,204 // addps %xmm12,%xmm1 - .byte 15,89,13,247,44,0,0 // mulps 0x2cf7(%rip),%xmm1 # 5950 <_sk_callback_sse41+0x88d> + .byte 15,89,13,250,44,0,0 // mulps 0x2cfa(%rip),%xmm1 # 5920 <_sk_callback_sse41+0x890> .byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10 .byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1 .byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1 @@ -25255,7 +25177,7 @@ _sk_parametric_g_sse41: .byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,200 // maxps %xmm0,%xmm1 - .byte 15,93,13,226,44,0,0 // minps 0x2ce2(%rip),%xmm1 # 5960 <_sk_callback_sse41+0x89d> + .byte 15,93,13,229,44,0,0 // minps 0x2ce5(%rip),%xmm1 # 5930 <_sk_callback_sse41+0x8a0> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -25285,31 +25207,31 @@ _sk_parametric_b_sse41: .byte 68,15,88,218 // addps %xmm2,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,131,44,0,0 // mulps 0x2c83(%rip),%xmm12 # 5970 <_sk_callback_sse41+0x8ad> - .byte 68,15,84,29,139,44,0,0 // andps 0x2c8b(%rip),%xmm11 # 5980 <_sk_callback_sse41+0x8bd> - .byte 68,15,86,29,147,44,0,0 // orps 0x2c93(%rip),%xmm11 # 5990 <_sk_callback_sse41+0x8cd> - .byte 68,15,88,37,155,44,0,0 // addps 0x2c9b(%rip),%xmm12 # 59a0 <_sk_callback_sse41+0x8dd> - .byte 15,40,21,164,44,0,0 // movaps 0x2ca4(%rip),%xmm2 # 59b0 <_sk_callback_sse41+0x8ed> + .byte 68,15,89,37,134,44,0,0 // mulps 0x2c86(%rip),%xmm12 # 5940 <_sk_callback_sse41+0x8b0> + .byte 68,15,84,29,142,44,0,0 // andps 0x2c8e(%rip),%xmm11 # 5950 <_sk_callback_sse41+0x8c0> + .byte 68,15,86,29,150,44,0,0 // orps 0x2c96(%rip),%xmm11 # 5960 <_sk_callback_sse41+0x8d0> + .byte 68,15,88,37,158,44,0,0 // addps 0x2c9e(%rip),%xmm12 # 5970 <_sk_callback_sse41+0x8e0> + .byte 15,40,21,167,44,0,0 // movaps 0x2ca7(%rip),%xmm2 # 5980 <_sk_callback_sse41+0x8f0> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,88,29,164,44,0,0 // addps 0x2ca4(%rip),%xmm11 # 59c0 <_sk_callback_sse41+0x8fd> - .byte 15,40,21,173,44,0,0 // movaps 0x2cad(%rip),%xmm2 # 59d0 <_sk_callback_sse41+0x90d> + .byte 68,15,88,29,167,44,0,0 // addps 0x2ca7(%rip),%xmm11 # 5990 <_sk_callback_sse41+0x900> + .byte 15,40,21,176,44,0,0 // movaps 0x2cb0(%rip),%xmm2 # 59a0 <_sk_callback_sse41+0x910> .byte 65,15,94,211 // divps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,154,44,0,0 // addps 0x2c9a(%rip),%xmm12 # 59e0 <_sk_callback_sse41+0x91d> - .byte 15,40,21,163,44,0,0 // movaps 0x2ca3(%rip),%xmm2 # 59f0 <_sk_callback_sse41+0x92d> + .byte 68,15,88,37,157,44,0,0 // addps 0x2c9d(%rip),%xmm12 # 59b0 <_sk_callback_sse41+0x920> + .byte 15,40,21,166,44,0,0 // movaps 0x2ca6(%rip),%xmm2 # 59c0 <_sk_callback_sse41+0x930> .byte 65,15,89,211 // mulps %xmm11,%xmm2 .byte 68,15,92,226 // subps %xmm2,%xmm12 - .byte 68,15,40,21,163,44,0,0 // movaps 0x2ca3(%rip),%xmm10 # 5a00 <_sk_callback_sse41+0x93d> + .byte 68,15,40,21,166,44,0,0 // movaps 0x2ca6(%rip),%xmm10 # 59d0 <_sk_callback_sse41+0x940> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,21,168,44,0,0 // movaps 0x2ca8(%rip),%xmm2 # 5a10 <_sk_callback_sse41+0x94d> + .byte 15,40,21,171,44,0,0 // movaps 0x2cab(%rip),%xmm2 # 59e0 <_sk_callback_sse41+0x950> .byte 65,15,94,210 // divps %xmm10,%xmm2 .byte 65,15,88,212 // addps %xmm12,%xmm2 - .byte 15,89,21,169,44,0,0 // mulps 0x2ca9(%rip),%xmm2 # 5a20 <_sk_callback_sse41+0x95d> + .byte 15,89,21,172,44,0,0 // mulps 0x2cac(%rip),%xmm2 # 59f0 <_sk_callback_sse41+0x960> .byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10 .byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2 .byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2 @@ -25317,7 +25239,7 @@ _sk_parametric_b_sse41: .byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,208 // maxps %xmm0,%xmm2 - .byte 15,93,21,148,44,0,0 // minps 0x2c94(%rip),%xmm2 # 5a30 <_sk_callback_sse41+0x96d> + .byte 15,93,21,151,44,0,0 // minps 0x2c97(%rip),%xmm2 # 5a00 <_sk_callback_sse41+0x970> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -25347,31 +25269,31 @@ _sk_parametric_a_sse41: .byte 68,15,88,219 // addps %xmm3,%xmm11 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12 - .byte 68,15,89,37,53,44,0,0 // mulps 0x2c35(%rip),%xmm12 # 5a40 <_sk_callback_sse41+0x97d> - .byte 68,15,84,29,61,44,0,0 // andps 0x2c3d(%rip),%xmm11 # 5a50 <_sk_callback_sse41+0x98d> - .byte 68,15,86,29,69,44,0,0 // orps 0x2c45(%rip),%xmm11 # 5a60 <_sk_callback_sse41+0x99d> - .byte 68,15,88,37,77,44,0,0 // addps 0x2c4d(%rip),%xmm12 # 5a70 <_sk_callback_sse41+0x9ad> - .byte 15,40,29,86,44,0,0 // movaps 0x2c56(%rip),%xmm3 # 5a80 <_sk_callback_sse41+0x9bd> + .byte 68,15,89,37,56,44,0,0 // mulps 0x2c38(%rip),%xmm12 # 5a10 <_sk_callback_sse41+0x980> + .byte 68,15,84,29,64,44,0,0 // andps 0x2c40(%rip),%xmm11 # 5a20 <_sk_callback_sse41+0x990> + .byte 68,15,86,29,72,44,0,0 // orps 0x2c48(%rip),%xmm11 # 5a30 <_sk_callback_sse41+0x9a0> + .byte 68,15,88,37,80,44,0,0 // addps 0x2c50(%rip),%xmm12 # 5a40 <_sk_callback_sse41+0x9b0> + .byte 15,40,29,89,44,0,0 // movaps 0x2c59(%rip),%xmm3 # 5a50 <_sk_callback_sse41+0x9c0> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,88,29,86,44,0,0 // addps 0x2c56(%rip),%xmm11 # 5a90 <_sk_callback_sse41+0x9cd> - .byte 15,40,29,95,44,0,0 // movaps 0x2c5f(%rip),%xmm3 # 5aa0 <_sk_callback_sse41+0x9dd> + .byte 68,15,88,29,89,44,0,0 // addps 0x2c59(%rip),%xmm11 # 5a60 <_sk_callback_sse41+0x9d0> + .byte 15,40,29,98,44,0,0 // movaps 0x2c62(%rip),%xmm3 # 5a70 <_sk_callback_sse41+0x9e0> .byte 65,15,94,219 // divps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10 .byte 69,15,40,220 // movaps %xmm12,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 68,15,88,37,76,44,0,0 // addps 0x2c4c(%rip),%xmm12 # 5ab0 <_sk_callback_sse41+0x9ed> - .byte 15,40,29,85,44,0,0 // movaps 0x2c55(%rip),%xmm3 # 5ac0 <_sk_callback_sse41+0x9fd> + .byte 68,15,88,37,79,44,0,0 // addps 0x2c4f(%rip),%xmm12 # 5a80 <_sk_callback_sse41+0x9f0> + .byte 15,40,29,88,44,0,0 // movaps 0x2c58(%rip),%xmm3 # 5a90 <_sk_callback_sse41+0xa00> .byte 65,15,89,219 // mulps %xmm11,%xmm3 .byte 68,15,92,227 // subps %xmm3,%xmm12 - .byte 68,15,40,21,85,44,0,0 // movaps 0x2c55(%rip),%xmm10 # 5ad0 <_sk_callback_sse41+0xa0d> + .byte 68,15,40,21,88,44,0,0 // movaps 0x2c58(%rip),%xmm10 # 5aa0 <_sk_callback_sse41+0xa10> .byte 69,15,92,211 // subps %xmm11,%xmm10 - .byte 15,40,29,90,44,0,0 // movaps 0x2c5a(%rip),%xmm3 # 5ae0 <_sk_callback_sse41+0xa1d> + .byte 15,40,29,93,44,0,0 // movaps 0x2c5d(%rip),%xmm3 # 5ab0 <_sk_callback_sse41+0xa20> .byte 65,15,94,218 // divps %xmm10,%xmm3 .byte 65,15,88,220 // addps %xmm12,%xmm3 - .byte 15,89,29,91,44,0,0 // mulps 0x2c5b(%rip),%xmm3 # 5af0 <_sk_callback_sse41+0xa2d> + .byte 15,89,29,94,44,0,0 // mulps 0x2c5e(%rip),%xmm3 # 5ac0 <_sk_callback_sse41+0xa30> .byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10 .byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 @@ -25379,7 +25301,7 @@ _sk_parametric_a_sse41: .byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 15,95,216 // maxps %xmm0,%xmm3 - .byte 15,93,29,70,44,0,0 // minps 0x2c46(%rip),%xmm3 # 5b00 <_sk_callback_sse41+0xa3d> + .byte 15,93,29,73,44,0,0 // minps 0x2c49(%rip),%xmm3 # 5ad0 <_sk_callback_sse41+0xa40> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -25389,29 +25311,29 @@ HIDDEN _sk_lab_to_xyz_sse41 FUNCTION(_sk_lab_to_xyz_sse41) _sk_lab_to_xyz_sse41: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,89,5,66,44,0,0 // mulps 0x2c42(%rip),%xmm8 # 5b10 <_sk_callback_sse41+0xa4d> - .byte 68,15,40,13,74,44,0,0 // movaps 0x2c4a(%rip),%xmm9 # 5b20 <_sk_callback_sse41+0xa5d> + .byte 68,15,89,5,69,44,0,0 // mulps 0x2c45(%rip),%xmm8 # 5ae0 <_sk_callback_sse41+0xa50> + .byte 68,15,40,13,77,44,0,0 // movaps 0x2c4d(%rip),%xmm9 # 5af0 <_sk_callback_sse41+0xa60> .byte 65,15,89,201 // mulps %xmm9,%xmm1 - .byte 15,40,5,79,44,0,0 // movaps 0x2c4f(%rip),%xmm0 # 5b30 <_sk_callback_sse41+0xa6d> + .byte 15,40,5,82,44,0,0 // movaps 0x2c52(%rip),%xmm0 # 5b00 <_sk_callback_sse41+0xa70> .byte 15,88,200 // addps %xmm0,%xmm1 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 68,15,88,5,77,44,0,0 // addps 0x2c4d(%rip),%xmm8 # 5b40 <_sk_callback_sse41+0xa7d> - .byte 68,15,89,5,85,44,0,0 // mulps 0x2c55(%rip),%xmm8 # 5b50 <_sk_callback_sse41+0xa8d> - .byte 15,89,13,94,44,0,0 // mulps 0x2c5e(%rip),%xmm1 # 5b60 <_sk_callback_sse41+0xa9d> + .byte 68,15,88,5,80,44,0,0 // addps 0x2c50(%rip),%xmm8 # 5b10 <_sk_callback_sse41+0xa80> + .byte 68,15,89,5,88,44,0,0 // mulps 0x2c58(%rip),%xmm8 # 5b20 <_sk_callback_sse41+0xa90> + .byte 15,89,13,97,44,0,0 // mulps 0x2c61(%rip),%xmm1 # 5b30 <_sk_callback_sse41+0xaa0> .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 15,89,21,99,44,0,0 // mulps 0x2c63(%rip),%xmm2 # 5b70 <_sk_callback_sse41+0xaad> + .byte 15,89,21,102,44,0,0 // mulps 0x2c66(%rip),%xmm2 # 5b40 <_sk_callback_sse41+0xab0> .byte 69,15,40,208 // movaps %xmm8,%xmm10 .byte 68,15,92,210 // subps %xmm2,%xmm10 .byte 68,15,40,217 // movaps %xmm1,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 .byte 68,15,89,217 // mulps %xmm1,%xmm11 - .byte 68,15,40,13,87,44,0,0 // movaps 0x2c57(%rip),%xmm9 # 5b80 <_sk_callback_sse41+0xabd> + .byte 68,15,40,13,90,44,0,0 // movaps 0x2c5a(%rip),%xmm9 # 5b50 <_sk_callback_sse41+0xac0> .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 15,40,21,87,44,0,0 // movaps 0x2c57(%rip),%xmm2 # 5b90 <_sk_callback_sse41+0xacd> + .byte 15,40,21,90,44,0,0 // movaps 0x2c5a(%rip),%xmm2 # 5b60 <_sk_callback_sse41+0xad0> .byte 15,88,202 // addps %xmm2,%xmm1 - .byte 68,15,40,37,92,44,0,0 // movaps 0x2c5c(%rip),%xmm12 # 5ba0 <_sk_callback_sse41+0xadd> + .byte 68,15,40,37,95,44,0,0 // movaps 0x2c5f(%rip),%xmm12 # 5b70 <_sk_callback_sse41+0xae0> .byte 65,15,89,204 // mulps %xmm12,%xmm1 .byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1 .byte 69,15,40,216 // movaps %xmm8,%xmm11 @@ -25430,8 +25352,8 @@ _sk_lab_to_xyz_sse41: .byte 65,15,89,212 // mulps %xmm12,%xmm2 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2 - .byte 15,89,13,21,44,0,0 // mulps 0x2c15(%rip),%xmm1 # 5bb0 <_sk_callback_sse41+0xaed> - .byte 15,89,21,30,44,0,0 // mulps 0x2c1e(%rip),%xmm2 # 5bc0 <_sk_callback_sse41+0xafd> + .byte 15,89,13,24,44,0,0 // mulps 0x2c18(%rip),%xmm1 # 5b80 <_sk_callback_sse41+0xaf0> + .byte 15,89,21,33,44,0,0 // mulps 0x2c21(%rip),%xmm2 # 5b90 <_sk_callback_sse41+0xb00> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,40,200 // movaps %xmm8,%xmm1 @@ -25444,11 +25366,11 @@ _sk_load_a8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,39 // jne 2fde <_sk_load_a8_sse41+0x31> + .byte 117,39 // jne 2fab <_sk_load_a8_sse41+0x31> .byte 102,65,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm0 - .byte 102,15,219,5,10,44,0,0 // pand 0x2c0a(%rip),%xmm0 # 5bd0 <_sk_callback_sse41+0xb0d> + .byte 102,15,219,5,13,44,0,0 // pand 0x2c0d(%rip),%xmm0 # 5ba0 <_sk_callback_sse41+0xb10> .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,16,44,0,0 // mulps 0x2c10(%rip),%xmm3 # 5be0 <_sk_callback_sse41+0xb1d> + .byte 15,89,29,19,44,0,0 // mulps 0x2c13(%rip),%xmm3 # 5bb0 <_sk_callback_sse41+0xb20> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -25457,12 +25379,12 @@ _sk_load_a8_sse41: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,53 // je 3020 <_sk_load_a8_sse41+0x73> + .byte 116,53 // je 2fed <_sk_load_a8_sse41+0x73> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,21 // je 300a <_sk_load_a8_sse41+0x5d> + .byte 116,21 // je 2fd7 <_sk_load_a8_sse41+0x5d> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,195 // jne 2fbe <_sk_load_a8_sse41+0x11> + .byte 117,195 // jne 2f8b <_sk_load_a8_sse41+0x11> .byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -25470,10 +25392,10 @@ _sk_load_a8_sse41: .byte 102,15,110,200 // movd %eax,%xmm1 .byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1 .byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0 - .byte 235,158 // jmp 2fbe <_sk_load_a8_sse41+0x11> + .byte 235,158 // jmp 2f8b <_sk_load_a8_sse41+0x11> .byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,147 // jmp 2fbe <_sk_load_a8_sse41+0x11> + .byte 235,147 // jmp 2f8b <_sk_load_a8_sse41+0x11> HIDDEN _sk_gather_a8_sse41 .globl _sk_gather_a8_sse41 @@ -25502,7 +25424,7 @@ _sk_gather_a8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,85,43,0,0 // mulps 0x2b55(%rip),%xmm3 # 5bf0 <_sk_callback_sse41+0xb2d> + .byte 15,89,29,88,43,0,0 // mulps 0x2b58(%rip),%xmm3 # 5bc0 <_sk_callback_sse41+0xb30> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -25516,13 +25438,13 @@ FUNCTION(_sk_store_a8_sse41) _sk_store_a8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 68,15,40,5,72,43,0,0 // movaps 0x2b48(%rip),%xmm8 # 5c00 <_sk_callback_sse41+0xb3d> + .byte 68,15,40,5,75,43,0,0 // movaps 0x2b4b(%rip),%xmm8 # 5bd0 <_sk_callback_sse41+0xb40> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8 .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,13 // jne 30de <_sk_store_a8_sse41+0x33> + .byte 117,13 // jne 30ab <_sk_store_a8_sse41+0x33> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 65,137,4,18 // mov %eax,(%r10,%rdx,1) .byte 72,173 // lods %ds:(%rsi),%rax @@ -25531,17 +25453,17 @@ _sk_store_a8_sse41: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,41 // je 311a <_sk_store_a8_sse41+0x6f> + .byte 116,41 // je 30e7 <_sk_store_a8_sse41+0x6f> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,15 // je 3106 <_sk_store_a8_sse41+0x5b> + .byte 116,15 // je 30d3 <_sk_store_a8_sse41+0x5b> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,221 // jne 30da <_sk_store_a8_sse41+0x2f> + .byte 117,221 // jne 30a7 <_sk_store_a8_sse41+0x2f> .byte 102,69,15,58,20,68,18,2,8 // pextrb $0x8,%xmm8,0x2(%r10,%rdx,1) - .byte 102,68,15,56,0,5,0,43,0,0 // pshufb 0x2b00(%rip),%xmm8 # 5c10 <_sk_callback_sse41+0xb4d> + .byte 102,68,15,56,0,5,3,43,0,0 // pshufb 0x2b03(%rip),%xmm8 # 5be0 <_sk_callback_sse41+0xb50> .byte 102,69,15,58,21,4,18,0 // pextrw $0x0,%xmm8,(%r10,%rdx,1) - .byte 235,192 // jmp 30da <_sk_store_a8_sse41+0x2f> + .byte 235,192 // jmp 30a7 <_sk_store_a8_sse41+0x2f> .byte 102,69,15,58,20,4,18,0 // pextrb $0x0,%xmm8,(%r10,%rdx,1) - .byte 235,182 // jmp 30da <_sk_store_a8_sse41+0x2f> + .byte 235,182 // jmp 30a7 <_sk_store_a8_sse41+0x2f> HIDDEN _sk_load_g8_sse41 .globl _sk_load_g8_sse41 @@ -25550,25 +25472,25 @@ _sk_load_g8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,42 // jne 3158 <_sk_load_g8_sse41+0x34> + .byte 117,42 // jne 3125 <_sk_load_g8_sse41+0x34> .byte 102,65,15,56,49,4,18 // pmovzxbd (%r10,%rdx,1),%xmm0 - .byte 102,15,219,5,227,42,0,0 // pand 0x2ae3(%rip),%xmm0 # 5c20 <_sk_callback_sse41+0xb5d> + .byte 102,15,219,5,230,42,0,0 // pand 0x2ae6(%rip),%xmm0 # 5bf0 <_sk_callback_sse41+0xb60> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,233,42,0,0 // mulps 0x2ae9(%rip),%xmm0 # 5c30 <_sk_callback_sse41+0xb6d> + .byte 15,89,5,236,42,0,0 // mulps 0x2aec(%rip),%xmm0 # 5c00 <_sk_callback_sse41+0xb70> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,240,42,0,0 // movaps 0x2af0(%rip),%xmm3 # 5c40 <_sk_callback_sse41+0xb7d> + .byte 15,40,29,243,42,0,0 // movaps 0x2af3(%rip),%xmm3 # 5c10 <_sk_callback_sse41+0xb80> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,53 // je 319a <_sk_load_g8_sse41+0x76> + .byte 116,53 // je 3167 <_sk_load_g8_sse41+0x76> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,21 // je 3184 <_sk_load_g8_sse41+0x60> + .byte 116,21 // je 3151 <_sk_load_g8_sse41+0x60> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,192 // jne 3135 <_sk_load_g8_sse41+0x11> + .byte 117,192 // jne 3102 <_sk_load_g8_sse41+0x11> .byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -25576,10 +25498,10 @@ _sk_load_g8_sse41: .byte 102,15,110,200 // movd %eax,%xmm1 .byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1 .byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0 - .byte 235,155 // jmp 3135 <_sk_load_g8_sse41+0x11> + .byte 235,155 // jmp 3102 <_sk_load_g8_sse41+0x11> .byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,144 // jmp 3135 <_sk_load_g8_sse41+0x11> + .byte 235,144 // jmp 3102 <_sk_load_g8_sse41+0x11> HIDDEN _sk_gather_g8_sse41 .globl _sk_gather_g8_sse41 @@ -25608,9 +25530,9 @@ _sk_gather_g8_sse41: .byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0 .byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,59,42,0,0 // mulps 0x2a3b(%rip),%xmm0 # 5c50 <_sk_callback_sse41+0xb8d> + .byte 15,89,5,62,42,0,0 // mulps 0x2a3e(%rip),%xmm0 # 5c20 <_sk_callback_sse41+0xb90> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,66,42,0,0 // movaps 0x2a42(%rip),%xmm3 # 5c60 <_sk_callback_sse41+0xb9d> + .byte 15,40,29,69,42,0,0 // movaps 0x2a45(%rip),%xmm3 # 5c30 <_sk_callback_sse41+0xba0> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 91 // pop %rbx @@ -25623,9 +25545,9 @@ _sk_gather_i8_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,137,193 // mov %rax,%r9 .byte 77,133,201 // test %r9,%r9 - .byte 116,5 // je 3236 <_sk_gather_i8_sse41+0xf> + .byte 116,5 // je 3203 <_sk_gather_i8_sse41+0xf> .byte 76,137,200 // mov %r9,%rax - .byte 235,2 // jmp 3238 <_sk_gather_i8_sse41+0x11> + .byte 235,2 // jmp 3205 <_sk_gather_i8_sse41+0x11> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,86 // push %r14 .byte 83 // push %rbx @@ -25658,17 +25580,17 @@ _sk_gather_i8_sse41: .byte 102,15,58,34,28,24,1 // pinsrd $0x1,(%rax,%rbx,1),%xmm3 .byte 102,66,15,58,34,28,152,2 // pinsrd $0x2,(%rax,%r11,4),%xmm3 .byte 102,66,15,58,34,28,16,3 // pinsrd $0x3,(%rax,%r10,1),%xmm3 - .byte 102,15,111,5,149,41,0,0 // movdqa 0x2995(%rip),%xmm0 # 5c70 <_sk_callback_sse41+0xbad> + .byte 102,15,111,5,152,41,0,0 // movdqa 0x2998(%rip),%xmm0 # 5c40 <_sk_callback_sse41+0xbb0> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,150,41,0,0 // movaps 0x2996(%rip),%xmm8 # 5c80 <_sk_callback_sse41+0xbbd> + .byte 68,15,40,5,153,41,0,0 // movaps 0x2999(%rip),%xmm8 # 5c50 <_sk_callback_sse41+0xbc0> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,149,41,0,0 // pshufb 0x2995(%rip),%xmm1 # 5c90 <_sk_callback_sse41+0xbcd> + .byte 102,15,56,0,13,152,41,0,0 // pshufb 0x2998(%rip),%xmm1 # 5c60 <_sk_callback_sse41+0xbd0> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,145,41,0,0 // pshufb 0x2991(%rip),%xmm2 # 5ca0 <_sk_callback_sse41+0xbdd> + .byte 102,15,56,0,21,148,41,0,0 // pshufb 0x2994(%rip),%xmm2 # 5c70 <_sk_callback_sse41+0xbe0> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -25686,41 +25608,41 @@ _sk_load_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,80 // jne 3383 <_sk_load_565_sse41+0x5a> + .byte 117,80 // jne 3350 <_sk_load_565_sse41+0x5a> .byte 102,65,15,56,51,20,82 // pmovzxwd (%r10,%rdx,2),%xmm2 - .byte 102,15,111,5,110,41,0,0 // movdqa 0x296e(%rip),%xmm0 # 5cb0 <_sk_callback_sse41+0xbed> + .byte 102,15,111,5,113,41,0,0 // movdqa 0x2971(%rip),%xmm0 # 5c80 <_sk_callback_sse41+0xbf0> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,112,41,0,0 // mulps 0x2970(%rip),%xmm0 # 5cc0 <_sk_callback_sse41+0xbfd> - .byte 102,15,111,13,120,41,0,0 // movdqa 0x2978(%rip),%xmm1 # 5cd0 <_sk_callback_sse41+0xc0d> + .byte 15,89,5,115,41,0,0 // mulps 0x2973(%rip),%xmm0 # 5c90 <_sk_callback_sse41+0xc00> + .byte 102,15,111,13,123,41,0,0 // movdqa 0x297b(%rip),%xmm1 # 5ca0 <_sk_callback_sse41+0xc10> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,122,41,0,0 // mulps 0x297a(%rip),%xmm1 # 5ce0 <_sk_callback_sse41+0xc1d> - .byte 102,15,219,21,130,41,0,0 // pand 0x2982(%rip),%xmm2 # 5cf0 <_sk_callback_sse41+0xc2d> + .byte 15,89,13,125,41,0,0 // mulps 0x297d(%rip),%xmm1 # 5cb0 <_sk_callback_sse41+0xc20> + .byte 102,15,219,21,133,41,0,0 // pand 0x2985(%rip),%xmm2 # 5cc0 <_sk_callback_sse41+0xc30> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,136,41,0,0 // mulps 0x2988(%rip),%xmm2 # 5d00 <_sk_callback_sse41+0xc3d> + .byte 15,89,21,139,41,0,0 // mulps 0x298b(%rip),%xmm2 # 5cd0 <_sk_callback_sse41+0xc40> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,143,41,0,0 // movaps 0x298f(%rip),%xmm3 # 5d10 <_sk_callback_sse41+0xc4d> + .byte 15,40,29,146,41,0,0 // movaps 0x2992(%rip),%xmm3 # 5ce0 <_sk_callback_sse41+0xc50> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,53 // je 33c5 <_sk_load_565_sse41+0x9c> + .byte 116,53 // je 3392 <_sk_load_565_sse41+0x9c> .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,21 // je 33af <_sk_load_565_sse41+0x86> + .byte 116,21 // je 337c <_sk_load_565_sse41+0x86> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,154 // jne 333a <_sk_load_565_sse41+0x11> + .byte 117,154 // jne 3307 <_sk_load_565_sse41+0x11> .byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2 .byte 102,65,15,110,4,82 // movd (%r10,%rdx,2),%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 .byte 102,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm2 - .byte 233,117,255,255,255 // jmpq 333a <_sk_load_565_sse41+0x11> + .byte 233,117,255,255,255 // jmpq 3307 <_sk_load_565_sse41+0x11> .byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax .byte 102,15,110,208 // movd %eax,%xmm2 - .byte 233,103,255,255,255 // jmpq 333a <_sk_load_565_sse41+0x11> + .byte 233,103,255,255,255 // jmpq 3307 <_sk_load_565_sse41+0x11> HIDDEN _sk_gather_565_sse41 .globl _sk_gather_565_sse41 @@ -25748,19 +25670,19 @@ _sk_gather_565_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2 - .byte 102,15,111,5,227,40,0,0 // movdqa 0x28e3(%rip),%xmm0 # 5d20 <_sk_callback_sse41+0xc5d> + .byte 102,15,111,5,230,40,0,0 // movdqa 0x28e6(%rip),%xmm0 # 5cf0 <_sk_callback_sse41+0xc60> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,229,40,0,0 // mulps 0x28e5(%rip),%xmm0 # 5d30 <_sk_callback_sse41+0xc6d> - .byte 102,15,111,13,237,40,0,0 // movdqa 0x28ed(%rip),%xmm1 # 5d40 <_sk_callback_sse41+0xc7d> + .byte 15,89,5,232,40,0,0 // mulps 0x28e8(%rip),%xmm0 # 5d00 <_sk_callback_sse41+0xc70> + .byte 102,15,111,13,240,40,0,0 // movdqa 0x28f0(%rip),%xmm1 # 5d10 <_sk_callback_sse41+0xc80> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,239,40,0,0 // mulps 0x28ef(%rip),%xmm1 # 5d50 <_sk_callback_sse41+0xc8d> - .byte 102,15,219,21,247,40,0,0 // pand 0x28f7(%rip),%xmm2 # 5d60 <_sk_callback_sse41+0xc9d> + .byte 15,89,13,242,40,0,0 // mulps 0x28f2(%rip),%xmm1 # 5d20 <_sk_callback_sse41+0xc90> + .byte 102,15,219,21,250,40,0,0 // pand 0x28fa(%rip),%xmm2 # 5d30 <_sk_callback_sse41+0xca0> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,253,40,0,0 // mulps 0x28fd(%rip),%xmm2 # 5d70 <_sk_callback_sse41+0xcad> + .byte 15,89,21,0,41,0,0 // mulps 0x2900(%rip),%xmm2 # 5d40 <_sk_callback_sse41+0xcb0> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,4,41,0,0 // movaps 0x2904(%rip),%xmm3 # 5d80 <_sk_callback_sse41+0xcbd> + .byte 15,40,29,7,41,0,0 // movaps 0x2907(%rip),%xmm3 # 5d50 <_sk_callback_sse41+0xcc0> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -25770,12 +25692,12 @@ FUNCTION(_sk_store_565_sse41) _sk_store_565_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,4,41,0,0 // movaps 0x2904(%rip),%xmm8 # 5d90 <_sk_callback_sse41+0xccd> + .byte 68,15,40,5,7,41,0,0 // movaps 0x2907(%rip),%xmm8 # 5d60 <_sk_callback_sse41+0xcd0> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,249,40,0,0 // movaps 0x28f9(%rip),%xmm10 # 5da0 <_sk_callback_sse41+0xcdd> + .byte 68,15,40,21,252,40,0,0 // movaps 0x28fc(%rip),%xmm10 # 5d70 <_sk_callback_sse41+0xce0> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -25785,7 +25707,7 @@ _sk_store_565_sse41: .byte 102,69,15,86,194 // orpd %xmm10,%xmm8 .byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 34de <_sk_store_565_sse41+0x5f> + .byte 117,10 // jne 34ab <_sk_store_565_sse41+0x5f> .byte 242,68,15,17,4,80 // movsd %xmm8,(%rax,%rdx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25793,17 +25715,17 @@ _sk_store_565_sse41: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,35 // je 3514 <_sk_store_565_sse41+0x95> + .byte 116,35 // je 34e1 <_sk_store_565_sse41+0x95> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,15 // je 3506 <_sk_store_565_sse41+0x87> + .byte 116,15 // je 34d3 <_sk_store_565_sse41+0x87> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,221 // jne 34da <_sk_store_565_sse41+0x5b> + .byte 117,221 // jne 34a7 <_sk_store_565_sse41+0x5b> .byte 102,68,15,58,21,68,80,4,4 // pextrw $0x4,%xmm8,0x4(%rax,%rdx,2) .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8 .byte 102,68,15,126,4,80 // movd %xmm8,(%rax,%rdx,2) - .byte 235,198 // jmp 34da <_sk_store_565_sse41+0x5b> + .byte 235,198 // jmp 34a7 <_sk_store_565_sse41+0x5b> .byte 102,68,15,58,21,4,80,0 // pextrw $0x0,%xmm8,(%rax,%rdx,2) - .byte 235,188 // jmp 34da <_sk_store_565_sse41+0x5b> + .byte 235,188 // jmp 34a7 <_sk_store_565_sse41+0x5b> HIDDEN _sk_load_4444_sse41 .globl _sk_load_4444_sse41 @@ -25812,44 +25734,44 @@ _sk_load_4444_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,95 // jne 3587 <_sk_load_4444_sse41+0x69> + .byte 117,95 // jne 3554 <_sk_load_4444_sse41+0x69> .byte 102,65,15,56,51,28,82 // pmovzxwd (%r10,%rdx,2),%xmm3 - .byte 102,15,111,5,121,40,0,0 // movdqa 0x2879(%rip),%xmm0 # 5db0 <_sk_callback_sse41+0xced> + .byte 102,15,111,5,124,40,0,0 // movdqa 0x287c(%rip),%xmm0 # 5d80 <_sk_callback_sse41+0xcf0> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,123,40,0,0 // mulps 0x287b(%rip),%xmm0 # 5dc0 <_sk_callback_sse41+0xcfd> - .byte 102,15,111,13,131,40,0,0 // movdqa 0x2883(%rip),%xmm1 # 5dd0 <_sk_callback_sse41+0xd0d> + .byte 15,89,5,126,40,0,0 // mulps 0x287e(%rip),%xmm0 # 5d90 <_sk_callback_sse41+0xd00> + .byte 102,15,111,13,134,40,0,0 // movdqa 0x2886(%rip),%xmm1 # 5da0 <_sk_callback_sse41+0xd10> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,133,40,0,0 // mulps 0x2885(%rip),%xmm1 # 5de0 <_sk_callback_sse41+0xd1d> - .byte 102,15,111,21,141,40,0,0 // movdqa 0x288d(%rip),%xmm2 # 5df0 <_sk_callback_sse41+0xd2d> + .byte 15,89,13,136,40,0,0 // mulps 0x2888(%rip),%xmm1 # 5db0 <_sk_callback_sse41+0xd20> + .byte 102,15,111,21,144,40,0,0 // movdqa 0x2890(%rip),%xmm2 # 5dc0 <_sk_callback_sse41+0xd30> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,143,40,0,0 // mulps 0x288f(%rip),%xmm2 # 5e00 <_sk_callback_sse41+0xd3d> - .byte 102,15,219,29,151,40,0,0 // pand 0x2897(%rip),%xmm3 # 5e10 <_sk_callback_sse41+0xd4d> + .byte 15,89,21,146,40,0,0 // mulps 0x2892(%rip),%xmm2 # 5dd0 <_sk_callback_sse41+0xd40> + .byte 102,15,219,29,154,40,0,0 // pand 0x289a(%rip),%xmm3 # 5de0 <_sk_callback_sse41+0xd50> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,157,40,0,0 // mulps 0x289d(%rip),%xmm3 # 5e20 <_sk_callback_sse41+0xd5d> + .byte 15,89,29,160,40,0,0 // mulps 0x28a0(%rip),%xmm3 # 5df0 <_sk_callback_sse41+0xd60> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,53 // je 35c9 <_sk_load_4444_sse41+0xab> + .byte 116,53 // je 3596 <_sk_load_4444_sse41+0xab> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,21 // je 35b3 <_sk_load_4444_sse41+0x95> + .byte 116,21 // je 3580 <_sk_load_4444_sse41+0x95> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,139 // jne 352f <_sk_load_4444_sse41+0x11> + .byte 117,139 // jne 34fc <_sk_load_4444_sse41+0x11> .byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,65,15,110,4,82 // movd (%r10,%rdx,2),%xmm0 .byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0 .byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3 - .byte 233,102,255,255,255 // jmpq 352f <_sk_load_4444_sse41+0x11> + .byte 233,102,255,255,255 // jmpq 34fc <_sk_load_4444_sse41+0x11> .byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax .byte 102,15,110,216 // movd %eax,%xmm3 - .byte 233,88,255,255,255 // jmpq 352f <_sk_load_4444_sse41+0x11> + .byte 233,88,255,255,255 // jmpq 34fc <_sk_load_4444_sse41+0x11> HIDDEN _sk_gather_4444_sse41 .globl _sk_gather_4444_sse41 @@ -25877,21 +25799,21 @@ _sk_gather_4444_sse41: .byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax .byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0 .byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3 - .byte 102,15,111,5,239,39,0,0 // movdqa 0x27ef(%rip),%xmm0 # 5e30 <_sk_callback_sse41+0xd6d> + .byte 102,15,111,5,242,39,0,0 // movdqa 0x27f2(%rip),%xmm0 # 5e00 <_sk_callback_sse41+0xd70> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,241,39,0,0 // mulps 0x27f1(%rip),%xmm0 # 5e40 <_sk_callback_sse41+0xd7d> - .byte 102,15,111,13,249,39,0,0 // movdqa 0x27f9(%rip),%xmm1 # 5e50 <_sk_callback_sse41+0xd8d> + .byte 15,89,5,244,39,0,0 // mulps 0x27f4(%rip),%xmm0 # 5e10 <_sk_callback_sse41+0xd80> + .byte 102,15,111,13,252,39,0,0 // movdqa 0x27fc(%rip),%xmm1 # 5e20 <_sk_callback_sse41+0xd90> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,251,39,0,0 // mulps 0x27fb(%rip),%xmm1 # 5e60 <_sk_callback_sse41+0xd9d> - .byte 102,15,111,21,3,40,0,0 // movdqa 0x2803(%rip),%xmm2 # 5e70 <_sk_callback_sse41+0xdad> + .byte 15,89,13,254,39,0,0 // mulps 0x27fe(%rip),%xmm1 # 5e30 <_sk_callback_sse41+0xda0> + .byte 102,15,111,21,6,40,0,0 // movdqa 0x2806(%rip),%xmm2 # 5e40 <_sk_callback_sse41+0xdb0> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,5,40,0,0 // mulps 0x2805(%rip),%xmm2 # 5e80 <_sk_callback_sse41+0xdbd> - .byte 102,15,219,29,13,40,0,0 // pand 0x280d(%rip),%xmm3 # 5e90 <_sk_callback_sse41+0xdcd> + .byte 15,89,21,8,40,0,0 // mulps 0x2808(%rip),%xmm2 # 5e50 <_sk_callback_sse41+0xdc0> + .byte 102,15,219,29,16,40,0,0 // pand 0x2810(%rip),%xmm3 # 5e60 <_sk_callback_sse41+0xdd0> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,19,40,0,0 // mulps 0x2813(%rip),%xmm3 # 5ea0 <_sk_callback_sse41+0xddd> + .byte 15,89,29,22,40,0,0 // mulps 0x2816(%rip),%xmm3 # 5e70 <_sk_callback_sse41+0xde0> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -25902,7 +25824,7 @@ FUNCTION(_sk_store_4444_sse41) _sk_store_4444_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,17,40,0,0 // movaps 0x2811(%rip),%xmm8 # 5eb0 <_sk_callback_sse41+0xded> + .byte 68,15,40,5,20,40,0,0 // movaps 0x2814(%rip),%xmm8 # 5e80 <_sk_callback_sse41+0xdf0> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -25922,7 +25844,7 @@ _sk_store_4444_sse41: .byte 102,69,15,86,194 // orpd %xmm10,%xmm8 .byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 3705 <_sk_store_4444_sse41+0x73> + .byte 117,10 // jne 36d2 <_sk_store_4444_sse41+0x73> .byte 242,68,15,17,4,80 // movsd %xmm8,(%rax,%rdx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -25930,17 +25852,17 @@ _sk_store_4444_sse41: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,35 // je 373b <_sk_store_4444_sse41+0xa9> + .byte 116,35 // je 3708 <_sk_store_4444_sse41+0xa9> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,15 // je 372d <_sk_store_4444_sse41+0x9b> + .byte 116,15 // je 36fa <_sk_store_4444_sse41+0x9b> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,221 // jne 3701 <_sk_store_4444_sse41+0x6f> + .byte 117,221 // jne 36ce <_sk_store_4444_sse41+0x6f> .byte 102,68,15,58,21,68,80,4,4 // pextrw $0x4,%xmm8,0x4(%rax,%rdx,2) .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8 .byte 102,68,15,126,4,80 // movd %xmm8,(%rax,%rdx,2) - .byte 235,198 // jmp 3701 <_sk_store_4444_sse41+0x6f> + .byte 235,198 // jmp 36ce <_sk_store_4444_sse41+0x6f> .byte 102,68,15,58,21,4,80,0 // pextrw $0x0,%xmm8,(%rax,%rdx,2) - .byte 235,188 // jmp 3701 <_sk_store_4444_sse41+0x6f> + .byte 235,188 // jmp 36ce <_sk_store_4444_sse41+0x6f> HIDDEN _sk_load_8888_sse41 .globl _sk_load_8888_sse41 @@ -25949,19 +25871,19 @@ _sk_load_8888_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,88 // jne 37a7 <_sk_load_8888_sse41+0x62> + .byte 117,88 // jne 3774 <_sk_load_8888_sse41+0x62> .byte 243,15,111,28,144 // movdqu (%rax,%rdx,4),%xmm3 - .byte 102,15,111,5,100,39,0,0 // movdqa 0x2764(%rip),%xmm0 # 5ec0 <_sk_callback_sse41+0xdfd> + .byte 102,15,111,5,103,39,0,0 // movdqa 0x2767(%rip),%xmm0 # 5e90 <_sk_callback_sse41+0xe00> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,101,39,0,0 // movaps 0x2765(%rip),%xmm8 # 5ed0 <_sk_callback_sse41+0xe0d> + .byte 68,15,40,5,104,39,0,0 // movaps 0x2768(%rip),%xmm8 # 5ea0 <_sk_callback_sse41+0xe10> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,100,39,0,0 // pshufb 0x2764(%rip),%xmm1 # 5ee0 <_sk_callback_sse41+0xe1d> + .byte 102,15,56,0,13,103,39,0,0 // pshufb 0x2767(%rip),%xmm1 # 5eb0 <_sk_callback_sse41+0xe20> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,96,39,0,0 // pshufb 0x2760(%rip),%xmm2 # 5ef0 <_sk_callback_sse41+0xe2d> + .byte 102,15,56,0,21,99,39,0,0 // pshufb 0x2763(%rip),%xmm2 # 5ec0 <_sk_callback_sse41+0xe30> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -25972,19 +25894,19 @@ _sk_load_8888_sse41: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,43 // je 37df <_sk_load_8888_sse41+0x9a> + .byte 116,43 // je 37ac <_sk_load_8888_sse41+0x9a> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,17 // je 37cf <_sk_load_8888_sse41+0x8a> + .byte 116,17 // je 379c <_sk_load_8888_sse41+0x8a> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,144 // jne 3754 <_sk_load_8888_sse41+0xf> + .byte 117,144 // jne 3721 <_sk_load_8888_sse41+0xf> .byte 102,15,110,68,144,8 // movd 0x8(%rax,%rdx,4),%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 243,15,126,4,144 // movq (%rax,%rdx,4),%xmm0 .byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3 - .byte 233,117,255,255,255 // jmpq 3754 <_sk_load_8888_sse41+0xf> + .byte 233,117,255,255,255 // jmpq 3721 <_sk_load_8888_sse41+0xf> .byte 102,15,110,28,144 // movd (%rax,%rdx,4),%xmm3 - .byte 233,107,255,255,255 // jmpq 3754 <_sk_load_8888_sse41+0xf> + .byte 233,107,255,255,255 // jmpq 3721 <_sk_load_8888_sse41+0xf> HIDDEN _sk_gather_8888_sse41 .globl _sk_gather_8888_sse41 @@ -26009,17 +25931,17 @@ _sk_gather_8888_sse41: .byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3 .byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3 .byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3 - .byte 102,15,111,5,182,38,0,0 // movdqa 0x26b6(%rip),%xmm0 # 5f00 <_sk_callback_sse41+0xe3d> + .byte 102,15,111,5,185,38,0,0 // movdqa 0x26b9(%rip),%xmm0 # 5ed0 <_sk_callback_sse41+0xe40> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,183,38,0,0 // movaps 0x26b7(%rip),%xmm8 # 5f10 <_sk_callback_sse41+0xe4d> + .byte 68,15,40,5,186,38,0,0 // movaps 0x26ba(%rip),%xmm8 # 5ee0 <_sk_callback_sse41+0xe50> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 - .byte 102,15,56,0,13,182,38,0,0 // pshufb 0x26b6(%rip),%xmm1 # 5f20 <_sk_callback_sse41+0xe5d> + .byte 102,15,56,0,13,185,38,0,0 // pshufb 0x26b9(%rip),%xmm1 # 5ef0 <_sk_callback_sse41+0xe60> .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,111,211 // movdqa %xmm3,%xmm2 - .byte 102,15,56,0,21,178,38,0,0 // pshufb 0x26b2(%rip),%xmm2 # 5f30 <_sk_callback_sse41+0xe6d> + .byte 102,15,56,0,21,181,38,0,0 // pshufb 0x26b5(%rip),%xmm2 # 5f00 <_sk_callback_sse41+0xe70> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 @@ -26035,7 +25957,7 @@ FUNCTION(_sk_store_8888_sse41) _sk_store_8888_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,157,38,0,0 // movaps 0x269d(%rip),%xmm8 # 5f40 <_sk_callback_sse41+0xe7d> + .byte 68,15,40,5,160,38,0,0 // movaps 0x26a0(%rip),%xmm8 # 5f10 <_sk_callback_sse41+0xe80> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -26054,23 +25976,23 @@ _sk_store_8888_sse41: .byte 102,69,15,235,193 // por %xmm9,%xmm8 .byte 102,69,15,235,194 // por %xmm10,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 3903 <_sk_store_8888_sse41+0x6d> + .byte 117,10 // jne 38d0 <_sk_store_8888_sse41+0x6d> .byte 243,68,15,127,4,144 // movdqu %xmm8,(%rax,%rdx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,29 // je 392d <_sk_store_8888_sse41+0x97> + .byte 116,29 // je 38fa <_sk_store_8888_sse41+0x97> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,15 // je 3925 <_sk_store_8888_sse41+0x8f> + .byte 116,15 // je 38f2 <_sk_store_8888_sse41+0x8f> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,227 // jne 38ff <_sk_store_8888_sse41+0x69> + .byte 117,227 // jne 38cc <_sk_store_8888_sse41+0x69> .byte 102,68,15,58,22,68,144,8,2 // pextrd $0x2,%xmm8,0x8(%rax,%rdx,4) .byte 102,68,15,214,4,144 // movq %xmm8,(%rax,%rdx,4) - .byte 235,210 // jmp 38ff <_sk_store_8888_sse41+0x69> + .byte 235,210 // jmp 38cc <_sk_store_8888_sse41+0x69> .byte 102,68,15,126,4,144 // movd %xmm8,(%rax,%rdx,4) - .byte 235,202 // jmp 38ff <_sk_store_8888_sse41+0x69> + .byte 235,202 // jmp 38cc <_sk_store_8888_sse41+0x69> HIDDEN _sk_load_f16_sse41 .globl _sk_load_f16_sse41 @@ -26079,7 +26001,7 @@ _sk_load_f16_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,60,1,0,0 // jne 3a7f <_sk_load_f16_sse41+0x14a> + .byte 15,133,60,1,0,0 // jne 3a4c <_sk_load_f16_sse41+0x14a> .byte 102,15,16,4,208 // movupd (%rax,%rdx,8),%xmm0 .byte 243,15,111,76,208,16 // movdqu 0x10(%rax,%rdx,8),%xmm1 .byte 102,68,15,40,200 // movapd %xmm0,%xmm9 @@ -26089,18 +26011,18 @@ _sk_load_f16_sse41: .byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,214,37,0,0 // movdqa 0x25d6(%rip),%xmm8 # 5f50 <_sk_callback_sse41+0xe8d> + .byte 102,68,15,111,5,217,37,0,0 // movdqa 0x25d9(%rip),%xmm8 # 5f20 <_sk_callback_sse41+0xe90> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,209,37,0,0 // movdqa 0x25d1(%rip),%xmm3 # 5f60 <_sk_callback_sse41+0xe9d> + .byte 102,15,111,29,212,37,0,0 // movdqa 0x25d4(%rip),%xmm3 # 5f30 <_sk_callback_sse41+0xea0> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,189,37,0,0 // movdqa 0x25bd(%rip),%xmm10 # 5f70 <_sk_callback_sse41+0xead> + .byte 102,68,15,111,21,192,37,0,0 // movdqa 0x25c0(%rip),%xmm10 # 5f40 <_sk_callback_sse41+0xeb0> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -26143,16 +26065,16 @@ _sk_load_f16_sse41: .byte 255,224 // jmpq *%rax .byte 242,15,16,4,208 // movsd (%rax,%rdx,8),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 3a97 <_sk_load_f16_sse41+0x162> + .byte 117,13 // jne 3a64 <_sk_load_f16_sse41+0x162> .byte 243,15,126,192 // movq %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,183,254,255,255 // jmpq 394e <_sk_load_f16_sse41+0x19> + .byte 233,183,254,255,255 // jmpq 391b <_sk_load_f16_sse41+0x19> .byte 102,15,22,68,208,8 // movhpd 0x8(%rax,%rdx,8),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,163,254,255,255 // jb 394e <_sk_load_f16_sse41+0x19> + .byte 15,130,163,254,255,255 // jb 391b <_sk_load_f16_sse41+0x19> .byte 243,15,126,76,208,16 // movq 0x10(%rax,%rdx,8),%xmm1 - .byte 233,152,254,255,255 // jmpq 394e <_sk_load_f16_sse41+0x19> + .byte 233,152,254,255,255 // jmpq 391b <_sk_load_f16_sse41+0x19> HIDDEN _sk_gather_f16_sse41 .globl _sk_gather_f16_sse41 @@ -26186,18 +26108,18 @@ _sk_gather_f16_sse41: .byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11 .byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9 .byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1 - .byte 102,68,15,111,5,67,36,0,0 // movdqa 0x2443(%rip),%xmm8 # 5f80 <_sk_callback_sse41+0xebd> + .byte 102,68,15,111,5,70,36,0,0 // movdqa 0x2446(%rip),%xmm8 # 5f50 <_sk_callback_sse41+0xec0> .byte 102,15,111,209 // movdqa %xmm1,%xmm2 .byte 102,65,15,219,208 // pand %xmm8,%xmm2 .byte 102,15,239,202 // pxor %xmm2,%xmm1 - .byte 102,15,111,29,62,36,0,0 // movdqa 0x243e(%rip),%xmm3 # 5f90 <_sk_callback_sse41+0xecd> + .byte 102,15,111,29,65,36,0,0 // movdqa 0x2441(%rip),%xmm3 # 5f60 <_sk_callback_sse41+0xed0> .byte 102,15,114,242,16 // pslld $0x10,%xmm2 .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0 .byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,202 // por %xmm2,%xmm1 - .byte 102,68,15,111,21,42,36,0,0 // movdqa 0x242a(%rip),%xmm10 # 5fa0 <_sk_callback_sse41+0xedd> + .byte 102,68,15,111,21,45,36,0,0 // movdqa 0x242d(%rip),%xmm10 # 5f70 <_sk_callback_sse41+0xee0> .byte 102,65,15,254,202 // paddd %xmm10,%xmm1 .byte 102,15,219,193 // pand %xmm1,%xmm0 .byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11 @@ -26246,17 +26168,17 @@ FUNCTION(_sk_store_f16_sse41) _sk_store_f16_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 102,68,15,111,21,95,35,0,0 // movdqa 0x235f(%rip),%xmm10 # 5fb0 <_sk_callback_sse41+0xeed> + .byte 102,68,15,111,21,98,35,0,0 // movdqa 0x2362(%rip),%xmm10 # 5f80 <_sk_callback_sse41+0xef0> .byte 102,68,15,111,216 // movdqa %xmm0,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,239,235 // pxor %xmm11,%xmm13 - .byte 102,68,15,111,13,82,35,0,0 // movdqa 0x2352(%rip),%xmm9 # 5fc0 <_sk_callback_sse41+0xefd> + .byte 102,68,15,111,13,85,35,0,0 // movdqa 0x2355(%rip),%xmm9 # 5f90 <_sk_callback_sse41+0xf00> .byte 102,65,15,114,211,16 // psrld $0x10,%xmm11 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8 .byte 102,65,15,114,213,13 // psrld $0xd,%xmm13 - .byte 102,68,15,111,37,67,35,0,0 // movdqa 0x2343(%rip),%xmm12 # 5fd0 <_sk_callback_sse41+0xf0d> + .byte 102,68,15,111,37,70,35,0,0 // movdqa 0x2346(%rip),%xmm12 # 5fa0 <_sk_callback_sse41+0xf10> .byte 102,69,15,235,220 // por %xmm12,%xmm11 .byte 102,69,15,254,221 // paddd %xmm13,%xmm11 .byte 102,69,15,223,195 // pandn %xmm11,%xmm8 @@ -26300,7 +26222,7 @@ _sk_store_f16_sse41: .byte 102,69,15,111,200 // movdqa %xmm8,%xmm9 .byte 102,69,15,98,203 // punpckldq %xmm11,%xmm9 .byte 77,133,192 // test %r8,%r8 - .byte 117,21 // jne 3d83 <_sk_store_f16_sse41+0x140> + .byte 117,21 // jne 3d50 <_sk_store_f16_sse41+0x140> .byte 68,15,17,12,208 // movups %xmm9,(%rax,%rdx,8) .byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8 .byte 243,68,15,127,68,208,16 // movdqu %xmm8,0x10(%rax,%rdx,8) @@ -26308,13 +26230,13 @@ _sk_store_f16_sse41: .byte 255,224 // jmpq *%rax .byte 102,68,15,214,12,208 // movq %xmm9,(%rax,%rdx,8) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 3d7f <_sk_store_f16_sse41+0x13c> + .byte 116,240 // je 3d4c <_sk_store_f16_sse41+0x13c> .byte 102,68,15,23,76,208,8 // movhpd %xmm9,0x8(%rax,%rdx,8) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 3d7f <_sk_store_f16_sse41+0x13c> + .byte 114,227 // jb 3d4c <_sk_store_f16_sse41+0x13c> .byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8 .byte 102,68,15,214,68,208,16 // movq %xmm8,0x10(%rax,%rdx,8) - .byte 235,213 // jmp 3d7f <_sk_store_f16_sse41+0x13c> + .byte 235,213 // jmp 3d4c <_sk_store_f16_sse41+0x13c> HIDDEN _sk_load_u16_be_sse41 .globl _sk_load_u16_be_sse41 @@ -26324,7 +26246,7 @@ _sk_load_u16_be_sse41: .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,185,0,0,0 // jne 3e79 <_sk_load_u16_be_sse41+0xcf> + .byte 15,133,185,0,0,0 // jne 3e46 <_sk_load_u16_be_sse41+0xcf> .byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0 .byte 243,65,15,111,76,65,16 // movdqu 0x10(%r9,%rax,2),%xmm1 .byte 102,15,40,208 // movapd %xmm0,%xmm2 @@ -26340,7 +26262,7 @@ _sk_load_u16_be_sse41: .byte 102,15,235,200 // por %xmm0,%xmm1 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,212,33,0,0 // movaps 0x21d4(%rip),%xmm8 # 5fe0 <_sk_callback_sse41+0xf1d> + .byte 68,15,40,5,215,33,0,0 // movaps 0x21d7(%rip),%xmm8 # 5fb0 <_sk_callback_sse41+0xf20> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -26368,16 +26290,16 @@ _sk_load_u16_be_sse41: .byte 255,224 // jmpq *%rax .byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 3e92 <_sk_load_u16_be_sse41+0xe8> + .byte 117,13 // jne 3e5f <_sk_load_u16_be_sse41+0xe8> .byte 243,15,126,192 // movq %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,59,255,255,255 // jmpq 3dcd <_sk_load_u16_be_sse41+0x23> + .byte 233,59,255,255,255 // jmpq 3d9a <_sk_load_u16_be_sse41+0x23> .byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,38,255,255,255 // jb 3dcd <_sk_load_u16_be_sse41+0x23> + .byte 15,130,38,255,255,255 // jb 3d9a <_sk_load_u16_be_sse41+0x23> .byte 243,65,15,126,76,65,16 // movq 0x10(%r9,%rax,2),%xmm1 - .byte 233,26,255,255,255 // jmpq 3dcd <_sk_load_u16_be_sse41+0x23> + .byte 233,26,255,255,255 // jmpq 3d9a <_sk_load_u16_be_sse41+0x23> HIDDEN _sk_load_rgb_u16_be_sse41 .globl _sk_load_rgb_u16_be_sse41 @@ -26387,7 +26309,7 @@ _sk_load_rgb_u16_be_sse41: .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,82 // lea (%rdx,%rdx,2),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,170,0,0,0 // jne 3f6f <_sk_load_rgb_u16_be_sse41+0xbc> + .byte 15,133,170,0,0,0 // jne 3f3c <_sk_load_rgb_u16_be_sse41+0xbc> .byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2 .byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3 .byte 102,15,115,219,4 // psrldq $0x4,%xmm3 @@ -26407,7 +26329,7 @@ _sk_load_rgb_u16_be_sse41: .byte 102,15,235,200 // por %xmm0,%xmm1 .byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,204,32,0,0 // movaps 0x20cc(%rip),%xmm8 # 5ff0 <_sk_callback_sse41+0xf2d> + .byte 68,15,40,5,207,32,0,0 // movaps 0x20cf(%rip),%xmm8 # 5fc0 <_sk_callback_sse41+0xf30> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -26424,27 +26346,27 @@ _sk_load_rgb_u16_be_sse41: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,147,32,0,0 // movaps 0x2093(%rip),%xmm3 # 6000 <_sk_callback_sse41+0xf3d> + .byte 15,40,29,150,32,0,0 // movaps 0x2096(%rip),%xmm3 # 5fd0 <_sk_callback_sse41+0xf40> .byte 255,224 // jmpq *%rax .byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2 .byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 3f94 <_sk_load_rgb_u16_be_sse41+0xe1> + .byte 117,13 // jne 3f61 <_sk_load_rgb_u16_be_sse41+0xe1> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,85,255,255,255 // jmpq 3ee9 <_sk_load_rgb_u16_be_sse41+0x36> + .byte 233,85,255,255,255 // jmpq 3eb6 <_sk_load_rgb_u16_be_sse41+0x36> .byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0 .byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,24 // jb 3fc5 <_sk_load_rgb_u16_be_sse41+0x112> + .byte 114,24 // jb 3f92 <_sk_load_rgb_u16_be_sse41+0x112> .byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3 .byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,36,255,255,255 // jmpq 3ee9 <_sk_load_rgb_u16_be_sse41+0x36> + .byte 233,36,255,255,255 // jmpq 3eb6 <_sk_load_rgb_u16_be_sse41+0x36> .byte 102,15,239,219 // pxor %xmm3,%xmm3 - .byte 233,27,255,255,255 // jmpq 3ee9 <_sk_load_rgb_u16_be_sse41+0x36> + .byte 233,27,255,255,255 // jmpq 3eb6 <_sk_load_rgb_u16_be_sse41+0x36> HIDDEN _sk_store_u16_be_sse41 .globl _sk_store_u16_be_sse41 @@ -26453,7 +26375,7 @@ _sk_store_u16_be_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax - .byte 68,15,40,21,45,32,0,0 // movaps 0x202d(%rip),%xmm10 # 6010 <_sk_callback_sse41+0xf4d> + .byte 68,15,40,21,48,32,0,0 // movaps 0x2030(%rip),%xmm10 # 5fe0 <_sk_callback_sse41+0xf50> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -26490,7 +26412,7 @@ _sk_store_u16_be_sse41: .byte 102,69,15,111,208 // movdqa %xmm8,%xmm10 .byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10 .byte 77,133,192 // test %r8,%r8 - .byte 117,21 // jne 40b1 <_sk_store_u16_be_sse41+0xe3> + .byte 117,21 // jne 407e <_sk_store_u16_be_sse41+0xe3> .byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2) .byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8 .byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2) @@ -26498,13 +26420,13 @@ _sk_store_u16_be_sse41: .byte 255,224 // jmpq *%rax .byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 40ad <_sk_store_u16_be_sse41+0xdf> + .byte 116,240 // je 407a <_sk_store_u16_be_sse41+0xdf> .byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 40ad <_sk_store_u16_be_sse41+0xdf> + .byte 114,227 // jb 407a <_sk_store_u16_be_sse41+0xdf> .byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8 .byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2) - .byte 235,213 // jmp 40ad <_sk_store_u16_be_sse41+0xdf> + .byte 235,213 // jmp 407a <_sk_store_u16_be_sse41+0xdf> HIDDEN _sk_load_f32_sse41 .globl _sk_load_f32_sse41 @@ -26517,7 +26439,7 @@ _sk_load_f32_sse41: .byte 72,193,224,4 // shl $0x4,%rax .byte 69,15,16,4,2 // movups (%r10,%rax,1),%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,66 // jne 4138 <_sk_load_f32_sse41+0x60> + .byte 117,66 // jne 4105 <_sk_load_f32_sse41+0x60> .byte 67,15,16,68,138,16 // movups 0x10(%r10,%r9,4),%xmm0 .byte 67,15,16,92,138,32 // movups 0x20(%r10,%r9,4),%xmm3 .byte 71,15,16,76,138,48 // movups 0x30(%r10,%r9,4),%xmm9 @@ -26537,17 +26459,17 @@ _sk_load_f32_sse41: .byte 255,224 // jmpq *%rax .byte 69,15,87,201 // xorps %xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,8 // jne 414a <_sk_load_f32_sse41+0x72> + .byte 117,8 // jne 4117 <_sk_load_f32_sse41+0x72> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 235,190 // jmp 4108 <_sk_load_f32_sse41+0x30> + .byte 235,190 // jmp 40d5 <_sk_load_f32_sse41+0x30> .byte 67,15,16,68,138,16 // movups 0x10(%r10,%r9,4),%xmm0 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,8 // jb 415e <_sk_load_f32_sse41+0x86> + .byte 114,8 // jb 412b <_sk_load_f32_sse41+0x86> .byte 67,15,16,92,138,32 // movups 0x20(%r10,%r9,4),%xmm3 - .byte 235,170 // jmp 4108 <_sk_load_f32_sse41+0x30> + .byte 235,170 // jmp 40d5 <_sk_load_f32_sse41+0x30> .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 235,165 // jmp 4108 <_sk_load_f32_sse41+0x30> + .byte 235,165 // jmp 40d5 <_sk_load_f32_sse41+0x30> HIDDEN _sk_store_f32_sse41 .globl _sk_store_f32_sse41 @@ -26573,7 +26495,7 @@ _sk_store_f32_sse41: .byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9 .byte 102,69,15,17,36,2 // movupd %xmm12,(%r10,%rax,1) .byte 77,133,192 // test %r8,%r8 - .byte 117,29 // jne 41d5 <_sk_store_f32_sse41+0x72> + .byte 117,29 // jne 41a2 <_sk_store_f32_sse41+0x72> .byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10 .byte 71,15,17,68,138,16 // movups %xmm8,0x10(%r10,%r9,4) .byte 102,71,15,17,76,138,32 // movupd %xmm9,0x20(%r10,%r9,4) @@ -26581,12 +26503,12 @@ _sk_store_f32_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,246 // je 41d1 <_sk_store_f32_sse41+0x6e> + .byte 116,246 // je 419e <_sk_store_f32_sse41+0x6e> .byte 71,15,17,68,138,16 // movups %xmm8,0x10(%r10,%r9,4) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,234 // jb 41d1 <_sk_store_f32_sse41+0x6e> + .byte 114,234 // jb 419e <_sk_store_f32_sse41+0x6e> .byte 102,71,15,17,76,138,32 // movupd %xmm9,0x20(%r10,%r9,4) - .byte 235,225 // jmp 41d1 <_sk_store_f32_sse41+0x6e> + .byte 235,225 // jmp 419e <_sk_store_f32_sse41+0x6e> HIDDEN _sk_clamp_x_sse41 .globl _sk_clamp_x_sse41 @@ -26670,7 +26592,7 @@ _sk_mirror_x_sse41: .byte 65,15,92,194 // subps %xmm10,%xmm0 .byte 243,69,15,88,192 // addss %xmm8,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 - .byte 243,68,15,89,13,249,32,0,0 // mulss 0x20f9(%rip),%xmm9 # 63e0 <_sk_callback_sse41+0x131d> + .byte 243,68,15,89,13,252,32,0,0 // mulss 0x20fc(%rip),%xmm9 # 63b0 <_sk_callback_sse41+0x1320> .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 @@ -26698,7 +26620,7 @@ _sk_mirror_y_sse41: .byte 65,15,92,202 // subps %xmm10,%xmm1 .byte 243,69,15,88,192 // addss %xmm8,%xmm8 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 - .byte 243,68,15,89,13,150,32,0,0 // mulss 0x2096(%rip),%xmm9 # 63e4 <_sk_callback_sse41+0x1321> + .byte 243,68,15,89,13,153,32,0,0 // mulss 0x2099(%rip),%xmm9 # 63b4 <_sk_callback_sse41+0x1324> .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 .byte 68,15,89,201 // mulps %xmm1,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 @@ -26720,7 +26642,7 @@ FUNCTION(_sk_clamp_x_1_sse41) _sk_clamp_x_1_sse41: .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,136,28,0,0 // minps 0x1c88(%rip),%xmm8 # 6020 <_sk_callback_sse41+0xf5d> + .byte 68,15,93,5,139,28,0,0 // minps 0x1c8b(%rip),%xmm8 # 5ff0 <_sk_callback_sse41+0xf60> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -26738,9 +26660,9 @@ HIDDEN _sk_mirror_x_1_sse41 .globl _sk_mirror_x_1_sse41 FUNCTION(_sk_mirror_x_1_sse41) _sk_mirror_x_1_sse41: - .byte 68,15,40,5,121,28,0,0 // movaps 0x1c79(%rip),%xmm8 # 6030 <_sk_callback_sse41+0xf6d> + .byte 68,15,40,5,124,28,0,0 // movaps 0x1c7c(%rip),%xmm8 # 6000 <_sk_callback_sse41+0xf70> .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,13,125,28,0,0 // movaps 0x1c7d(%rip),%xmm9 # 6040 <_sk_callback_sse41+0xf7d> + .byte 68,15,40,13,128,28,0,0 // movaps 0x1c80(%rip),%xmm9 # 6010 <_sk_callback_sse41+0xf80> .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9 .byte 69,15,88,201 // addps %xmm9,%xmm9 @@ -26757,10 +26679,10 @@ HIDDEN _sk_luminance_to_alpha_sse41 FUNCTION(_sk_luminance_to_alpha_sse41) _sk_luminance_to_alpha_sse41: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,92,28,0,0 // mulps 0x1c5c(%rip),%xmm0 # 6050 <_sk_callback_sse41+0xf8d> - .byte 15,89,13,101,28,0,0 // mulps 0x1c65(%rip),%xmm1 # 6060 <_sk_callback_sse41+0xf9d> + .byte 15,89,5,95,28,0,0 // mulps 0x1c5f(%rip),%xmm0 # 6020 <_sk_callback_sse41+0xf90> + .byte 15,89,13,104,28,0,0 // mulps 0x1c68(%rip),%xmm1 # 6030 <_sk_callback_sse41+0xfa0> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,107,28,0,0 // mulps 0x1c6b(%rip),%xmm3 # 6070 <_sk_callback_sse41+0xfad> + .byte 15,89,29,110,28,0,0 // mulps 0x1c6e(%rip),%xmm3 # 6040 <_sk_callback_sse41+0xfb0> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -27039,9 +26961,9 @@ _sk_evenly_spaced_gradient_sse41: .byte 72,139,24 // mov (%rax),%rbx .byte 76,139,112,8 // mov 0x8(%rax),%r14 .byte 72,255,203 // dec %rbx - .byte 120,7 // js 4843 <_sk_evenly_spaced_gradient_sse41+0x1a> + .byte 120,7 // js 4810 <_sk_evenly_spaced_gradient_sse41+0x1a> .byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1 - .byte 235,21 // jmp 4858 <_sk_evenly_spaced_gradient_sse41+0x2f> + .byte 235,21 // jmp 4825 <_sk_evenly_spaced_gradient_sse41+0x2f> .byte 73,137,217 // mov %rbx,%r9 .byte 73,209,233 // shr %r9 .byte 131,227,1 // and $0x1,%ebx @@ -27131,15 +27053,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41 .globl _sk_gauss_a_to_rgba_sse41 FUNCTION(_sk_gauss_a_to_rgba_sse41) _sk_gauss_a_to_rgba_sse41: - .byte 15,40,5,122,22,0,0 // movaps 0x167a(%rip),%xmm0 # 6080 <_sk_callback_sse41+0xfbd> + .byte 15,40,5,125,22,0,0 // movaps 0x167d(%rip),%xmm0 # 6050 <_sk_callback_sse41+0xfc0> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,128,22,0,0 // addps 0x1680(%rip),%xmm0 # 6090 <_sk_callback_sse41+0xfcd> + .byte 15,88,5,131,22,0,0 // addps 0x1683(%rip),%xmm0 # 6060 <_sk_callback_sse41+0xfd0> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,134,22,0,0 // addps 0x1686(%rip),%xmm0 # 60a0 <_sk_callback_sse41+0xfdd> + .byte 15,88,5,137,22,0,0 // addps 0x1689(%rip),%xmm0 # 6070 <_sk_callback_sse41+0xfe0> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,140,22,0,0 // addps 0x168c(%rip),%xmm0 # 60b0 <_sk_callback_sse41+0xfed> + .byte 15,88,5,143,22,0,0 // addps 0x168f(%rip),%xmm0 # 6080 <_sk_callback_sse41+0xff0> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,146,22,0,0 // addps 0x1692(%rip),%xmm0 # 60c0 <_sk_callback_sse41+0xffd> + .byte 15,88,5,149,22,0,0 // addps 0x1695(%rip),%xmm0 # 6090 <_sk_callback_sse41+0x1000> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 @@ -27157,12 +27079,12 @@ _sk_gradient_sse41: .byte 76,139,8 // mov (%rax),%r9 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,249,2 // cmp $0x2,%r9 - .byte 114,50 // jb 4a81 <_sk_gradient_sse41+0x46> + .byte 114,50 // jb 4a4e <_sk_gradient_sse41+0x46> .byte 72,139,88,72 // mov 0x48(%rax),%rbx .byte 73,255,201 // dec %r9 .byte 72,131,195,4 // add $0x4,%rbx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,107,22,0,0 // movaps 0x166b(%rip),%xmm2 # 60d0 <_sk_callback_sse41+0x100d> + .byte 15,40,21,110,22,0,0 // movaps 0x166e(%rip),%xmm2 # 60a0 <_sk_callback_sse41+0x1010> .byte 243,15,16,27 // movss (%rbx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -27170,7 +27092,7 @@ _sk_gradient_sse41: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 72,131,195,4 // add $0x4,%rbx .byte 73,255,201 // dec %r9 - .byte 117,228 // jne 4a65 <_sk_gradient_sse41+0x2a> + .byte 117,228 // jne 4a32 <_sk_gradient_sse41+0x2a> .byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9 .byte 69,137,202 // mov %r9d,%r10d .byte 73,193,233,32 // shr $0x20,%r9 @@ -27300,26 +27222,26 @@ _sk_xy_to_unit_angle_sse41: .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,40,236 // movaps %xmm12,%xmm13 .byte 69,15,89,237 // mulps %xmm13,%xmm13 - .byte 68,15,40,21,12,20,0,0 // movaps 0x140c(%rip),%xmm10 # 60e0 <_sk_callback_sse41+0x101d> + .byte 68,15,40,21,15,20,0,0 // movaps 0x140f(%rip),%xmm10 # 60b0 <_sk_callback_sse41+0x1020> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,16,20,0,0 // addps 0x1410(%rip),%xmm10 # 60f0 <_sk_callback_sse41+0x102d> + .byte 68,15,88,21,19,20,0,0 // addps 0x1413(%rip),%xmm10 # 60c0 <_sk_callback_sse41+0x1030> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,20,20,0,0 // addps 0x1414(%rip),%xmm10 # 6100 <_sk_callback_sse41+0x103d> + .byte 68,15,88,21,23,20,0,0 // addps 0x1417(%rip),%xmm10 # 60d0 <_sk_callback_sse41+0x1040> .byte 69,15,89,213 // mulps %xmm13,%xmm10 - .byte 68,15,88,21,24,20,0,0 // addps 0x1418(%rip),%xmm10 # 6110 <_sk_callback_sse41+0x104d> + .byte 68,15,88,21,27,20,0,0 // addps 0x141b(%rip),%xmm10 # 60e0 <_sk_callback_sse41+0x1050> .byte 69,15,89,212 // mulps %xmm12,%xmm10 .byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0 - .byte 68,15,40,29,23,20,0,0 // movaps 0x1417(%rip),%xmm11 # 6120 <_sk_callback_sse41+0x105d> + .byte 68,15,40,29,26,20,0,0 // movaps 0x141a(%rip),%xmm11 # 60f0 <_sk_callback_sse41+0x1060> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 - .byte 68,15,40,29,16,20,0,0 // movaps 0x1410(%rip),%xmm11 # 6130 <_sk_callback_sse41+0x106d> + .byte 68,15,40,29,19,20,0,0 // movaps 0x1413(%rip),%xmm11 # 6100 <_sk_callback_sse41+0x1070> .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 65,15,40,193 // movaps %xmm9,%xmm0 .byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0 - .byte 68,15,40,13,2,20,0,0 // movaps 0x1402(%rip),%xmm9 # 6140 <_sk_callback_sse41+0x107d> + .byte 68,15,40,13,5,20,0,0 // movaps 0x1405(%rip),%xmm9 # 6110 <_sk_callback_sse41+0x1080> .byte 69,15,92,202 // subps %xmm10,%xmm9 .byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10 .byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8 @@ -27345,7 +27267,7 @@ HIDDEN _sk_save_xy_sse41 FUNCTION(_sk_save_xy_sse41) _sk_save_xy_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,214,19,0,0 // movaps 0x13d6(%rip),%xmm8 # 6150 <_sk_callback_sse41+0x108d> + .byte 68,15,40,5,217,19,0,0 // movaps 0x13d9(%rip),%xmm8 # 6120 <_sk_callback_sse41+0x1090> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -27389,8 +27311,8 @@ _sk_bilinear_nx_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,88,19,0,0 // addps 0x1358(%rip),%xmm0 # 6160 <_sk_callback_sse41+0x109d> - .byte 68,15,40,13,96,19,0,0 // movaps 0x1360(%rip),%xmm9 # 6170 <_sk_callback_sse41+0x10ad> + .byte 15,88,5,91,19,0,0 // addps 0x135b(%rip),%xmm0 # 6130 <_sk_callback_sse41+0x10a0> + .byte 68,15,40,13,99,19,0,0 // movaps 0x1363(%rip),%xmm9 # 6140 <_sk_callback_sse41+0x10b0> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -27403,7 +27325,7 @@ _sk_bilinear_px_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,79,19,0,0 // addps 0x134f(%rip),%xmm0 # 6180 <_sk_callback_sse41+0x10bd> + .byte 15,88,5,82,19,0,0 // addps 0x1352(%rip),%xmm0 # 6150 <_sk_callback_sse41+0x10c0> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -27415,8 +27337,8 @@ _sk_bilinear_ny_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,65,19,0,0 // addps 0x1341(%rip),%xmm1 # 6190 <_sk_callback_sse41+0x10cd> - .byte 68,15,40,13,73,19,0,0 // movaps 0x1349(%rip),%xmm9 # 61a0 <_sk_callback_sse41+0x10dd> + .byte 15,88,13,68,19,0,0 // addps 0x1344(%rip),%xmm1 # 6160 <_sk_callback_sse41+0x10d0> + .byte 68,15,40,13,76,19,0,0 // movaps 0x134c(%rip),%xmm9 # 6170 <_sk_callback_sse41+0x10e0> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -27429,7 +27351,7 @@ _sk_bilinear_py_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,55,19,0,0 // addps 0x1337(%rip),%xmm1 # 61b0 <_sk_callback_sse41+0x10ed> + .byte 15,88,13,58,19,0,0 // addps 0x133a(%rip),%xmm1 # 6180 <_sk_callback_sse41+0x10f0> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -27441,13 +27363,13 @@ _sk_bicubic_n3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,42,19,0,0 // addps 0x132a(%rip),%xmm0 # 61c0 <_sk_callback_sse41+0x10fd> - .byte 68,15,40,13,50,19,0,0 // movaps 0x1332(%rip),%xmm9 # 61d0 <_sk_callback_sse41+0x110d> + .byte 15,88,5,45,19,0,0 // addps 0x132d(%rip),%xmm0 # 6190 <_sk_callback_sse41+0x1100> + .byte 68,15,40,13,53,19,0,0 // movaps 0x1335(%rip),%xmm9 # 61a0 <_sk_callback_sse41+0x1110> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,46,19,0,0 // mulps 0x132e(%rip),%xmm9 # 61e0 <_sk_callback_sse41+0x111d> - .byte 68,15,88,13,54,19,0,0 // addps 0x1336(%rip),%xmm9 # 61f0 <_sk_callback_sse41+0x112d> + .byte 68,15,89,13,49,19,0,0 // mulps 0x1331(%rip),%xmm9 # 61b0 <_sk_callback_sse41+0x1120> + .byte 68,15,88,13,57,19,0,0 // addps 0x1339(%rip),%xmm9 # 61c0 <_sk_callback_sse41+0x1130> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -27460,16 +27382,16 @@ _sk_bicubic_n1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,37,19,0,0 // addps 0x1325(%rip),%xmm0 # 6200 <_sk_callback_sse41+0x113d> - .byte 68,15,40,13,45,19,0,0 // movaps 0x132d(%rip),%xmm9 # 6210 <_sk_callback_sse41+0x114d> + .byte 15,88,5,40,19,0,0 // addps 0x1328(%rip),%xmm0 # 61d0 <_sk_callback_sse41+0x1140> + .byte 68,15,40,13,48,19,0,0 // movaps 0x1330(%rip),%xmm9 # 61e0 <_sk_callback_sse41+0x1150> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,49,19,0,0 // movaps 0x1331(%rip),%xmm8 # 6220 <_sk_callback_sse41+0x115d> + .byte 68,15,40,5,52,19,0,0 // movaps 0x1334(%rip),%xmm8 # 61f0 <_sk_callback_sse41+0x1160> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,53,19,0,0 // addps 0x1335(%rip),%xmm8 # 6230 <_sk_callback_sse41+0x116d> + .byte 68,15,88,5,56,19,0,0 // addps 0x1338(%rip),%xmm8 # 6200 <_sk_callback_sse41+0x1170> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,57,19,0,0 // addps 0x1339(%rip),%xmm8 # 6240 <_sk_callback_sse41+0x117d> + .byte 68,15,88,5,60,19,0,0 // addps 0x133c(%rip),%xmm8 # 6210 <_sk_callback_sse41+0x1180> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,61,19,0,0 // addps 0x133d(%rip),%xmm8 # 6250 <_sk_callback_sse41+0x118d> + .byte 68,15,88,5,64,19,0,0 // addps 0x1340(%rip),%xmm8 # 6220 <_sk_callback_sse41+0x1190> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -27479,17 +27401,17 @@ HIDDEN _sk_bicubic_p1x_sse41 FUNCTION(_sk_bicubic_p1x_sse41) _sk_bicubic_p1x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,55,19,0,0 // movaps 0x1337(%rip),%xmm8 # 6260 <_sk_callback_sse41+0x119d> + .byte 68,15,40,5,58,19,0,0 // movaps 0x133a(%rip),%xmm8 # 6230 <_sk_callback_sse41+0x11a0> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,51,19,0,0 // movaps 0x1333(%rip),%xmm10 # 6270 <_sk_callback_sse41+0x11ad> + .byte 68,15,40,21,54,19,0,0 // movaps 0x1336(%rip),%xmm10 # 6240 <_sk_callback_sse41+0x11b0> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,55,19,0,0 // addps 0x1337(%rip),%xmm10 # 6280 <_sk_callback_sse41+0x11bd> + .byte 68,15,88,21,58,19,0,0 // addps 0x133a(%rip),%xmm10 # 6250 <_sk_callback_sse41+0x11c0> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,51,19,0,0 // addps 0x1333(%rip),%xmm10 # 6290 <_sk_callback_sse41+0x11cd> + .byte 68,15,88,21,54,19,0,0 // addps 0x1336(%rip),%xmm10 # 6260 <_sk_callback_sse41+0x11d0> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -27501,11 +27423,11 @@ _sk_bicubic_p3x_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,38,19,0,0 // addps 0x1326(%rip),%xmm0 # 62a0 <_sk_callback_sse41+0x11dd> + .byte 15,88,5,41,19,0,0 // addps 0x1329(%rip),%xmm0 # 6270 <_sk_callback_sse41+0x11e0> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,38,19,0,0 // mulps 0x1326(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x11ed> - .byte 68,15,88,5,46,19,0,0 // addps 0x132e(%rip),%xmm8 # 62c0 <_sk_callback_sse41+0x11fd> + .byte 68,15,89,5,41,19,0,0 // mulps 0x1329(%rip),%xmm8 # 6280 <_sk_callback_sse41+0x11f0> + .byte 68,15,88,5,49,19,0,0 // addps 0x1331(%rip),%xmm8 # 6290 <_sk_callback_sse41+0x1200> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -27518,13 +27440,13 @@ _sk_bicubic_n3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,28,19,0,0 // addps 0x131c(%rip),%xmm1 # 62d0 <_sk_callback_sse41+0x120d> - .byte 68,15,40,13,36,19,0,0 // movaps 0x1324(%rip),%xmm9 # 62e0 <_sk_callback_sse41+0x121d> + .byte 15,88,13,31,19,0,0 // addps 0x131f(%rip),%xmm1 # 62a0 <_sk_callback_sse41+0x1210> + .byte 68,15,40,13,39,19,0,0 // movaps 0x1327(%rip),%xmm9 # 62b0 <_sk_callback_sse41+0x1220> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,32,19,0,0 // mulps 0x1320(%rip),%xmm9 # 62f0 <_sk_callback_sse41+0x122d> - .byte 68,15,88,13,40,19,0,0 // addps 0x1328(%rip),%xmm9 # 6300 <_sk_callback_sse41+0x123d> + .byte 68,15,89,13,35,19,0,0 // mulps 0x1323(%rip),%xmm9 # 62c0 <_sk_callback_sse41+0x1230> + .byte 68,15,88,13,43,19,0,0 // addps 0x132b(%rip),%xmm9 # 62d0 <_sk_callback_sse41+0x1240> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -27537,16 +27459,16 @@ _sk_bicubic_n1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,22,19,0,0 // addps 0x1316(%rip),%xmm1 # 6310 <_sk_callback_sse41+0x124d> - .byte 68,15,40,13,30,19,0,0 // movaps 0x131e(%rip),%xmm9 # 6320 <_sk_callback_sse41+0x125d> + .byte 15,88,13,25,19,0,0 // addps 0x1319(%rip),%xmm1 # 62e0 <_sk_callback_sse41+0x1250> + .byte 68,15,40,13,33,19,0,0 // movaps 0x1321(%rip),%xmm9 # 62f0 <_sk_callback_sse41+0x1260> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,34,19,0,0 // movaps 0x1322(%rip),%xmm8 # 6330 <_sk_callback_sse41+0x126d> + .byte 68,15,40,5,37,19,0,0 // movaps 0x1325(%rip),%xmm8 # 6300 <_sk_callback_sse41+0x1270> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,38,19,0,0 // addps 0x1326(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x127d> + .byte 68,15,88,5,41,19,0,0 // addps 0x1329(%rip),%xmm8 # 6310 <_sk_callback_sse41+0x1280> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,42,19,0,0 // addps 0x132a(%rip),%xmm8 # 6350 <_sk_callback_sse41+0x128d> + .byte 68,15,88,5,45,19,0,0 // addps 0x132d(%rip),%xmm8 # 6320 <_sk_callback_sse41+0x1290> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,46,19,0,0 // addps 0x132e(%rip),%xmm8 # 6360 <_sk_callback_sse41+0x129d> + .byte 68,15,88,5,49,19,0,0 // addps 0x1331(%rip),%xmm8 # 6330 <_sk_callback_sse41+0x12a0> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -27556,17 +27478,17 @@ HIDDEN _sk_bicubic_p1y_sse41 FUNCTION(_sk_bicubic_p1y_sse41) _sk_bicubic_p1y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,40,19,0,0 // movaps 0x1328(%rip),%xmm8 # 6370 <_sk_callback_sse41+0x12ad> + .byte 68,15,40,5,43,19,0,0 // movaps 0x132b(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x12b0> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,35,19,0,0 // movaps 0x1323(%rip),%xmm10 # 6380 <_sk_callback_sse41+0x12bd> + .byte 68,15,40,21,38,19,0,0 // movaps 0x1326(%rip),%xmm10 # 6350 <_sk_callback_sse41+0x12c0> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,39,19,0,0 // addps 0x1327(%rip),%xmm10 # 6390 <_sk_callback_sse41+0x12cd> + .byte 68,15,88,21,42,19,0,0 // addps 0x132a(%rip),%xmm10 # 6360 <_sk_callback_sse41+0x12d0> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,35,19,0,0 // addps 0x1323(%rip),%xmm10 # 63a0 <_sk_callback_sse41+0x12dd> + .byte 68,15,88,21,38,19,0,0 // addps 0x1326(%rip),%xmm10 # 6370 <_sk_callback_sse41+0x12e0> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -27578,11 +27500,11 @@ _sk_bicubic_p3y_sse41: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,21,19,0,0 // addps 0x1315(%rip),%xmm1 # 63b0 <_sk_callback_sse41+0x12ed> + .byte 15,88,13,24,19,0,0 // addps 0x1318(%rip),%xmm1 # 6380 <_sk_callback_sse41+0x12f0> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,21,19,0,0 // mulps 0x1315(%rip),%xmm8 # 63c0 <_sk_callback_sse41+0x12fd> - .byte 68,15,88,5,29,19,0,0 // addps 0x131d(%rip),%xmm8 # 63d0 <_sk_callback_sse41+0x130d> + .byte 68,15,89,5,24,19,0,0 // mulps 0x1318(%rip),%xmm8 # 6390 <_sk_callback_sse41+0x1300> + .byte 68,15,88,5,32,19,0,0 // addps 0x1320(%rip),%xmm8 # 63a0 <_sk_callback_sse41+0x1310> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -27812,11 +27734,11 @@ BALIGN16 .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi) .byte 0,224 // add %ah,%al .byte 64,0,0 // add %al,(%rax) - .byte 224,64 // loopne 5398 <.literal16+0x1d8> + .byte 224,64 // loopne 5368 <.literal16+0x1d8> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 539c <.literal16+0x1dc> + .byte 224,64 // loopne 536c <.literal16+0x1dc> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 53a0 <.literal16+0x1e0> + .byte 224,64 // loopne 5370 <.literal16+0x1e0> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd @@ -27836,13 +27758,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 53c1 <.literal16+0x201> + .byte 71,225,61 // rex.RXB loope 5391 <.literal16+0x201> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 53c5 <.literal16+0x205> + .byte 71,225,61 // rex.RXB loope 5395 <.literal16+0x205> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 53c9 <.literal16+0x209> + .byte 71,225,61 // rex.RXB loope 5399 <.literal16+0x209> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 53cd <.literal16+0x20d> + .byte 71,225,61 // rex.RXB loope 539d <.literal16+0x20d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -27867,13 +27789,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5401 <.literal16+0x241> + .byte 71,225,61 // rex.RXB loope 53d1 <.literal16+0x241> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5405 <.literal16+0x245> + .byte 71,225,61 // rex.RXB loope 53d5 <.literal16+0x245> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5409 <.literal16+0x249> + .byte 71,225,61 // rex.RXB loope 53d9 <.literal16+0x249> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 540d <.literal16+0x24d> + .byte 71,225,61 // rex.RXB loope 53dd <.literal16+0x24d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -27898,13 +27820,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5441 <.literal16+0x281> + .byte 71,225,61 // rex.RXB loope 5411 <.literal16+0x281> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5445 <.literal16+0x285> + .byte 71,225,61 // rex.RXB loope 5415 <.literal16+0x285> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5449 <.literal16+0x289> + .byte 71,225,61 // rex.RXB loope 5419 <.literal16+0x289> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 544d <.literal16+0x28d> + .byte 71,225,61 // rex.RXB loope 541d <.literal16+0x28d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -27929,13 +27851,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5481 <.literal16+0x2c1> + .byte 71,225,61 // rex.RXB loope 5451 <.literal16+0x2c1> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5485 <.literal16+0x2c5> + .byte 71,225,61 // rex.RXB loope 5455 <.literal16+0x2c5> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5489 <.literal16+0x2c9> + .byte 71,225,61 // rex.RXB loope 5459 <.literal16+0x2c9> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 548d <.literal16+0x2cd> + .byte 71,225,61 // rex.RXB loope 545d <.literal16+0x2cd> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -27952,10 +27874,10 @@ BALIGN16 .byte 0,1 // add %al,(%rcx) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005478 <_sk_callback_sse41+0xa0003b5> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005448 <_sk_callback_sse41+0xa0003b8> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005480 <_sk_callback_sse41+0x30003bd> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005450 <_sk_callback_sse41+0x30003c0> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -27974,11 +27896,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) .byte 67,0,0 // rex.XB add %al,(%r8) - .byte 127,67 // jg 54eb <.literal16+0x32b> + .byte 127,67 // jg 54bb <.literal16+0x32b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 54ef <.literal16+0x32f> + .byte 127,67 // jg 54bf <.literal16+0x32f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 54f3 <.literal16+0x333> + .byte 127,67 // jg 54c3 <.literal16+0x333> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -28213,13 +28135,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 56c9 <.literal16+0x509> + .byte 224,7 // loopne 5699 <.literal16+0x509> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 56cd <.literal16+0x50d> + .byte 224,7 // loopne 569d <.literal16+0x50d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 56d1 <.literal16+0x511> + .byte 224,7 // loopne 56a1 <.literal16+0x511> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 56d5 <.literal16+0x515> + .byte 224,7 // loopne 56a5 <.literal16+0x515> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -28253,10 +28175,10 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 1,255 // add %edi,%edi .byte 255 // (bad) - .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a005718 <_sk_callback_sse41+0xa000655> + .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a0056e8 <_sk_callback_sse41+0xa000658> .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005720 <_sk_callback_sse41+0x300065d> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 30056f0 <_sk_callback_sse41+0x3000660> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -28311,11 +28233,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 57eb <.literal16+0x62b> + .byte 127,67 // jg 57bb <.literal16+0x62b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 57ef <.literal16+0x62f> + .byte 127,67 // jg 57bf <.literal16+0x62f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 57f3 <.literal16+0x633> + .byte 127,67 // jg 57c3 <.literal16+0x633> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax) @@ -28330,16 +28252,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 57e4 <.literal16+0x624> + .byte 127,0 // jg 57b4 <.literal16+0x624> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 57e8 <.literal16+0x628> + .byte 127,0 // jg 57b8 <.literal16+0x628> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 57ec <.literal16+0x62c> + .byte 127,0 // jg 57bc <.literal16+0x62c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 57f0 <.literal16+0x630> + .byte 127,0 // jg 57c0 <.literal16+0x630> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -28348,7 +28270,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5875 <.literal16+0x6b5> + .byte 119,115 // ja 5845 <.literal16+0x6b5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -28359,7 +28281,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 57d9 <.literal16+0x619> + .byte 117,191 // jne 57a9 <.literal16+0x619> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -28371,7 +28293,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a3981a <_sk_callback_sse41+0xffffffffe9a34757> + .byte 233,220,63,163,233 // jmpq ffffffffe9a397ea <_sk_callback_sse41+0xffffffffe9a3475a> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -28426,16 +28348,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 58b4 <.literal16+0x6f4> + .byte 127,0 // jg 5884 <.literal16+0x6f4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 58b8 <.literal16+0x6f8> + .byte 127,0 // jg 5888 <.literal16+0x6f8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 58bc <.literal16+0x6fc> + .byte 127,0 // jg 588c <.literal16+0x6fc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 58c0 <.literal16+0x700> + .byte 127,0 // jg 5890 <.literal16+0x700> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -28444,7 +28366,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5945 <.literal16+0x785> + .byte 119,115 // ja 5915 <.literal16+0x785> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -28455,7 +28377,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 58a9 <.literal16+0x6e9> + .byte 117,191 // jne 5879 <.literal16+0x6e9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -28467,7 +28389,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a398ea <_sk_callback_sse41+0xffffffffe9a34827> + .byte 233,220,63,163,233 // jmpq ffffffffe9a398ba <_sk_callback_sse41+0xffffffffe9a3482a> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -28522,16 +28444,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5984 <.literal16+0x7c4> + .byte 127,0 // jg 5954 <.literal16+0x7c4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5988 <.literal16+0x7c8> + .byte 127,0 // jg 5958 <.literal16+0x7c8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 598c <.literal16+0x7cc> + .byte 127,0 // jg 595c <.literal16+0x7cc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5990 <.literal16+0x7d0> + .byte 127,0 // jg 5960 <.literal16+0x7d0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -28540,7 +28462,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5a15 <.literal16+0x855> + .byte 119,115 // ja 59e5 <.literal16+0x855> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -28551,7 +28473,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5979 <.literal16+0x7b9> + .byte 117,191 // jne 5949 <.literal16+0x7b9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -28563,7 +28485,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a399ba <_sk_callback_sse41+0xffffffffe9a348f7> + .byte 233,220,63,163,233 // jmpq ffffffffe9a3998a <_sk_callback_sse41+0xffffffffe9a348fa> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -28618,16 +28540,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5a54 <.literal16+0x894> + .byte 127,0 // jg 5a24 <.literal16+0x894> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5a58 <.literal16+0x898> + .byte 127,0 // jg 5a28 <.literal16+0x898> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5a5c <.literal16+0x89c> + .byte 127,0 // jg 5a2c <.literal16+0x89c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5a60 <.literal16+0x8a0> + .byte 127,0 // jg 5a30 <.literal16+0x8a0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -28636,7 +28558,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5ae5 <.literal16+0x925> + .byte 119,115 // ja 5ab5 <.literal16+0x925> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -28647,7 +28569,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5a49 <.literal16+0x889> + .byte 117,191 // jne 5a19 <.literal16+0x889> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -28659,7 +28581,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a39a8a <_sk_callback_sse41+0xffffffffe9a349c7> + .byte 233,220,63,163,233 // jmpq ffffffffe9a39a5a <_sk_callback_sse41+0xffffffffe9a349ca> .byte 220,63 // fdivrl (%rdi) .byte 81 // push %rcx .byte 140,242 // mov %?,%edx @@ -28710,13 +28632,13 @@ BALIGN16 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 - .byte 127,67 // jg 5b67 <.literal16+0x9a7> + .byte 127,67 // jg 5b37 <.literal16+0x9a7> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5b6b <.literal16+0x9ab> + .byte 127,67 // jg 5b3b <.literal16+0x9ab> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5b6f <.literal16+0x9af> + .byte 127,67 // jg 5b3f <.literal16+0x9af> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5b73 <.literal16+0x9b3> + .byte 127,67 // jg 5b43 <.literal16+0x9b3> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -28763,16 +28685,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%rbx) .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5bf3 <.literal16+0xa33> + .byte 118,63 // jbe 5bc3 <.literal16+0xa33> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5bf7 <.literal16+0xa37> + .byte 118,63 // jbe 5bc7 <.literal16+0xa37> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5bfb <.literal16+0xa3b> + .byte 118,63 // jbe 5bcb <.literal16+0xa3b> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 5bff <.literal16+0xa3f> + .byte 118,63 // jbe 5bcf <.literal16+0xa3f> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) @@ -28792,11 +28714,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5c4b <.literal16+0xa8b> + .byte 127,67 // jg 5c1b <.literal16+0xa8b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5c4f <.literal16+0xa8f> + .byte 127,67 // jg 5c1f <.literal16+0xa8f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5c53 <.literal16+0xa93> + .byte 127,67 // jg 5c23 <.literal16+0xa93> .byte 0,4,0 // add %al,(%rax,%rax,1) .byte 0,0 // add %al,(%rax) .byte 0,0 // add %al,(%rax) @@ -28839,7 +28761,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005ca0 <_sk_callback_sse41+0x3000bdd> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005c70 <_sk_callback_sse41+0x3000be0> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -28868,13 +28790,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5cd9 <.literal16+0xb19> + .byte 224,7 // loopne 5ca9 <.literal16+0xb19> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5cdd <.literal16+0xb1d> + .byte 224,7 // loopne 5cad <.literal16+0xb1d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5ce1 <.literal16+0xb21> + .byte 224,7 // loopne 5cb1 <.literal16+0xb21> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5ce5 <.literal16+0xb25> + .byte 224,7 // loopne 5cb5 <.literal16+0xb25> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -28920,13 +28842,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5d49 <.literal16+0xb89> + .byte 224,7 // loopne 5d19 <.literal16+0xb89> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5d4d <.literal16+0xb8d> + .byte 224,7 // loopne 5d1d <.literal16+0xb8d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5d51 <.literal16+0xb91> + .byte 224,7 // loopne 5d21 <.literal16+0xb91> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5d55 <.literal16+0xb95> + .byte 224,7 // loopne 5d25 <.literal16+0xb95> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -28964,13 +28886,13 @@ BALIGN16 .byte 65,0,0 // add %al,(%r8) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 5de6 <.literal16+0xc26> + .byte 124,66 // jl 5db6 <.literal16+0xc26> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 5dea <.literal16+0xc2a> + .byte 124,66 // jl 5dba <.literal16+0xc2a> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 5dee <.literal16+0xc2e> + .byte 124,66 // jl 5dbe <.literal16+0xc2e> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 5df2 <.literal16+0xc32> + .byte 124,66 // jl 5dc2 <.literal16+0xc32> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 0,240 // add %dh,%al @@ -29060,13 +28982,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5ef5 <.literal16+0xd35> + .byte 112,65 // jo 5ec5 <.literal16+0xd35> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5ef9 <.literal16+0xd39> + .byte 112,65 // jo 5ec9 <.literal16+0xd39> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5efd <.literal16+0xd3d> + .byte 112,65 // jo 5ecd <.literal16+0xd3d> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 5f01 <.literal16+0xd41> + .byte 112,65 // jo 5ed1 <.literal16+0xd41> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -29081,7 +29003,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005ef0 <_sk_callback_sse41+0x3000e2d> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005ec0 <_sk_callback_sse41+0x3000e30> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -29108,7 +29030,7 @@ BALIGN16 .byte 5,255,255,255,9 // add $0x9ffffff,%eax .byte 255 // (bad) .byte 255 // (bad) - .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005f30 <_sk_callback_sse41+0x3000e6d> + .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 3005f00 <_sk_callback_sse41+0x3000e70> .byte 255 // (bad) .byte 255 // (bad) .byte 255,6 // incl (%rsi) @@ -29123,11 +29045,11 @@ BALIGN16 .byte 255,0 // incl (%rax) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5f8b <.literal16+0xdcb> + .byte 127,67 // jg 5f5b <.literal16+0xdcb> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5f8f <.literal16+0xdcf> + .byte 127,67 // jg 5f5f <.literal16+0xdcf> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5f93 <.literal16+0xdd3> + .byte 127,67 // jg 5f63 <.literal16+0xdd3> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) @@ -29203,13 +29125,13 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 605b <.literal16+0xe9b> + .byte 127,71 // jg 602b <.literal16+0xe9b> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 605f <.literal16+0xe9f> + .byte 127,71 // jg 602f <.literal16+0xe9f> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 6063 <.literal16+0xea3> + .byte 127,71 // jg 6033 <.literal16+0xea3> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 6067 <.literal16+0xea7> + .byte 127,71 // jg 6037 <.literal16+0xea7> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -29255,10 +29177,10 @@ BALIGN16 .byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax .byte 152 // cwtl .byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx) - .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0719a <_sk_callback_sse41+0x2dc020d7> + .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0716a <_sk_callback_sse41+0x2dc020da> .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js 60cc <.literal16+0xf0c> + .byte 120,57 // js 609c <.literal16+0xf0c> .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil @@ -29380,11 +29302,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 6202 <.literal16+0x1042> + .byte 62,114,28 // jb,pt 61d2 <.literal16+0x1042> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6206 <.literal16+0x1046> + .byte 62,114,28 // jb,pt 61d6 <.literal16+0x1046> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 620a <.literal16+0x104a> + .byte 62,114,28 // jb,pt 61da <.literal16+0x104a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -29428,7 +29350,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f095 <_sk_callback_sse41+0x3d639fd2> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f065 <_sk_callback_sse41+0x3d639fd5> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -29454,7 +29376,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f0d5 <_sk_callback_sse41+0x3d63a012> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f0a5 <_sk_callback_sse41+0x3d63a015> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -29463,13 +29385,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 62ce <.literal16+0x110e> + .byte 114,28 // jb 629e <.literal16+0x110e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 62d2 <.literal16+0x1112> + .byte 62,114,28 // jb,pt 62a2 <.literal16+0x1112> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 62d6 <.literal16+0x1116> + .byte 62,114,28 // jb,pt 62a6 <.literal16+0x1116> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 62da <.literal16+0x111a> + .byte 62,114,28 // jb,pt 62aa <.literal16+0x111a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -29490,11 +29412,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 6312 <.literal16+0x1152> + .byte 62,114,28 // jb,pt 62e2 <.literal16+0x1152> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6316 <.literal16+0x1156> + .byte 62,114,28 // jb,pt 62e6 <.literal16+0x1156> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 631a <.literal16+0x115a> + .byte 62,114,28 // jb,pt 62ea <.literal16+0x115a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -29538,7 +29460,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f1a5 <_sk_callback_sse41+0x3d63a0e2> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f175 <_sk_callback_sse41+0x3d63a0e5> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -29564,7 +29486,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f1e5 <_sk_callback_sse41+0x3d63a122> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f1b5 <_sk_callback_sse41+0x3d63a125> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -29573,13 +29495,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 63de <.literal16+0x121e> + .byte 114,28 // jb 63ae <.literal16+0x121e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 63e2 <_sk_callback_sse41+0x131f> + .byte 62,114,28 // jb,pt 63b2 <_sk_callback_sse41+0x1322> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 63e6 <_sk_callback_sse41+0x1323> + .byte 62,114,28 // jb,pt 63b6 <_sk_callback_sse41+0x1326> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 63ea <_sk_callback_sse41+0x1327> + .byte 62,114,28 // jb,pt 63ba <_sk_callback_sse41+0x132a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -29609,9 +29531,9 @@ _sk_start_pipeline_sse2: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 80 // push %rax - .byte 77,137,199 // mov %r8,%r15 + .byte 77,137,196 // mov %r8,%r12 .byte 73,137,208 // mov %rdx,%r8 - .byte 73,137,244 // mov %rsi,%r12 + .byte 73,137,247 // mov %rsi,%r15 .byte 72,137,251 // mov %rdi,%rbx .byte 72,137,206 // mov %rcx,%rsi .byte 72,173 // lods %ds:(%rsi),%rax @@ -29620,21 +29542,13 @@ _sk_start_pipeline_sse2: .byte 76,57,193 // cmp %r8,%rcx .byte 118,5 // jbe 30 <_sk_start_pipeline_sse2+0x30> .byte 72,137,218 // mov %rbx,%rdx - .byte 235,75 // jmp 7b <_sk_start_pipeline_sse2+0x7b> + .byte 235,48 // jmp 60 <_sk_start_pipeline_sse2+0x60> .byte 76,137,69,208 // mov %r8,-0x30(%rbp) - .byte 65,184,0,0,0,0 // mov $0x0,%r8d - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,87,201 // xorps %xmm1,%xmm1 - .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 15,87,228 // xorps %xmm4,%xmm4 - .byte 15,87,237 // xorps %xmm5,%xmm5 - .byte 15,87,246 // xorps %xmm6,%xmm6 - .byte 15,87,255 // xorps %xmm7,%xmm7 - .byte 76,137,255 // mov %r15,%rdi + .byte 69,49,192 // xor %r8d,%r8d + .byte 76,137,231 // mov %r12,%rdi .byte 76,137,238 // mov %r13,%rsi .byte 72,137,218 // mov %rbx,%rdx - .byte 76,137,225 // mov %r12,%rcx + .byte 76,137,249 // mov %r15,%rcx .byte 73,137,198 // mov %rax,%r14 .byte 65,255,214 // callq *%r14 .byte 76,139,69,208 // mov -0x30(%rbp),%r8 @@ -29643,20 +29557,12 @@ _sk_start_pipeline_sse2: .byte 72,131,195,8 // add $0x8,%rbx .byte 76,57,195 // cmp %r8,%rbx .byte 72,137,211 // mov %rdx,%rbx - .byte 118,185 // jbe 34 <_sk_start_pipeline_sse2+0x34> + .byte 118,212 // jbe 34 <_sk_start_pipeline_sse2+0x34> .byte 73,41,208 // sub %rdx,%r8 - .byte 116,49 // je b1 <_sk_start_pipeline_sse2+0xb1> - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,87,201 // xorps %xmm1,%xmm1 - .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 15,87,228 // xorps %xmm4,%xmm4 - .byte 15,87,237 // xorps %xmm5,%xmm5 - .byte 15,87,246 // xorps %xmm6,%xmm6 - .byte 15,87,255 // xorps %xmm7,%xmm7 - .byte 76,137,255 // mov %r15,%rdi + .byte 116,25 // je 7e <_sk_start_pipeline_sse2+0x7e> + .byte 76,137,231 // mov %r12,%rdi .byte 76,137,238 // mov %r13,%rsi - .byte 76,137,225 // mov %r12,%rcx + .byte 76,137,249 // mov %r15,%rcx .byte 72,131,196,8 // add $0x8,%rsp .byte 91 // pop %rbx .byte 65,92 // pop %r12 @@ -29687,7 +29593,7 @@ _sk_seed_shader_sse2: .byte 102,15,110,194 // movd %edx,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,21,156,85,0,0 // movaps 0x559c(%rip),%xmm2 # 5670 <_sk_callback_sse2+0xfa> + .byte 15,40,21,159,85,0,0 // movaps 0x559f(%rip),%xmm2 # 5640 <_sk_callback_sse2+0xfd> .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,7 // movups (%rdi),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -29696,7 +29602,7 @@ _sk_seed_shader_sse2: .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,21,139,85,0,0 // movaps 0x558b(%rip),%xmm2 # 5680 <_sk_callback_sse2+0x10a> + .byte 15,40,21,142,85,0,0 // movaps 0x558e(%rip),%xmm2 # 5650 <_sk_callback_sse2+0x10d> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,87,237 // xorps %xmm5,%xmm5 @@ -29716,14 +29622,14 @@ _sk_dither_sse2: .byte 102,68,15,110,193 // movd %ecx,%xmm8 .byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8 .byte 102,69,15,239,193 // pxor %xmm9,%xmm8 - .byte 102,68,15,111,21,89,85,0,0 // movdqa 0x5559(%rip),%xmm10 # 5690 <_sk_callback_sse2+0x11a> + .byte 102,68,15,111,21,92,85,0,0 // movdqa 0x555c(%rip),%xmm10 # 5660 <_sk_callback_sse2+0x11d> .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 .byte 102,69,15,219,218 // pand %xmm10,%xmm11 .byte 102,65,15,114,243,5 // pslld $0x5,%xmm11 .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 102,65,15,114,242,4 // pslld $0x4,%xmm10 - .byte 102,68,15,111,37,69,85,0,0 // movdqa 0x5545(%rip),%xmm12 # 56a0 <_sk_callback_sse2+0x12a> - .byte 102,68,15,111,45,76,85,0,0 // movdqa 0x554c(%rip),%xmm13 # 56b0 <_sk_callback_sse2+0x13a> + .byte 102,68,15,111,37,72,85,0,0 // movdqa 0x5548(%rip),%xmm12 # 5670 <_sk_callback_sse2+0x12d> + .byte 102,68,15,111,45,79,85,0,0 // movdqa 0x554f(%rip),%xmm13 # 5680 <_sk_callback_sse2+0x13d> .byte 102,69,15,111,240 // movdqa %xmm8,%xmm14 .byte 102,69,15,219,245 // pand %xmm13,%xmm14 .byte 102,65,15,114,246,2 // pslld $0x2,%xmm14 @@ -29739,8 +29645,8 @@ _sk_dither_sse2: .byte 102,69,15,235,245 // por %xmm13,%xmm14 .byte 102,69,15,235,240 // por %xmm8,%xmm14 .byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8 - .byte 68,15,89,5,7,85,0,0 // mulps 0x5507(%rip),%xmm8 # 56c0 <_sk_callback_sse2+0x14a> - .byte 68,15,88,5,15,85,0,0 // addps 0x550f(%rip),%xmm8 # 56d0 <_sk_callback_sse2+0x15a> + .byte 68,15,89,5,10,85,0,0 // mulps 0x550a(%rip),%xmm8 # 5690 <_sk_callback_sse2+0x14d> + .byte 68,15,88,5,18,85,0,0 // addps 0x5512(%rip),%xmm8 # 56a0 <_sk_callback_sse2+0x15d> .byte 243,68,15,16,16 // movss (%rax),%xmm10 .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -29817,7 +29723,7 @@ HIDDEN _sk_srcatop_sse2 FUNCTION(_sk_srcatop_sse2) _sk_srcatop_sse2: .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 68,15,40,5,105,84,0,0 // movaps 0x5469(%rip),%xmm8 # 56e0 <_sk_callback_sse2+0x16a> + .byte 68,15,40,5,108,84,0,0 // movaps 0x546c(%rip),%xmm8 # 56b0 <_sk_callback_sse2+0x16d> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -29842,7 +29748,7 @@ FUNCTION(_sk_dstatop_sse2) _sk_dstatop_sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 .byte 68,15,89,196 // mulps %xmm4,%xmm8 - .byte 68,15,40,13,44,84,0,0 // movaps 0x542c(%rip),%xmm9 # 56f0 <_sk_callback_sse2+0x17a> + .byte 68,15,40,13,47,84,0,0 // movaps 0x542f(%rip),%xmm9 # 56c0 <_sk_callback_sse2+0x17d> .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 @@ -29889,7 +29795,7 @@ HIDDEN _sk_srcout_sse2 .globl _sk_srcout_sse2 FUNCTION(_sk_srcout_sse2) _sk_srcout_sse2: - .byte 68,15,40,5,208,83,0,0 // movaps 0x53d0(%rip),%xmm8 # 5700 <_sk_callback_sse2+0x18a> + .byte 68,15,40,5,211,83,0,0 // movaps 0x53d3(%rip),%xmm8 # 56d0 <_sk_callback_sse2+0x18d> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 @@ -29902,7 +29808,7 @@ HIDDEN _sk_dstout_sse2 .globl _sk_dstout_sse2 FUNCTION(_sk_dstout_sse2) _sk_dstout_sse2: - .byte 68,15,40,5,192,83,0,0 // movaps 0x53c0(%rip),%xmm8 # 5710 <_sk_callback_sse2+0x19a> + .byte 68,15,40,5,195,83,0,0 // movaps 0x53c3(%rip),%xmm8 # 56e0 <_sk_callback_sse2+0x19d> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -29919,7 +29825,7 @@ HIDDEN _sk_srcover_sse2 .globl _sk_srcover_sse2 FUNCTION(_sk_srcover_sse2) _sk_srcover_sse2: - .byte 68,15,40,5,163,83,0,0 // movaps 0x53a3(%rip),%xmm8 # 5720 <_sk_callback_sse2+0x1aa> + .byte 68,15,40,5,166,83,0,0 // movaps 0x53a6(%rip),%xmm8 # 56f0 <_sk_callback_sse2+0x1ad> .byte 68,15,92,195 // subps %xmm3,%xmm8 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -29939,7 +29845,7 @@ HIDDEN _sk_dstover_sse2 .globl _sk_dstover_sse2 FUNCTION(_sk_dstover_sse2) _sk_dstover_sse2: - .byte 68,15,40,5,119,83,0,0 // movaps 0x5377(%rip),%xmm8 # 5730 <_sk_callback_sse2+0x1ba> + .byte 68,15,40,5,122,83,0,0 // movaps 0x537a(%rip),%xmm8 # 5700 <_sk_callback_sse2+0x1bd> .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -29967,7 +29873,7 @@ HIDDEN _sk_multiply_sse2 .globl _sk_multiply_sse2 FUNCTION(_sk_multiply_sse2) _sk_multiply_sse2: - .byte 68,15,40,5,75,83,0,0 // movaps 0x534b(%rip),%xmm8 # 5740 <_sk_callback_sse2+0x1ca> + .byte 68,15,40,5,78,83,0,0 // movaps 0x534e(%rip),%xmm8 # 5710 <_sk_callback_sse2+0x1cd> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,209 // movaps %xmm9,%xmm10 @@ -30042,7 +29948,7 @@ HIDDEN _sk_xor__sse2 FUNCTION(_sk_xor__sse2) _sk_xor__sse2: .byte 68,15,40,195 // movaps %xmm3,%xmm8 - .byte 15,40,29,128,82,0,0 // movaps 0x5280(%rip),%xmm3 # 5750 <_sk_callback_sse2+0x1da> + .byte 15,40,29,131,82,0,0 // movaps 0x5283(%rip),%xmm3 # 5720 <_sk_callback_sse2+0x1dd> .byte 68,15,40,203 // movaps %xmm3,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 65,15,89,193 // mulps %xmm9,%xmm0 @@ -30090,7 +29996,7 @@ _sk_darken_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,95,209 // maxps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,235,81,0,0 // movaps 0x51eb(%rip),%xmm2 # 5760 <_sk_callback_sse2+0x1ea> + .byte 15,40,21,238,81,0,0 // movaps 0x51ee(%rip),%xmm2 # 5730 <_sk_callback_sse2+0x1ed> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -30124,7 +30030,7 @@ _sk_lighten_sse2: .byte 68,15,89,206 // mulps %xmm6,%xmm9 .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,144,81,0,0 // movaps 0x5190(%rip),%xmm2 # 5770 <_sk_callback_sse2+0x1fa> + .byte 15,40,21,147,81,0,0 // movaps 0x5193(%rip),%xmm2 # 5740 <_sk_callback_sse2+0x1fd> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -30161,7 +30067,7 @@ _sk_difference_sse2: .byte 65,15,93,209 // minps %xmm9,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,42,81,0,0 // movaps 0x512a(%rip),%xmm2 # 5780 <_sk_callback_sse2+0x20a> + .byte 15,40,21,45,81,0,0 // movaps 0x512d(%rip),%xmm2 # 5750 <_sk_callback_sse2+0x20d> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -30189,7 +30095,7 @@ _sk_exclusion_sse2: .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 68,15,92,194 // subps %xmm2,%xmm8 - .byte 15,40,21,234,80,0,0 // movaps 0x50ea(%rip),%xmm2 # 5790 <_sk_callback_sse2+0x21a> + .byte 15,40,21,237,80,0,0 // movaps 0x50ed(%rip),%xmm2 # 5760 <_sk_callback_sse2+0x21d> .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,89,215 // mulps %xmm7,%xmm2 .byte 15,88,218 // addps %xmm2,%xmm3 @@ -30202,7 +30108,7 @@ HIDDEN _sk_colorburn_sse2 FUNCTION(_sk_colorburn_sse2) _sk_colorburn_sse2: .byte 68,15,40,192 // movaps %xmm0,%xmm8 - .byte 68,15,40,21,221,80,0,0 // movaps 0x50dd(%rip),%xmm10 # 57a0 <_sk_callback_sse2+0x22a> + .byte 68,15,40,21,224,80,0,0 // movaps 0x50e0(%rip),%xmm10 # 5770 <_sk_callback_sse2+0x22d> .byte 69,15,40,202 // movaps %xmm10,%xmm9 .byte 68,15,92,207 // subps %xmm7,%xmm9 .byte 69,15,40,217 // movaps %xmm9,%xmm11 @@ -30296,7 +30202,7 @@ HIDDEN _sk_colordodge_sse2 FUNCTION(_sk_colordodge_sse2) _sk_colordodge_sse2: .byte 68,15,40,200 // movaps %xmm0,%xmm9 - .byte 68,15,40,21,147,79,0,0 // movaps 0x4f93(%rip),%xmm10 # 57b0 <_sk_callback_sse2+0x23a> + .byte 68,15,40,21,150,79,0,0 // movaps 0x4f96(%rip),%xmm10 # 5780 <_sk_callback_sse2+0x23d> .byte 69,15,40,218 // movaps %xmm10,%xmm11 .byte 68,15,92,223 // subps %xmm7,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 @@ -30390,7 +30296,7 @@ _sk_hardlight_sse2: .byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp) .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 15,40,236 // movaps %xmm4,%xmm5 - .byte 68,15,40,29,72,78,0,0 // movaps 0x4e48(%rip),%xmm11 # 57c0 <_sk_callback_sse2+0x24a> + .byte 68,15,40,29,75,78,0,0 // movaps 0x4e4b(%rip),%xmm11 # 5790 <_sk_callback_sse2+0x24d> .byte 69,15,40,211 // movaps %xmm11,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,194 // movaps %xmm10,%xmm8 @@ -30478,7 +30384,7 @@ FUNCTION(_sk_overlay_sse2) _sk_overlay_sse2: .byte 68,15,40,193 // movaps %xmm1,%xmm8 .byte 68,15,40,232 // movaps %xmm0,%xmm13 - .byte 68,15,40,13,22,77,0,0 // movaps 0x4d16(%rip),%xmm9 # 57d0 <_sk_callback_sse2+0x25a> + .byte 68,15,40,13,25,77,0,0 // movaps 0x4d19(%rip),%xmm9 # 57a0 <_sk_callback_sse2+0x25d> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 68,15,92,215 // subps %xmm7,%xmm10 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -30569,7 +30475,7 @@ _sk_softlight_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 68,15,94,215 // divps %xmm7,%xmm10 .byte 69,15,84,212 // andps %xmm12,%xmm10 - .byte 68,15,40,13,211,75,0,0 // movaps 0x4bd3(%rip),%xmm9 # 57e0 <_sk_callback_sse2+0x26a> + .byte 68,15,40,13,214,75,0,0 // movaps 0x4bd6(%rip),%xmm9 # 57b0 <_sk_callback_sse2+0x26d> .byte 69,15,40,249 // movaps %xmm9,%xmm15 .byte 69,15,92,250 // subps %xmm10,%xmm15 .byte 69,15,40,218 // movaps %xmm10,%xmm11 @@ -30582,10 +30488,10 @@ _sk_softlight_sse2: .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 65,15,88,194 // addps %xmm10,%xmm0 - .byte 68,15,40,53,173,75,0,0 // movaps 0x4bad(%rip),%xmm14 # 57f0 <_sk_callback_sse2+0x27a> + .byte 68,15,40,53,176,75,0,0 // movaps 0x4bb0(%rip),%xmm14 # 57c0 <_sk_callback_sse2+0x27d> .byte 69,15,88,222 // addps %xmm14,%xmm11 .byte 68,15,89,216 // mulps %xmm0,%xmm11 - .byte 68,15,40,21,173,75,0,0 // movaps 0x4bad(%rip),%xmm10 # 5800 <_sk_callback_sse2+0x28a> + .byte 68,15,40,21,176,75,0,0 // movaps 0x4bb0(%rip),%xmm10 # 57d0 <_sk_callback_sse2+0x28d> .byte 69,15,89,234 // mulps %xmm10,%xmm13 .byte 69,15,88,235 // addps %xmm11,%xmm13 .byte 15,88,228 // addps %xmm4,%xmm4 @@ -30730,7 +30636,7 @@ _sk_hue_sse2: .byte 68,15,40,209 // movaps %xmm1,%xmm10 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 68,15,89,211 // mulps %xmm3,%xmm10 - .byte 68,15,40,5,240,73,0,0 // movaps 0x49f0(%rip),%xmm8 # 5840 <_sk_callback_sse2+0x2ca> + .byte 68,15,40,5,243,73,0,0 // movaps 0x49f3(%rip),%xmm8 # 5810 <_sk_callback_sse2+0x2cd> .byte 69,15,40,216 // movaps %xmm8,%xmm11 .byte 15,40,207 // movaps %xmm7,%xmm1 .byte 68,15,92,217 // subps %xmm1,%xmm11 @@ -30778,12 +30684,12 @@ _sk_hue_sse2: .byte 69,15,84,206 // andps %xmm14,%xmm9 .byte 69,15,84,214 // andps %xmm14,%xmm10 .byte 65,15,84,214 // andps %xmm14,%xmm2 - .byte 68,15,40,61,253,72,0,0 // movaps 0x48fd(%rip),%xmm15 # 5810 <_sk_callback_sse2+0x29a> + .byte 68,15,40,61,0,73,0,0 // movaps 0x4900(%rip),%xmm15 # 57e0 <_sk_callback_sse2+0x29d> .byte 65,15,89,231 // mulps %xmm15,%xmm4 - .byte 15,40,5,2,73,0,0 // movaps 0x4902(%rip),%xmm0 # 5820 <_sk_callback_sse2+0x2aa> + .byte 15,40,5,5,73,0,0 // movaps 0x4905(%rip),%xmm0 # 57f0 <_sk_callback_sse2+0x2ad> .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 15,88,244 // addps %xmm4,%xmm6 - .byte 68,15,40,53,4,73,0,0 // movaps 0x4904(%rip),%xmm14 # 5830 <_sk_callback_sse2+0x2ba> + .byte 68,15,40,53,7,73,0,0 // movaps 0x4907(%rip),%xmm14 # 5800 <_sk_callback_sse2+0x2bd> .byte 68,15,40,239 // movaps %xmm7,%xmm13 .byte 69,15,89,238 // mulps %xmm14,%xmm13 .byte 68,15,88,238 // addps %xmm6,%xmm13 @@ -30961,14 +30867,14 @@ _sk_saturation_sse2: .byte 68,15,84,211 // andps %xmm3,%xmm10 .byte 68,15,84,203 // andps %xmm3,%xmm9 .byte 15,84,195 // andps %xmm3,%xmm0 - .byte 68,15,40,5,150,70,0,0 // movaps 0x4696(%rip),%xmm8 # 5850 <_sk_callback_sse2+0x2da> + .byte 68,15,40,5,153,70,0,0 // movaps 0x4699(%rip),%xmm8 # 5820 <_sk_callback_sse2+0x2dd> .byte 15,40,214 // movaps %xmm6,%xmm2 .byte 65,15,89,208 // mulps %xmm8,%xmm2 - .byte 15,40,13,152,70,0,0 // movaps 0x4698(%rip),%xmm1 # 5860 <_sk_callback_sse2+0x2ea> + .byte 15,40,13,155,70,0,0 // movaps 0x469b(%rip),%xmm1 # 5830 <_sk_callback_sse2+0x2ed> .byte 15,40,221 // movaps %xmm5,%xmm3 .byte 15,89,217 // mulps %xmm1,%xmm3 .byte 15,88,218 // addps %xmm2,%xmm3 - .byte 68,15,40,37,151,70,0,0 // movaps 0x4697(%rip),%xmm12 # 5870 <_sk_callback_sse2+0x2fa> + .byte 68,15,40,37,154,70,0,0 // movaps 0x469a(%rip),%xmm12 # 5840 <_sk_callback_sse2+0x2fd> .byte 69,15,89,236 // mulps %xmm12,%xmm13 .byte 68,15,88,235 // addps %xmm3,%xmm13 .byte 65,15,40,210 // movaps %xmm10,%xmm2 @@ -31013,7 +30919,7 @@ _sk_saturation_sse2: .byte 15,40,223 // movaps %xmm7,%xmm3 .byte 15,40,236 // movaps %xmm4,%xmm5 .byte 15,89,221 // mulps %xmm5,%xmm3 - .byte 68,15,40,5,252,69,0,0 // movaps 0x45fc(%rip),%xmm8 # 5880 <_sk_callback_sse2+0x30a> + .byte 68,15,40,5,255,69,0,0 // movaps 0x45ff(%rip),%xmm8 # 5850 <_sk_callback_sse2+0x30d> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 68,15,92,199 // subps %xmm7,%xmm8 .byte 15,88,253 // addps %xmm5,%xmm7 @@ -31114,14 +31020,14 @@ _sk_color_sse2: .byte 68,15,40,213 // movaps %xmm5,%xmm10 .byte 69,15,89,208 // mulps %xmm8,%xmm10 .byte 65,15,40,208 // movaps %xmm8,%xmm2 - .byte 68,15,40,45,154,68,0,0 // movaps 0x449a(%rip),%xmm13 # 5890 <_sk_callback_sse2+0x31a> + .byte 68,15,40,45,157,68,0,0 // movaps 0x449d(%rip),%xmm13 # 5860 <_sk_callback_sse2+0x31d> .byte 68,15,40,198 // movaps %xmm6,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,40,53,154,68,0,0 // movaps 0x449a(%rip),%xmm14 # 58a0 <_sk_callback_sse2+0x32a> + .byte 68,15,40,53,157,68,0,0 // movaps 0x449d(%rip),%xmm14 # 5870 <_sk_callback_sse2+0x32d> .byte 65,15,40,195 // movaps %xmm11,%xmm0 .byte 65,15,89,198 // mulps %xmm14,%xmm0 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,29,150,68,0,0 // movaps 0x4496(%rip),%xmm11 # 58b0 <_sk_callback_sse2+0x33a> + .byte 68,15,40,29,153,68,0,0 // movaps 0x4499(%rip),%xmm11 # 5880 <_sk_callback_sse2+0x33d> .byte 69,15,89,227 // mulps %xmm11,%xmm12 .byte 68,15,88,224 // addps %xmm0,%xmm12 .byte 65,15,40,193 // movaps %xmm9,%xmm0 @@ -31129,7 +31035,7 @@ _sk_color_sse2: .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,89,254 // mulps %xmm14,%xmm15 .byte 68,15,88,248 // addps %xmm0,%xmm15 - .byte 68,15,40,5,130,68,0,0 // movaps 0x4482(%rip),%xmm8 # 58c0 <_sk_callback_sse2+0x34a> + .byte 68,15,40,5,133,68,0,0 // movaps 0x4485(%rip),%xmm8 # 5890 <_sk_callback_sse2+0x34d> .byte 65,15,40,224 // movaps %xmm8,%xmm4 .byte 15,92,226 // subps %xmm2,%xmm4 .byte 15,89,252 // mulps %xmm4,%xmm7 @@ -31265,15 +31171,15 @@ _sk_luminosity_sse2: .byte 68,15,40,205 // movaps %xmm5,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 .byte 15,89,222 // mulps %xmm6,%xmm3 - .byte 68,15,40,37,153,66,0,0 // movaps 0x4299(%rip),%xmm12 # 58d0 <_sk_callback_sse2+0x35a> + .byte 68,15,40,37,156,66,0,0 // movaps 0x429c(%rip),%xmm12 # 58a0 <_sk_callback_sse2+0x35d> .byte 68,15,40,199 // movaps %xmm7,%xmm8 .byte 69,15,89,196 // mulps %xmm12,%xmm8 - .byte 68,15,40,45,153,66,0,0 // movaps 0x4299(%rip),%xmm13 # 58e0 <_sk_callback_sse2+0x36a> + .byte 68,15,40,45,156,66,0,0 // movaps 0x429c(%rip),%xmm13 # 58b0 <_sk_callback_sse2+0x36d> .byte 68,15,40,241 // movaps %xmm1,%xmm14 .byte 69,15,89,245 // mulps %xmm13,%xmm14 .byte 69,15,88,240 // addps %xmm8,%xmm14 - .byte 68,15,40,29,149,66,0,0 // movaps 0x4295(%rip),%xmm11 # 58f0 <_sk_callback_sse2+0x37a> - .byte 68,15,40,5,157,66,0,0 // movaps 0x429d(%rip),%xmm8 # 5900 <_sk_callback_sse2+0x38a> + .byte 68,15,40,29,152,66,0,0 // movaps 0x4298(%rip),%xmm11 # 58c0 <_sk_callback_sse2+0x37d> + .byte 68,15,40,5,160,66,0,0 // movaps 0x42a0(%rip),%xmm8 # 58d0 <_sk_callback_sse2+0x38d> .byte 69,15,40,248 // movaps %xmm8,%xmm15 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 68,15,92,248 // subps %xmm0,%xmm15 @@ -31409,10 +31315,10 @@ _sk_srcover_rgba_8888_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,227,0,0,0 // jne 193b <_sk_srcover_rgba_8888_sse2+0xf1> + .byte 15,133,227,0,0,0 // jne 1908 <_sk_srcover_rgba_8888_sse2+0xf1> .byte 243,68,15,111,4,144 // movdqu (%rax,%rdx,4),%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 102,15,111,53,167,64,0,0 // movdqa 0x40a7(%rip),%xmm6 # 5910 <_sk_callback_sse2+0x39a> + .byte 102,15,111,53,170,64,0,0 // movdqa 0x40aa(%rip),%xmm6 # 58e0 <_sk_callback_sse2+0x39d> .byte 102,65,15,111,224 // movdqa %xmm8,%xmm4 .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 @@ -31426,9 +31332,9 @@ _sk_srcover_rgba_8888_sse2: .byte 15,91,247 // cvtdq2ps %xmm7,%xmm6 .byte 102,65,15,114,208,24 // psrld $0x18,%xmm8 .byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7 - .byte 68,15,40,5,119,64,0,0 // movaps 0x4077(%rip),%xmm8 # 5920 <_sk_callback_sse2+0x3aa> + .byte 68,15,40,5,122,64,0,0 // movaps 0x407a(%rip),%xmm8 # 58f0 <_sk_callback_sse2+0x3ad> .byte 68,15,92,195 // subps %xmm3,%xmm8 - .byte 68,15,40,37,123,64,0,0 // movaps 0x407b(%rip),%xmm12 # 5930 <_sk_callback_sse2+0x3ba> + .byte 68,15,40,37,126,64,0,0 // movaps 0x407e(%rip),%xmm12 # 5900 <_sk_callback_sse2+0x3bd> .byte 65,15,89,196 // mulps %xmm12,%xmm0 .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 68,15,89,204 // mulps %xmm4,%xmm9 @@ -31454,7 +31360,7 @@ _sk_srcover_rgba_8888_sse2: .byte 102,15,114,240,24 // pslld $0x18,%xmm0 .byte 102,15,235,194 // por %xmm2,%xmm0 .byte 102,15,235,193 // por %xmm1,%xmm0 - .byte 117,82 // jne 1974 <_sk_srcover_rgba_8888_sse2+0x12a> + .byte 117,82 // jne 1941 <_sk_srcover_rgba_8888_sse2+0x12a> .byte 243,15,127,4,144 // movdqu %xmm0,(%rax,%rdx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,193 // movaps %xmm9,%xmm0 @@ -31465,32 +31371,32 @@ _sk_srcover_rgba_8888_sse2: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,87 // je 199f <_sk_srcover_rgba_8888_sse2+0x155> + .byte 116,87 // je 196c <_sk_srcover_rgba_8888_sse2+0x155> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,22 // je 1969 <_sk_srcover_rgba_8888_sse2+0x11f> + .byte 116,22 // je 1936 <_sk_srcover_rgba_8888_sse2+0x11f> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 15,133,1,255,255,255 // jne 185e <_sk_srcover_rgba_8888_sse2+0x14> + .byte 15,133,1,255,255,255 // jne 182b <_sk_srcover_rgba_8888_sse2+0x14> .byte 102,15,110,100,144,8 // movd 0x8(%rax,%rdx,4),%xmm4 .byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8 .byte 102,68,15,18,4,144 // movlpd (%rax,%rdx,4),%xmm8 - .byte 233,234,254,255,255 // jmpq 185e <_sk_srcover_rgba_8888_sse2+0x14> + .byte 233,234,254,255,255 // jmpq 182b <_sk_srcover_rgba_8888_sse2+0x14> .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,41 // je 19aa <_sk_srcover_rgba_8888_sse2+0x160> + .byte 116,41 // je 1977 <_sk_srcover_rgba_8888_sse2+0x160> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,17 // je 1998 <_sk_srcover_rgba_8888_sse2+0x14e> + .byte 116,17 // je 1965 <_sk_srcover_rgba_8888_sse2+0x14e> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,154 // jne 1927 <_sk_srcover_rgba_8888_sse2+0xdd> + .byte 117,154 // jne 18f4 <_sk_srcover_rgba_8888_sse2+0xdd> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,15,126,76,144,8 // movd %xmm1,0x8(%rax,%rdx,4) .byte 102,15,214,4,144 // movq %xmm0,(%rax,%rdx,4) - .byte 235,136 // jmp 1927 <_sk_srcover_rgba_8888_sse2+0xdd> + .byte 235,136 // jmp 18f4 <_sk_srcover_rgba_8888_sse2+0xdd> .byte 102,68,15,110,4,144 // movd (%rax,%rdx,4),%xmm8 - .byte 233,180,254,255,255 // jmpq 185e <_sk_srcover_rgba_8888_sse2+0x14> + .byte 233,180,254,255,255 // jmpq 182b <_sk_srcover_rgba_8888_sse2+0x14> .byte 102,15,126,4,144 // movd %xmm0,(%rax,%rdx,4) - .byte 233,115,255,255,255 // jmpq 1927 <_sk_srcover_rgba_8888_sse2+0xdd> + .byte 233,115,255,255,255 // jmpq 18f4 <_sk_srcover_rgba_8888_sse2+0xdd> HIDDEN _sk_clamp_0_sse2 .globl _sk_clamp_0_sse2 @@ -31508,7 +31414,7 @@ HIDDEN _sk_clamp_1_sse2 .globl _sk_clamp_1_sse2 FUNCTION(_sk_clamp_1_sse2) _sk_clamp_1_sse2: - .byte 68,15,40,5,108,63,0,0 // movaps 0x3f6c(%rip),%xmm8 # 5940 <_sk_callback_sse2+0x3ca> + .byte 68,15,40,5,111,63,0,0 // movaps 0x3f6f(%rip),%xmm8 # 5910 <_sk_callback_sse2+0x3cd> .byte 65,15,93,192 // minps %xmm8,%xmm0 .byte 65,15,93,200 // minps %xmm8,%xmm1 .byte 65,15,93,208 // minps %xmm8,%xmm2 @@ -31520,7 +31426,7 @@ HIDDEN _sk_clamp_a_sse2 .globl _sk_clamp_a_sse2 FUNCTION(_sk_clamp_a_sse2) _sk_clamp_a_sse2: - .byte 15,93,29,97,63,0,0 // minps 0x3f61(%rip),%xmm3 # 5950 <_sk_callback_sse2+0x3da> + .byte 15,93,29,100,63,0,0 // minps 0x3f64(%rip),%xmm3 # 5920 <_sk_callback_sse2+0x3dd> .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 .byte 15,93,211 // minps %xmm3,%xmm2 @@ -31607,7 +31513,7 @@ HIDDEN _sk_unpremul_sse2 FUNCTION(_sk_unpremul_sse2) _sk_unpremul_sse2: .byte 69,15,87,192 // xorps %xmm8,%xmm8 - .byte 68,15,40,13,204,62,0,0 // movaps 0x3ecc(%rip),%xmm9 # 5960 <_sk_callback_sse2+0x3ea> + .byte 68,15,40,13,207,62,0,0 // movaps 0x3ecf(%rip),%xmm9 # 5930 <_sk_callback_sse2+0x3ed> .byte 68,15,94,203 // divps %xmm3,%xmm9 .byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8 .byte 69,15,84,193 // andps %xmm9,%xmm8 @@ -31621,20 +31527,20 @@ HIDDEN _sk_from_srgb_sse2 .globl _sk_from_srgb_sse2 FUNCTION(_sk_from_srgb_sse2) _sk_from_srgb_sse2: - .byte 68,15,40,5,183,62,0,0 // movaps 0x3eb7(%rip),%xmm8 # 5970 <_sk_callback_sse2+0x3fa> + .byte 68,15,40,5,186,62,0,0 // movaps 0x3eba(%rip),%xmm8 # 5940 <_sk_callback_sse2+0x3fd> .byte 68,15,40,232 // movaps %xmm0,%xmm13 .byte 69,15,89,232 // mulps %xmm8,%xmm13 .byte 68,15,40,216 // movaps %xmm0,%xmm11 .byte 69,15,89,219 // mulps %xmm11,%xmm11 - .byte 68,15,40,13,175,62,0,0 // movaps 0x3eaf(%rip),%xmm9 # 5980 <_sk_callback_sse2+0x40a> + .byte 68,15,40,13,178,62,0,0 // movaps 0x3eb2(%rip),%xmm9 # 5950 <_sk_callback_sse2+0x40d> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,241 // mulps %xmm9,%xmm14 - .byte 68,15,40,21,175,62,0,0 // movaps 0x3eaf(%rip),%xmm10 # 5990 <_sk_callback_sse2+0x41a> + .byte 68,15,40,21,178,62,0,0 // movaps 0x3eb2(%rip),%xmm10 # 5960 <_sk_callback_sse2+0x41d> .byte 69,15,88,242 // addps %xmm10,%xmm14 .byte 69,15,89,243 // mulps %xmm11,%xmm14 - .byte 68,15,40,29,175,62,0,0 // movaps 0x3eaf(%rip),%xmm11 # 59a0 <_sk_callback_sse2+0x42a> + .byte 68,15,40,29,178,62,0,0 // movaps 0x3eb2(%rip),%xmm11 # 5970 <_sk_callback_sse2+0x42d> .byte 69,15,88,243 // addps %xmm11,%xmm14 - .byte 68,15,40,37,179,62,0,0 // movaps 0x3eb3(%rip),%xmm12 # 59b0 <_sk_callback_sse2+0x43a> + .byte 68,15,40,37,182,62,0,0 // movaps 0x3eb6(%rip),%xmm12 # 5980 <_sk_callback_sse2+0x43d> .byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0 .byte 68,15,84,232 // andps %xmm0,%xmm13 .byte 65,15,85,198 // andnps %xmm14,%xmm0 @@ -31671,22 +31577,22 @@ HIDDEN _sk_to_srgb_sse2 FUNCTION(_sk_to_srgb_sse2) _sk_to_srgb_sse2: .byte 68,15,82,232 // rsqrtps %xmm0,%xmm13 - .byte 68,15,40,5,64,62,0,0 // movaps 0x3e40(%rip),%xmm8 # 59c0 <_sk_callback_sse2+0x44a> + .byte 68,15,40,5,67,62,0,0 // movaps 0x3e43(%rip),%xmm8 # 5990 <_sk_callback_sse2+0x44d> .byte 68,15,40,240 // movaps %xmm0,%xmm14 .byte 69,15,89,240 // mulps %xmm8,%xmm14 - .byte 68,15,40,13,64,62,0,0 // movaps 0x3e40(%rip),%xmm9 # 59d0 <_sk_callback_sse2+0x45a> + .byte 68,15,40,13,67,62,0,0 // movaps 0x3e43(%rip),%xmm9 # 59a0 <_sk_callback_sse2+0x45d> .byte 69,15,40,253 // movaps %xmm13,%xmm15 .byte 69,15,89,249 // mulps %xmm9,%xmm15 - .byte 68,15,40,21,64,62,0,0 // movaps 0x3e40(%rip),%xmm10 # 59e0 <_sk_callback_sse2+0x46a> + .byte 68,15,40,21,67,62,0,0 // movaps 0x3e43(%rip),%xmm10 # 59b0 <_sk_callback_sse2+0x46d> .byte 69,15,88,250 // addps %xmm10,%xmm15 .byte 69,15,89,253 // mulps %xmm13,%xmm15 - .byte 68,15,40,29,64,62,0,0 // movaps 0x3e40(%rip),%xmm11 # 59f0 <_sk_callback_sse2+0x47a> + .byte 68,15,40,29,67,62,0,0 // movaps 0x3e43(%rip),%xmm11 # 59c0 <_sk_callback_sse2+0x47d> .byte 69,15,88,251 // addps %xmm11,%xmm15 - .byte 68,15,40,37,68,62,0,0 // movaps 0x3e44(%rip),%xmm12 # 5a00 <_sk_callback_sse2+0x48a> + .byte 68,15,40,37,71,62,0,0 // movaps 0x3e47(%rip),%xmm12 # 59d0 <_sk_callback_sse2+0x48d> .byte 69,15,88,236 // addps %xmm12,%xmm13 .byte 69,15,83,237 // rcpps %xmm13,%xmm13 .byte 69,15,89,239 // mulps %xmm15,%xmm13 - .byte 68,15,40,61,64,62,0,0 // movaps 0x3e40(%rip),%xmm15 # 5a10 <_sk_callback_sse2+0x49a> + .byte 68,15,40,61,67,62,0,0 // movaps 0x3e43(%rip),%xmm15 # 59e0 <_sk_callback_sse2+0x49d> .byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,197 // andnps %xmm13,%xmm0 @@ -31736,7 +31642,7 @@ _sk_rgb_to_hsl_sse2: .byte 68,15,93,218 // minps %xmm2,%xmm11 .byte 65,15,40,202 // movaps %xmm10,%xmm1 .byte 65,15,92,203 // subps %xmm11,%xmm1 - .byte 68,15,40,45,153,61,0,0 // movaps 0x3d99(%rip),%xmm13 # 5a20 <_sk_callback_sse2+0x4aa> + .byte 68,15,40,45,156,61,0,0 // movaps 0x3d9c(%rip),%xmm13 # 59f0 <_sk_callback_sse2+0x4ad> .byte 68,15,94,233 // divps %xmm1,%xmm13 .byte 65,15,40,194 // movaps %xmm10,%xmm0 .byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0 @@ -31745,30 +31651,30 @@ _sk_rgb_to_hsl_sse2: .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,40,241 // movaps %xmm9,%xmm14 .byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14 - .byte 68,15,84,53,127,61,0,0 // andps 0x3d7f(%rip),%xmm14 # 5a30 <_sk_callback_sse2+0x4ba> + .byte 68,15,84,53,130,61,0,0 // andps 0x3d82(%rip),%xmm14 # 5a00 <_sk_callback_sse2+0x4bd> .byte 69,15,88,244 // addps %xmm12,%xmm14 .byte 69,15,40,250 // movaps %xmm10,%xmm15 .byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15 .byte 65,15,92,208 // subps %xmm8,%xmm2 .byte 65,15,89,213 // mulps %xmm13,%xmm2 - .byte 68,15,40,37,114,61,0,0 // movaps 0x3d72(%rip),%xmm12 # 5a40 <_sk_callback_sse2+0x4ca> + .byte 68,15,40,37,117,61,0,0 // movaps 0x3d75(%rip),%xmm12 # 5a10 <_sk_callback_sse2+0x4cd> .byte 65,15,88,212 // addps %xmm12,%xmm2 .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 69,15,89,197 // mulps %xmm13,%xmm8 - .byte 68,15,88,5,110,61,0,0 // addps 0x3d6e(%rip),%xmm8 # 5a50 <_sk_callback_sse2+0x4da> + .byte 68,15,88,5,113,61,0,0 // addps 0x3d71(%rip),%xmm8 # 5a20 <_sk_callback_sse2+0x4dd> .byte 65,15,84,215 // andps %xmm15,%xmm2 .byte 69,15,85,248 // andnps %xmm8,%xmm15 .byte 68,15,86,250 // orps %xmm2,%xmm15 .byte 68,15,84,240 // andps %xmm0,%xmm14 .byte 65,15,85,199 // andnps %xmm15,%xmm0 .byte 65,15,86,198 // orps %xmm14,%xmm0 - .byte 15,89,5,95,61,0,0 // mulps 0x3d5f(%rip),%xmm0 # 5a60 <_sk_callback_sse2+0x4ea> + .byte 15,89,5,98,61,0,0 // mulps 0x3d62(%rip),%xmm0 # 5a30 <_sk_callback_sse2+0x4ed> .byte 69,15,40,194 // movaps %xmm10,%xmm8 .byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8 .byte 65,15,84,192 // andps %xmm8,%xmm0 .byte 69,15,92,226 // subps %xmm10,%xmm12 .byte 69,15,88,211 // addps %xmm11,%xmm10 - .byte 68,15,40,13,82,61,0,0 // movaps 0x3d52(%rip),%xmm9 # 5a70 <_sk_callback_sse2+0x4fa> + .byte 68,15,40,13,85,61,0,0 // movaps 0x3d55(%rip),%xmm9 # 5a40 <_sk_callback_sse2+0x4fd> .byte 65,15,40,210 // movaps %xmm10,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9 @@ -31792,7 +31698,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp) .byte 68,15,40,218 // movaps %xmm2,%xmm11 .byte 15,40,240 // movaps %xmm0,%xmm6 - .byte 68,15,40,13,17,61,0,0 // movaps 0x3d11(%rip),%xmm9 # 5a80 <_sk_callback_sse2+0x50a> + .byte 68,15,40,13,20,61,0,0 // movaps 0x3d14(%rip),%xmm9 # 5a50 <_sk_callback_sse2+0x50d> .byte 69,15,40,209 // movaps %xmm9,%xmm10 .byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10 .byte 15,40,193 // movaps %xmm1,%xmm0 @@ -31809,28 +31715,28 @@ _sk_hsl_to_rgb_sse2: .byte 69,15,88,211 // addps %xmm11,%xmm10 .byte 69,15,88,219 // addps %xmm11,%xmm11 .byte 69,15,92,218 // subps %xmm10,%xmm11 - .byte 15,40,5,218,60,0,0 // movaps 0x3cda(%rip),%xmm0 # 5a90 <_sk_callback_sse2+0x51a> + .byte 15,40,5,221,60,0,0 // movaps 0x3cdd(%rip),%xmm0 # 5a60 <_sk_callback_sse2+0x51d> .byte 15,88,198 // addps %xmm6,%xmm0 .byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 .byte 15,40,216 // movaps %xmm0,%xmm3 .byte 15,194,217,1 // cmpltps %xmm1,%xmm3 - .byte 15,84,29,210,60,0,0 // andps 0x3cd2(%rip),%xmm3 # 5aa0 <_sk_callback_sse2+0x52a> + .byte 15,84,29,213,60,0,0 // andps 0x3cd5(%rip),%xmm3 # 5a70 <_sk_callback_sse2+0x52d> .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,92,193 // subps %xmm1,%xmm0 - .byte 68,15,40,45,212,60,0,0 // movaps 0x3cd4(%rip),%xmm13 # 5ab0 <_sk_callback_sse2+0x53a> + .byte 68,15,40,45,215,60,0,0 // movaps 0x3cd7(%rip),%xmm13 # 5a80 <_sk_callback_sse2+0x53d> .byte 69,15,40,197 // movaps %xmm13,%xmm8 .byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8 .byte 69,15,40,242 // movaps %xmm10,%xmm14 .byte 69,15,92,243 // subps %xmm11,%xmm14 .byte 65,15,40,217 // movaps %xmm9,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 - .byte 15,40,21,228,60,0,0 // movaps 0x3ce4(%rip),%xmm2 # 5ae0 <_sk_callback_sse2+0x56a> + .byte 15,40,21,231,60,0,0 // movaps 0x3ce7(%rip),%xmm2 # 5ab0 <_sk_callback_sse2+0x56d> .byte 68,15,40,250 // movaps %xmm2,%xmm15 .byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15 - .byte 15,40,13,180,60,0,0 // movaps 0x3cb4(%rip),%xmm1 # 5ac0 <_sk_callback_sse2+0x54a> + .byte 15,40,13,183,60,0,0 // movaps 0x3cb7(%rip),%xmm1 # 5a90 <_sk_callback_sse2+0x54d> .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,45,186,60,0,0 // movaps 0x3cba(%rip),%xmm5 # 5ad0 <_sk_callback_sse2+0x55a> + .byte 15,40,45,189,60,0,0 // movaps 0x3cbd(%rip),%xmm5 # 5aa0 <_sk_callback_sse2+0x55d> .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,92,224 // subps %xmm0,%xmm4 .byte 65,15,89,230 // mulps %xmm14,%xmm4 @@ -31853,7 +31759,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,47,60,0,0 // andps 0x3c2f(%rip),%xmm3 # 5aa0 <_sk_callback_sse2+0x52a> + .byte 15,84,29,50,60,0,0 // andps 0x3c32(%rip),%xmm3 # 5a70 <_sk_callback_sse2+0x52d> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 68,15,40,230 // movaps %xmm6,%xmm12 .byte 68,15,92,224 // subps %xmm0,%xmm12 @@ -31883,12 +31789,12 @@ _sk_hsl_to_rgb_sse2: .byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7 .byte 15,40,231 // movaps %xmm7,%xmm4 .byte 15,85,227 // andnps %xmm3,%xmm4 - .byte 15,88,53,7,60,0,0 // addps 0x3c07(%rip),%xmm6 # 5af0 <_sk_callback_sse2+0x57a> + .byte 15,88,53,10,60,0,0 // addps 0x3c0a(%rip),%xmm6 # 5ac0 <_sk_callback_sse2+0x57d> .byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,222 // movaps %xmm6,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,84,29,162,59,0,0 // andps 0x3ba2(%rip),%xmm3 # 5aa0 <_sk_callback_sse2+0x52a> + .byte 15,84,29,165,59,0,0 // andps 0x3ba5(%rip),%xmm3 # 5a70 <_sk_callback_sse2+0x52d> .byte 15,92,195 // subps %xmm3,%xmm0 .byte 15,92,240 // subps %xmm0,%xmm6 .byte 15,89,206 // mulps %xmm6,%xmm1 @@ -31948,13 +31854,13 @@ _sk_scale_u8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,61 // jne 1ff1 <_sk_scale_u8_sse2+0x47> + .byte 117,61 // jne 1fbe <_sk_scale_u8_sse2+0x47> .byte 102,69,15,110,4,18 // movd (%r10,%rdx,1),%xmm8 .byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8 .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 - .byte 102,68,15,219,5,51,59,0,0 // pand 0x3b33(%rip),%xmm8 # 5b00 <_sk_callback_sse2+0x58a> + .byte 102,68,15,219,5,54,59,0,0 // pand 0x3b36(%rip),%xmm8 # 5ad0 <_sk_callback_sse2+0x58d> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,55,59,0,0 // mulps 0x3b37(%rip),%xmm8 # 5b10 <_sk_callback_sse2+0x59a> + .byte 68,15,89,5,58,59,0,0 // mulps 0x3b3a(%rip),%xmm8 # 5ae0 <_sk_callback_sse2+0x59d> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 @@ -31965,12 +31871,12 @@ _sk_scale_u8_sse2: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,61 // je 203b <_sk_scale_u8_sse2+0x91> + .byte 116,61 // je 2008 <_sk_scale_u8_sse2+0x91> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,23 // je 2020 <_sk_scale_u8_sse2+0x76> + .byte 116,23 // je 1fed <_sk_scale_u8_sse2+0x76> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,181 // jne 1fc4 <_sk_scale_u8_sse2+0x1a> + .byte 117,181 // jne 1f91 <_sk_scale_u8_sse2+0x1a> .byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8 @@ -31979,10 +31885,10 @@ _sk_scale_u8_sse2: .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9 .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 .byte 242,69,15,16,193 // movsd %xmm9,%xmm8 - .byte 235,137 // jmp 1fc4 <_sk_scale_u8_sse2+0x1a> + .byte 235,137 // jmp 1f91 <_sk_scale_u8_sse2+0x1a> .byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 233,122,255,255,255 // jmpq 1fc4 <_sk_scale_u8_sse2+0x1a> + .byte 233,122,255,255,255 // jmpq 1f91 <_sk_scale_u8_sse2+0x1a> HIDDEN _sk_lerp_1_float_sse2 .globl _sk_lerp_1_float_sse2 @@ -32013,13 +31919,13 @@ _sk_lerp_u8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,81 // jne 20dd <_sk_lerp_u8_sse2+0x5b> + .byte 117,81 // jne 20aa <_sk_lerp_u8_sse2+0x5b> .byte 102,69,15,110,4,18 // movd (%r10,%rdx,1),%xmm8 .byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8 .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 - .byte 102,68,15,219,5,123,58,0,0 // pand 0x3a7b(%rip),%xmm8 # 5b20 <_sk_callback_sse2+0x5aa> + .byte 102,68,15,219,5,126,58,0,0 // pand 0x3a7e(%rip),%xmm8 # 5af0 <_sk_callback_sse2+0x5ad> .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,127,58,0,0 // mulps 0x3a7f(%rip),%xmm8 # 5b30 <_sk_callback_sse2+0x5ba> + .byte 68,15,89,5,130,58,0,0 // mulps 0x3a82(%rip),%xmm8 # 5b00 <_sk_callback_sse2+0x5bd> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -32037,12 +31943,12 @@ _sk_lerp_u8_sse2: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,64 // je 212a <_sk_lerp_u8_sse2+0xa8> + .byte 116,64 // je 20f7 <_sk_lerp_u8_sse2+0xa8> .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,23 // je 210c <_sk_lerp_u8_sse2+0x8a> + .byte 116,23 // je 20d9 <_sk_lerp_u8_sse2+0x8a> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,161 // jne 209c <_sk_lerp_u8_sse2+0x1a> + .byte 117,161 // jne 2069 <_sk_lerp_u8_sse2+0x1a> .byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8 @@ -32051,10 +31957,10 @@ _sk_lerp_u8_sse2: .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9 .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 .byte 242,69,15,16,193 // movsd %xmm9,%xmm8 - .byte 233,114,255,255,255 // jmpq 209c <_sk_lerp_u8_sse2+0x1a> + .byte 233,114,255,255,255 // jmpq 2069 <_sk_lerp_u8_sse2+0x1a> .byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 233,99,255,255,255 // jmpq 209c <_sk_lerp_u8_sse2+0x1a> + .byte 233,99,255,255,255 // jmpq 2069 <_sk_lerp_u8_sse2+0x1a> HIDDEN _sk_lerp_565_sse2 .globl _sk_lerp_565_sse2 @@ -32063,20 +31969,20 @@ _sk_lerp_565_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,156,0,0,0 // jne 21e3 <_sk_lerp_565_sse2+0xaa> + .byte 15,133,156,0,0,0 // jne 21b0 <_sk_lerp_565_sse2+0xaa> .byte 243,69,15,126,12,82 // movq (%r10,%rdx,2),%xmm9 .byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9 - .byte 102,68,15,111,5,229,57,0,0 // movdqa 0x39e5(%rip),%xmm8 # 5b40 <_sk_callback_sse2+0x5ca> + .byte 102,68,15,111,5,232,57,0,0 // movdqa 0x39e8(%rip),%xmm8 # 5b10 <_sk_callback_sse2+0x5cd> .byte 102,69,15,219,193 // pand %xmm9,%xmm8 .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 - .byte 68,15,89,5,228,57,0,0 // mulps 0x39e4(%rip),%xmm8 # 5b50 <_sk_callback_sse2+0x5da> - .byte 102,68,15,111,21,235,57,0,0 // movdqa 0x39eb(%rip),%xmm10 # 5b60 <_sk_callback_sse2+0x5ea> + .byte 68,15,89,5,231,57,0,0 // mulps 0x39e7(%rip),%xmm8 # 5b20 <_sk_callback_sse2+0x5dd> + .byte 102,68,15,111,21,238,57,0,0 // movdqa 0x39ee(%rip),%xmm10 # 5b30 <_sk_callback_sse2+0x5ed> .byte 102,69,15,219,209 // pand %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 - .byte 68,15,89,21,234,57,0,0 // mulps 0x39ea(%rip),%xmm10 # 5b70 <_sk_callback_sse2+0x5fa> - .byte 102,68,15,219,13,241,57,0,0 // pand 0x39f1(%rip),%xmm9 # 5b80 <_sk_callback_sse2+0x60a> + .byte 68,15,89,21,237,57,0,0 // mulps 0x39ed(%rip),%xmm10 # 5b40 <_sk_callback_sse2+0x5fd> + .byte 102,68,15,219,13,244,57,0,0 // pand 0x39f4(%rip),%xmm9 # 5b50 <_sk_callback_sse2+0x60d> .byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9 - .byte 68,15,89,13,245,57,0,0 // mulps 0x39f5(%rip),%xmm9 # 5b90 <_sk_callback_sse2+0x61a> + .byte 68,15,89,13,248,57,0,0 // mulps 0x39f8(%rip),%xmm9 # 5b60 <_sk_callback_sse2+0x61d> .byte 15,92,196 // subps %xmm4,%xmm0 .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 @@ -32101,22 +32007,22 @@ _sk_lerp_565_sse2: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,59 // je 222b <_sk_lerp_565_sse2+0xf2> + .byte 116,59 // je 21f8 <_sk_lerp_565_sse2+0xf2> .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,27 // je 2216 <_sk_lerp_565_sse2+0xdd> + .byte 116,27 // je 21e3 <_sk_lerp_565_sse2+0xdd> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 15,133,77,255,255,255 // jne 2152 <_sk_lerp_565_sse2+0x19> + .byte 15,133,77,255,255,255 // jne 211f <_sk_lerp_565_sse2+0x19> .byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 102,69,15,112,200,69 // pshufd $0x45,%xmm8,%xmm9 .byte 102,69,15,110,4,82 // movd (%r10,%rdx,2),%xmm8 .byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8 .byte 242,69,15,16,200 // movsd %xmm8,%xmm9 - .byte 233,39,255,255,255 // jmpq 2152 <_sk_lerp_565_sse2+0x19> + .byte 233,39,255,255,255 // jmpq 211f <_sk_lerp_565_sse2+0x19> .byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax .byte 102,68,15,110,200 // movd %eax,%xmm9 - .byte 233,24,255,255,255 // jmpq 2152 <_sk_lerp_565_sse2+0x19> + .byte 233,24,255,255,255 // jmpq 211f <_sk_lerp_565_sse2+0x19> HIDDEN _sk_load_tables_sse2 .globl _sk_load_tables_sse2 @@ -32125,12 +32031,12 @@ _sk_load_tables_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,36,1,0,0 // jne 236c <_sk_load_tables_sse2+0x132> + .byte 15,133,36,1,0,0 // jne 2339 <_sk_load_tables_sse2+0x132> .byte 243,69,15,111,12,145 // movdqu (%r9,%rdx,4),%xmm9 .byte 65,87 // push %r15 .byte 65,86 // push %r14 .byte 83 // push %rbx - .byte 102,68,15,111,5,68,57,0,0 // movdqa 0x3944(%rip),%xmm8 # 5ba0 <_sk_callback_sse2+0x62a> + .byte 102,68,15,111,5,71,57,0,0 // movdqa 0x3947(%rip),%xmm8 # 5b70 <_sk_callback_sse2+0x62d> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 @@ -32186,7 +32092,7 @@ _sk_load_tables_sse2: .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 102,65,15,114,209,24 // psrld $0x18,%xmm9 .byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3 - .byte 15,89,29,77,56,0,0 // mulps 0x384d(%rip),%xmm3 # 5bb0 <_sk_callback_sse2+0x63a> + .byte 15,89,29,80,56,0,0 // mulps 0x3850(%rip),%xmm3 # 5b80 <_sk_callback_sse2+0x63d> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -32195,18 +32101,18 @@ _sk_load_tables_sse2: .byte 69,137,194 // mov %r8d,%r10d .byte 65,128,226,3 // and $0x3,%r10b .byte 65,128,250,1 // cmp $0x1,%r10b - .byte 116,45 // je 23a6 <_sk_load_tables_sse2+0x16c> + .byte 116,45 // je 2373 <_sk_load_tables_sse2+0x16c> .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 65,128,250,2 // cmp $0x2,%r10b - .byte 116,23 // je 239b <_sk_load_tables_sse2+0x161> + .byte 116,23 // je 2368 <_sk_load_tables_sse2+0x161> .byte 65,128,250,3 // cmp $0x3,%r10b - .byte 15,133,192,254,255,255 // jne 224e <_sk_load_tables_sse2+0x14> + .byte 15,133,192,254,255,255 // jne 221b <_sk_load_tables_sse2+0x14> .byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0 .byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9 .byte 102,69,15,18,12,145 // movlpd (%r9,%rdx,4),%xmm9 - .byte 233,168,254,255,255 // jmpq 224e <_sk_load_tables_sse2+0x14> + .byte 233,168,254,255,255 // jmpq 221b <_sk_load_tables_sse2+0x14> .byte 102,69,15,110,12,145 // movd (%r9,%rdx,4),%xmm9 - .byte 233,157,254,255,255 // jmpq 224e <_sk_load_tables_sse2+0x14> + .byte 233,157,254,255,255 // jmpq 221b <_sk_load_tables_sse2+0x14> HIDDEN _sk_load_tables_u16_be_sse2 .globl _sk_load_tables_u16_be_sse2 @@ -32216,7 +32122,7 @@ _sk_load_tables_u16_be_sse2: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,101,1,0,0 // jne 252c <_sk_load_tables_u16_be_sse2+0x17b> + .byte 15,133,101,1,0,0 // jne 24f9 <_sk_load_tables_u16_be_sse2+0x17b> .byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0 .byte 102,67,15,16,76,81,16 // movupd 0x10(%r9,%r10,2),%xmm1 .byte 65,87 // push %r15 @@ -32228,7 +32134,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9 - .byte 102,68,15,111,21,194,55,0,0 // movdqa 0x37c2(%rip),%xmm10 # 5bc0 <_sk_callback_sse2+0x64a> + .byte 102,68,15,111,21,197,55,0,0 // movdqa 0x37c5(%rip),%xmm10 # 5b90 <_sk_callback_sse2+0x64d> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,194 // pand %xmm10,%xmm0 .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 @@ -32290,7 +32196,7 @@ _sk_load_tables_u16_be_sse2: .byte 102,65,15,235,217 // por %xmm9,%xmm3 .byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,173,54,0,0 // mulps 0x36ad(%rip),%xmm3 # 5bd0 <_sk_callback_sse2+0x65a> + .byte 15,89,29,176,54,0,0 // mulps 0x36b0(%rip),%xmm3 # 5ba0 <_sk_callback_sse2+0x65d> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 65,94 // pop %r14 @@ -32298,17 +32204,17 @@ _sk_load_tables_u16_be_sse2: .byte 255,224 // jmpq *%rax .byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,17 // jne 2549 <_sk_load_tables_u16_be_sse2+0x198> + .byte 117,17 // jne 2516 <_sk_load_tables_u16_be_sse2+0x198> .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 102,15,20,193 // unpcklpd %xmm1,%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 - .byte 233,139,254,255,255 // jmpq 23d4 <_sk_load_tables_u16_be_sse2+0x23> + .byte 233,139,254,255,255 // jmpq 23a1 <_sk_load_tables_u16_be_sse2+0x23> .byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,118,254,255,255 // jb 23d4 <_sk_load_tables_u16_be_sse2+0x23> + .byte 15,130,118,254,255,255 // jb 23a1 <_sk_load_tables_u16_be_sse2+0x23> .byte 242,67,15,16,76,81,16 // movsd 0x10(%r9,%r10,2),%xmm1 - .byte 233,106,254,255,255 // jmpq 23d4 <_sk_load_tables_u16_be_sse2+0x23> + .byte 233,106,254,255,255 // jmpq 23a1 <_sk_load_tables_u16_be_sse2+0x23> HIDDEN _sk_load_tables_rgb_u16_be_sse2 .globl _sk_load_tables_rgb_u16_be_sse2 @@ -32318,7 +32224,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 76,139,8 // mov (%rax),%r9 .byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,84,1,0,0 // jne 26d0 <_sk_load_tables_rgb_u16_be_sse2+0x166> + .byte 15,133,84,1,0,0 // jne 269d <_sk_load_tables_rgb_u16_be_sse2+0x166> .byte 243,71,15,111,28,81 // movdqu (%r9,%r10,2),%xmm11 .byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1 .byte 102,15,115,217,4 // psrldq $0x4,%xmm1 @@ -32333,7 +32239,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10 .byte 102,65,15,111,195 // movdqa %xmm11,%xmm0 .byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0 - .byte 102,68,15,111,5,28,54,0,0 // movdqa 0x361c(%rip),%xmm8 # 5be0 <_sk_callback_sse2+0x66a> + .byte 102,68,15,111,5,31,54,0,0 // movdqa 0x361f(%rip),%xmm8 # 5bb0 <_sk_callback_sse2+0x66d> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,65,15,219,192 // pand %xmm8,%xmm0 .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 @@ -32389,7 +32295,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 15,20,211 // unpcklps %xmm3,%xmm2 .byte 65,15,20,208 // unpcklps %xmm8,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,39,53,0,0 // movaps 0x3527(%rip),%xmm3 # 5bf0 <_sk_callback_sse2+0x67a> + .byte 15,40,29,42,53,0,0 // movaps 0x352a(%rip),%xmm3 # 5bc0 <_sk_callback_sse2+0x67d> .byte 91 // pop %rbx .byte 65,94 // pop %r14 .byte 65,95 // pop %r15 @@ -32398,21 +32304,21 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 102,71,15,196,92,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm11 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,14 // jne 26f6 <_sk_load_tables_rgb_u16_be_sse2+0x18c> + .byte 117,14 // jne 26c3 <_sk_load_tables_rgb_u16_be_sse2+0x18c> .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 - .byte 233,172,254,255,255 // jmpq 25a2 <_sk_load_tables_rgb_u16_be_sse2+0x38> + .byte 233,172,254,255,255 // jmpq 256f <_sk_load_tables_rgb_u16_be_sse2+0x38> .byte 102,71,15,110,84,81,6 // movd 0x6(%r9,%r10,2),%xmm10 .byte 102,71,15,196,84,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm10 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,24 // jb 2727 <_sk_load_tables_rgb_u16_be_sse2+0x1bd> + .byte 114,24 // jb 26f4 <_sk_load_tables_rgb_u16_be_sse2+0x1bd> .byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1 .byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,123,254,255,255 // jmpq 25a2 <_sk_load_tables_rgb_u16_be_sse2+0x38> + .byte 233,123,254,255,255 // jmpq 256f <_sk_load_tables_rgb_u16_be_sse2+0x38> .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,114,254,255,255 // jmpq 25a2 <_sk_load_tables_rgb_u16_be_sse2+0x38> + .byte 233,114,254,255,255 // jmpq 256f <_sk_load_tables_rgb_u16_be_sse2+0x38> HIDDEN _sk_byte_tables_sse2 .globl _sk_byte_tables_sse2 @@ -32423,7 +32329,7 @@ _sk_byte_tables_sse2: .byte 65,86 // push %r14 .byte 83 // push %rbx .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,192,52,0,0 // movaps 0x34c0(%rip),%xmm8 # 5c00 <_sk_callback_sse2+0x68a> + .byte 68,15,40,5,195,52,0,0 // movaps 0x34c3(%rip),%xmm8 # 5bd0 <_sk_callback_sse2+0x68d> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,73,15,126,193 // movq %xmm0,%r9 @@ -32451,7 +32357,7 @@ _sk_byte_tables_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,90,52,0,0 // movaps 0x345a(%rip),%xmm10 # 5c10 <_sk_callback_sse2+0x69a> + .byte 68,15,40,21,93,52,0,0 // movaps 0x345d(%rip),%xmm10 # 5be0 <_sk_callback_sse2+0x69d> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -32572,7 +32478,7 @@ _sk_byte_tables_rgb_sse2: .byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0 .byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,21,162,50,0,0 // movaps 0x32a2(%rip),%xmm10 # 5c20 <_sk_callback_sse2+0x6aa> + .byte 68,15,40,21,165,50,0,0 // movaps 0x32a5(%rip),%xmm10 # 5bf0 <_sk_callback_sse2+0x6ad> .byte 65,15,89,194 // mulps %xmm10,%xmm0 .byte 65,15,89,200 // mulps %xmm8,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 @@ -32779,15 +32685,15 @@ _sk_parametric_r_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,214,47,0,0 // mulps 0x2fd6(%rip),%xmm9 # 5c30 <_sk_callback_sse2+0x6ba> - .byte 68,15,84,21,222,47,0,0 // andps 0x2fde(%rip),%xmm10 # 5c40 <_sk_callback_sse2+0x6ca> - .byte 68,15,86,21,230,47,0,0 // orps 0x2fe6(%rip),%xmm10 # 5c50 <_sk_callback_sse2+0x6da> - .byte 68,15,88,13,238,47,0,0 // addps 0x2fee(%rip),%xmm9 # 5c60 <_sk_callback_sse2+0x6ea> - .byte 68,15,40,37,246,47,0,0 // movaps 0x2ff6(%rip),%xmm12 # 5c70 <_sk_callback_sse2+0x6fa> + .byte 68,15,89,13,217,47,0,0 // mulps 0x2fd9(%rip),%xmm9 # 5c00 <_sk_callback_sse2+0x6bd> + .byte 68,15,84,21,225,47,0,0 // andps 0x2fe1(%rip),%xmm10 # 5c10 <_sk_callback_sse2+0x6cd> + .byte 68,15,86,21,233,47,0,0 // orps 0x2fe9(%rip),%xmm10 # 5c20 <_sk_callback_sse2+0x6dd> + .byte 68,15,88,13,241,47,0,0 // addps 0x2ff1(%rip),%xmm9 # 5c30 <_sk_callback_sse2+0x6ed> + .byte 68,15,40,37,249,47,0,0 // movaps 0x2ff9(%rip),%xmm12 # 5c40 <_sk_callback_sse2+0x6fd> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,246,47,0,0 // addps 0x2ff6(%rip),%xmm10 # 5c80 <_sk_callback_sse2+0x70a> - .byte 68,15,40,37,254,47,0,0 // movaps 0x2ffe(%rip),%xmm12 # 5c90 <_sk_callback_sse2+0x71a> + .byte 68,15,88,21,249,47,0,0 // addps 0x2ff9(%rip),%xmm10 # 5c50 <_sk_callback_sse2+0x70d> + .byte 68,15,40,37,1,48,0,0 // movaps 0x3001(%rip),%xmm12 # 5c60 <_sk_callback_sse2+0x71d> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -32795,22 +32701,22 @@ _sk_parametric_r_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,232,47,0,0 // movaps 0x2fe8(%rip),%xmm10 # 5ca0 <_sk_callback_sse2+0x72a> + .byte 68,15,40,21,235,47,0,0 // movaps 0x2feb(%rip),%xmm10 # 5c70 <_sk_callback_sse2+0x72d> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,220,47,0,0 // addps 0x2fdc(%rip),%xmm9 # 5cb0 <_sk_callback_sse2+0x73a> - .byte 68,15,40,37,228,47,0,0 // movaps 0x2fe4(%rip),%xmm12 # 5cc0 <_sk_callback_sse2+0x74a> + .byte 68,15,88,13,223,47,0,0 // addps 0x2fdf(%rip),%xmm9 # 5c80 <_sk_callback_sse2+0x73d> + .byte 68,15,40,37,231,47,0,0 // movaps 0x2fe7(%rip),%xmm12 # 5c90 <_sk_callback_sse2+0x74d> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,228,47,0,0 // movaps 0x2fe4(%rip),%xmm12 # 5cd0 <_sk_callback_sse2+0x75a> + .byte 68,15,40,37,231,47,0,0 // movaps 0x2fe7(%rip),%xmm12 # 5ca0 <_sk_callback_sse2+0x75d> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,232,47,0,0 // movaps 0x2fe8(%rip),%xmm13 # 5ce0 <_sk_callback_sse2+0x76a> + .byte 68,15,40,45,235,47,0,0 // movaps 0x2feb(%rip),%xmm13 # 5cb0 <_sk_callback_sse2+0x76d> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,232,47,0,0 // mulps 0x2fe8(%rip),%xmm13 # 5cf0 <_sk_callback_sse2+0x77a> + .byte 68,15,89,45,235,47,0,0 // mulps 0x2feb(%rip),%xmm13 # 5cc0 <_sk_callback_sse2+0x77d> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -32846,15 +32752,15 @@ _sk_parametric_g_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,104,47,0,0 // mulps 0x2f68(%rip),%xmm9 # 5d00 <_sk_callback_sse2+0x78a> - .byte 68,15,84,21,112,47,0,0 // andps 0x2f70(%rip),%xmm10 # 5d10 <_sk_callback_sse2+0x79a> - .byte 68,15,86,21,120,47,0,0 // orps 0x2f78(%rip),%xmm10 # 5d20 <_sk_callback_sse2+0x7aa> - .byte 68,15,88,13,128,47,0,0 // addps 0x2f80(%rip),%xmm9 # 5d30 <_sk_callback_sse2+0x7ba> - .byte 68,15,40,37,136,47,0,0 // movaps 0x2f88(%rip),%xmm12 # 5d40 <_sk_callback_sse2+0x7ca> + .byte 68,15,89,13,107,47,0,0 // mulps 0x2f6b(%rip),%xmm9 # 5cd0 <_sk_callback_sse2+0x78d> + .byte 68,15,84,21,115,47,0,0 // andps 0x2f73(%rip),%xmm10 # 5ce0 <_sk_callback_sse2+0x79d> + .byte 68,15,86,21,123,47,0,0 // orps 0x2f7b(%rip),%xmm10 # 5cf0 <_sk_callback_sse2+0x7ad> + .byte 68,15,88,13,131,47,0,0 // addps 0x2f83(%rip),%xmm9 # 5d00 <_sk_callback_sse2+0x7bd> + .byte 68,15,40,37,139,47,0,0 // movaps 0x2f8b(%rip),%xmm12 # 5d10 <_sk_callback_sse2+0x7cd> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,136,47,0,0 // addps 0x2f88(%rip),%xmm10 # 5d50 <_sk_callback_sse2+0x7da> - .byte 68,15,40,37,144,47,0,0 // movaps 0x2f90(%rip),%xmm12 # 5d60 <_sk_callback_sse2+0x7ea> + .byte 68,15,88,21,139,47,0,0 // addps 0x2f8b(%rip),%xmm10 # 5d20 <_sk_callback_sse2+0x7dd> + .byte 68,15,40,37,147,47,0,0 // movaps 0x2f93(%rip),%xmm12 # 5d30 <_sk_callback_sse2+0x7ed> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -32862,22 +32768,22 @@ _sk_parametric_g_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,122,47,0,0 // movaps 0x2f7a(%rip),%xmm10 # 5d70 <_sk_callback_sse2+0x7fa> + .byte 68,15,40,21,125,47,0,0 // movaps 0x2f7d(%rip),%xmm10 # 5d40 <_sk_callback_sse2+0x7fd> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,110,47,0,0 // addps 0x2f6e(%rip),%xmm9 # 5d80 <_sk_callback_sse2+0x80a> - .byte 68,15,40,37,118,47,0,0 // movaps 0x2f76(%rip),%xmm12 # 5d90 <_sk_callback_sse2+0x81a> + .byte 68,15,88,13,113,47,0,0 // addps 0x2f71(%rip),%xmm9 # 5d50 <_sk_callback_sse2+0x80d> + .byte 68,15,40,37,121,47,0,0 // movaps 0x2f79(%rip),%xmm12 # 5d60 <_sk_callback_sse2+0x81d> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,118,47,0,0 // movaps 0x2f76(%rip),%xmm12 # 5da0 <_sk_callback_sse2+0x82a> + .byte 68,15,40,37,121,47,0,0 // movaps 0x2f79(%rip),%xmm12 # 5d70 <_sk_callback_sse2+0x82d> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,122,47,0,0 // movaps 0x2f7a(%rip),%xmm13 # 5db0 <_sk_callback_sse2+0x83a> + .byte 68,15,40,45,125,47,0,0 // movaps 0x2f7d(%rip),%xmm13 # 5d80 <_sk_callback_sse2+0x83d> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,122,47,0,0 // mulps 0x2f7a(%rip),%xmm13 # 5dc0 <_sk_callback_sse2+0x84a> + .byte 68,15,89,45,125,47,0,0 // mulps 0x2f7d(%rip),%xmm13 # 5d90 <_sk_callback_sse2+0x84d> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -32913,15 +32819,15 @@ _sk_parametric_b_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,250,46,0,0 // mulps 0x2efa(%rip),%xmm9 # 5dd0 <_sk_callback_sse2+0x85a> - .byte 68,15,84,21,2,47,0,0 // andps 0x2f02(%rip),%xmm10 # 5de0 <_sk_callback_sse2+0x86a> - .byte 68,15,86,21,10,47,0,0 // orps 0x2f0a(%rip),%xmm10 # 5df0 <_sk_callback_sse2+0x87a> - .byte 68,15,88,13,18,47,0,0 // addps 0x2f12(%rip),%xmm9 # 5e00 <_sk_callback_sse2+0x88a> - .byte 68,15,40,37,26,47,0,0 // movaps 0x2f1a(%rip),%xmm12 # 5e10 <_sk_callback_sse2+0x89a> + .byte 68,15,89,13,253,46,0,0 // mulps 0x2efd(%rip),%xmm9 # 5da0 <_sk_callback_sse2+0x85d> + .byte 68,15,84,21,5,47,0,0 // andps 0x2f05(%rip),%xmm10 # 5db0 <_sk_callback_sse2+0x86d> + .byte 68,15,86,21,13,47,0,0 // orps 0x2f0d(%rip),%xmm10 # 5dc0 <_sk_callback_sse2+0x87d> + .byte 68,15,88,13,21,47,0,0 // addps 0x2f15(%rip),%xmm9 # 5dd0 <_sk_callback_sse2+0x88d> + .byte 68,15,40,37,29,47,0,0 // movaps 0x2f1d(%rip),%xmm12 # 5de0 <_sk_callback_sse2+0x89d> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,26,47,0,0 // addps 0x2f1a(%rip),%xmm10 # 5e20 <_sk_callback_sse2+0x8aa> - .byte 68,15,40,37,34,47,0,0 // movaps 0x2f22(%rip),%xmm12 # 5e30 <_sk_callback_sse2+0x8ba> + .byte 68,15,88,21,29,47,0,0 // addps 0x2f1d(%rip),%xmm10 # 5df0 <_sk_callback_sse2+0x8ad> + .byte 68,15,40,37,37,47,0,0 // movaps 0x2f25(%rip),%xmm12 # 5e00 <_sk_callback_sse2+0x8bd> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -32929,22 +32835,22 @@ _sk_parametric_b_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,12,47,0,0 // movaps 0x2f0c(%rip),%xmm10 # 5e40 <_sk_callback_sse2+0x8ca> + .byte 68,15,40,21,15,47,0,0 // movaps 0x2f0f(%rip),%xmm10 # 5e10 <_sk_callback_sse2+0x8cd> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,0,47,0,0 // addps 0x2f00(%rip),%xmm9 # 5e50 <_sk_callback_sse2+0x8da> - .byte 68,15,40,37,8,47,0,0 // movaps 0x2f08(%rip),%xmm12 # 5e60 <_sk_callback_sse2+0x8ea> + .byte 68,15,88,13,3,47,0,0 // addps 0x2f03(%rip),%xmm9 # 5e20 <_sk_callback_sse2+0x8dd> + .byte 68,15,40,37,11,47,0,0 // movaps 0x2f0b(%rip),%xmm12 # 5e30 <_sk_callback_sse2+0x8ed> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,8,47,0,0 // movaps 0x2f08(%rip),%xmm12 # 5e70 <_sk_callback_sse2+0x8fa> + .byte 68,15,40,37,11,47,0,0 // movaps 0x2f0b(%rip),%xmm12 # 5e40 <_sk_callback_sse2+0x8fd> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,12,47,0,0 // movaps 0x2f0c(%rip),%xmm13 # 5e80 <_sk_callback_sse2+0x90a> + .byte 68,15,40,45,15,47,0,0 // movaps 0x2f0f(%rip),%xmm13 # 5e50 <_sk_callback_sse2+0x90d> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,12,47,0,0 // mulps 0x2f0c(%rip),%xmm13 # 5e90 <_sk_callback_sse2+0x91a> + .byte 68,15,89,45,15,47,0,0 // mulps 0x2f0f(%rip),%xmm13 # 5e60 <_sk_callback_sse2+0x91d> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -32980,15 +32886,15 @@ _sk_parametric_a_sse2: .byte 69,15,88,209 // addps %xmm9,%xmm10 .byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11 .byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9 - .byte 68,15,89,13,140,46,0,0 // mulps 0x2e8c(%rip),%xmm9 # 5ea0 <_sk_callback_sse2+0x92a> - .byte 68,15,84,21,148,46,0,0 // andps 0x2e94(%rip),%xmm10 # 5eb0 <_sk_callback_sse2+0x93a> - .byte 68,15,86,21,156,46,0,0 // orps 0x2e9c(%rip),%xmm10 # 5ec0 <_sk_callback_sse2+0x94a> - .byte 68,15,88,13,164,46,0,0 // addps 0x2ea4(%rip),%xmm9 # 5ed0 <_sk_callback_sse2+0x95a> - .byte 68,15,40,37,172,46,0,0 // movaps 0x2eac(%rip),%xmm12 # 5ee0 <_sk_callback_sse2+0x96a> + .byte 68,15,89,13,143,46,0,0 // mulps 0x2e8f(%rip),%xmm9 # 5e70 <_sk_callback_sse2+0x92d> + .byte 68,15,84,21,151,46,0,0 // andps 0x2e97(%rip),%xmm10 # 5e80 <_sk_callback_sse2+0x93d> + .byte 68,15,86,21,159,46,0,0 // orps 0x2e9f(%rip),%xmm10 # 5e90 <_sk_callback_sse2+0x94d> + .byte 68,15,88,13,167,46,0,0 // addps 0x2ea7(%rip),%xmm9 # 5ea0 <_sk_callback_sse2+0x95d> + .byte 68,15,40,37,175,46,0,0 // movaps 0x2eaf(%rip),%xmm12 # 5eb0 <_sk_callback_sse2+0x96d> .byte 69,15,89,226 // mulps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,88,21,172,46,0,0 // addps 0x2eac(%rip),%xmm10 # 5ef0 <_sk_callback_sse2+0x97a> - .byte 68,15,40,37,180,46,0,0 // movaps 0x2eb4(%rip),%xmm12 # 5f00 <_sk_callback_sse2+0x98a> + .byte 68,15,88,21,175,46,0,0 // addps 0x2eaf(%rip),%xmm10 # 5ec0 <_sk_callback_sse2+0x97d> + .byte 68,15,40,37,183,46,0,0 // movaps 0x2eb7(%rip),%xmm12 # 5ed0 <_sk_callback_sse2+0x98d> .byte 69,15,94,226 // divps %xmm10,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 .byte 69,15,89,203 // mulps %xmm11,%xmm9 @@ -32996,22 +32902,22 @@ _sk_parametric_a_sse2: .byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13 - .byte 68,15,40,21,158,46,0,0 // movaps 0x2e9e(%rip),%xmm10 # 5f10 <_sk_callback_sse2+0x99a> + .byte 68,15,40,21,161,46,0,0 // movaps 0x2ea1(%rip),%xmm10 # 5ee0 <_sk_callback_sse2+0x99d> .byte 69,15,84,234 // andps %xmm10,%xmm13 .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,229 // subps %xmm13,%xmm12 .byte 69,15,40,233 // movaps %xmm9,%xmm13 .byte 69,15,92,236 // subps %xmm12,%xmm13 - .byte 68,15,88,13,146,46,0,0 // addps 0x2e92(%rip),%xmm9 # 5f20 <_sk_callback_sse2+0x9aa> - .byte 68,15,40,37,154,46,0,0 // movaps 0x2e9a(%rip),%xmm12 # 5f30 <_sk_callback_sse2+0x9ba> + .byte 68,15,88,13,149,46,0,0 // addps 0x2e95(%rip),%xmm9 # 5ef0 <_sk_callback_sse2+0x9ad> + .byte 68,15,40,37,157,46,0,0 // movaps 0x2e9d(%rip),%xmm12 # 5f00 <_sk_callback_sse2+0x9bd> .byte 69,15,89,229 // mulps %xmm13,%xmm12 .byte 69,15,92,204 // subps %xmm12,%xmm9 - .byte 68,15,40,37,154,46,0,0 // movaps 0x2e9a(%rip),%xmm12 # 5f40 <_sk_callback_sse2+0x9ca> + .byte 68,15,40,37,157,46,0,0 // movaps 0x2e9d(%rip),%xmm12 # 5f10 <_sk_callback_sse2+0x9cd> .byte 69,15,92,229 // subps %xmm13,%xmm12 - .byte 68,15,40,45,158,46,0,0 // movaps 0x2e9e(%rip),%xmm13 # 5f50 <_sk_callback_sse2+0x9da> + .byte 68,15,40,45,161,46,0,0 // movaps 0x2ea1(%rip),%xmm13 # 5f20 <_sk_callback_sse2+0x9dd> .byte 69,15,94,236 // divps %xmm12,%xmm13 .byte 69,15,88,233 // addps %xmm9,%xmm13 - .byte 68,15,89,45,158,46,0,0 // mulps 0x2e9e(%rip),%xmm13 # 5f60 <_sk_callback_sse2+0x9ea> + .byte 68,15,89,45,161,46,0,0 // mulps 0x2ea1(%rip),%xmm13 # 5f30 <_sk_callback_sse2+0x9ed> .byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9 .byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12 .byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12 @@ -33028,29 +32934,29 @@ HIDDEN _sk_lab_to_xyz_sse2 .globl _sk_lab_to_xyz_sse2 FUNCTION(_sk_lab_to_xyz_sse2) _sk_lab_to_xyz_sse2: - .byte 15,89,5,123,46,0,0 // mulps 0x2e7b(%rip),%xmm0 # 5f70 <_sk_callback_sse2+0x9fa> - .byte 68,15,40,5,131,46,0,0 // movaps 0x2e83(%rip),%xmm8 # 5f80 <_sk_callback_sse2+0xa0a> + .byte 15,89,5,126,46,0,0 // mulps 0x2e7e(%rip),%xmm0 # 5f40 <_sk_callback_sse2+0x9fd> + .byte 68,15,40,5,134,46,0,0 // movaps 0x2e86(%rip),%xmm8 # 5f50 <_sk_callback_sse2+0xa0d> .byte 65,15,89,200 // mulps %xmm8,%xmm1 - .byte 68,15,40,13,135,46,0,0 // movaps 0x2e87(%rip),%xmm9 # 5f90 <_sk_callback_sse2+0xa1a> + .byte 68,15,40,13,138,46,0,0 // movaps 0x2e8a(%rip),%xmm9 # 5f60 <_sk_callback_sse2+0xa1d> .byte 65,15,88,201 // addps %xmm9,%xmm1 .byte 65,15,89,208 // mulps %xmm8,%xmm2 .byte 65,15,88,209 // addps %xmm9,%xmm2 - .byte 15,88,5,132,46,0,0 // addps 0x2e84(%rip),%xmm0 # 5fa0 <_sk_callback_sse2+0xa2a> - .byte 15,89,5,141,46,0,0 // mulps 0x2e8d(%rip),%xmm0 # 5fb0 <_sk_callback_sse2+0xa3a> - .byte 15,89,13,150,46,0,0 // mulps 0x2e96(%rip),%xmm1 # 5fc0 <_sk_callback_sse2+0xa4a> + .byte 15,88,5,135,46,0,0 // addps 0x2e87(%rip),%xmm0 # 5f70 <_sk_callback_sse2+0xa2d> + .byte 15,89,5,144,46,0,0 // mulps 0x2e90(%rip),%xmm0 # 5f80 <_sk_callback_sse2+0xa3d> + .byte 15,89,13,153,46,0,0 // mulps 0x2e99(%rip),%xmm1 # 5f90 <_sk_callback_sse2+0xa4d> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,21,156,46,0,0 // mulps 0x2e9c(%rip),%xmm2 # 5fd0 <_sk_callback_sse2+0xa5a> + .byte 15,89,21,159,46,0,0 // mulps 0x2e9f(%rip),%xmm2 # 5fa0 <_sk_callback_sse2+0xa5d> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 68,15,92,202 // subps %xmm2,%xmm9 .byte 68,15,40,225 // movaps %xmm1,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 .byte 68,15,89,225 // mulps %xmm1,%xmm12 - .byte 15,40,21,145,46,0,0 // movaps 0x2e91(%rip),%xmm2 # 5fe0 <_sk_callback_sse2+0xa6a> + .byte 15,40,21,148,46,0,0 // movaps 0x2e94(%rip),%xmm2 # 5fb0 <_sk_callback_sse2+0xa6d> .byte 68,15,40,194 // movaps %xmm2,%xmm8 .byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8 - .byte 68,15,40,21,144,46,0,0 // movaps 0x2e90(%rip),%xmm10 # 5ff0 <_sk_callback_sse2+0xa7a> + .byte 68,15,40,21,147,46,0,0 // movaps 0x2e93(%rip),%xmm10 # 5fc0 <_sk_callback_sse2+0xa7d> .byte 65,15,88,202 // addps %xmm10,%xmm1 - .byte 68,15,40,29,148,46,0,0 // movaps 0x2e94(%rip),%xmm11 # 6000 <_sk_callback_sse2+0xa8a> + .byte 68,15,40,29,151,46,0,0 // movaps 0x2e97(%rip),%xmm11 # 5fd0 <_sk_callback_sse2+0xa8d> .byte 65,15,89,203 // mulps %xmm11,%xmm1 .byte 69,15,84,224 // andps %xmm8,%xmm12 .byte 68,15,85,193 // andnps %xmm1,%xmm8 @@ -33074,8 +32980,8 @@ _sk_lab_to_xyz_sse2: .byte 15,84,194 // andps %xmm2,%xmm0 .byte 65,15,85,209 // andnps %xmm9,%xmm2 .byte 15,86,208 // orps %xmm0,%xmm2 - .byte 68,15,89,5,68,46,0,0 // mulps 0x2e44(%rip),%xmm8 # 6010 <_sk_callback_sse2+0xa9a> - .byte 15,89,21,77,46,0,0 // mulps 0x2e4d(%rip),%xmm2 # 6020 <_sk_callback_sse2+0xaaa> + .byte 68,15,89,5,71,46,0,0 // mulps 0x2e47(%rip),%xmm8 # 5fe0 <_sk_callback_sse2+0xa9d> + .byte 15,89,21,80,46,0,0 // mulps 0x2e50(%rip),%xmm2 # 5ff0 <_sk_callback_sse2+0xaad> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -33087,13 +32993,13 @@ _sk_load_a8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,46 // jne 3213 <_sk_load_a8_sse2+0x38> + .byte 117,46 // jne 31e0 <_sk_load_a8_sse2+0x38> .byte 102,65,15,110,4,18 // movd (%r10,%rdx,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,5,53,46,0,0 // pand 0x2e35(%rip),%xmm0 # 6030 <_sk_callback_sse2+0xaba> + .byte 102,15,219,5,56,46,0,0 // pand 0x2e38(%rip),%xmm0 # 6000 <_sk_callback_sse2+0xabd> .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,59,46,0,0 // mulps 0x2e3b(%rip),%xmm3 # 6040 <_sk_callback_sse2+0xaca> + .byte 15,89,29,62,46,0,0 // mulps 0x2e3e(%rip),%xmm3 # 6010 <_sk_callback_sse2+0xacd> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 @@ -33102,12 +33008,12 @@ _sk_load_a8_sse2: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,54 // je 3256 <_sk_load_a8_sse2+0x7b> + .byte 116,54 // je 3223 <_sk_load_a8_sse2+0x7b> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,21 // je 323f <_sk_load_a8_sse2+0x64> + .byte 116,21 // je 320c <_sk_load_a8_sse2+0x64> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,195 // jne 31f3 <_sk_load_a8_sse2+0x18> + .byte 117,195 // jne 31c0 <_sk_load_a8_sse2+0x18> .byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -33116,10 +33022,10 @@ _sk_load_a8_sse2: .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 242,15,16,193 // movsd %xmm1,%xmm0 - .byte 235,157 // jmp 31f3 <_sk_load_a8_sse2+0x18> + .byte 235,157 // jmp 31c0 <_sk_load_a8_sse2+0x18> .byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,146 // jmp 31f3 <_sk_load_a8_sse2+0x18> + .byte 235,146 // jmp 31c0 <_sk_load_a8_sse2+0x18> HIDDEN _sk_gather_a8_sse2 .globl _sk_gather_a8_sse2 @@ -33161,7 +33067,7 @@ _sk_gather_a8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,29,92,45,0,0 // mulps 0x2d5c(%rip),%xmm3 # 6050 <_sk_callback_sse2+0xada> + .byte 15,89,29,95,45,0,0 // mulps 0x2d5f(%rip),%xmm3 # 6020 <_sk_callback_sse2+0xadd> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 @@ -33176,7 +33082,7 @@ FUNCTION(_sk_store_a8_sse2) _sk_store_a8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 68,15,40,5,78,45,0,0 // movaps 0x2d4e(%rip),%xmm8 # 6060 <_sk_callback_sse2+0xaea> + .byte 68,15,40,5,81,45,0,0 // movaps 0x2d51(%rip),%xmm8 # 6030 <_sk_callback_sse2+0xaed> .byte 68,15,89,195 // mulps %xmm3,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 .byte 102,65,15,114,240,16 // pslld $0x10,%xmm8 @@ -33184,7 +33090,7 @@ _sk_store_a8_sse2: .byte 102,69,15,107,192 // packssdw %xmm8,%xmm8 .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,13 // jne 3343 <_sk_store_a8_sse2+0x3e> + .byte 117,13 // jne 3310 <_sk_store_a8_sse2+0x3e> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 65,137,4,18 // mov %eax,(%r10,%rdx,1) .byte 72,173 // lods %ds:(%rsi),%rax @@ -33194,24 +33100,24 @@ _sk_store_a8_sse2: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,59 // je 3395 <_sk_store_a8_sse2+0x90> + .byte 116,59 // je 3362 <_sk_store_a8_sse2+0x90> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,22 // je 3376 <_sk_store_a8_sse2+0x71> + .byte 116,22 // je 3343 <_sk_store_a8_sse2+0x71> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,217 // jne 333f <_sk_store_a8_sse2+0x3a> + .byte 117,217 // jne 330c <_sk_store_a8_sse2+0x3a> .byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp) .byte 138,68,36,240 // mov -0x10(%rsp),%al .byte 65,136,68,18,2 // mov %al,0x2(%r10,%rdx,1) - .byte 102,68,15,219,5,241,44,0,0 // pand 0x2cf1(%rip),%xmm8 # 6070 <_sk_callback_sse2+0xafa> + .byte 102,68,15,219,5,244,44,0,0 // pand 0x2cf4(%rip),%xmm8 # 6040 <_sk_callback_sse2+0xafd> .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 102,65,137,4,18 // mov %ax,(%r10,%rdx,1) - .byte 235,170 // jmp 333f <_sk_store_a8_sse2+0x3a> + .byte 235,170 // jmp 330c <_sk_store_a8_sse2+0x3a> .byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp) .byte 138,68,36,216 // mov -0x28(%rsp),%al .byte 65,136,4,18 // mov %al,(%r10,%rdx,1) - .byte 235,153 // jmp 333f <_sk_store_a8_sse2+0x3a> + .byte 235,153 // jmp 330c <_sk_store_a8_sse2+0x3a> HIDDEN _sk_load_g8_sse2 .globl _sk_load_g8_sse2 @@ -33220,27 +33126,27 @@ _sk_load_g8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,49 // jne 33e1 <_sk_load_g8_sse2+0x3b> + .byte 117,49 // jne 33ae <_sk_load_g8_sse2+0x3b> .byte 102,65,15,110,4,18 // movd (%r10,%rdx,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,5,186,44,0,0 // pand 0x2cba(%rip),%xmm0 # 6080 <_sk_callback_sse2+0xb0a> + .byte 102,15,219,5,189,44,0,0 // pand 0x2cbd(%rip),%xmm0 # 6050 <_sk_callback_sse2+0xb0d> .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,192,44,0,0 // mulps 0x2cc0(%rip),%xmm0 # 6090 <_sk_callback_sse2+0xb1a> + .byte 15,89,5,195,44,0,0 // mulps 0x2cc3(%rip),%xmm0 # 6060 <_sk_callback_sse2+0xb1d> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,199,44,0,0 // movaps 0x2cc7(%rip),%xmm3 # 60a0 <_sk_callback_sse2+0xb2a> + .byte 15,40,29,202,44,0,0 // movaps 0x2cca(%rip),%xmm3 # 6070 <_sk_callback_sse2+0xb2d> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,54 // je 3424 <_sk_load_g8_sse2+0x7e> + .byte 116,54 // je 33f1 <_sk_load_g8_sse2+0x7e> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,21 // je 340d <_sk_load_g8_sse2+0x67> + .byte 116,21 // je 33da <_sk_load_g8_sse2+0x67> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,192 // jne 33be <_sk_load_g8_sse2+0x18> + .byte 117,192 // jne 338b <_sk_load_g8_sse2+0x18> .byte 65,15,182,68,18,2 // movzbl 0x2(%r10,%rdx,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0 @@ -33249,10 +33155,10 @@ _sk_load_g8_sse2: .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 102,15,97,200 // punpcklwd %xmm0,%xmm1 .byte 242,15,16,193 // movsd %xmm1,%xmm0 - .byte 235,154 // jmp 33be <_sk_load_g8_sse2+0x18> + .byte 235,154 // jmp 338b <_sk_load_g8_sse2+0x18> .byte 65,15,182,4,18 // movzbl (%r10,%rdx,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,143 // jmp 33be <_sk_load_g8_sse2+0x18> + .byte 235,143 // jmp 338b <_sk_load_g8_sse2+0x18> HIDDEN _sk_gather_g8_sse2 .globl _sk_gather_g8_sse2 @@ -33294,9 +33200,9 @@ _sk_gather_g8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,238,43,0,0 // mulps 0x2bee(%rip),%xmm0 # 60b0 <_sk_callback_sse2+0xb3a> + .byte 15,89,5,241,43,0,0 // mulps 0x2bf1(%rip),%xmm0 # 6080 <_sk_callback_sse2+0xb3d> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,245,43,0,0 // movaps 0x2bf5(%rip),%xmm3 # 60c0 <_sk_callback_sse2+0xb4a> + .byte 15,40,29,248,43,0,0 // movaps 0x2bf8(%rip),%xmm3 # 6090 <_sk_callback_sse2+0xb4d> .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 91 // pop %rbx @@ -33310,9 +33216,9 @@ _sk_gather_i8_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 73,137,193 // mov %rax,%r9 .byte 77,133,201 // test %r9,%r9 - .byte 116,5 // je 34e4 <_sk_gather_i8_sse2+0xf> + .byte 116,5 // je 34b1 <_sk_gather_i8_sse2+0xf> .byte 76,137,200 // mov %r9,%rax - .byte 235,2 // jmp 34e6 <_sk_gather_i8_sse2+0x11> + .byte 235,2 // jmp 34b3 <_sk_gather_i8_sse2+0x11> .byte 72,173 // lods %ds:(%rsi),%rax .byte 85 // push %rbp .byte 65,86 // push %r14 @@ -33364,11 +33270,11 @@ _sk_gather_i8_sse2: .byte 102,66,15,110,76,149,0 // movd 0x0(%rbp,%r10,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,21,14,43,0,0 // movdqa 0x2b0e(%rip),%xmm2 # 60d0 <_sk_callback_sse2+0xb5a> + .byte 102,15,111,21,17,43,0,0 // movdqa 0x2b11(%rip),%xmm2 # 60a0 <_sk_callback_sse2+0xb5d> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,10,43,0,0 // movaps 0x2b0a(%rip),%xmm8 # 60e0 <_sk_callback_sse2+0xb6a> + .byte 68,15,40,5,13,43,0,0 // movaps 0x2b0d(%rip),%xmm8 # 60b0 <_sk_callback_sse2+0xb6d> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -33396,42 +33302,42 @@ _sk_load_565_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,83 // jne 3677 <_sk_load_565_sse2+0x5d> + .byte 117,83 // jne 3644 <_sk_load_565_sse2+0x5d> .byte 243,65,15,126,20,82 // movq (%r10,%rdx,2),%xmm2 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,186,42,0,0 // movdqa 0x2aba(%rip),%xmm0 # 60f0 <_sk_callback_sse2+0xb7a> + .byte 102,15,111,5,189,42,0,0 // movdqa 0x2abd(%rip),%xmm0 # 60c0 <_sk_callback_sse2+0xb7d> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,188,42,0,0 // mulps 0x2abc(%rip),%xmm0 # 6100 <_sk_callback_sse2+0xb8a> - .byte 102,15,111,13,196,42,0,0 // movdqa 0x2ac4(%rip),%xmm1 # 6110 <_sk_callback_sse2+0xb9a> + .byte 15,89,5,191,42,0,0 // mulps 0x2abf(%rip),%xmm0 # 60d0 <_sk_callback_sse2+0xb8d> + .byte 102,15,111,13,199,42,0,0 // movdqa 0x2ac7(%rip),%xmm1 # 60e0 <_sk_callback_sse2+0xb9d> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,198,42,0,0 // mulps 0x2ac6(%rip),%xmm1 # 6120 <_sk_callback_sse2+0xbaa> - .byte 102,15,219,21,206,42,0,0 // pand 0x2ace(%rip),%xmm2 # 6130 <_sk_callback_sse2+0xbba> + .byte 15,89,13,201,42,0,0 // mulps 0x2ac9(%rip),%xmm1 # 60f0 <_sk_callback_sse2+0xbad> + .byte 102,15,219,21,209,42,0,0 // pand 0x2ad1(%rip),%xmm2 # 6100 <_sk_callback_sse2+0xbbd> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,212,42,0,0 // mulps 0x2ad4(%rip),%xmm2 # 6140 <_sk_callback_sse2+0xbca> + .byte 15,89,21,215,42,0,0 // mulps 0x2ad7(%rip),%xmm2 # 6110 <_sk_callback_sse2+0xbcd> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,219,42,0,0 // movaps 0x2adb(%rip),%xmm3 # 6150 <_sk_callback_sse2+0xbda> + .byte 15,40,29,222,42,0,0 // movaps 0x2ade(%rip),%xmm3 # 6120 <_sk_callback_sse2+0xbdd> .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,50 // je 36b6 <_sk_load_565_sse2+0x9c> + .byte 116,50 // je 3683 <_sk_load_565_sse2+0x9c> .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,21 // je 36a3 <_sk_load_565_sse2+0x89> + .byte 116,21 // je 3670 <_sk_load_565_sse2+0x89> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,154 // jne 362e <_sk_load_565_sse2+0x14> + .byte 117,154 // jne 35fb <_sk_load_565_sse2+0x14> .byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2 .byte 102,65,15,110,4,82 // movd (%r10,%rdx,2),%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 .byte 242,15,16,208 // movsd %xmm0,%xmm2 - .byte 233,120,255,255,255 // jmpq 362e <_sk_load_565_sse2+0x14> + .byte 233,120,255,255,255 // jmpq 35fb <_sk_load_565_sse2+0x14> .byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax .byte 102,15,110,208 // movd %eax,%xmm2 - .byte 233,106,255,255,255 // jmpq 362e <_sk_load_565_sse2+0x14> + .byte 233,106,255,255,255 // jmpq 35fb <_sk_load_565_sse2+0x14> HIDDEN _sk_gather_565_sse2 .globl _sk_gather_565_sse2 @@ -33466,19 +33372,19 @@ _sk_gather_565_sse2: .byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,5,22,42,0,0 // movdqa 0x2a16(%rip),%xmm0 # 6160 <_sk_callback_sse2+0xbea> + .byte 102,15,111,5,25,42,0,0 // movdqa 0x2a19(%rip),%xmm0 # 6130 <_sk_callback_sse2+0xbed> .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,24,42,0,0 // mulps 0x2a18(%rip),%xmm0 # 6170 <_sk_callback_sse2+0xbfa> - .byte 102,15,111,13,32,42,0,0 // movdqa 0x2a20(%rip),%xmm1 # 6180 <_sk_callback_sse2+0xc0a> + .byte 15,89,5,27,42,0,0 // mulps 0x2a1b(%rip),%xmm0 # 6140 <_sk_callback_sse2+0xbfd> + .byte 102,15,111,13,35,42,0,0 // movdqa 0x2a23(%rip),%xmm1 # 6150 <_sk_callback_sse2+0xc0d> .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,34,42,0,0 // mulps 0x2a22(%rip),%xmm1 # 6190 <_sk_callback_sse2+0xc1a> - .byte 102,15,219,21,42,42,0,0 // pand 0x2a2a(%rip),%xmm2 # 61a0 <_sk_callback_sse2+0xc2a> + .byte 15,89,13,37,42,0,0 // mulps 0x2a25(%rip),%xmm1 # 6160 <_sk_callback_sse2+0xc1d> + .byte 102,15,219,21,45,42,0,0 // pand 0x2a2d(%rip),%xmm2 # 6170 <_sk_callback_sse2+0xc2d> .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,48,42,0,0 // mulps 0x2a30(%rip),%xmm2 # 61b0 <_sk_callback_sse2+0xc3a> + .byte 15,89,21,51,42,0,0 // mulps 0x2a33(%rip),%xmm2 # 6180 <_sk_callback_sse2+0xc3d> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,55,42,0,0 // movaps 0x2a37(%rip),%xmm3 # 61c0 <_sk_callback_sse2+0xc4a> + .byte 15,40,29,58,42,0,0 // movaps 0x2a3a(%rip),%xmm3 # 6190 <_sk_callback_sse2+0xc4d> .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -33488,12 +33394,12 @@ FUNCTION(_sk_store_565_sse2) _sk_store_565_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 68,15,40,5,55,42,0,0 // movaps 0x2a37(%rip),%xmm8 # 61d0 <_sk_callback_sse2+0xc5a> + .byte 68,15,40,5,58,42,0,0 // movaps 0x2a3a(%rip),%xmm8 # 61a0 <_sk_callback_sse2+0xc5d> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 .byte 102,65,15,114,241,11 // pslld $0xb,%xmm9 - .byte 68,15,40,21,44,42,0,0 // movaps 0x2a2c(%rip),%xmm10 # 61e0 <_sk_callback_sse2+0xc6a> + .byte 68,15,40,21,47,42,0,0 // movaps 0x2a2f(%rip),%xmm10 # 61b0 <_sk_callback_sse2+0xc6d> .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10 .byte 102,65,15,114,242,5 // pslld $0x5,%xmm10 @@ -33505,7 +33411,7 @@ _sk_store_565_sse2: .byte 102,65,15,114,224,16 // psrad $0x10,%xmm8 .byte 102,69,15,107,192 // packssdw %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 37f6 <_sk_store_565_sse2+0x6a> + .byte 117,10 // jne 37c3 <_sk_store_565_sse2+0x6a> .byte 242,69,15,17,4,82 // movsd %xmm8,(%r10,%rdx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -33513,19 +33419,19 @@ _sk_store_565_sse2: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,38 // je 382e <_sk_store_565_sse2+0xa2> + .byte 116,38 // je 37fb <_sk_store_565_sse2+0xa2> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,18 // je 3820 <_sk_store_565_sse2+0x94> + .byte 116,18 // je 37ed <_sk_store_565_sse2+0x94> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,222 // jne 37f2 <_sk_store_565_sse2+0x66> + .byte 117,222 // jne 37bf <_sk_store_565_sse2+0x66> .byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax .byte 102,65,137,68,82,4 // mov %ax,0x4(%r10,%rdx,2) .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8 .byte 102,69,15,126,4,82 // movd %xmm8,(%r10,%rdx,2) - .byte 235,196 // jmp 37f2 <_sk_store_565_sse2+0x66> + .byte 235,196 // jmp 37bf <_sk_store_565_sse2+0x66> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 102,65,137,4,82 // mov %ax,(%r10,%rdx,2) - .byte 235,184 // jmp 37f2 <_sk_store_565_sse2+0x66> + .byte 235,184 // jmp 37bf <_sk_store_565_sse2+0x66> HIDDEN _sk_load_4444_sse2 .globl _sk_load_4444_sse2 @@ -33534,45 +33440,45 @@ _sk_load_4444_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 .byte 77,133,192 // test %r8,%r8 - .byte 117,98 // jne 38a6 <_sk_load_4444_sse2+0x6c> + .byte 117,98 // jne 3873 <_sk_load_4444_sse2+0x6c> .byte 243,65,15,126,28,82 // movq (%r10,%rdx,2),%xmm3 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,154,41,0,0 // movdqa 0x299a(%rip),%xmm0 # 61f0 <_sk_callback_sse2+0xc7a> + .byte 102,15,111,5,157,41,0,0 // movdqa 0x299d(%rip),%xmm0 # 61c0 <_sk_callback_sse2+0xc7d> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,156,41,0,0 // mulps 0x299c(%rip),%xmm0 # 6200 <_sk_callback_sse2+0xc8a> - .byte 102,15,111,13,164,41,0,0 // movdqa 0x29a4(%rip),%xmm1 # 6210 <_sk_callback_sse2+0xc9a> + .byte 15,89,5,159,41,0,0 // mulps 0x299f(%rip),%xmm0 # 61d0 <_sk_callback_sse2+0xc8d> + .byte 102,15,111,13,167,41,0,0 // movdqa 0x29a7(%rip),%xmm1 # 61e0 <_sk_callback_sse2+0xc9d> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,166,41,0,0 // mulps 0x29a6(%rip),%xmm1 # 6220 <_sk_callback_sse2+0xcaa> - .byte 102,15,111,21,174,41,0,0 // movdqa 0x29ae(%rip),%xmm2 # 6230 <_sk_callback_sse2+0xcba> + .byte 15,89,13,169,41,0,0 // mulps 0x29a9(%rip),%xmm1 # 61f0 <_sk_callback_sse2+0xcad> + .byte 102,15,111,21,177,41,0,0 // movdqa 0x29b1(%rip),%xmm2 # 6200 <_sk_callback_sse2+0xcbd> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,176,41,0,0 // mulps 0x29b0(%rip),%xmm2 # 6240 <_sk_callback_sse2+0xcca> - .byte 102,15,219,29,184,41,0,0 // pand 0x29b8(%rip),%xmm3 # 6250 <_sk_callback_sse2+0xcda> + .byte 15,89,21,179,41,0,0 // mulps 0x29b3(%rip),%xmm2 # 6210 <_sk_callback_sse2+0xccd> + .byte 102,15,219,29,187,41,0,0 // pand 0x29bb(%rip),%xmm3 # 6220 <_sk_callback_sse2+0xcdd> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,190,41,0,0 // mulps 0x29be(%rip),%xmm3 # 6260 <_sk_callback_sse2+0xcea> + .byte 15,89,29,193,41,0,0 // mulps 0x29c1(%rip),%xmm3 # 6230 <_sk_callback_sse2+0xced> .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,50 // je 38e5 <_sk_load_4444_sse2+0xab> + .byte 116,50 // je 38b2 <_sk_load_4444_sse2+0xab> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,21 // je 38d2 <_sk_load_4444_sse2+0x98> + .byte 116,21 // je 389f <_sk_load_4444_sse2+0x98> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,139 // jne 384e <_sk_load_4444_sse2+0x14> + .byte 117,139 // jne 381b <_sk_load_4444_sse2+0x14> .byte 65,15,183,68,82,4 // movzwl 0x4(%r10,%rdx,2),%eax .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,65,15,110,4,82 // movd (%r10,%rdx,2),%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 .byte 242,15,16,216 // movsd %xmm0,%xmm3 - .byte 233,105,255,255,255 // jmpq 384e <_sk_load_4444_sse2+0x14> + .byte 233,105,255,255,255 // jmpq 381b <_sk_load_4444_sse2+0x14> .byte 65,15,183,4,82 // movzwl (%r10,%rdx,2),%eax .byte 102,15,110,216 // movd %eax,%xmm3 - .byte 233,91,255,255,255 // jmpq 384e <_sk_load_4444_sse2+0x14> + .byte 233,91,255,255,255 // jmpq 381b <_sk_load_4444_sse2+0x14> HIDDEN _sk_gather_4444_sse2 .globl _sk_gather_4444_sse2 @@ -33607,21 +33513,21 @@ _sk_gather_4444_sse2: .byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,5,247,40,0,0 // movdqa 0x28f7(%rip),%xmm0 # 6270 <_sk_callback_sse2+0xcfa> + .byte 102,15,111,5,250,40,0,0 // movdqa 0x28fa(%rip),%xmm0 # 6240 <_sk_callback_sse2+0xcfd> .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,5,249,40,0,0 // mulps 0x28f9(%rip),%xmm0 # 6280 <_sk_callback_sse2+0xd0a> - .byte 102,15,111,13,1,41,0,0 // movdqa 0x2901(%rip),%xmm1 # 6290 <_sk_callback_sse2+0xd1a> + .byte 15,89,5,252,40,0,0 // mulps 0x28fc(%rip),%xmm0 # 6250 <_sk_callback_sse2+0xd0d> + .byte 102,15,111,13,4,41,0,0 // movdqa 0x2904(%rip),%xmm1 # 6260 <_sk_callback_sse2+0xd1d> .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,13,3,41,0,0 // mulps 0x2903(%rip),%xmm1 # 62a0 <_sk_callback_sse2+0xd2a> - .byte 102,15,111,21,11,41,0,0 // movdqa 0x290b(%rip),%xmm2 # 62b0 <_sk_callback_sse2+0xd3a> + .byte 15,89,13,6,41,0,0 // mulps 0x2906(%rip),%xmm1 # 6270 <_sk_callback_sse2+0xd2d> + .byte 102,15,111,21,14,41,0,0 // movdqa 0x290e(%rip),%xmm2 # 6280 <_sk_callback_sse2+0xd3d> .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,21,13,41,0,0 // mulps 0x290d(%rip),%xmm2 # 62c0 <_sk_callback_sse2+0xd4a> - .byte 102,15,219,29,21,41,0,0 // pand 0x2915(%rip),%xmm3 # 62d0 <_sk_callback_sse2+0xd5a> + .byte 15,89,21,16,41,0,0 // mulps 0x2910(%rip),%xmm2 # 6290 <_sk_callback_sse2+0xd4d> + .byte 102,15,219,29,24,41,0,0 // pand 0x2918(%rip),%xmm3 # 62a0 <_sk_callback_sse2+0xd5d> .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,29,27,41,0,0 // mulps 0x291b(%rip),%xmm3 # 62e0 <_sk_callback_sse2+0xd6a> + .byte 15,89,29,30,41,0,0 // mulps 0x291e(%rip),%xmm3 # 62b0 <_sk_callback_sse2+0xd6d> .byte 72,173 // lods %ds:(%rsi),%rax .byte 91 // pop %rbx .byte 255,224 // jmpq *%rax @@ -33632,7 +33538,7 @@ FUNCTION(_sk_store_4444_sse2) _sk_store_4444_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,16 // mov (%rax),%r10 - .byte 68,15,40,5,25,41,0,0 // movaps 0x2919(%rip),%xmm8 # 62f0 <_sk_callback_sse2+0xd7a> + .byte 68,15,40,5,28,41,0,0 // movaps 0x291c(%rip),%xmm8 # 62c0 <_sk_callback_sse2+0xd7d> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -33654,7 +33560,7 @@ _sk_store_4444_sse2: .byte 102,65,15,114,224,16 // psrad $0x10,%xmm8 .byte 102,69,15,107,192 // packssdw %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 3a48 <_sk_store_4444_sse2+0x7e> + .byte 117,10 // jne 3a15 <_sk_store_4444_sse2+0x7e> .byte 242,69,15,17,4,82 // movsd %xmm8,(%r10,%rdx,2) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -33662,19 +33568,19 @@ _sk_store_4444_sse2: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,38 // je 3a80 <_sk_store_4444_sse2+0xb6> + .byte 116,38 // je 3a4d <_sk_store_4444_sse2+0xb6> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,18 // je 3a72 <_sk_store_4444_sse2+0xa8> + .byte 116,18 // je 3a3f <_sk_store_4444_sse2+0xa8> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,222 // jne 3a44 <_sk_store_4444_sse2+0x7a> + .byte 117,222 // jne 3a11 <_sk_store_4444_sse2+0x7a> .byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax .byte 102,65,137,68,82,4 // mov %ax,0x4(%r10,%rdx,2) .byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8 .byte 102,69,15,126,4,82 // movd %xmm8,(%r10,%rdx,2) - .byte 235,196 // jmp 3a44 <_sk_store_4444_sse2+0x7a> + .byte 235,196 // jmp 3a11 <_sk_store_4444_sse2+0x7a> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 102,65,137,4,82 // mov %ax,(%r10,%rdx,2) - .byte 235,184 // jmp 3a44 <_sk_store_4444_sse2+0x7a> + .byte 235,184 // jmp 3a11 <_sk_store_4444_sse2+0x7a> HIDDEN _sk_load_8888_sse2 .globl _sk_load_8888_sse2 @@ -33683,13 +33589,13 @@ _sk_load_8888_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 77,133,192 // test %r8,%r8 - .byte 117,98 // jne 3af8 <_sk_load_8888_sse2+0x6c> + .byte 117,98 // jne 3ac5 <_sk_load_8888_sse2+0x6c> .byte 243,68,15,111,12,144 // movdqu (%rax,%rdx,4),%xmm9 - .byte 102,15,111,21,92,40,0,0 // movdqa 0x285c(%rip),%xmm2 # 6300 <_sk_callback_sse2+0xd8a> + .byte 102,15,111,21,95,40,0,0 // movdqa 0x285f(%rip),%xmm2 # 62d0 <_sk_callback_sse2+0xd8d> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,88,40,0,0 // movaps 0x2858(%rip),%xmm8 # 6310 <_sk_callback_sse2+0xd9a> + .byte 68,15,40,5,91,40,0,0 // movaps 0x285b(%rip),%xmm8 # 62e0 <_sk_callback_sse2+0xd9d> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -33709,18 +33615,18 @@ _sk_load_8888_sse2: .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,40 // je 3b2d <_sk_load_8888_sse2+0xa1> + .byte 116,40 // je 3afa <_sk_load_8888_sse2+0xa1> .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,18 // je 3b22 <_sk_load_8888_sse2+0x96> + .byte 116,18 // je 3aef <_sk_load_8888_sse2+0x96> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,134 // jne 3a9c <_sk_load_8888_sse2+0x10> + .byte 117,134 // jne 3a69 <_sk_load_8888_sse2+0x10> .byte 102,15,110,68,144,8 // movd 0x8(%rax,%rdx,4),%xmm0 .byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9 .byte 102,68,15,18,12,144 // movlpd (%rax,%rdx,4),%xmm9 - .byte 233,111,255,255,255 // jmpq 3a9c <_sk_load_8888_sse2+0x10> + .byte 233,111,255,255,255 // jmpq 3a69 <_sk_load_8888_sse2+0x10> .byte 102,68,15,110,12,144 // movd (%rax,%rdx,4),%xmm9 - .byte 233,100,255,255,255 // jmpq 3a9c <_sk_load_8888_sse2+0x10> + .byte 233,100,255,255,255 // jmpq 3a69 <_sk_load_8888_sse2+0x10> HIDDEN _sk_gather_8888_sse2 .globl _sk_gather_8888_sse2 @@ -33754,11 +33660,11 @@ _sk_gather_8888_sse2: .byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1 .byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9 .byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9 - .byte 102,15,111,21,102,39,0,0 // movdqa 0x2766(%rip),%xmm2 # 6320 <_sk_callback_sse2+0xdaa> + .byte 102,15,111,21,105,39,0,0 // movdqa 0x2769(%rip),%xmm2 # 62f0 <_sk_callback_sse2+0xdad> .byte 102,65,15,111,193 // movdqa %xmm9,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 68,15,40,5,98,39,0,0 // movaps 0x2762(%rip),%xmm8 # 6330 <_sk_callback_sse2+0xdba> + .byte 68,15,40,5,101,39,0,0 // movaps 0x2765(%rip),%xmm8 # 6300 <_sk_callback_sse2+0xdbd> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,65,15,111,201 // movdqa %xmm9,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -33783,7 +33689,7 @@ FUNCTION(_sk_store_8888_sse2) _sk_store_8888_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 68,15,40,5,36,39,0,0 // movaps 0x2724(%rip),%xmm8 # 6340 <_sk_callback_sse2+0xdca> + .byte 68,15,40,5,39,39,0,0 // movaps 0x2727(%rip),%xmm8 # 6310 <_sk_callback_sse2+0xdcd> .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9 @@ -33802,24 +33708,24 @@ _sk_store_8888_sse2: .byte 102,69,15,235,193 // por %xmm9,%xmm8 .byte 102,69,15,235,194 // por %xmm10,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 3c7c <_sk_store_8888_sse2+0x6d> + .byte 117,10 // jne 3c49 <_sk_store_8888_sse2+0x6d> .byte 243,68,15,127,4,144 // movdqu %xmm8,(%rax,%rdx,4) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,3 // and $0x3,%r9b .byte 65,128,249,1 // cmp $0x1,%r9b - .byte 116,33 // je 3caa <_sk_store_8888_sse2+0x9b> + .byte 116,33 // je 3c77 <_sk_store_8888_sse2+0x9b> .byte 65,128,249,2 // cmp $0x2,%r9b - .byte 116,19 // je 3ca2 <_sk_store_8888_sse2+0x93> + .byte 116,19 // je 3c6f <_sk_store_8888_sse2+0x93> .byte 65,128,249,3 // cmp $0x3,%r9b - .byte 117,227 // jne 3c78 <_sk_store_8888_sse2+0x69> + .byte 117,227 // jne 3c45 <_sk_store_8888_sse2+0x69> .byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9 .byte 102,68,15,126,76,144,8 // movd %xmm9,0x8(%rax,%rdx,4) .byte 102,68,15,214,4,144 // movq %xmm8,(%rax,%rdx,4) - .byte 235,206 // jmp 3c78 <_sk_store_8888_sse2+0x69> + .byte 235,206 // jmp 3c45 <_sk_store_8888_sse2+0x69> .byte 102,68,15,126,4,144 // movd %xmm8,(%rax,%rdx,4) - .byte 235,198 // jmp 3c78 <_sk_store_8888_sse2+0x69> + .byte 235,198 // jmp 3c45 <_sk_store_8888_sse2+0x69> HIDDEN _sk_load_f16_sse2 .globl _sk_load_f16_sse2 @@ -33828,7 +33734,7 @@ _sk_load_f16_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,96,1,0,0 // jne 3e20 <_sk_load_f16_sse2+0x16e> + .byte 15,133,96,1,0,0 // jne 3ded <_sk_load_f16_sse2+0x16e> .byte 102,15,16,4,208 // movupd (%rax,%rdx,8),%xmm0 .byte 102,15,16,76,208,16 // movupd 0x10(%rax,%rdx,8),%xmm1 .byte 102,68,15,40,192 // movapd %xmm0,%xmm8 @@ -33840,7 +33746,7 @@ _sk_load_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,80,38,0,0 // movdqa 0x2650(%rip),%xmm9 # 6350 <_sk_callback_sse2+0xdda> + .byte 102,68,15,111,13,83,38,0,0 // movdqa 0x2653(%rip),%xmm9 # 6320 <_sk_callback_sse2+0xddd> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -33848,11 +33754,11 @@ _sk_load_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,53,38,0,0 // movdqa 0x2635(%rip),%xmm11 # 6360 <_sk_callback_sse2+0xdea> + .byte 102,68,15,111,29,56,38,0,0 // movdqa 0x2638(%rip),%xmm11 # 6330 <_sk_callback_sse2+0xded> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,55,38,0,0 // movdqa 0x2637(%rip),%xmm12 # 6370 <_sk_callback_sse2+0xdfa> + .byte 102,68,15,111,37,58,38,0,0 // movdqa 0x263a(%rip),%xmm12 # 6340 <_sk_callback_sse2+0xdfd> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,58,38,0,0 // movdqa 0x263a(%rip),%xmm3 # 6380 <_sk_callback_sse2+0xe0a> + .byte 102,15,111,29,61,38,0,0 // movdqa 0x263d(%rip),%xmm3 # 6350 <_sk_callback_sse2+0xe0d> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -33900,17 +33806,17 @@ _sk_load_f16_sse2: .byte 255,224 // jmpq *%rax .byte 242,15,16,4,208 // movsd (%rax,%rdx,8),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,17 // jne 3e3c <_sk_load_f16_sse2+0x18a> + .byte 117,17 // jne 3e09 <_sk_load_f16_sse2+0x18a> .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 102,15,20,193 // unpcklpd %xmm1,%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 - .byte 233,143,254,255,255 // jmpq 3ccb <_sk_load_f16_sse2+0x19> + .byte 233,143,254,255,255 // jmpq 3c98 <_sk_load_f16_sse2+0x19> .byte 102,15,22,68,208,8 // movhpd 0x8(%rax,%rdx,8),%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,123,254,255,255 // jb 3ccb <_sk_load_f16_sse2+0x19> + .byte 15,130,123,254,255,255 // jb 3c98 <_sk_load_f16_sse2+0x19> .byte 242,15,16,76,208,16 // movsd 0x10(%rax,%rdx,8),%xmm1 - .byte 233,112,254,255,255 // jmpq 3ccb <_sk_load_f16_sse2+0x19> + .byte 233,112,254,255,255 // jmpq 3c98 <_sk_load_f16_sse2+0x19> HIDDEN _sk_gather_f16_sse2 .globl _sk_gather_f16_sse2 @@ -33952,7 +33858,7 @@ _sk_gather_f16_sse2: .byte 102,69,15,239,210 // pxor %xmm10,%xmm10 .byte 102,65,15,111,206 // movdqa %xmm14,%xmm1 .byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1 - .byte 102,68,15,111,13,140,36,0,0 // movdqa 0x248c(%rip),%xmm9 # 6390 <_sk_callback_sse2+0xe1a> + .byte 102,68,15,111,13,143,36,0,0 // movdqa 0x248f(%rip),%xmm9 # 6360 <_sk_callback_sse2+0xe1d> .byte 102,15,111,193 // movdqa %xmm1,%xmm0 .byte 102,65,15,219,193 // pand %xmm9,%xmm0 .byte 102,15,239,200 // pxor %xmm0,%xmm1 @@ -33960,11 +33866,11 @@ _sk_gather_f16_sse2: .byte 102,68,15,111,233 // movdqa %xmm1,%xmm13 .byte 102,65,15,114,245,13 // pslld $0xd,%xmm13 .byte 102,68,15,235,232 // por %xmm0,%xmm13 - .byte 102,68,15,111,29,113,36,0,0 // movdqa 0x2471(%rip),%xmm11 # 63a0 <_sk_callback_sse2+0xe2a> + .byte 102,68,15,111,29,116,36,0,0 // movdqa 0x2474(%rip),%xmm11 # 6370 <_sk_callback_sse2+0xe2d> .byte 102,69,15,254,235 // paddd %xmm11,%xmm13 - .byte 102,68,15,111,37,115,36,0,0 // movdqa 0x2473(%rip),%xmm12 # 63b0 <_sk_callback_sse2+0xe3a> + .byte 102,68,15,111,37,118,36,0,0 // movdqa 0x2476(%rip),%xmm12 # 6380 <_sk_callback_sse2+0xe3d> .byte 102,65,15,239,204 // pxor %xmm12,%xmm1 - .byte 102,15,111,29,118,36,0,0 // movdqa 0x2476(%rip),%xmm3 # 63c0 <_sk_callback_sse2+0xe4a> + .byte 102,15,111,29,121,36,0,0 // movdqa 0x2479(%rip),%xmm3 # 6390 <_sk_callback_sse2+0xe4d> .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0 .byte 102,65,15,223,197 // pandn %xmm13,%xmm0 @@ -34018,17 +33924,17 @@ FUNCTION(_sk_store_f16_sse2) _sk_store_f16_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 72,139,0 // mov (%rax),%rax - .byte 102,68,15,111,21,157,35,0,0 // movdqa 0x239d(%rip),%xmm10 # 63d0 <_sk_callback_sse2+0xe5a> + .byte 102,68,15,111,21,160,35,0,0 // movdqa 0x23a0(%rip),%xmm10 # 63a0 <_sk_callback_sse2+0xe5d> .byte 102,68,15,111,224 // movdqa %xmm0,%xmm12 .byte 102,69,15,219,226 // pand %xmm10,%xmm12 .byte 102,68,15,111,232 // movdqa %xmm0,%xmm13 .byte 102,69,15,239,236 // pxor %xmm12,%xmm13 - .byte 102,68,15,111,13,144,35,0,0 // movdqa 0x2390(%rip),%xmm9 # 63e0 <_sk_callback_sse2+0xe6a> + .byte 102,68,15,111,13,147,35,0,0 // movdqa 0x2393(%rip),%xmm9 # 63b0 <_sk_callback_sse2+0xe6d> .byte 102,65,15,114,212,16 // psrld $0x10,%xmm12 .byte 102,69,15,111,193 // movdqa %xmm9,%xmm8 .byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8 .byte 102,65,15,114,213,13 // psrld $0xd,%xmm13 - .byte 102,68,15,111,29,129,35,0,0 // movdqa 0x2381(%rip),%xmm11 # 63f0 <_sk_callback_sse2+0xe7a> + .byte 102,68,15,111,29,132,35,0,0 // movdqa 0x2384(%rip),%xmm11 # 63c0 <_sk_callback_sse2+0xe7d> .byte 102,69,15,235,227 // por %xmm11,%xmm12 .byte 102,69,15,254,229 // paddd %xmm13,%xmm12 .byte 102,65,15,114,244,16 // pslld $0x10,%xmm12 @@ -34080,7 +33986,7 @@ _sk_store_f16_sse2: .byte 102,69,15,111,200 // movdqa %xmm8,%xmm9 .byte 102,69,15,98,204 // punpckldq %xmm12,%xmm9 .byte 77,133,192 // test %r8,%r8 - .byte 117,21 // jne 4191 <_sk_store_f16_sse2+0x16c> + .byte 117,21 // jne 415e <_sk_store_f16_sse2+0x16c> .byte 68,15,17,12,208 // movups %xmm9,(%rax,%rdx,8) .byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8 .byte 243,68,15,127,68,208,16 // movdqu %xmm8,0x10(%rax,%rdx,8) @@ -34088,13 +33994,13 @@ _sk_store_f16_sse2: .byte 255,224 // jmpq *%rax .byte 102,68,15,214,12,208 // movq %xmm9,(%rax,%rdx,8) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 418d <_sk_store_f16_sse2+0x168> + .byte 116,240 // je 415a <_sk_store_f16_sse2+0x168> .byte 102,68,15,23,76,208,8 // movhpd %xmm9,0x8(%rax,%rdx,8) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 418d <_sk_store_f16_sse2+0x168> + .byte 114,227 // jb 415a <_sk_store_f16_sse2+0x168> .byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8 .byte 102,68,15,214,68,208,16 // movq %xmm8,0x10(%rax,%rdx,8) - .byte 235,213 // jmp 418d <_sk_store_f16_sse2+0x168> + .byte 235,213 // jmp 415a <_sk_store_f16_sse2+0x168> HIDDEN _sk_load_u16_be_sse2 .globl _sk_load_u16_be_sse2 @@ -34104,7 +34010,7 @@ _sk_load_u16_be_sse2: .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,190,0,0,0 // jne 428c <_sk_load_u16_be_sse2+0xd4> + .byte 15,133,190,0,0,0 // jne 4259 <_sk_load_u16_be_sse2+0xd4> .byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0 .byte 102,65,15,16,76,65,16 // movupd 0x10(%r9,%rax,2),%xmm1 .byte 102,15,40,208 // movapd %xmm0,%xmm2 @@ -34121,7 +34027,7 @@ _sk_load_u16_be_sse2: .byte 102,69,15,239,201 // pxor %xmm9,%xmm9 .byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 68,15,40,5,225,33,0,0 // movaps 0x21e1(%rip),%xmm8 # 6400 <_sk_callback_sse2+0xe8a> + .byte 68,15,40,5,228,33,0,0 // movaps 0x21e4(%rip),%xmm8 # 63d0 <_sk_callback_sse2+0xe8d> .byte 65,15,89,192 // mulps %xmm8,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -34149,17 +34055,17 @@ _sk_load_u16_be_sse2: .byte 255,224 // jmpq *%rax .byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,17 // jne 42a9 <_sk_load_u16_be_sse2+0xf1> + .byte 117,17 // jne 4276 <_sk_load_u16_be_sse2+0xf1> .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 102,15,20,193 // unpcklpd %xmm1,%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 - .byte 233,50,255,255,255 // jmpq 41db <_sk_load_u16_be_sse2+0x23> + .byte 233,50,255,255,255 // jmpq 41a8 <_sk_load_u16_be_sse2+0x23> .byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0 .byte 102,15,87,201 // xorpd %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 15,130,29,255,255,255 // jb 41db <_sk_load_u16_be_sse2+0x23> + .byte 15,130,29,255,255,255 // jb 41a8 <_sk_load_u16_be_sse2+0x23> .byte 242,65,15,16,76,65,16 // movsd 0x10(%r9,%rax,2),%xmm1 - .byte 233,17,255,255,255 // jmpq 41db <_sk_load_u16_be_sse2+0x23> + .byte 233,17,255,255,255 // jmpq 41a8 <_sk_load_u16_be_sse2+0x23> HIDDEN _sk_load_rgb_u16_be_sse2 .globl _sk_load_rgb_u16_be_sse2 @@ -34169,7 +34075,7 @@ _sk_load_rgb_u16_be_sse2: .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,82 // lea (%rdx,%rdx,2),%rax .byte 77,133,192 // test %r8,%r8 - .byte 15,133,175,0,0,0 // jne 438b <_sk_load_rgb_u16_be_sse2+0xc1> + .byte 15,133,175,0,0,0 // jne 4358 <_sk_load_rgb_u16_be_sse2+0xc1> .byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2 .byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3 .byte 102,15,115,219,4 // psrldq $0x4,%xmm3 @@ -34190,7 +34096,7 @@ _sk_load_rgb_u16_be_sse2: .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1 .byte 15,91,193 // cvtdq2ps %xmm1,%xmm0 - .byte 68,15,40,13,208,32,0,0 // movaps 0x20d0(%rip),%xmm9 # 6410 <_sk_callback_sse2+0xe9a> + .byte 68,15,40,13,211,32,0,0 // movaps 0x20d3(%rip),%xmm9 # 63e0 <_sk_callback_sse2+0xe9d> .byte 65,15,89,193 // mulps %xmm9,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -34207,27 +34113,27 @@ _sk_load_rgb_u16_be_sse2: .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 .byte 65,15,89,209 // mulps %xmm9,%xmm2 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,151,32,0,0 // movaps 0x2097(%rip),%xmm3 # 6420 <_sk_callback_sse2+0xeaa> + .byte 15,40,29,154,32,0,0 // movaps 0x209a(%rip),%xmm3 # 63f0 <_sk_callback_sse2+0xead> .byte 255,224 // jmpq *%rax .byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2 .byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,13 // jne 43b0 <_sk_load_rgb_u16_be_sse2+0xe6> + .byte 117,13 // jne 437d <_sk_load_rgb_u16_be_sse2+0xe6> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,80,255,255,255 // jmpq 4300 <_sk_load_rgb_u16_be_sse2+0x36> + .byte 233,80,255,255,255 // jmpq 42cd <_sk_load_rgb_u16_be_sse2+0x36> .byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0 .byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,24 // jb 43e1 <_sk_load_rgb_u16_be_sse2+0x117> + .byte 114,24 // jb 43ae <_sk_load_rgb_u16_be_sse2+0x117> .byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3 .byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3 .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 233,31,255,255,255 // jmpq 4300 <_sk_load_rgb_u16_be_sse2+0x36> + .byte 233,31,255,255,255 // jmpq 42cd <_sk_load_rgb_u16_be_sse2+0x36> .byte 102,15,239,219 // pxor %xmm3,%xmm3 - .byte 233,22,255,255,255 // jmpq 4300 <_sk_load_rgb_u16_be_sse2+0x36> + .byte 233,22,255,255,255 // jmpq 42cd <_sk_load_rgb_u16_be_sse2+0x36> HIDDEN _sk_store_u16_be_sse2 .globl _sk_store_u16_be_sse2 @@ -34236,7 +34142,7 @@ _sk_store_u16_be_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,8 // mov (%rax),%r9 .byte 72,141,4,149,0,0,0,0 // lea 0x0(,%rdx,4),%rax - .byte 68,15,40,21,49,32,0,0 // movaps 0x2031(%rip),%xmm10 # 6430 <_sk_callback_sse2+0xeba> + .byte 68,15,40,21,52,32,0,0 // movaps 0x2034(%rip),%xmm10 # 6400 <_sk_callback_sse2+0xebd> .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 69,15,89,194 // mulps %xmm10,%xmm8 .byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8 @@ -34281,7 +34187,7 @@ _sk_store_u16_be_sse2: .byte 102,69,15,111,208 // movdqa %xmm8,%xmm10 .byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10 .byte 77,133,192 // test %r8,%r8 - .byte 117,21 // jne 44f9 <_sk_store_u16_be_sse2+0x10f> + .byte 117,21 // jne 44c6 <_sk_store_u16_be_sse2+0x10f> .byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2) .byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8 .byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2) @@ -34289,13 +34195,13 @@ _sk_store_u16_be_sse2: .byte 255,224 // jmpq *%rax .byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2) .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,240 // je 44f5 <_sk_store_u16_be_sse2+0x10b> + .byte 116,240 // je 44c2 <_sk_store_u16_be_sse2+0x10b> .byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,227 // jb 44f5 <_sk_store_u16_be_sse2+0x10b> + .byte 114,227 // jb 44c2 <_sk_store_u16_be_sse2+0x10b> .byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8 .byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2) - .byte 235,213 // jmp 44f5 <_sk_store_u16_be_sse2+0x10b> + .byte 235,213 // jmp 44c2 <_sk_store_u16_be_sse2+0x10b> HIDDEN _sk_load_f32_sse2 .globl _sk_load_f32_sse2 @@ -34308,7 +34214,7 @@ _sk_load_f32_sse2: .byte 72,193,224,4 // shl $0x4,%rax .byte 69,15,16,4,2 // movups (%r10,%rax,1),%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,66 // jne 4580 <_sk_load_f32_sse2+0x60> + .byte 117,66 // jne 454d <_sk_load_f32_sse2+0x60> .byte 67,15,16,68,138,16 // movups 0x10(%r10,%r9,4),%xmm0 .byte 67,15,16,92,138,32 // movups 0x20(%r10,%r9,4),%xmm3 .byte 71,15,16,76,138,48 // movups 0x30(%r10,%r9,4),%xmm9 @@ -34328,17 +34234,17 @@ _sk_load_f32_sse2: .byte 255,224 // jmpq *%rax .byte 69,15,87,201 // xorps %xmm9,%xmm9 .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 117,8 // jne 4592 <_sk_load_f32_sse2+0x72> + .byte 117,8 // jne 455f <_sk_load_f32_sse2+0x72> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 235,190 // jmp 4550 <_sk_load_f32_sse2+0x30> + .byte 235,190 // jmp 451d <_sk_load_f32_sse2+0x30> .byte 67,15,16,68,138,16 // movups 0x10(%r10,%r9,4),%xmm0 .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,8 // jb 45a6 <_sk_load_f32_sse2+0x86> + .byte 114,8 // jb 4573 <_sk_load_f32_sse2+0x86> .byte 67,15,16,92,138,32 // movups 0x20(%r10,%r9,4),%xmm3 - .byte 235,170 // jmp 4550 <_sk_load_f32_sse2+0x30> + .byte 235,170 // jmp 451d <_sk_load_f32_sse2+0x30> .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 235,165 // jmp 4550 <_sk_load_f32_sse2+0x30> + .byte 235,165 // jmp 451d <_sk_load_f32_sse2+0x30> HIDDEN _sk_store_f32_sse2 .globl _sk_store_f32_sse2 @@ -34364,7 +34270,7 @@ _sk_store_f32_sse2: .byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9 .byte 102,69,15,17,36,2 // movupd %xmm12,(%r10,%rax,1) .byte 77,133,192 // test %r8,%r8 - .byte 117,29 // jne 461d <_sk_store_f32_sse2+0x72> + .byte 117,29 // jne 45ea <_sk_store_f32_sse2+0x72> .byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10 .byte 71,15,17,68,138,16 // movups %xmm8,0x10(%r10,%r9,4) .byte 102,71,15,17,76,138,32 // movupd %xmm9,0x20(%r10,%r9,4) @@ -34372,12 +34278,12 @@ _sk_store_f32_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax .byte 73,131,248,1 // cmp $0x1,%r8 - .byte 116,246 // je 4619 <_sk_store_f32_sse2+0x6e> + .byte 116,246 // je 45e6 <_sk_store_f32_sse2+0x6e> .byte 71,15,17,68,138,16 // movups %xmm8,0x10(%r10,%r9,4) .byte 73,131,248,3 // cmp $0x3,%r8 - .byte 114,234 // jb 4619 <_sk_store_f32_sse2+0x6e> + .byte 114,234 // jb 45e6 <_sk_store_f32_sse2+0x6e> .byte 102,71,15,17,76,138,32 // movupd %xmm9,0x20(%r10,%r9,4) - .byte 235,225 // jmp 4619 <_sk_store_f32_sse2+0x6e> + .byte 235,225 // jmp 45e6 <_sk_store_f32_sse2+0x6e> HIDDEN _sk_clamp_x_sse2 .globl _sk_clamp_x_sse2 @@ -34423,7 +34329,7 @@ _sk_repeat_x_sse2: .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,138,29,0,0 // andps 0x1d8a(%rip),%xmm9 # 6440 <_sk_callback_sse2+0xeca> + .byte 68,15,84,13,141,29,0,0 // andps 0x1d8d(%rip),%xmm9 # 6410 <_sk_callback_sse2+0xecd> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -34446,7 +34352,7 @@ _sk_repeat_y_sse2: .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,75,29,0,0 // andps 0x1d4b(%rip),%xmm9 # 6450 <_sk_callback_sse2+0xeda> + .byte 68,15,84,13,78,29,0,0 // andps 0x1d4e(%rip),%xmm9 # 6420 <_sk_callback_sse2+0xedd> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8 .byte 69,15,89,208 // mulps %xmm8,%xmm10 @@ -34469,13 +34375,13 @@ _sk_mirror_x_sse2: .byte 65,15,92,192 // subps %xmm8,%xmm0 .byte 243,69,15,88,201 // addss %xmm9,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 - .byte 243,68,15,89,21,27,33,0,0 // mulss 0x211b(%rip),%xmm10 # 6870 <_sk_callback_sse2+0x12fa> + .byte 243,68,15,89,21,30,33,0,0 // mulss 0x211e(%rip),%xmm10 # 6840 <_sk_callback_sse2+0x12fd> .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 68,15,89,208 // mulps %xmm0,%xmm10 .byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11 .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,236,28,0,0 // andps 0x1cec(%rip),%xmm10 # 6460 <_sk_callback_sse2+0xeea> + .byte 68,15,84,21,239,28,0,0 // andps 0x1cef(%rip),%xmm10 # 6430 <_sk_callback_sse2+0xeed> .byte 69,15,87,228 // xorps %xmm12,%xmm12 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,89,217 // mulps %xmm9,%xmm11 @@ -34501,13 +34407,13 @@ _sk_mirror_y_sse2: .byte 65,15,92,200 // subps %xmm8,%xmm1 .byte 243,69,15,88,201 // addss %xmm9,%xmm9 .byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9 - .byte 243,68,15,89,21,165,32,0,0 // mulss 0x20a5(%rip),%xmm10 # 6874 <_sk_callback_sse2+0x12fe> + .byte 243,68,15,89,21,168,32,0,0 // mulss 0x20a8(%rip),%xmm10 # 6844 <_sk_callback_sse2+0x1301> .byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10 .byte 68,15,89,209 // mulps %xmm1,%xmm10 .byte 243,69,15,91,218 // cvttps2dq %xmm10,%xmm11 .byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11 .byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10 - .byte 68,15,84,21,130,28,0,0 // andps 0x1c82(%rip),%xmm10 # 6470 <_sk_callback_sse2+0xefa> + .byte 68,15,84,21,133,28,0,0 // andps 0x1c85(%rip),%xmm10 # 6440 <_sk_callback_sse2+0xefd> .byte 69,15,87,228 // xorps %xmm12,%xmm12 .byte 69,15,92,218 // subps %xmm10,%xmm11 .byte 69,15,89,217 // mulps %xmm9,%xmm11 @@ -34527,7 +34433,7 @@ FUNCTION(_sk_clamp_x_1_sse2) _sk_clamp_x_1_sse2: .byte 69,15,87,192 // xorps %xmm8,%xmm8 .byte 68,15,95,192 // maxps %xmm0,%xmm8 - .byte 68,15,93,5,84,28,0,0 // minps 0x1c54(%rip),%xmm8 # 6480 <_sk_callback_sse2+0xf0a> + .byte 68,15,93,5,87,28,0,0 // minps 0x1c57(%rip),%xmm8 # 6450 <_sk_callback_sse2+0xf0d> .byte 72,173 // lods %ds:(%rsi),%rax .byte 65,15,40,192 // movaps %xmm8,%xmm0 .byte 255,224 // jmpq *%rax @@ -34540,7 +34446,7 @@ _sk_repeat_x_1_sse2: .byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8 .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9 - .byte 68,15,84,13,66,28,0,0 // andps 0x1c42(%rip),%xmm9 # 6490 <_sk_callback_sse2+0xf1a> + .byte 68,15,84,13,69,28,0,0 // andps 0x1c45(%rip),%xmm9 # 6460 <_sk_callback_sse2+0xf1d> .byte 69,15,92,193 // subps %xmm9,%xmm8 .byte 65,15,92,192 // subps %xmm8,%xmm0 .byte 72,173 // lods %ds:(%rsi),%rax @@ -34550,14 +34456,14 @@ HIDDEN _sk_mirror_x_1_sse2 .globl _sk_mirror_x_1_sse2 FUNCTION(_sk_mirror_x_1_sse2) _sk_mirror_x_1_sse2: - .byte 68,15,40,5,62,28,0,0 // movaps 0x1c3e(%rip),%xmm8 # 64a0 <_sk_callback_sse2+0xf2a> + .byte 68,15,40,5,65,28,0,0 // movaps 0x1c41(%rip),%xmm8 # 6470 <_sk_callback_sse2+0xf2d> .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,13,66,28,0,0 // movaps 0x1c42(%rip),%xmm9 # 64b0 <_sk_callback_sse2+0xf3a> + .byte 68,15,40,13,69,28,0,0 // movaps 0x1c45(%rip),%xmm9 # 6480 <_sk_callback_sse2+0xf3d> .byte 68,15,89,200 // mulps %xmm0,%xmm9 .byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10 .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,84,13,56,28,0,0 // andps 0x1c38(%rip),%xmm9 # 64c0 <_sk_callback_sse2+0xf4a> + .byte 68,15,84,13,59,28,0,0 // andps 0x1c3b(%rip),%xmm9 # 6490 <_sk_callback_sse2+0xf4d> .byte 69,15,87,219 // xorps %xmm11,%xmm11 .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,88,210 // addps %xmm10,%xmm10 @@ -34573,10 +34479,10 @@ HIDDEN _sk_luminance_to_alpha_sse2 FUNCTION(_sk_luminance_to_alpha_sse2) _sk_luminance_to_alpha_sse2: .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 15,89,5,30,28,0,0 // mulps 0x1c1e(%rip),%xmm0 # 64d0 <_sk_callback_sse2+0xf5a> - .byte 15,89,13,39,28,0,0 // mulps 0x1c27(%rip),%xmm1 # 64e0 <_sk_callback_sse2+0xf6a> + .byte 15,89,5,33,28,0,0 // mulps 0x1c21(%rip),%xmm0 # 64a0 <_sk_callback_sse2+0xf5d> + .byte 15,89,13,42,28,0,0 // mulps 0x1c2a(%rip),%xmm1 # 64b0 <_sk_callback_sse2+0xf6d> .byte 15,88,200 // addps %xmm0,%xmm1 - .byte 15,89,29,45,28,0,0 // mulps 0x1c2d(%rip),%xmm3 # 64f0 <_sk_callback_sse2+0xf7a> + .byte 15,89,29,48,28,0,0 // mulps 0x1c30(%rip),%xmm3 # 64c0 <_sk_callback_sse2+0xf7d> .byte 15,88,217 // addps %xmm1,%xmm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,87,192 // xorps %xmm0,%xmm0 @@ -34854,9 +34760,9 @@ _sk_evenly_spaced_gradient_sse2: .byte 72,139,24 // mov (%rax),%rbx .byte 76,139,112,8 // mov 0x8(%rax),%r14 .byte 72,255,203 // dec %rbx - .byte 120,7 // js 4cff <_sk_evenly_spaced_gradient_sse2+0x18> + .byte 120,7 // js 4ccc <_sk_evenly_spaced_gradient_sse2+0x18> .byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1 - .byte 235,21 // jmp 4d14 <_sk_evenly_spaced_gradient_sse2+0x2d> + .byte 235,21 // jmp 4ce1 <_sk_evenly_spaced_gradient_sse2+0x2d> .byte 73,137,217 // mov %rbx,%r9 .byte 73,209,233 // shr %r9 .byte 131,227,1 // and $0x1,%ebx @@ -34954,15 +34860,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2 .globl _sk_gauss_a_to_rgba_sse2 FUNCTION(_sk_gauss_a_to_rgba_sse2) _sk_gauss_a_to_rgba_sse2: - .byte 15,40,5,96,22,0,0 // movaps 0x1660(%rip),%xmm0 # 6500 <_sk_callback_sse2+0xf8a> + .byte 15,40,5,99,22,0,0 // movaps 0x1663(%rip),%xmm0 # 64d0 <_sk_callback_sse2+0xf8d> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,102,22,0,0 // addps 0x1666(%rip),%xmm0 # 6510 <_sk_callback_sse2+0xf9a> + .byte 15,88,5,105,22,0,0 // addps 0x1669(%rip),%xmm0 # 64e0 <_sk_callback_sse2+0xf9d> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,108,22,0,0 // addps 0x166c(%rip),%xmm0 # 6520 <_sk_callback_sse2+0xfaa> + .byte 15,88,5,111,22,0,0 // addps 0x166f(%rip),%xmm0 # 64f0 <_sk_callback_sse2+0xfad> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,114,22,0,0 // addps 0x1672(%rip),%xmm0 # 6530 <_sk_callback_sse2+0xfba> + .byte 15,88,5,117,22,0,0 // addps 0x1675(%rip),%xmm0 # 6500 <_sk_callback_sse2+0xfbd> .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,5,120,22,0,0 // addps 0x1678(%rip),%xmm0 # 6540 <_sk_callback_sse2+0xfca> + .byte 15,88,5,123,22,0,0 // addps 0x167b(%rip),%xmm0 # 6510 <_sk_callback_sse2+0xfcd> .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 @@ -34980,12 +34886,12 @@ _sk_gradient_sse2: .byte 76,139,8 // mov (%rax),%r9 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 73,131,249,2 // cmp $0x2,%r9 - .byte 114,50 // jb 4f1b <_sk_gradient_sse2+0x46> + .byte 114,50 // jb 4ee8 <_sk_gradient_sse2+0x46> .byte 72,139,88,72 // mov 0x48(%rax),%rbx .byte 73,255,201 // dec %r9 .byte 72,131,195,4 // add $0x4,%rbx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,21,81,22,0,0 // movaps 0x1651(%rip),%xmm2 # 6550 <_sk_callback_sse2+0xfda> + .byte 15,40,21,84,22,0,0 // movaps 0x1654(%rip),%xmm2 # 6520 <_sk_callback_sse2+0xfdd> .byte 243,15,16,27 // movss (%rbx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -34993,7 +34899,7 @@ _sk_gradient_sse2: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 72,131,195,4 // add $0x4,%rbx .byte 73,255,201 // dec %r9 - .byte 117,228 // jne 4eff <_sk_gradient_sse2+0x2a> + .byte 117,228 // jne 4ecc <_sk_gradient_sse2+0x2a> .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2 .byte 102,73,15,126,211 // movq %xmm2,%r11 .byte 69,137,217 // mov %r11d,%r9d @@ -35132,29 +35038,29 @@ _sk_xy_to_unit_angle_sse2: .byte 69,15,94,220 // divps %xmm12,%xmm11 .byte 69,15,40,227 // movaps %xmm11,%xmm12 .byte 69,15,89,228 // mulps %xmm12,%xmm12 - .byte 68,15,40,45,18,20,0,0 // movaps 0x1412(%rip),%xmm13 # 6560 <_sk_callback_sse2+0xfea> + .byte 68,15,40,45,21,20,0,0 // movaps 0x1415(%rip),%xmm13 # 6530 <_sk_callback_sse2+0xfed> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,22,20,0,0 // addps 0x1416(%rip),%xmm13 # 6570 <_sk_callback_sse2+0xffa> + .byte 68,15,88,45,25,20,0,0 // addps 0x1419(%rip),%xmm13 # 6540 <_sk_callback_sse2+0xffd> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,26,20,0,0 // addps 0x141a(%rip),%xmm13 # 6580 <_sk_callback_sse2+0x100a> + .byte 68,15,88,45,29,20,0,0 // addps 0x141d(%rip),%xmm13 # 6550 <_sk_callback_sse2+0x100d> .byte 69,15,89,236 // mulps %xmm12,%xmm13 - .byte 68,15,88,45,30,20,0,0 // addps 0x141e(%rip),%xmm13 # 6590 <_sk_callback_sse2+0x101a> + .byte 68,15,88,45,33,20,0,0 // addps 0x1421(%rip),%xmm13 # 6560 <_sk_callback_sse2+0x101d> .byte 69,15,89,235 // mulps %xmm11,%xmm13 .byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9 - .byte 68,15,40,21,29,20,0,0 // movaps 0x141d(%rip),%xmm10 # 65a0 <_sk_callback_sse2+0x102a> + .byte 68,15,40,21,32,20,0,0 // movaps 0x1420(%rip),%xmm10 # 6570 <_sk_callback_sse2+0x102d> .byte 69,15,92,213 // subps %xmm13,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,205 // andnps %xmm13,%xmm9 .byte 69,15,86,202 // orps %xmm10,%xmm9 .byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8 - .byte 68,15,40,21,16,20,0,0 // movaps 0x1410(%rip),%xmm10 # 65b0 <_sk_callback_sse2+0x103a> + .byte 68,15,40,21,19,20,0,0 // movaps 0x1413(%rip),%xmm10 # 6580 <_sk_callback_sse2+0x103d> .byte 69,15,92,209 // subps %xmm9,%xmm10 .byte 69,15,84,208 // andps %xmm8,%xmm10 .byte 69,15,85,193 // andnps %xmm9,%xmm8 .byte 69,15,86,194 // orps %xmm10,%xmm8 .byte 68,15,40,201 // movaps %xmm1,%xmm9 .byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9 - .byte 68,15,40,21,255,19,0,0 // movaps 0x13ff(%rip),%xmm10 # 65c0 <_sk_callback_sse2+0x104a> + .byte 68,15,40,21,2,20,0,0 // movaps 0x1402(%rip),%xmm10 # 6590 <_sk_callback_sse2+0x104d> .byte 69,15,92,208 // subps %xmm8,%xmm10 .byte 69,15,84,209 // andps %xmm9,%xmm10 .byte 69,15,85,200 // andnps %xmm8,%xmm9 @@ -35181,7 +35087,7 @@ HIDDEN _sk_save_xy_sse2 FUNCTION(_sk_save_xy_sse2) _sk_save_xy_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,209,19,0,0 // movaps 0x13d1(%rip),%xmm8 # 65d0 <_sk_callback_sse2+0x105a> + .byte 68,15,40,5,212,19,0,0 // movaps 0x13d4(%rip),%xmm8 # 65a0 <_sk_callback_sse2+0x105d> .byte 15,17,0 // movups %xmm0,(%rax) .byte 68,15,40,200 // movaps %xmm0,%xmm9 .byte 69,15,88,200 // addps %xmm8,%xmm9 @@ -35189,7 +35095,7 @@ _sk_save_xy_sse2: .byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10 .byte 69,15,40,217 // movaps %xmm9,%xmm11 .byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11 - .byte 68,15,40,37,188,19,0,0 // movaps 0x13bc(%rip),%xmm12 # 65e0 <_sk_callback_sse2+0x106a> + .byte 68,15,40,37,191,19,0,0 // movaps 0x13bf(%rip),%xmm12 # 65b0 <_sk_callback_sse2+0x106d> .byte 69,15,84,220 // andps %xmm12,%xmm11 .byte 69,15,92,211 // subps %xmm11,%xmm10 .byte 69,15,92,202 // subps %xmm10,%xmm9 @@ -35236,8 +35142,8 @@ _sk_bilinear_nx_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,53,19,0,0 // addps 0x1335(%rip),%xmm0 # 65f0 <_sk_callback_sse2+0x107a> - .byte 68,15,40,13,61,19,0,0 // movaps 0x133d(%rip),%xmm9 # 6600 <_sk_callback_sse2+0x108a> + .byte 15,88,5,56,19,0,0 // addps 0x1338(%rip),%xmm0 # 65c0 <_sk_callback_sse2+0x107d> + .byte 68,15,40,13,64,19,0,0 // movaps 0x1340(%rip),%xmm9 # 65d0 <_sk_callback_sse2+0x108d> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -35250,7 +35156,7 @@ _sk_bilinear_px_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,44,19,0,0 // addps 0x132c(%rip),%xmm0 # 6610 <_sk_callback_sse2+0x109a> + .byte 15,88,5,47,19,0,0 // addps 0x132f(%rip),%xmm0 # 65e0 <_sk_callback_sse2+0x109d> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -35262,8 +35168,8 @@ _sk_bilinear_ny_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,30,19,0,0 // addps 0x131e(%rip),%xmm1 # 6620 <_sk_callback_sse2+0x10aa> - .byte 68,15,40,13,38,19,0,0 // movaps 0x1326(%rip),%xmm9 # 6630 <_sk_callback_sse2+0x10ba> + .byte 15,88,13,33,19,0,0 // addps 0x1321(%rip),%xmm1 # 65f0 <_sk_callback_sse2+0x10ad> + .byte 68,15,40,13,41,19,0,0 // movaps 0x1329(%rip),%xmm9 # 6600 <_sk_callback_sse2+0x10bd> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -35276,7 +35182,7 @@ _sk_bilinear_py_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,20,19,0,0 // addps 0x1314(%rip),%xmm1 # 6640 <_sk_callback_sse2+0x10ca> + .byte 15,88,13,23,19,0,0 // addps 0x1317(%rip),%xmm1 # 6610 <_sk_callback_sse2+0x10cd> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -35288,13 +35194,13 @@ _sk_bicubic_n3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,7,19,0,0 // addps 0x1307(%rip),%xmm0 # 6650 <_sk_callback_sse2+0x10da> - .byte 68,15,40,13,15,19,0,0 // movaps 0x130f(%rip),%xmm9 # 6660 <_sk_callback_sse2+0x10ea> + .byte 15,88,5,10,19,0,0 // addps 0x130a(%rip),%xmm0 # 6620 <_sk_callback_sse2+0x10dd> + .byte 68,15,40,13,18,19,0,0 // movaps 0x1312(%rip),%xmm9 # 6630 <_sk_callback_sse2+0x10ed> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,11,19,0,0 // mulps 0x130b(%rip),%xmm9 # 6670 <_sk_callback_sse2+0x10fa> - .byte 68,15,88,13,19,19,0,0 // addps 0x1313(%rip),%xmm9 # 6680 <_sk_callback_sse2+0x110a> + .byte 68,15,89,13,14,19,0,0 // mulps 0x130e(%rip),%xmm9 # 6640 <_sk_callback_sse2+0x10fd> + .byte 68,15,88,13,22,19,0,0 // addps 0x1316(%rip),%xmm9 # 6650 <_sk_callback_sse2+0x110d> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -35307,16 +35213,16 @@ _sk_bicubic_n1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,2,19,0,0 // addps 0x1302(%rip),%xmm0 # 6690 <_sk_callback_sse2+0x111a> - .byte 68,15,40,13,10,19,0,0 // movaps 0x130a(%rip),%xmm9 # 66a0 <_sk_callback_sse2+0x112a> + .byte 15,88,5,5,19,0,0 // addps 0x1305(%rip),%xmm0 # 6660 <_sk_callback_sse2+0x111d> + .byte 68,15,40,13,13,19,0,0 // movaps 0x130d(%rip),%xmm9 # 6670 <_sk_callback_sse2+0x112d> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,14,19,0,0 // movaps 0x130e(%rip),%xmm8 # 66b0 <_sk_callback_sse2+0x113a> + .byte 68,15,40,5,17,19,0,0 // movaps 0x1311(%rip),%xmm8 # 6680 <_sk_callback_sse2+0x113d> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,18,19,0,0 // addps 0x1312(%rip),%xmm8 # 66c0 <_sk_callback_sse2+0x114a> + .byte 68,15,88,5,21,19,0,0 // addps 0x1315(%rip),%xmm8 # 6690 <_sk_callback_sse2+0x114d> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,22,19,0,0 // addps 0x1316(%rip),%xmm8 # 66d0 <_sk_callback_sse2+0x115a> + .byte 68,15,88,5,25,19,0,0 // addps 0x1319(%rip),%xmm8 # 66a0 <_sk_callback_sse2+0x115d> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,26,19,0,0 // addps 0x131a(%rip),%xmm8 # 66e0 <_sk_callback_sse2+0x116a> + .byte 68,15,88,5,29,19,0,0 // addps 0x131d(%rip),%xmm8 # 66b0 <_sk_callback_sse2+0x116d> .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -35326,17 +35232,17 @@ HIDDEN _sk_bicubic_p1x_sse2 FUNCTION(_sk_bicubic_p1x_sse2) _sk_bicubic_p1x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,20,19,0,0 // movaps 0x1314(%rip),%xmm8 # 66f0 <_sk_callback_sse2+0x117a> + .byte 68,15,40,5,23,19,0,0 // movaps 0x1317(%rip),%xmm8 # 66c0 <_sk_callback_sse2+0x117d> .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9 .byte 65,15,88,192 // addps %xmm8,%xmm0 - .byte 68,15,40,21,16,19,0,0 // movaps 0x1310(%rip),%xmm10 # 6700 <_sk_callback_sse2+0x118a> + .byte 68,15,40,21,19,19,0,0 // movaps 0x1313(%rip),%xmm10 # 66d0 <_sk_callback_sse2+0x118d> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,20,19,0,0 // addps 0x1314(%rip),%xmm10 # 6710 <_sk_callback_sse2+0x119a> + .byte 68,15,88,21,23,19,0,0 // addps 0x1317(%rip),%xmm10 # 66e0 <_sk_callback_sse2+0x119d> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,16,19,0,0 // addps 0x1310(%rip),%xmm10 # 6720 <_sk_callback_sse2+0x11aa> + .byte 68,15,88,21,19,19,0,0 // addps 0x1313(%rip),%xmm10 # 66f0 <_sk_callback_sse2+0x11ad> .byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -35348,11 +35254,11 @@ _sk_bicubic_p3x_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,0 // movups (%rax),%xmm0 .byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8 - .byte 15,88,5,3,19,0,0 // addps 0x1303(%rip),%xmm0 # 6730 <_sk_callback_sse2+0x11ba> + .byte 15,88,5,6,19,0,0 // addps 0x1306(%rip),%xmm0 # 6700 <_sk_callback_sse2+0x11bd> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,3,19,0,0 // mulps 0x1303(%rip),%xmm8 # 6740 <_sk_callback_sse2+0x11ca> - .byte 68,15,88,5,11,19,0,0 // addps 0x130b(%rip),%xmm8 # 6750 <_sk_callback_sse2+0x11da> + .byte 68,15,89,5,6,19,0,0 // mulps 0x1306(%rip),%xmm8 # 6710 <_sk_callback_sse2+0x11cd> + .byte 68,15,88,5,14,19,0,0 // addps 0x130e(%rip),%xmm8 # 6720 <_sk_callback_sse2+0x11dd> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -35365,13 +35271,13 @@ _sk_bicubic_n3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,249,18,0,0 // addps 0x12f9(%rip),%xmm1 # 6760 <_sk_callback_sse2+0x11ea> - .byte 68,15,40,13,1,19,0,0 // movaps 0x1301(%rip),%xmm9 # 6770 <_sk_callback_sse2+0x11fa> + .byte 15,88,13,252,18,0,0 // addps 0x12fc(%rip),%xmm1 # 6730 <_sk_callback_sse2+0x11ed> + .byte 68,15,40,13,4,19,0,0 // movaps 0x1304(%rip),%xmm9 # 6740 <_sk_callback_sse2+0x11fd> .byte 69,15,92,200 // subps %xmm8,%xmm9 .byte 69,15,40,193 // movaps %xmm9,%xmm8 .byte 69,15,89,192 // mulps %xmm8,%xmm8 - .byte 68,15,89,13,253,18,0,0 // mulps 0x12fd(%rip),%xmm9 # 6780 <_sk_callback_sse2+0x120a> - .byte 68,15,88,13,5,19,0,0 // addps 0x1305(%rip),%xmm9 # 6790 <_sk_callback_sse2+0x121a> + .byte 68,15,89,13,0,19,0,0 // mulps 0x1300(%rip),%xmm9 # 6750 <_sk_callback_sse2+0x120d> + .byte 68,15,88,13,8,19,0,0 // addps 0x1308(%rip),%xmm9 # 6760 <_sk_callback_sse2+0x121d> .byte 69,15,89,200 // mulps %xmm8,%xmm9 .byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -35384,16 +35290,16 @@ _sk_bicubic_n1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,243,18,0,0 // addps 0x12f3(%rip),%xmm1 # 67a0 <_sk_callback_sse2+0x122a> - .byte 68,15,40,13,251,18,0,0 // movaps 0x12fb(%rip),%xmm9 # 67b0 <_sk_callback_sse2+0x123a> + .byte 15,88,13,246,18,0,0 // addps 0x12f6(%rip),%xmm1 # 6770 <_sk_callback_sse2+0x122d> + .byte 68,15,40,13,254,18,0,0 // movaps 0x12fe(%rip),%xmm9 # 6780 <_sk_callback_sse2+0x123d> .byte 69,15,92,200 // subps %xmm8,%xmm9 - .byte 68,15,40,5,255,18,0,0 // movaps 0x12ff(%rip),%xmm8 # 67c0 <_sk_callback_sse2+0x124a> + .byte 68,15,40,5,2,19,0,0 // movaps 0x1302(%rip),%xmm8 # 6790 <_sk_callback_sse2+0x124d> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,3,19,0,0 // addps 0x1303(%rip),%xmm8 # 67d0 <_sk_callback_sse2+0x125a> + .byte 68,15,88,5,6,19,0,0 // addps 0x1306(%rip),%xmm8 # 67a0 <_sk_callback_sse2+0x125d> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,7,19,0,0 // addps 0x1307(%rip),%xmm8 # 67e0 <_sk_callback_sse2+0x126a> + .byte 68,15,88,5,10,19,0,0 // addps 0x130a(%rip),%xmm8 # 67b0 <_sk_callback_sse2+0x126d> .byte 69,15,89,193 // mulps %xmm9,%xmm8 - .byte 68,15,88,5,11,19,0,0 // addps 0x130b(%rip),%xmm8 # 67f0 <_sk_callback_sse2+0x127a> + .byte 68,15,88,5,14,19,0,0 // addps 0x130e(%rip),%xmm8 # 67c0 <_sk_callback_sse2+0x127d> .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -35403,17 +35309,17 @@ HIDDEN _sk_bicubic_p1y_sse2 FUNCTION(_sk_bicubic_p1y_sse2) _sk_bicubic_p1y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 68,15,40,5,5,19,0,0 // movaps 0x1305(%rip),%xmm8 # 6800 <_sk_callback_sse2+0x128a> + .byte 68,15,40,5,8,19,0,0 // movaps 0x1308(%rip),%xmm8 # 67d0 <_sk_callback_sse2+0x128d> .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9 .byte 65,15,88,200 // addps %xmm8,%xmm1 - .byte 68,15,40,21,0,19,0,0 // movaps 0x1300(%rip),%xmm10 # 6810 <_sk_callback_sse2+0x129a> + .byte 68,15,40,21,3,19,0,0 // movaps 0x1303(%rip),%xmm10 # 67e0 <_sk_callback_sse2+0x129d> .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,4,19,0,0 // addps 0x1304(%rip),%xmm10 # 6820 <_sk_callback_sse2+0x12aa> + .byte 68,15,88,21,7,19,0,0 // addps 0x1307(%rip),%xmm10 # 67f0 <_sk_callback_sse2+0x12ad> .byte 69,15,89,209 // mulps %xmm9,%xmm10 .byte 69,15,88,208 // addps %xmm8,%xmm10 .byte 69,15,89,209 // mulps %xmm9,%xmm10 - .byte 68,15,88,21,0,19,0,0 // addps 0x1300(%rip),%xmm10 # 6830 <_sk_callback_sse2+0x12ba> + .byte 68,15,88,21,3,19,0,0 // addps 0x1303(%rip),%xmm10 # 6800 <_sk_callback_sse2+0x12bd> .byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -35425,11 +35331,11 @@ _sk_bicubic_p3y_sse2: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,72,32 // movups 0x20(%rax),%xmm1 .byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8 - .byte 15,88,13,242,18,0,0 // addps 0x12f2(%rip),%xmm1 # 6840 <_sk_callback_sse2+0x12ca> + .byte 15,88,13,245,18,0,0 // addps 0x12f5(%rip),%xmm1 # 6810 <_sk_callback_sse2+0x12cd> .byte 69,15,40,200 // movaps %xmm8,%xmm9 .byte 69,15,89,201 // mulps %xmm9,%xmm9 - .byte 68,15,89,5,242,18,0,0 // mulps 0x12f2(%rip),%xmm8 # 6850 <_sk_callback_sse2+0x12da> - .byte 68,15,88,5,250,18,0,0 // addps 0x12fa(%rip),%xmm8 # 6860 <_sk_callback_sse2+0x12ea> + .byte 68,15,89,5,245,18,0,0 // mulps 0x12f5(%rip),%xmm8 # 6820 <_sk_callback_sse2+0x12dd> + .byte 68,15,88,5,253,18,0,0 // addps 0x12fd(%rip),%xmm8 # 6830 <_sk_callback_sse2+0x12ed> .byte 69,15,89,193 // mulps %xmm9,%xmm8 .byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax) .byte 72,173 // lods %ds:(%rsi),%rax @@ -35659,11 +35565,11 @@ BALIGN16 .byte 128,191,0,0,128,191,0 // cmpb $0x0,-0x40800000(%rdi) .byte 0,224 // add %ah,%al .byte 64,0,0 // add %al,(%rax) - .byte 224,64 // loopne 5848 <.literal16+0x1d8> + .byte 224,64 // loopne 5818 <.literal16+0x1d8> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 584c <.literal16+0x1dc> + .byte 224,64 // loopne 581c <.literal16+0x1dc> .byte 0,0 // add %al,(%rax) - .byte 224,64 // loopne 5850 <.literal16+0x1e0> + .byte 224,64 // loopne 5820 <.literal16+0x1e0> .byte 154 // (bad) .byte 153 // cltd .byte 153 // cltd @@ -35683,13 +35589,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5871 <.literal16+0x201> + .byte 71,225,61 // rex.RXB loope 5841 <.literal16+0x201> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5875 <.literal16+0x205> + .byte 71,225,61 // rex.RXB loope 5845 <.literal16+0x205> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5879 <.literal16+0x209> + .byte 71,225,61 // rex.RXB loope 5849 <.literal16+0x209> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 587d <.literal16+0x20d> + .byte 71,225,61 // rex.RXB loope 584d <.literal16+0x20d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -35714,13 +35620,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 58b1 <.literal16+0x241> + .byte 71,225,61 // rex.RXB loope 5881 <.literal16+0x241> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 58b5 <.literal16+0x245> + .byte 71,225,61 // rex.RXB loope 5885 <.literal16+0x245> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 58b9 <.literal16+0x249> + .byte 71,225,61 // rex.RXB loope 5889 <.literal16+0x249> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 58bd <.literal16+0x24d> + .byte 71,225,61 // rex.RXB loope 588d <.literal16+0x24d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -35745,13 +35651,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 58f1 <.literal16+0x281> + .byte 71,225,61 // rex.RXB loope 58c1 <.literal16+0x281> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 58f5 <.literal16+0x285> + .byte 71,225,61 // rex.RXB loope 58c5 <.literal16+0x285> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 58f9 <.literal16+0x289> + .byte 71,225,61 // rex.RXB loope 58c9 <.literal16+0x289> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 58fd <.literal16+0x28d> + .byte 71,225,61 // rex.RXB loope 58cd <.literal16+0x28d> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -35776,13 +35682,13 @@ BALIGN16 .byte 10,23 // or (%rdi),%dl .byte 63 // (bad) .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5931 <.literal16+0x2c1> + .byte 71,225,61 // rex.RXB loope 5901 <.literal16+0x2c1> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5935 <.literal16+0x2c5> + .byte 71,225,61 // rex.RXB loope 5905 <.literal16+0x2c5> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 5939 <.literal16+0x2c9> + .byte 71,225,61 // rex.RXB loope 5909 <.literal16+0x2c9> .byte 174 // scas %es:(%rdi),%al - .byte 71,225,61 // rex.RXB loope 593d <.literal16+0x2cd> + .byte 71,225,61 // rex.RXB loope 590d <.literal16+0x2cd> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -35803,11 +35709,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%rax) .byte 67,0,0 // rex.XB add %al,(%r8) - .byte 127,67 // jg 597b <.literal16+0x30b> + .byte 127,67 // jg 594b <.literal16+0x30b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 597f <.literal16+0x30f> + .byte 127,67 // jg 594f <.literal16+0x30f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5983 <.literal16+0x313> + .byte 127,67 // jg 5953 <.literal16+0x313> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -36047,13 +35953,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 5b69 <.literal16+0x4f9> + .byte 224,7 // loopne 5b39 <.literal16+0x4f9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5b6d <.literal16+0x4fd> + .byte 224,7 // loopne 5b3d <.literal16+0x4fd> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5b71 <.literal16+0x501> + .byte 224,7 // loopne 5b41 <.literal16+0x501> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 5b75 <.literal16+0x505> + .byte 224,7 // loopne 5b45 <.literal16+0x505> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -36118,11 +36024,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5c4b <.literal16+0x5db> + .byte 127,67 // jg 5c1b <.literal16+0x5db> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5c4f <.literal16+0x5df> + .byte 127,67 // jg 5c1f <.literal16+0x5df> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5c53 <.literal16+0x5e3> + .byte 127,67 // jg 5c23 <.literal16+0x5e3> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%rax) .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%rax) @@ -36137,16 +36043,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5c44 <.literal16+0x5d4> + .byte 127,0 // jg 5c14 <.literal16+0x5d4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5c48 <.literal16+0x5d8> + .byte 127,0 // jg 5c18 <.literal16+0x5d8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5c4c <.literal16+0x5dc> + .byte 127,0 // jg 5c1c <.literal16+0x5dc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5c50 <.literal16+0x5e0> + .byte 127,0 // jg 5c20 <.literal16+0x5e0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -36155,7 +36061,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5cd5 <.literal16+0x665> + .byte 119,115 // ja 5ca5 <.literal16+0x665> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -36166,7 +36072,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5c39 <.literal16+0x5c9> + .byte 117,191 // jne 5c09 <.literal16+0x5c9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -36178,7 +36084,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a39c7a <_sk_callback_sse2+0xffffffffe9a34704> + .byte 233,220,63,163,233 // jmpq ffffffffe9a39c4a <_sk_callback_sse2+0xffffffffe9a34707> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -36232,16 +36138,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5d14 <.literal16+0x6a4> + .byte 127,0 // jg 5ce4 <.literal16+0x6a4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5d18 <.literal16+0x6a8> + .byte 127,0 // jg 5ce8 <.literal16+0x6a8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5d1c <.literal16+0x6ac> + .byte 127,0 // jg 5cec <.literal16+0x6ac> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5d20 <.literal16+0x6b0> + .byte 127,0 // jg 5cf0 <.literal16+0x6b0> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -36250,7 +36156,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5da5 <.literal16+0x735> + .byte 119,115 // ja 5d75 <.literal16+0x735> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -36261,7 +36167,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5d09 <.literal16+0x699> + .byte 117,191 // jne 5cd9 <.literal16+0x699> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -36273,7 +36179,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a39d4a <_sk_callback_sse2+0xffffffffe9a347d4> + .byte 233,220,63,163,233 // jmpq ffffffffe9a39d1a <_sk_callback_sse2+0xffffffffe9a347d7> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -36327,16 +36233,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5de4 <.literal16+0x774> + .byte 127,0 // jg 5db4 <.literal16+0x774> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5de8 <.literal16+0x778> + .byte 127,0 // jg 5db8 <.literal16+0x778> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5dec <.literal16+0x77c> + .byte 127,0 // jg 5dbc <.literal16+0x77c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5df0 <.literal16+0x780> + .byte 127,0 // jg 5dc0 <.literal16+0x780> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -36345,7 +36251,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5e75 <.literal16+0x805> + .byte 119,115 // ja 5e45 <.literal16+0x805> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -36356,7 +36262,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5dd9 <.literal16+0x769> + .byte 117,191 // jne 5da9 <.literal16+0x769> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -36368,7 +36274,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a39e1a <_sk_callback_sse2+0xffffffffe9a348a4> + .byte 233,220,63,163,233 // jmpq ffffffffe9a39dea <_sk_callback_sse2+0xffffffffe9a348a7> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -36422,16 +36328,16 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 5eb4 <.literal16+0x844> + .byte 127,0 // jg 5e84 <.literal16+0x844> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5eb8 <.literal16+0x848> + .byte 127,0 // jg 5e88 <.literal16+0x848> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5ebc <.literal16+0x84c> + .byte 127,0 // jg 5e8c <.literal16+0x84c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 5ec0 <.literal16+0x850> + .byte 127,0 // jg 5e90 <.literal16+0x850> .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -36440,7 +36346,7 @@ BALIGN16 .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) - .byte 119,115 // ja 5f45 <.literal16+0x8d5> + .byte 119,115 // ja 5f15 <.literal16+0x8d5> .byte 248 // clc .byte 194,119,115 // retq $0x7377 .byte 248 // clc @@ -36451,7 +36357,7 @@ BALIGN16 .byte 194,117,191 // retq $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) - .byte 117,191 // jne 5ea9 <.literal16+0x839> + .byte 117,191 // jne 5e79 <.literal16+0x839> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // (bad) .byte 249 // stc @@ -36463,7 +36369,7 @@ BALIGN16 .byte 249 // stc .byte 68,180,62 // rex.R mov $0x3e,%spl .byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9 - .byte 233,220,63,163,233 // jmpq ffffffffe9a39eea <_sk_callback_sse2+0xffffffffe9a34974> + .byte 233,220,63,163,233 // jmpq ffffffffe9a39eba <_sk_callback_sse2+0xffffffffe9a34977> .byte 220,63 // fdivrl (%rdi) .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) @@ -36513,13 +36419,13 @@ BALIGN16 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 .byte 200,66,0,0 // enterq $0x42,$0x0 - .byte 127,67 // jg 5fc7 <.literal16+0x957> + .byte 127,67 // jg 5f97 <.literal16+0x957> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5fcb <.literal16+0x95b> + .byte 127,67 // jg 5f9b <.literal16+0x95b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5fcf <.literal16+0x95f> + .byte 127,67 // jg 5f9f <.literal16+0x95f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 5fd3 <.literal16+0x963> + .byte 127,67 // jg 5fa3 <.literal16+0x963> .byte 0,0 // add %al,(%rax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%rax) @@ -36566,16 +36472,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%rbx) .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 6053 <.literal16+0x9e3> + .byte 118,63 // jbe 6023 <.literal16+0x9e3> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 6057 <.literal16+0x9e7> + .byte 118,63 // jbe 6027 <.literal16+0x9e7> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 605b <.literal16+0x9eb> + .byte 118,63 // jbe 602b <.literal16+0x9eb> .byte 31 // (bad) .byte 215 // xlat %ds:(%rbx) - .byte 118,63 // jbe 605f <.literal16+0x9ef> + .byte 118,63 // jbe 602f <.literal16+0x9ef> .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) .byte 246,64,83,63 // testb $0x3f,0x53(%rax) @@ -36595,11 +36501,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%rbx) .byte 0,127,67 // add %bh,0x43(%rdi) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 60ab <.literal16+0xa3b> + .byte 127,67 // jg 607b <.literal16+0xa3b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 60af <.literal16+0xa3f> + .byte 127,67 // jg 607f <.literal16+0xa3f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 60b3 <.literal16+0xa43> + .byte 127,67 // jg 6083 <.literal16+0xa43> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -36655,13 +36561,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6119 <.literal16+0xaa9> + .byte 224,7 // loopne 60e9 <.literal16+0xaa9> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 611d <.literal16+0xaad> + .byte 224,7 // loopne 60ed <.literal16+0xaad> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6121 <.literal16+0xab1> + .byte 224,7 // loopne 60f1 <.literal16+0xab1> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6125 <.literal16+0xab5> + .byte 224,7 // loopne 60f5 <.literal16+0xab5> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -36707,13 +36613,13 @@ BALIGN16 .byte 132,55 // test %dh,(%rdi) .byte 8,33 // or %ah,(%rcx) .byte 132,55 // test %dh,(%rdi) - .byte 224,7 // loopne 6189 <.literal16+0xb19> + .byte 224,7 // loopne 6159 <.literal16+0xb19> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 618d <.literal16+0xb1d> + .byte 224,7 // loopne 615d <.literal16+0xb1d> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6191 <.literal16+0xb21> + .byte 224,7 // loopne 6161 <.literal16+0xb21> .byte 0,0 // add %al,(%rax) - .byte 224,7 // loopne 6195 <.literal16+0xb25> + .byte 224,7 // loopne 6165 <.literal16+0xb25> .byte 0,0 // add %al,(%rax) .byte 33,8 // and %ecx,(%rax) .byte 2,58 // add (%rdx),%bh @@ -36751,13 +36657,13 @@ BALIGN16 .byte 65,0,0 // add %al,(%r8) .byte 248 // clc .byte 65,0,0 // add %al,(%r8) - .byte 124,66 // jl 6226 <.literal16+0xbb6> + .byte 124,66 // jl 61f6 <.literal16+0xbb6> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 622a <.literal16+0xbba> + .byte 124,66 // jl 61fa <.literal16+0xbba> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 622e <.literal16+0xbbe> + .byte 124,66 // jl 61fe <.literal16+0xbbe> .byte 0,0 // add %al,(%rax) - .byte 124,66 // jl 6232 <.literal16+0xbc2> + .byte 124,66 // jl 6202 <.literal16+0xbc2> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%rax) .byte 0,240 // add %dh,%al @@ -36847,13 +36753,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6335 <.literal16+0xcc5> + .byte 112,65 // jo 6305 <.literal16+0xcc5> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6339 <.literal16+0xcc9> + .byte 112,65 // jo 6309 <.literal16+0xcc9> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 633d <.literal16+0xccd> + .byte 112,65 // jo 630d <.literal16+0xccd> .byte 0,0 // add %al,(%rax) - .byte 112,65 // jo 6341 <.literal16+0xcd1> + .byte 112,65 // jo 6311 <.literal16+0xcd1> .byte 255,0 // incl (%rax) .byte 0,0 // add %al,(%rax) .byte 255,0 // incl (%rax) @@ -36875,11 +36781,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%rbx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%rax) .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 638b <.literal16+0xd1b> + .byte 127,67 // jg 635b <.literal16+0xd1b> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 638f <.literal16+0xd1f> + .byte 127,67 // jg 635f <.literal16+0xd1f> .byte 0,0 // add %al,(%rax) - .byte 127,67 // jg 6393 <.literal16+0xd23> + .byte 127,67 // jg 6363 <.literal16+0xd23> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) .byte 0,0 // add %al,(%rax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax) @@ -36955,13 +36861,13 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 255 // (bad) - .byte 127,71 // jg 647b <.literal16+0xe0b> + .byte 127,71 // jg 644b <.literal16+0xe0b> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 647f <.literal16+0xe0f> + .byte 127,71 // jg 644f <.literal16+0xe0f> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 6483 <.literal16+0xe13> + .byte 127,71 // jg 6453 <.literal16+0xe13> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 6487 <.literal16+0xe17> + .byte 127,71 // jg 6457 <.literal16+0xe17> .byte 0,0 // add %al,(%rax) .byte 128,63,0 // cmpb $0x0,(%rdi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%rax) @@ -37038,10 +36944,10 @@ BALIGN16 .byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax .byte 152 // cwtl .byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx) - .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc0761a <_sk_callback_sse2+0x2dc020a4> + .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc075ea <_sk_callback_sse2+0x2dc020a7> .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js 654c <.literal16+0xedc> + .byte 120,57 // js 651c <.literal16+0xedc> .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil .byte 64,18,120,57 // adc 0x39(%rax),%dil @@ -37169,11 +37075,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 6692 <.literal16+0x1022> + .byte 62,114,28 // jb,pt 6662 <.literal16+0x1022> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6696 <.literal16+0x1026> + .byte 62,114,28 // jb,pt 6666 <.literal16+0x1026> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 669a <.literal16+0x102a> + .byte 62,114,28 // jb,pt 666a <.literal16+0x102a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -37217,7 +37123,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f525 <_sk_callback_sse2+0x3d639faf> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f4f5 <_sk_callback_sse2+0x3d639fb2> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -37243,7 +37149,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f565 <_sk_callback_sse2+0x3d639fef> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f535 <_sk_callback_sse2+0x3d639ff2> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -37252,13 +37158,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 675e <.literal16+0x10ee> + .byte 114,28 // jb 672e <.literal16+0x10ee> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6762 <.literal16+0x10f2> + .byte 62,114,28 // jb,pt 6732 <.literal16+0x10f2> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6766 <.literal16+0x10f6> + .byte 62,114,28 // jb,pt 6736 <.literal16+0x10f6> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 676a <.literal16+0x10fa> + .byte 62,114,28 // jb,pt 673a <.literal16+0x10fa> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -37279,11 +37185,11 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 128,63,114 // cmpb $0x72,(%rdi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 67a2 <.literal16+0x1132> + .byte 62,114,28 // jb,pt 6772 <.literal16+0x1132> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 67a6 <.literal16+0x1136> + .byte 62,114,28 // jb,pt 6776 <.literal16+0x1136> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 67aa <.literal16+0x113a> + .byte 62,114,28 // jb,pt 677a <.literal16+0x113a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -37327,7 +37233,7 @@ BALIGN16 .byte 0,0 // add %al,(%rax) .byte 0,63 // add %bh,(%rdi) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f635 <_sk_callback_sse2+0x3d63a0bf> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f605 <_sk_callback_sse2+0x3d63a0c2> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 0,63 // add %bh,(%rdi) .byte 0,0 // add %al,(%rax) @@ -37353,7 +37259,7 @@ BALIGN16 .byte 0,192 // add %al,%al .byte 63 // (bad) .byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi) - .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f675 <_sk_callback_sse2+0x3d63a0ff> + .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d63f645 <_sk_callback_sse2+0x3d63a102> .byte 57,142,99,61,0,0 // cmp %ecx,0x3d63(%rsi) .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al @@ -37362,13 +37268,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%rdi) .byte 0,192 // add %al,%al .byte 63 // (bad) - .byte 114,28 // jb 686e <.literal16+0x11fe> + .byte 114,28 // jb 683e <.literal16+0x11fe> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6872 <_sk_callback_sse2+0x12fc> + .byte 62,114,28 // jb,pt 6842 <_sk_callback_sse2+0x12ff> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 6876 <_sk_callback_sse2+0x1300> + .byte 62,114,28 // jb,pt 6846 <_sk_callback_sse2+0x1303> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 687a <_sk_callback_sse2+0x1304> + .byte 62,114,28 // jb,pt 684a <_sk_callback_sse2+0x1307> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%rdi) .byte 170 // stos %al,%es:(%rdi) @@ -37398,9 +37304,9 @@ _sk_start_pipeline_hsw_lowp: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 80 // push %rax - .byte 76,137,195 // mov %r8,%rbx + .byte 77,137,196 // mov %r8,%r12 .byte 73,137,215 // mov %rdx,%r15 - .byte 73,137,244 // mov %rsi,%r12 + .byte 72,137,243 // mov %rsi,%rbx .byte 73,137,254 // mov %rdi,%r14 .byte 72,137,206 // mov %rcx,%rsi .byte 72,173 // lods %ds:(%rsi),%rax @@ -37409,21 +37315,13 @@ _sk_start_pipeline_hsw_lowp: .byte 76,57,249 // cmp %r15,%rcx .byte 118,5 // jbe 30 <_sk_start_pipeline_hsw_lowp+0x30> .byte 76,137,242 // mov %r14,%rdx - .byte 235,80 // jmp 80 <_sk_start_pipeline_hsw_lowp+0x80> + .byte 235,45 // jmp 5d <_sk_start_pipeline_hsw_lowp+0x5d> .byte 76,137,125,208 // mov %r15,-0x30(%rbp) - .byte 65,184,0,0,0,0 // mov $0x0,%r8d - .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 - .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 - .byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2 - .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 - .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 - .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 - .byte 197,204,87,246 // vxorps %ymm6,%ymm6,%ymm6 - .byte 197,196,87,255 // vxorps %ymm7,%ymm7,%ymm7 - .byte 72,137,223 // mov %rbx,%rdi + .byte 69,49,192 // xor %r8d,%r8d + .byte 76,137,231 // mov %r12,%rdi .byte 73,137,247 // mov %rsi,%r15 .byte 76,137,242 // mov %r14,%rdx - .byte 76,137,225 // mov %r12,%rcx + .byte 72,137,217 // mov %rbx,%rcx .byte 65,255,213 // callq *%r13 .byte 76,137,254 // mov %r15,%rsi .byte 76,139,125,208 // mov -0x30(%rbp),%r15 @@ -37431,20 +37329,12 @@ _sk_start_pipeline_hsw_lowp: .byte 73,131,198,32 // add $0x20,%r14 .byte 77,57,254 // cmp %r15,%r14 .byte 73,137,214 // mov %rdx,%r14 - .byte 118,180 // jbe 34 <_sk_start_pipeline_hsw_lowp+0x34> + .byte 118,215 // jbe 34 <_sk_start_pipeline_hsw_lowp+0x34> .byte 77,137,248 // mov %r15,%r8 .byte 73,41,208 // sub %rdx,%r8 - .byte 116,41 // je b1 <_sk_start_pipeline_hsw_lowp+0xb1> - .byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0 - .byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1 - .byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2 - .byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3 - .byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4 - .byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5 - .byte 197,204,87,246 // vxorps %ymm6,%ymm6,%ymm6 - .byte 197,196,87,255 // vxorps %ymm7,%ymm7,%ymm7 - .byte 72,137,223 // mov %rbx,%rdi - .byte 76,137,225 // mov %r12,%rcx + .byte 116,9 // je 6e <_sk_start_pipeline_hsw_lowp+0x6e> + .byte 76,137,231 // mov %r12,%rdi + .byte 72,137,217 // mov %rbx,%rcx .byte 65,255,213 // callq *%r13 .byte 76,137,248 // mov %r15,%rax .byte 72,131,196,8 // add $0x8,%rsp @@ -37468,7 +37358,7 @@ HIDDEN _sk_constant_color_hsw_lowp FUNCTION(_sk_constant_color_hsw_lowp) _sk_constant_color_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,121,24,5,130,21,0,0 // vbroadcastss 0x1582(%rip),%xmm0 # 1654 <_sk_xor__hsw_lowp+0x78> + .byte 196,226,121,24,5,129,21,0,0 // vbroadcastss 0x1581(%rip),%xmm0 # 1610 <_sk_xor__hsw_lowp+0x78> .byte 197,248,88,24 // vaddps (%rax),%xmm0,%xmm3 .byte 196,226,125,121,195 // vpbroadcastw %xmm3,%ymm0 .byte 197,251,112,203,234 // vpshuflw $0xea,%xmm3,%xmm1 @@ -37487,7 +37377,7 @@ HIDDEN _sk_set_rgb_hsw_lowp FUNCTION(_sk_set_rgb_hsw_lowp) _sk_set_rgb_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 197,250,16,21,69,21,0,0 // vmovss 0x1545(%rip),%xmm2 # 1658 <_sk_xor__hsw_lowp+0x7c> + .byte 197,250,16,21,68,21,0,0 // vmovss 0x1544(%rip),%xmm2 # 1614 <_sk_xor__hsw_lowp+0x7c> .byte 197,234,88,0 // vaddss (%rax),%xmm2,%xmm0 .byte 196,193,121,126,193 // vmovd %xmm0,%r9d .byte 196,193,121,110,193 // vmovd %r9d,%xmm0 @@ -37523,19 +37413,19 @@ _sk_load_8888_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,210,0,0,0 // jne 252 <_sk_load_8888_hsw_lowp+0xe0> + .byte 15,133,210,0,0,0 // jne 20f <_sk_load_8888_hsw_lowp+0xe0> .byte 196,193,126,111,92,147,32 // vmovdqu 0x20(%r11,%rdx,4),%ymm3 .byte 196,65,126,111,4,147 // vmovdqu (%r11,%rdx,4),%ymm8 - .byte 197,253,111,5,235,20,0,0 // vmovdqa 0x14eb(%rip),%ymm0 # 1680 <_sk_xor__hsw_lowp+0xa4> + .byte 197,253,111,5,206,20,0,0 // vmovdqa 0x14ce(%rip),%ymm0 # 1620 <_sk_xor__hsw_lowp+0x88> .byte 196,226,61,0,200 // vpshufb %ymm0,%ymm8,%ymm1 .byte 196,227,253,0,201,232 // vpermq $0xe8,%ymm1,%ymm1 .byte 196,226,101,0,192 // vpshufb %ymm0,%ymm3,%ymm0 .byte 196,227,253,0,192,232 // vpermq $0xe8,%ymm0,%ymm0 .byte 196,227,117,56,192,1 // vinserti128 $0x1,%xmm0,%ymm1,%ymm0 .byte 197,253,113,240,8 // vpsllw $0x8,%ymm0,%ymm0 - .byte 196,98,125,121,13,225,20,0,0 // vpbroadcastw 0x14e1(%rip),%ymm9 # 16a0 <_sk_xor__hsw_lowp+0xc4> + .byte 196,98,125,121,13,196,20,0,0 // vpbroadcastw 0x14c4(%rip),%ymm9 # 1640 <_sk_xor__hsw_lowp+0xa8> .byte 196,193,125,228,193 // vpmulhuw %ymm9,%ymm0,%ymm0 - .byte 197,253,111,13,244,20,0,0 // vmovdqa 0x14f4(%rip),%ymm1 # 16c0 <_sk_xor__hsw_lowp+0xe4> + .byte 197,253,111,13,215,20,0,0 // vmovdqa 0x14d7(%rip),%ymm1 # 1660 <_sk_xor__hsw_lowp+0xc8> .byte 196,226,61,0,209 // vpshufb %ymm1,%ymm8,%ymm2 .byte 196,227,253,0,210,232 // vpermq $0xe8,%ymm2,%ymm2 .byte 196,226,101,0,201 // vpshufb %ymm1,%ymm3,%ymm1 @@ -37543,7 +37433,7 @@ _sk_load_8888_hsw_lowp: .byte 196,227,109,56,201,1 // vinserti128 $0x1,%xmm1,%ymm2,%ymm1 .byte 197,245,113,241,8 // vpsllw $0x8,%ymm1,%ymm1 .byte 196,193,117,228,201 // vpmulhuw %ymm9,%ymm1,%ymm1 - .byte 197,253,111,21,230,20,0,0 // vmovdqa 0x14e6(%rip),%ymm2 # 16e0 <_sk_xor__hsw_lowp+0x104> + .byte 197,253,111,21,201,20,0,0 // vmovdqa 0x14c9(%rip),%ymm2 # 1680 <_sk_xor__hsw_lowp+0xe8> .byte 196,98,61,0,210 // vpshufb %ymm2,%ymm8,%ymm10 .byte 196,67,253,0,210,232 // vpermq $0xe8,%ymm10,%ymm10 .byte 196,226,101,0,210 // vpshufb %ymm2,%ymm3,%ymm2 @@ -37551,7 +37441,7 @@ _sk_load_8888_hsw_lowp: .byte 196,227,45,56,210,1 // vinserti128 $0x1,%xmm2,%ymm10,%ymm2 .byte 197,237,113,242,8 // vpsllw $0x8,%ymm2,%ymm2 .byte 196,193,109,228,209 // vpmulhuw %ymm9,%ymm2,%ymm2 - .byte 197,125,111,21,216,20,0,0 // vmovdqa 0x14d8(%rip),%ymm10 # 1700 <_sk_xor__hsw_lowp+0x124> + .byte 197,125,111,21,187,20,0,0 // vmovdqa 0x14bb(%rip),%ymm10 # 16a0 <_sk_xor__hsw_lowp+0x108> .byte 196,66,61,0,194 // vpshufb %ymm10,%ymm8,%ymm8 .byte 196,67,253,0,192,232 // vpermq $0xe8,%ymm8,%ymm8 .byte 196,194,101,0,218 // vpshufb %ymm10,%ymm3,%ymm3 @@ -37567,14 +37457,14 @@ _sk_load_8888_hsw_lowp: .byte 196,65,61,239,192 // vpxor %ymm8,%ymm8,%ymm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 15,135,30,255,255,255 // ja 18d <_sk_load_8888_hsw_lowp+0x1b> + .byte 15,135,30,255,255,255 // ja 14a <_sk_load_8888_hsw_lowp+0x1b> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,30,1,0,0 // lea 0x11e(%rip),%r10 # 398 <_sk_load_8888_hsw_lowp+0x226> + .byte 76,141,21,29,1,0,0 // lea 0x11d(%rip),%r10 # 354 <_sk_load_8888_hsw_lowp+0x225> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,110,4,147 // vmovd (%r11,%rdx,4),%xmm8 - .byte 233,255,254,255,255 // jmpq 18d <_sk_load_8888_hsw_lowp+0x1b> + .byte 233,255,254,255,255 // jmpq 14a <_sk_load_8888_hsw_lowp+0x1b> .byte 196,193,121,110,68,147,8 // vmovd 0x8(%r11,%rdx,4),%xmm0 .byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -37582,7 +37472,7 @@ _sk_load_8888_hsw_lowp: .byte 196,194,121,53,4,147 // vpmovzxdq (%r11,%rdx,4),%xmm0 .byte 197,249,112,192,232 // vpshufd $0xe8,%xmm0,%xmm0 .byte 196,99,61,2,192,3 // vpblendd $0x3,%ymm0,%ymm8,%ymm8 - .byte 233,211,254,255,255 // jmpq 18d <_sk_load_8888_hsw_lowp+0x1b> + .byte 233,211,254,255,255 // jmpq 14a <_sk_load_8888_hsw_lowp+0x1b> .byte 196,193,121,110,68,147,24 // vmovd 0x18(%r11,%rdx,4),%xmm0 .byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0 .byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3 @@ -37595,7 +37485,7 @@ _sk_load_8888_hsw_lowp: .byte 196,99,61,56,192,1 // vinserti128 $0x1,%xmm0,%ymm8,%ymm8 .byte 196,193,122,111,4,147 // vmovdqu (%r11,%rdx,4),%xmm0 .byte 196,67,125,2,192,240 // vpblendd $0xf0,%ymm8,%ymm0,%ymm8 - .byte 233,132,254,255,255 // jmpq 18d <_sk_load_8888_hsw_lowp+0x1b> + .byte 233,132,254,255,255 // jmpq 14a <_sk_load_8888_hsw_lowp+0x1b> .byte 196,193,121,110,68,147,40 // vmovd 0x28(%r11,%rdx,4),%xmm0 .byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -37604,7 +37494,7 @@ _sk_load_8888_hsw_lowp: .byte 196,227,101,2,216,15 // vpblendd $0xf,%ymm0,%ymm3,%ymm3 .byte 196,193,121,110,68,147,32 // vmovd 0x20(%r11,%rdx,4),%xmm0 .byte 196,227,101,2,216,1 // vpblendd $0x1,%ymm0,%ymm3,%ymm3 - .byte 233,72,254,255,255 // jmpq 187 <_sk_load_8888_hsw_lowp+0x15> + .byte 233,72,254,255,255 // jmpq 144 <_sk_load_8888_hsw_lowp+0x15> .byte 196,193,121,110,68,147,56 // vmovd 0x38(%r11,%rdx,4),%xmm0 .byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0 .byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1 @@ -37618,41 +37508,40 @@ _sk_load_8888_hsw_lowp: .byte 196,65,126,111,4,147 // vmovdqu (%r11,%rdx,4),%ymm8 .byte 196,193,122,111,68,147,32 // vmovdqu 0x20(%r11,%rdx,4),%xmm0 .byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3 - .byte 233,248,253,255,255 // jmpq 18d <_sk_load_8888_hsw_lowp+0x1b> - .byte 15,31,0 // nopl (%rax) - .byte 235,254 // jmp 398 <_sk_load_8888_hsw_lowp+0x226> - .byte 255 // (bad) - .byte 255,12,255 // decl (%rdi,%rdi,8) - .byte 255 // (bad) - .byte 255,246 // push %rsi + .byte 233,248,253,255,255 // jmpq 14a <_sk_load_8888_hsw_lowp+0x1b> + .byte 102,144 // xchg %ax,%ax + .byte 236 // in (%dx),%al .byte 254 // (bad) .byte 255 // (bad) - .byte 255,96,255 // jmpq *-0x1(%rax) + .byte 255,13,255,255,255,247 // decl -0x8000001(%rip) # fffffffff800035c <_sk_xor__hsw_lowp+0xfffffffff7ffedc4> + .byte 254 // (bad) .byte 255 // (bad) - .byte 255,76,255,255 // decl -0x1(%rdi,%rdi,8) + .byte 255,97,255 // jmpq *-0x1(%rcx) .byte 255 // (bad) - .byte 56,255 // cmp %bh,%bh - .byte 255 // (bad) - .byte 255,34 // jmpq *(%rdx) + .byte 255,77,255 // decl -0x1(%rbp) .byte 255 // (bad) .byte 255 // (bad) + .byte 57,255 // cmp %edi,%edi .byte 255 // (bad) - .byte 239 // out %eax,(%dx) + .byte 255,35 // jmpq *(%rbx) + .byte 255 // (bad) + .byte 255 // (bad) + .byte 255,240 // push %rax .byte 253 // std .byte 255 // (bad) - .byte 255,149,255,255,255,135 // callq *-0x78000001(%rbp) + .byte 255,150,255,255,255,136 // callq *-0x77000001(%rsi) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,113,255 // pushq -0x1(%rcx) + .byte 255,114,255 // pushq -0x1(%rdx) .byte 255 // (bad) - .byte 255,229 // jmpq *%rbp + .byte 255,230 // jmpq *%rsi .byte 255 // (bad) .byte 255 // (bad) - .byte 255,209 // callq *%rcx + .byte 255,210 // callq *%rdx .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 189,255,255,255,167 // mov $0xa7ffffff,%ebp + .byte 190,255,255,255,168 // mov $0xa8ffffff,%esi .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -37664,7 +37553,7 @@ _sk_store_8888_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 197,189,113,208,7 // vpsrlw $0x7,%ymm0,%ymm8 - .byte 196,98,125,121,13,57,19,0,0 // vpbroadcastw 0x1339(%rip),%ymm9 # 1720 <_sk_xor__hsw_lowp+0x144> + .byte 196,98,125,121,13,29,19,0,0 // vpbroadcastw 0x131d(%rip),%ymm9 # 16c0 <_sk_xor__hsw_lowp+0x128> .byte 196,65,61,234,193 // vpminsw %ymm9,%ymm8,%ymm8 .byte 196,66,125,51,208 // vpmovzxwd %xmm8,%ymm10 .byte 196,67,125,57,192,1 // vextracti128 $0x1,%ymm8,%xmm8 @@ -37697,7 +37586,7 @@ _sk_store_8888_hsw_lowp: .byte 196,65,29,235,198 // vpor %ymm14,%ymm12,%ymm8 .byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,17 // jne 4a2 <_sk_store_8888_hsw_lowp+0xce> + .byte 117,17 // jne 45e <_sk_store_8888_hsw_lowp+0xce> .byte 196,65,126,127,4,147 // vmovdqu %ymm8,(%r11,%rdx,4) .byte 196,65,126,127,76,147,32 // vmovdqu %ymm9,0x20(%r11,%rdx,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -37706,17 +37595,17 @@ _sk_store_8888_hsw_lowp: .byte 65,128,225,15 // and $0xf,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,236 // ja 49e <_sk_store_8888_hsw_lowp+0xca> + .byte 119,236 // ja 45a <_sk_store_8888_hsw_lowp+0xca> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,175,0,0,0 // lea 0xaf(%rip),%r10 # 56c <_sk_store_8888_hsw_lowp+0x198> + .byte 76,141,21,175,0,0,0 // lea 0xaf(%rip),%r10 # 528 <_sk_store_8888_hsw_lowp+0x198> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,126,4,147 // vmovd %xmm8,(%r11,%rdx,4) - .byte 235,208 // jmp 49e <_sk_store_8888_hsw_lowp+0xca> + .byte 235,208 // jmp 45a <_sk_store_8888_hsw_lowp+0xca> .byte 196,67,121,22,68,147,8,2 // vpextrd $0x2,%xmm8,0x8(%r11,%rdx,4) .byte 196,65,121,214,4,147 // vmovq %xmm8,(%r11,%rdx,4) - .byte 235,192 // jmp 49e <_sk_store_8888_hsw_lowp+0xca> + .byte 235,192 // jmp 45a <_sk_store_8888_hsw_lowp+0xca> .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,67,121,22,76,147,24,2 // vpextrd $0x2,%xmm9,0x18(%r11,%rdx,4) .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 @@ -37724,12 +37613,12 @@ _sk_store_8888_hsw_lowp: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,65,121,126,76,147,16 // vmovd %xmm9,0x10(%r11,%rdx,4) .byte 196,65,122,127,4,147 // vmovdqu %xmm8,(%r11,%rdx,4) - .byte 235,143 // jmp 49e <_sk_store_8888_hsw_lowp+0xca> + .byte 235,143 // jmp 45a <_sk_store_8888_hsw_lowp+0xca> .byte 196,67,121,22,76,147,40,2 // vpextrd $0x2,%xmm9,0x28(%r11,%rdx,4) .byte 196,67,121,22,76,147,36,1 // vpextrd $0x1,%xmm9,0x24(%r11,%rdx,4) .byte 196,65,121,126,76,147,32 // vmovd %xmm9,0x20(%r11,%rdx,4) .byte 196,65,126,127,4,147 // vmovdqu %ymm8,(%r11,%rdx,4) - .byte 233,109,255,255,255 // jmpq 49e <_sk_store_8888_hsw_lowp+0xca> + .byte 233,109,255,255,255 // jmpq 45a <_sk_store_8888_hsw_lowp+0xca> .byte 196,67,125,57,202,1 // vextracti128 $0x1,%ymm9,%xmm10 .byte 196,67,121,22,84,147,56,2 // vpextrd $0x2,%xmm10,0x38(%r11,%rdx,4) .byte 196,67,125,57,202,1 // vextracti128 $0x1,%ymm9,%xmm10 @@ -37738,7 +37627,7 @@ _sk_store_8888_hsw_lowp: .byte 196,65,121,126,84,147,48 // vmovd %xmm10,0x30(%r11,%rdx,4) .byte 196,65,126,127,4,147 // vmovdqu %ymm8,(%r11,%rdx,4) .byte 196,65,122,127,76,147,32 // vmovdqu %xmm9,0x20(%r11,%rdx,4) - .byte 233,50,255,255,255 // jmpq 49e <_sk_store_8888_hsw_lowp+0xca> + .byte 233,50,255,255,255 // jmpq 45a <_sk_store_8888_hsw_lowp+0xca> .byte 90 // pop %rdx .byte 255 // (bad) .byte 255 // (bad) @@ -37781,11 +37670,11 @@ _sk_load_a8_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,45 // jne 5df <_sk_load_a8_hsw_lowp+0x37> + .byte 117,45 // jne 59b <_sk_load_a8_hsw_lowp+0x37> .byte 196,193,122,111,4,19 // vmovdqu (%r11,%rdx,1),%xmm0 .byte 196,226,125,48,192 // vpmovzxbw %xmm0,%ymm0 .byte 197,253,113,240,8 // vpsllw $0x8,%ymm0,%ymm0 - .byte 196,226,125,121,13,87,17,0,0 // vpbroadcastw 0x1157(%rip),%ymm1 # 1722 <_sk_xor__hsw_lowp+0x146> + .byte 196,226,125,121,13,59,17,0,0 // vpbroadcastw 0x113b(%rip),%ymm1 # 16c2 <_sk_xor__hsw_lowp+0x12a> .byte 197,253,228,217 // vpmulhuw %ymm1,%ymm0,%ymm3 .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0 @@ -37797,35 +37686,35 @@ _sk_load_a8_hsw_lowp: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,197 // ja 5b8 <_sk_load_a8_hsw_lowp+0x10> + .byte 119,197 // ja 574 <_sk_load_a8_hsw_lowp+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 6c0 <_sk_load_a8_hsw_lowp+0x118> + .byte 76,141,21,194,0,0,0 // lea 0xc2(%rip),%r10 # 67c <_sk_load_a8_hsw_lowp+0x118> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,166 // jmp 5b8 <_sk_load_a8_hsw_lowp+0x10> + .byte 235,166 // jmp 574 <_sk_load_a8_hsw_lowp+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,195,121,32,68,19,2,2 // vpinsrb $0x2,0x2(%r11,%rdx,1),%xmm0,%xmm0 .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0 - .byte 235,137 // jmp 5b8 <_sk_load_a8_hsw_lowp+0x10> + .byte 235,137 // jmp 574 <_sk_load_a8_hsw_lowp+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,195,121,32,68,19,6,6 // vpinsrb $0x6,0x6(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,5,5 // vpinsrb $0x5,0x5(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,4,4 // vpinsrb $0x4,0x4(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,92,255,255,255 // jmpq 5b8 <_sk_load_a8_hsw_lowp+0x10> + .byte 233,92,255,255,255 // jmpq 574 <_sk_load_a8_hsw_lowp+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,195,121,32,68,19,10,10 // vpinsrb $0xa,0xa(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,9,9 // vpinsrb $0x9,0x9(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,8,8 // vpinsrb $0x8,0x8(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,193,122,126,12,19 // vmovq (%r11,%rdx,1),%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,47,255,255,255 // jmpq 5b8 <_sk_load_a8_hsw_lowp+0x10> + .byte 233,47,255,255,255 // jmpq 574 <_sk_load_a8_hsw_lowp+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,195,121,32,68,19,14,14 // vpinsrb $0xe,0xe(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,13,13 // vpinsrb $0xd,0xd(%r11,%rdx,1),%xmm0,%xmm0 @@ -37833,7 +37722,7 @@ _sk_load_a8_hsw_lowp: .byte 196,193,122,126,12,19 // vmovq (%r11,%rdx,1),%xmm1 .byte 196,195,113,34,76,19,8,2 // vpinsrd $0x2,0x8(%r11,%rdx,1),%xmm1,%xmm1 .byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0 - .byte 233,250,254,255,255 // jmpq 5b8 <_sk_load_a8_hsw_lowp+0x10> + .byte 233,250,254,255,255 // jmpq 574 <_sk_load_a8_hsw_lowp+0x10> .byte 102,144 // xchg %ax,%ax .byte 71,255 // rex.RXB (bad) .byte 255 // (bad) @@ -37845,7 +37734,7 @@ _sk_load_a8_hsw_lowp: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 123,255 // jnp 6d5 <_sk_load_a8_hsw_lowp+0x12d> + .byte 123,255 // jnp 691 <_sk_load_a8_hsw_lowp+0x12d> .byte 255 // (bad) .byte 255,111,255 // ljmp *-0x1(%rdi) .byte 255 // (bad) @@ -37880,7 +37769,7 @@ _sk_store_a8_hsw_lowp: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,65,57,103,193 // vpackuswb %xmm9,%xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 720 <_sk_store_a8_hsw_lowp+0x24> + .byte 117,10 // jne 6dc <_sk_store_a8_hsw_lowp+0x24> .byte 196,65,122,127,4,19 // vmovdqu %xmm8,(%r11,%rdx,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -37888,32 +37777,32 @@ _sk_store_a8_hsw_lowp: .byte 65,128,225,15 // and $0xf,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,236 // ja 71c <_sk_store_a8_hsw_lowp+0x20> + .byte 119,236 // ja 6d8 <_sk_store_a8_hsw_lowp+0x20> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,137,0,0,0 // lea 0x89(%rip),%r10 # 7c4 <_sk_store_a8_hsw_lowp+0xc8> + .byte 76,141,21,137,0,0,0 // lea 0x89(%rip),%r10 # 780 <_sk_store_a8_hsw_lowp+0xc8> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,67,121,20,4,19,0 // vpextrb $0x0,%xmm8,(%r11,%rdx,1) - .byte 235,207 // jmp 71c <_sk_store_a8_hsw_lowp+0x20> + .byte 235,207 // jmp 6d8 <_sk_store_a8_hsw_lowp+0x20> .byte 196,67,121,20,68,19,2,2 // vpextrb $0x2,%xmm8,0x2(%r11,%rdx,1) .byte 196,67,121,21,4,19,0 // vpextrw $0x0,%xmm8,(%r11,%rdx,1) - .byte 235,190 // jmp 71c <_sk_store_a8_hsw_lowp+0x20> + .byte 235,190 // jmp 6d8 <_sk_store_a8_hsw_lowp+0x20> .byte 196,67,121,20,68,19,6,6 // vpextrb $0x6,%xmm8,0x6(%r11,%rdx,1) .byte 196,67,121,20,68,19,5,5 // vpextrb $0x5,%xmm8,0x5(%r11,%rdx,1) .byte 196,67,121,20,68,19,4,4 // vpextrb $0x4,%xmm8,0x4(%r11,%rdx,1) .byte 196,65,121,126,4,19 // vmovd %xmm8,(%r11,%rdx,1) - .byte 235,158 // jmp 71c <_sk_store_a8_hsw_lowp+0x20> + .byte 235,158 // jmp 6d8 <_sk_store_a8_hsw_lowp+0x20> .byte 196,67,121,20,68,19,10,10 // vpextrb $0xa,%xmm8,0xa(%r11,%rdx,1) .byte 196,67,121,20,68,19,9,9 // vpextrb $0x9,%xmm8,0x9(%r11,%rdx,1) .byte 196,67,121,20,68,19,8,8 // vpextrb $0x8,%xmm8,0x8(%r11,%rdx,1) - .byte 235,32 // jmp 7b8 <_sk_store_a8_hsw_lowp+0xbc> + .byte 235,32 // jmp 774 <_sk_store_a8_hsw_lowp+0xbc> .byte 196,67,121,20,68,19,14,14 // vpextrb $0xe,%xmm8,0xe(%r11,%rdx,1) .byte 196,67,121,20,68,19,13,13 // vpextrb $0xd,%xmm8,0xd(%r11,%rdx,1) .byte 196,67,121,20,68,19,12,12 // vpextrb $0xc,%xmm8,0xc(%r11,%rdx,1) .byte 196,67,121,22,68,19,8,2 // vpextrd $0x2,%xmm8,0x8(%r11,%rdx,1) .byte 196,65,121,214,4,19 // vmovq %xmm8,(%r11,%rdx,1) - .byte 233,89,255,255,255 // jmpq 71c <_sk_store_a8_hsw_lowp+0x20> + .byte 233,89,255,255,255 // jmpq 6d8 <_sk_store_a8_hsw_lowp+0x20> .byte 144 // nop .byte 128,255,255 // cmp $0xff,%bh .byte 255,145,255,255,255,137 // callq *-0x76000001(%rcx) @@ -37956,14 +37845,14 @@ _sk_load_g8_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,50 // jne 83c <_sk_load_g8_hsw_lowp+0x3c> + .byte 117,50 // jne 7f8 <_sk_load_g8_hsw_lowp+0x3c> .byte 196,193,122,111,4,19 // vmovdqu (%r11,%rdx,1),%xmm0 .byte 196,226,125,48,192 // vpmovzxbw %xmm0,%ymm0 .byte 197,253,113,240,8 // vpsllw $0x8,%ymm0,%ymm0 - .byte 196,226,125,121,13,1,15,0,0 // vpbroadcastw 0xf01(%rip),%ymm1 # 1724 <_sk_xor__hsw_lowp+0x148> + .byte 196,226,125,121,13,229,14,0,0 // vpbroadcastw 0xee5(%rip),%ymm1 # 16c4 <_sk_xor__hsw_lowp+0x12c> .byte 197,253,228,193 // vpmulhuw %ymm1,%ymm0,%ymm0 .byte 72,173 // lods %ds:(%rsi),%rax - .byte 196,226,125,121,29,244,14,0,0 // vpbroadcastw 0xef4(%rip),%ymm3 # 1726 <_sk_xor__hsw_lowp+0x14a> + .byte 196,226,125,121,29,216,14,0,0 // vpbroadcastw 0xed8(%rip),%ymm3 # 16c6 <_sk_xor__hsw_lowp+0x12e> .byte 197,253,111,200 // vmovdqa %ymm0,%ymm1 .byte 197,253,111,208 // vmovdqa %ymm0,%ymm2 .byte 255,224 // jmpq *%rax @@ -37972,35 +37861,35 @@ _sk_load_g8_hsw_lowp: .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,192 // ja 810 <_sk_load_g8_hsw_lowp+0x10> + .byte 119,192 // ja 7cc <_sk_load_g8_hsw_lowp+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,193,0,0,0 // lea 0xc1(%rip),%r10 # 91c <_sk_load_g8_hsw_lowp+0x11c> + .byte 76,141,21,193,0,0,0 // lea 0xc1(%rip),%r10 # 8d8 <_sk_load_g8_hsw_lowp+0x11c> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,249,110,192 // vmovd %eax,%xmm0 - .byte 235,161 // jmp 810 <_sk_load_g8_hsw_lowp+0x10> + .byte 235,161 // jmp 7cc <_sk_load_g8_hsw_lowp+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,195,121,32,68,19,2,2 // vpinsrb $0x2,0x2(%r11,%rdx,1),%xmm0,%xmm0 .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax .byte 197,249,110,200 // vmovd %eax,%xmm1 .byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0 - .byte 235,132 // jmp 810 <_sk_load_g8_hsw_lowp+0x10> + .byte 235,132 // jmp 7cc <_sk_load_g8_hsw_lowp+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,195,121,32,68,19,6,6 // vpinsrb $0x6,0x6(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,5,5 // vpinsrb $0x5,0x5(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,4,4 // vpinsrb $0x4,0x4(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,193,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm1 .byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0 - .byte 233,87,255,255,255 // jmpq 810 <_sk_load_g8_hsw_lowp+0x10> + .byte 233,87,255,255,255 // jmpq 7cc <_sk_load_g8_hsw_lowp+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,195,121,32,68,19,10,10 // vpinsrb $0xa,0xa(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,9,9 // vpinsrb $0x9,0x9(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,8,8 // vpinsrb $0x8,0x8(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,193,122,126,12,19 // vmovq (%r11,%rdx,1),%xmm1 .byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0 - .byte 233,42,255,255,255 // jmpq 810 <_sk_load_g8_hsw_lowp+0x10> + .byte 233,42,255,255,255 // jmpq 7cc <_sk_load_g8_hsw_lowp+0x10> .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0 .byte 196,195,121,32,68,19,14,14 // vpinsrb $0xe,0xe(%r11,%rdx,1),%xmm0,%xmm0 .byte 196,195,121,32,68,19,13,13 // vpinsrb $0xd,0xd(%r11,%rdx,1),%xmm0,%xmm0 @@ -38008,7 +37897,7 @@ _sk_load_g8_hsw_lowp: .byte 196,193,122,126,12,19 // vmovq (%r11,%rdx,1),%xmm1 .byte 196,195,113,34,76,19,8,2 // vpinsrd $0x2,0x8(%r11,%rdx,1),%xmm1,%xmm1 .byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0 - .byte 233,245,254,255,255 // jmpq 810 <_sk_load_g8_hsw_lowp+0x10> + .byte 233,245,254,255,255 // jmpq 7cc <_sk_load_g8_hsw_lowp+0x10> .byte 144 // nop .byte 72,255 // rex.W (bad) .byte 255 // (bad) @@ -38019,7 +37908,7 @@ _sk_load_g8_hsw_lowp: .byte 255,140,255,255,255,132,255 // decl -0x7b0001(%rdi,%rdi,8) .byte 255 // (bad) .byte 255 // (bad) - .byte 124,255 // jl 931 <_sk_load_g8_hsw_lowp+0x131> + .byte 124,255 // jl 8ed <_sk_load_g8_hsw_lowp+0x131> .byte 255 // (bad) .byte 255,112,255 // pushq -0x1(%rax) .byte 255 // (bad) @@ -38051,20 +37940,20 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,220,1,0,0 // jne b42 <_sk_srcover_rgba_8888_hsw_lowp+0x1ea> + .byte 15,133,220,1,0,0 // jne afe <_sk_srcover_rgba_8888_hsw_lowp+0x1ea> .byte 196,193,126,111,124,147,32 // vmovdqu 0x20(%r11,%rdx,4),%ymm7 .byte 196,65,126,111,4,147 // vmovdqu (%r11,%rdx,4),%ymm8 - .byte 197,253,111,37,197,13,0,0 // vmovdqa 0xdc5(%rip),%ymm4 # 1740 <_sk_xor__hsw_lowp+0x164> + .byte 197,253,111,37,169,13,0,0 // vmovdqa 0xda9(%rip),%ymm4 # 16e0 <_sk_xor__hsw_lowp+0x148> .byte 196,226,61,0,236 // vpshufb %ymm4,%ymm8,%ymm5 .byte 196,227,253,0,237,232 // vpermq $0xe8,%ymm5,%ymm5 .byte 196,226,69,0,228 // vpshufb %ymm4,%ymm7,%ymm4 .byte 196,227,253,0,228,232 // vpermq $0xe8,%ymm4,%ymm4 .byte 196,227,85,56,228,1 // vinserti128 $0x1,%xmm4,%ymm5,%ymm4 - .byte 196,98,125,121,13,192,13,0,0 // vpbroadcastw 0xdc0(%rip),%ymm9 # 1760 <_sk_xor__hsw_lowp+0x184> + .byte 196,98,125,121,13,164,13,0,0 // vpbroadcastw 0xda4(%rip),%ymm9 # 1700 <_sk_xor__hsw_lowp+0x168> .byte 197,221,113,244,8 // vpsllw $0x8,%ymm4,%ymm4 - .byte 196,98,125,121,21,180,13,0,0 // vpbroadcastw 0xdb4(%rip),%ymm10 # 1762 <_sk_xor__hsw_lowp+0x186> + .byte 196,98,125,121,21,152,13,0,0 // vpbroadcastw 0xd98(%rip),%ymm10 # 1702 <_sk_xor__hsw_lowp+0x16a> .byte 196,193,93,228,226 // vpmulhuw %ymm10,%ymm4,%ymm4 - .byte 197,253,111,45,197,13,0,0 // vmovdqa 0xdc5(%rip),%ymm5 # 1780 <_sk_xor__hsw_lowp+0x1a4> + .byte 197,253,111,45,169,13,0,0 // vmovdqa 0xda9(%rip),%ymm5 # 1720 <_sk_xor__hsw_lowp+0x188> .byte 196,226,61,0,245 // vpshufb %ymm5,%ymm8,%ymm6 .byte 196,227,253,0,246,232 // vpermq $0xe8,%ymm6,%ymm6 .byte 196,226,69,0,237 // vpshufb %ymm5,%ymm7,%ymm5 @@ -38072,7 +37961,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,227,77,56,237,1 // vinserti128 $0x1,%xmm5,%ymm6,%ymm5 .byte 197,213,113,245,8 // vpsllw $0x8,%ymm5,%ymm5 .byte 196,193,85,228,234 // vpmulhuw %ymm10,%ymm5,%ymm5 - .byte 197,253,111,53,183,13,0,0 // vmovdqa 0xdb7(%rip),%ymm6 # 17a0 <_sk_xor__hsw_lowp+0x1c4> + .byte 197,253,111,53,155,13,0,0 // vmovdqa 0xd9b(%rip),%ymm6 # 1740 <_sk_xor__hsw_lowp+0x1a8> .byte 196,98,61,0,222 // vpshufb %ymm6,%ymm8,%ymm11 .byte 196,67,253,0,219,232 // vpermq $0xe8,%ymm11,%ymm11 .byte 196,226,69,0,246 // vpshufb %ymm6,%ymm7,%ymm6 @@ -38080,7 +37969,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,227,37,56,246,1 // vinserti128 $0x1,%xmm6,%ymm11,%ymm6 .byte 197,205,113,246,8 // vpsllw $0x8,%ymm6,%ymm6 .byte 196,193,77,228,242 // vpmulhuw %ymm10,%ymm6,%ymm6 - .byte 197,125,111,29,169,13,0,0 // vmovdqa 0xda9(%rip),%ymm11 # 17c0 <_sk_xor__hsw_lowp+0x1e4> + .byte 197,125,111,29,141,13,0,0 // vmovdqa 0xd8d(%rip),%ymm11 # 1760 <_sk_xor__hsw_lowp+0x1c8> .byte 196,66,61,0,195 // vpshufb %ymm11,%ymm8,%ymm8 .byte 196,67,253,0,192,232 // vpermq $0xe8,%ymm8,%ymm8 .byte 196,194,69,0,251 // vpshufb %ymm11,%ymm7,%ymm7 @@ -38088,7 +37977,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,227,61,56,255,1 // vinserti128 $0x1,%xmm7,%ymm8,%ymm7 .byte 197,197,113,247,8 // vpsllw $0x8,%ymm7,%ymm7 .byte 196,193,69,228,250 // vpmulhuw %ymm10,%ymm7,%ymm7 - .byte 196,98,125,121,5,154,13,0,0 // vpbroadcastw 0xd9a(%rip),%ymm8 # 17e0 <_sk_xor__hsw_lowp+0x204> + .byte 196,98,125,121,5,126,13,0,0 // vpbroadcastw 0xd7e(%rip),%ymm8 # 1780 <_sk_xor__hsw_lowp+0x1e8> .byte 197,61,249,195 // vpsubw %ymm3,%ymm8,%ymm8 .byte 196,66,93,11,208 // vpmulhrsw %ymm8,%ymm4,%ymm10 .byte 196,66,125,29,210 // vpabsw %ymm10,%ymm10 @@ -38135,7 +38024,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,65,13,235,193 // vpor %ymm9,%ymm14,%ymm8 .byte 196,65,37,235,192 // vpor %ymm8,%ymm11,%ymm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,77 // jne b7e <_sk_srcover_rgba_8888_hsw_lowp+0x226> + .byte 117,77 // jne b3a <_sk_srcover_rgba_8888_hsw_lowp+0x226> .byte 196,65,126,127,4,147 // vmovdqu %ymm8,(%r11,%rdx,4) .byte 196,65,126,127,84,147,32 // vmovdqu %ymm10,0x20(%r11,%rdx,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -38146,26 +38035,26 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,65,61,239,192 // vpxor %ymm8,%ymm8,%ymm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 15,135,20,254,255,255 // ja 973 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + .byte 15,135,20,254,255,255 // ja 92f <_sk_srcover_rgba_8888_hsw_lowp+0x1b> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,238,1,0,0 // lea 0x1ee(%rip),%r10 # d58 <_sk_srcover_rgba_8888_hsw_lowp+0x400> + .byte 76,141,21,238,1,0,0 // lea 0x1ee(%rip),%r10 # d14 <_sk_srcover_rgba_8888_hsw_lowp+0x400> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,110,4,147 // vmovd (%r11,%rdx,4),%xmm8 - .byte 233,245,253,255,255 // jmpq 973 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + .byte 233,245,253,255,255 // jmpq 92f <_sk_srcover_rgba_8888_hsw_lowp+0x1b> .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,15 // and $0xf,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,176 // ja b3e <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + .byte 119,176 // ja afa <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 76,141,13,251,1,0,0 // lea 0x1fb(%rip),%r9 # d94 <_sk_srcover_rgba_8888_hsw_lowp+0x43c> + .byte 76,141,13,251,1,0,0 // lea 0x1fb(%rip),%r9 # d50 <_sk_srcover_rgba_8888_hsw_lowp+0x43c> .byte 73,99,4,129 // movslq (%r9,%rax,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax .byte 196,65,121,126,4,147 // vmovd %xmm8,(%r11,%rdx,4) - .byte 235,148 // jmp b3e <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + .byte 235,148 // jmp afa <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> .byte 196,193,121,110,100,147,8 // vmovd 0x8(%r11,%rdx,4),%xmm4 .byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4 .byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7 @@ -38173,7 +38062,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,194,121,53,36,147 // vpmovzxdq (%r11,%rdx,4),%xmm4 .byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4 .byte 196,99,61,2,196,3 // vpblendd $0x3,%ymm4,%ymm8,%ymm8 - .byte 233,157,253,255,255 // jmpq 973 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + .byte 233,157,253,255,255 // jmpq 92f <_sk_srcover_rgba_8888_hsw_lowp+0x1b> .byte 196,193,121,110,100,147,24 // vmovd 0x18(%r11,%rdx,4),%xmm4 .byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4 .byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7 @@ -38186,7 +38075,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,99,61,56,196,1 // vinserti128 $0x1,%xmm4,%ymm8,%ymm8 .byte 196,193,122,111,36,147 // vmovdqu (%r11,%rdx,4),%xmm4 .byte 196,67,93,2,192,240 // vpblendd $0xf0,%ymm8,%ymm4,%ymm8 - .byte 233,78,253,255,255 // jmpq 973 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + .byte 233,78,253,255,255 // jmpq 92f <_sk_srcover_rgba_8888_hsw_lowp+0x1b> .byte 196,193,121,110,100,147,40 // vmovd 0x28(%r11,%rdx,4),%xmm4 .byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 @@ -38195,7 +38084,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,227,69,2,252,15 // vpblendd $0xf,%ymm4,%ymm7,%ymm7 .byte 196,193,121,110,100,147,32 // vmovd 0x20(%r11,%rdx,4),%xmm4 .byte 196,227,69,2,252,1 // vpblendd $0x1,%ymm4,%ymm7,%ymm7 - .byte 233,18,253,255,255 // jmpq 96d <_sk_srcover_rgba_8888_hsw_lowp+0x15> + .byte 233,18,253,255,255 // jmpq 929 <_sk_srcover_rgba_8888_hsw_lowp+0x15> .byte 196,193,121,110,100,147,56 // vmovd 0x38(%r11,%rdx,4),%xmm4 .byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4 .byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5 @@ -38209,10 +38098,10 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,65,126,111,4,147 // vmovdqu (%r11,%rdx,4),%ymm8 .byte 196,193,122,111,100,147,32 // vmovdqu 0x20(%r11,%rdx,4),%xmm4 .byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7 - .byte 233,194,252,255,255 // jmpq 973 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + .byte 233,194,252,255,255 // jmpq 92f <_sk_srcover_rgba_8888_hsw_lowp+0x1b> .byte 196,67,121,22,68,147,8,2 // vpextrd $0x2,%xmm8,0x8(%r11,%rdx,4) .byte 196,65,121,214,4,147 // vmovq %xmm8,(%r11,%rdx,4) - .byte 233,122,254,255,255 // jmpq b3e <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + .byte 233,122,254,255,255 // jmpq afa <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,67,121,22,76,147,24,2 // vpextrd $0x2,%xmm9,0x18(%r11,%rdx,4) .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 @@ -38220,12 +38109,12 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9 .byte 196,65,121,126,76,147,16 // vmovd %xmm9,0x10(%r11,%rdx,4) .byte 196,65,122,127,4,147 // vmovdqu %xmm8,(%r11,%rdx,4) - .byte 233,70,254,255,255 // jmpq b3e <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + .byte 233,70,254,255,255 // jmpq afa <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> .byte 196,67,121,22,84,147,40,2 // vpextrd $0x2,%xmm10,0x28(%r11,%rdx,4) .byte 196,67,121,22,84,147,36,1 // vpextrd $0x1,%xmm10,0x24(%r11,%rdx,4) .byte 196,65,121,126,84,147,32 // vmovd %xmm10,0x20(%r11,%rdx,4) .byte 196,65,126,127,4,147 // vmovdqu %ymm8,(%r11,%rdx,4) - .byte 233,36,254,255,255 // jmpq b3e <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + .byte 233,36,254,255,255 // jmpq afa <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> .byte 196,67,125,57,209,1 // vextracti128 $0x1,%ymm10,%xmm9 .byte 196,67,121,22,76,147,56,2 // vpextrd $0x2,%xmm9,0x38(%r11,%rdx,4) .byte 196,67,125,57,209,1 // vextracti128 $0x1,%ymm10,%xmm9 @@ -38234,7 +38123,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 196,65,121,126,76,147,48 // vmovd %xmm9,0x30(%r11,%rdx,4) .byte 196,65,126,127,4,147 // vmovdqu %ymm8,(%r11,%rdx,4) .byte 196,65,122,127,84,147,32 // vmovdqu %xmm10,0x20(%r11,%rdx,4) - .byte 233,233,253,255,255 // jmpq b3e <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + .byte 233,233,253,255,255 // jmpq afa <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> .byte 15,31,0 // nopl (%rax) .byte 27,254 // sbb %esi,%edi .byte 255 // (bad) @@ -38248,7 +38137,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 255 // (bad) .byte 255,148,254,255,255,126,254 // callq *-0x1810001(%rsi,%rdi,8) .byte 255 // (bad) - .byte 255,21,252,255,255,241 // callq *-0xe000004(%rip) # fffffffff2000d75 <_sk_xor__hsw_lowp+0xfffffffff1fff799> + .byte 255,21,252,255,255,241 // callq *-0xe000004(%rip) # fffffffff2000d31 <_sk_xor__hsw_lowp+0xfffffffff1fff799> .byte 254 // (bad) .byte 255 // (bad) .byte 255,227 // jmpq *%rbx @@ -38259,7 +38148,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 255 // (bad) .byte 255,65,255 // incl -0x1(%rcx) .byte 255 // (bad) - .byte 255,45,255,255,255,25 // ljmp *0x19ffffff(%rip) # 1a000d8c <_sk_xor__hsw_lowp+0x19fff7b0> + .byte 255,45,255,255,255,25 // ljmp *0x19ffffff(%rip) # 1a000d48 <_sk_xor__hsw_lowp+0x19fff7b0> .byte 255 // (bad) .byte 255 // (bad) .byte 255,3 // incl (%rbx) @@ -38268,7 +38157,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 255,14 // decl (%rsi) .byte 254 // (bad) .byte 255 // (bad) - .byte 255,37,255,255,255,29 // jmpq *0x1dffffff(%rip) # 1e000d9c <_sk_xor__hsw_lowp+0x1dfff7c0> + .byte 255,37,255,255,255,29 // jmpq *0x1dffffff(%rip) # 1e000d58 <_sk_xor__hsw_lowp+0x1dfff7c0> .byte 255 // (bad) .byte 255 // (bad) .byte 255,89,255 // lcall *-0x1(%rcx) @@ -38281,7 +38170,7 @@ _sk_srcover_rgba_8888_hsw_lowp: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 123,255 // jnp db1 <_sk_srcover_rgba_8888_hsw_lowp+0x459> + .byte 123,255 // jnp d6d <_sk_srcover_rgba_8888_hsw_lowp+0x459> .byte 255 // (bad) .byte 255,116,255,255 // pushq -0x1(%rdi,%rdi,8) .byte 255,108,255,255 // ljmp *-0x1(%rdi,%rdi,8) @@ -38299,7 +38188,7 @@ FUNCTION(_sk_scale_1_float_hsw_lowp) _sk_scale_1_float_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,122,16,0 // vmovss (%rax),%xmm8 - .byte 197,58,88,5,126,8,0,0 // vaddss 0x87e(%rip),%xmm8,%xmm8 # 165c <_sk_xor__hsw_lowp+0x80> + .byte 197,58,88,5,126,8,0,0 // vaddss 0x87e(%rip),%xmm8,%xmm8 # 1618 <_sk_xor__hsw_lowp+0x80> .byte 197,121,126,192 // vmovd %xmm8,%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 .byte 196,66,125,121,192 // vpbroadcastw %xmm8,%ymm8 @@ -38321,11 +38210,11 @@ _sk_scale_u8_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,75 // jne e6c <_sk_scale_u8_hsw_lowp+0x55> + .byte 117,75 // jne e28 <_sk_scale_u8_hsw_lowp+0x55> .byte 196,65,122,111,4,19 // vmovdqu (%r11,%rdx,1),%xmm8 .byte 196,66,125,48,192 // vpmovzxbw %xmm8,%ymm8 .byte 196,193,61,113,240,8 // vpsllw $0x8,%ymm8,%ymm8 - .byte 196,98,125,121,13,167,9,0,0 // vpbroadcastw 0x9a7(%rip),%ymm9 # 17e2 <_sk_xor__hsw_lowp+0x206> + .byte 196,98,125,121,13,139,9,0,0 // vpbroadcastw 0x98b(%rip),%ymm9 # 1782 <_sk_xor__hsw_lowp+0x1ea> .byte 196,65,61,228,193 // vpmulhuw %ymm9,%ymm8,%ymm8 .byte 196,194,125,11,192 // vpmulhrsw %ymm8,%ymm0,%ymm0 .byte 196,226,125,29,192 // vpabsw %ymm0,%ymm0 @@ -38342,35 +38231,35 @@ _sk_scale_u8_hsw_lowp: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 119,166 // ja e27 <_sk_scale_u8_hsw_lowp+0x10> + .byte 119,166 // ja de3 <_sk_scale_u8_hsw_lowp+0x10> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,200,0,0,0 // lea 0xc8(%rip),%r10 # f54 <_sk_scale_u8_hsw_lowp+0x13d> + .byte 76,141,21,200,0,0,0 // lea 0xc8(%rip),%r10 # f10 <_sk_scale_u8_hsw_lowp+0x13d> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 235,135 // jmp e27 <_sk_scale_u8_hsw_lowp+0x10> + .byte 235,135 // jmp de3 <_sk_scale_u8_hsw_lowp+0x10> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,67,57,32,68,19,2,2 // vpinsrb $0x2,0x2(%r11,%rdx,1),%xmm8,%xmm8 .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,67,57,14,193,1 // vpblendw $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,102,255,255,255 // jmpq e27 <_sk_scale_u8_hsw_lowp+0x10> + .byte 233,102,255,255,255 // jmpq de3 <_sk_scale_u8_hsw_lowp+0x10> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,67,57,32,68,19,6,6 // vpinsrb $0x6,0x6(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,5,5 // vpinsrb $0x5,0x5(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,4,4 // vpinsrb $0x4,0x4(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9 .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,56,255,255,255 // jmpq e27 <_sk_scale_u8_hsw_lowp+0x10> + .byte 233,56,255,255,255 // jmpq de3 <_sk_scale_u8_hsw_lowp+0x10> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,67,57,32,68,19,10,10 // vpinsrb $0xa,0xa(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,9,9 // vpinsrb $0x9,0x9(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,8,8 // vpinsrb $0x8,0x8(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,65,122,126,12,19 // vmovq (%r11,%rdx,1),%xmm9 .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8 - .byte 233,10,255,255,255 // jmpq e27 <_sk_scale_u8_hsw_lowp+0x10> + .byte 233,10,255,255,255 // jmpq de3 <_sk_scale_u8_hsw_lowp+0x10> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,67,57,32,68,19,14,14 // vpinsrb $0xe,0xe(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,13,13 // vpinsrb $0xd,0xd(%r11,%rdx,1),%xmm8,%xmm8 @@ -38378,7 +38267,7 @@ _sk_scale_u8_hsw_lowp: .byte 196,65,122,126,12,19 // vmovq (%r11,%rdx,1),%xmm9 .byte 196,67,49,34,76,19,8,2 // vpinsrd $0x2,0x8(%r11,%rdx,1),%xmm9,%xmm9 .byte 196,67,49,2,192,8 // vpblendd $0x8,%xmm8,%xmm9,%xmm8 - .byte 233,212,254,255,255 // jmpq e27 <_sk_scale_u8_hsw_lowp+0x10> + .byte 233,212,254,255,255 // jmpq de3 <_sk_scale_u8_hsw_lowp+0x10> .byte 144 // nop .byte 65,255 // rex.B (bad) .byte 255 // (bad) @@ -38389,7 +38278,7 @@ _sk_scale_u8_hsw_lowp: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 122,255 // jp f69 <_sk_scale_u8_hsw_lowp+0x152> + .byte 122,255 // jp f25 <_sk_scale_u8_hsw_lowp+0x152> .byte 255 // (bad) .byte 255,109,255 // ljmp *-0x1(%rbp) .byte 255 // (bad) @@ -38420,13 +38309,13 @@ FUNCTION(_sk_lerp_1_float_hsw_lowp) _sk_lerp_1_float_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 197,122,16,0 // vmovss (%rax),%xmm8 - .byte 197,58,88,5,194,6,0,0 // vaddss 0x6c2(%rip),%xmm8,%xmm8 # 1660 <_sk_xor__hsw_lowp+0x84> + .byte 197,58,88,5,194,6,0,0 // vaddss 0x6c2(%rip),%xmm8,%xmm8 # 161c <_sk_xor__hsw_lowp+0x84> .byte 197,121,126,192 // vmovd %xmm8,%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 .byte 196,66,125,121,192 // vpbroadcastw %xmm8,%ymm8 .byte 196,194,125,11,192 // vpmulhrsw %ymm8,%ymm0,%ymm0 .byte 196,226,125,29,192 // vpabsw %ymm0,%ymm0 - .byte 196,98,125,121,13,38,8,0,0 // vpbroadcastw 0x826(%rip),%ymm9 # 17e4 <_sk_xor__hsw_lowp+0x208> + .byte 196,98,125,121,13,10,8,0,0 // vpbroadcastw 0x80a(%rip),%ymm9 # 1784 <_sk_xor__hsw_lowp+0x1ec> .byte 196,65,53,249,200 // vpsubw %ymm8,%ymm9,%ymm9 .byte 196,66,93,11,209 // vpmulhrsw %ymm9,%ymm4,%ymm10 .byte 196,66,125,29,210 // vpabsw %ymm10,%ymm10 @@ -38456,15 +38345,15 @@ _sk_lerp_u8_hsw_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,145,0,0,0 // jne 10bc <_sk_lerp_u8_hsw_lowp+0x9f> + .byte 15,133,145,0,0,0 // jne 1078 <_sk_lerp_u8_hsw_lowp+0x9f> .byte 196,65,122,111,4,19 // vmovdqu (%r11,%rdx,1),%xmm8 .byte 196,66,125,48,192 // vpmovzxbw %xmm8,%ymm8 .byte 196,193,61,113,240,8 // vpsllw $0x8,%ymm8,%ymm8 - .byte 196,98,125,121,13,161,7,0,0 // vpbroadcastw 0x7a1(%rip),%ymm9 # 17e6 <_sk_xor__hsw_lowp+0x20a> + .byte 196,98,125,121,13,133,7,0,0 // vpbroadcastw 0x785(%rip),%ymm9 # 1786 <_sk_xor__hsw_lowp+0x1ee> .byte 196,65,61,228,193 // vpmulhuw %ymm9,%ymm8,%ymm8 .byte 196,194,125,11,192 // vpmulhrsw %ymm8,%ymm0,%ymm0 .byte 196,226,125,29,192 // vpabsw %ymm0,%ymm0 - .byte 196,98,125,121,13,139,7,0,0 // vpbroadcastw 0x78b(%rip),%ymm9 # 17e8 <_sk_xor__hsw_lowp+0x20c> + .byte 196,98,125,121,13,111,7,0,0 // vpbroadcastw 0x76f(%rip),%ymm9 # 1788 <_sk_xor__hsw_lowp+0x1f0> .byte 196,65,53,249,200 // vpsubw %ymm8,%ymm9,%ymm9 .byte 196,66,93,11,209 // vpmulhrsw %ymm9,%ymm4,%ymm10 .byte 196,66,125,29,210 // vpabsw %ymm10,%ymm10 @@ -38491,35 +38380,35 @@ _sk_lerp_u8_hsw_lowp: .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,14 // cmp $0xe,%r9b - .byte 15,135,92,255,255,255 // ja 1031 <_sk_lerp_u8_hsw_lowp+0x14> + .byte 15,135,92,255,255,255 // ja fed <_sk_lerp_u8_hsw_lowp+0x14> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,204,0,0,0 // lea 0xcc(%rip),%r10 # 11ac <_sk_lerp_u8_hsw_lowp+0x18f> + .byte 76,141,21,204,0,0,0 // lea 0xcc(%rip),%r10 # 1168 <_sk_lerp_u8_hsw_lowp+0x18f> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 197,121,110,192 // vmovd %eax,%xmm8 - .byte 233,58,255,255,255 // jmpq 1031 <_sk_lerp_u8_hsw_lowp+0x14> + .byte 233,58,255,255,255 // jmpq fed <_sk_lerp_u8_hsw_lowp+0x14> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,67,57,32,68,19,2,2 // vpinsrb $0x2,0x2(%r11,%rdx,1),%xmm8,%xmm8 .byte 65,15,183,4,19 // movzwl (%r11,%rdx,1),%eax .byte 197,121,110,200 // vmovd %eax,%xmm9 .byte 196,67,57,14,193,1 // vpblendw $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,25,255,255,255 // jmpq 1031 <_sk_lerp_u8_hsw_lowp+0x14> + .byte 233,25,255,255,255 // jmpq fed <_sk_lerp_u8_hsw_lowp+0x14> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,67,57,32,68,19,6,6 // vpinsrb $0x6,0x6(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,5,5 // vpinsrb $0x5,0x5(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,4,4 // vpinsrb $0x4,0x4(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,65,121,110,12,19 // vmovd (%r11,%rdx,1),%xmm9 .byte 196,67,57,2,193,1 // vpblendd $0x1,%xmm9,%xmm8,%xmm8 - .byte 233,235,254,255,255 // jmpq 1031 <_sk_lerp_u8_hsw_lowp+0x14> + .byte 233,235,254,255,255 // jmpq fed <_sk_lerp_u8_hsw_lowp+0x14> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,67,57,32,68,19,10,10 // vpinsrb $0xa,0xa(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,9,9 // vpinsrb $0x9,0x9(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,8,8 // vpinsrb $0x8,0x8(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,65,122,126,12,19 // vmovq (%r11,%rdx,1),%xmm9 .byte 196,67,49,2,192,12 // vpblendd $0xc,%xmm8,%xmm9,%xmm8 - .byte 233,189,254,255,255 // jmpq 1031 <_sk_lerp_u8_hsw_lowp+0x14> + .byte 233,189,254,255,255 // jmpq fed <_sk_lerp_u8_hsw_lowp+0x14> .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8 .byte 196,67,57,32,68,19,14,14 // vpinsrb $0xe,0xe(%r11,%rdx,1),%xmm8,%xmm8 .byte 196,67,57,32,68,19,13,13 // vpinsrb $0xd,0xd(%r11,%rdx,1),%xmm8,%xmm8 @@ -38527,7 +38416,7 @@ _sk_lerp_u8_hsw_lowp: .byte 196,65,122,126,12,19 // vmovq (%r11,%rdx,1),%xmm9 .byte 196,67,49,34,76,19,8,2 // vpinsrd $0x2,0x8(%r11,%rdx,1),%xmm9,%xmm9 .byte 196,67,49,2,192,8 // vpblendd $0x8,%xmm8,%xmm9,%xmm8 - .byte 233,135,254,255,255 // jmpq 1031 <_sk_lerp_u8_hsw_lowp+0x14> + .byte 233,135,254,255,255 // jmpq fed <_sk_lerp_u8_hsw_lowp+0x14> .byte 102,144 // xchg %ax,%ax .byte 61,255,255,255,88 // cmp $0x58ffffff,%eax .byte 255 // (bad) @@ -38538,7 +38427,7 @@ _sk_lerp_u8_hsw_lowp: .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 121,255 // jns 11c1 <_sk_lerp_u8_hsw_lowp+0x1a4> + .byte 121,255 // jns 117d <_sk_lerp_u8_hsw_lowp+0x1a4> .byte 255 // (bad) .byte 255,108,255,255 // ljmp *-0x1(%rdi,%rdi,8) .byte 255,183,255,255,255,175 // pushq -0x50000001(%rdi) @@ -38629,7 +38518,7 @@ FUNCTION(_sk_srcatop_hsw_lowp) _sk_srcatop_hsw_lowp: .byte 196,226,125,11,199 // vpmulhrsw %ymm7,%ymm0,%ymm0 .byte 196,226,125,29,192 // vpabsw %ymm0,%ymm0 - .byte 196,98,125,121,5,111,5,0,0 // vpbroadcastw 0x56f(%rip),%ymm8 # 17ea <_sk_xor__hsw_lowp+0x20e> + .byte 196,98,125,121,5,83,5,0,0 // vpbroadcastw 0x553(%rip),%ymm8 # 178a <_sk_xor__hsw_lowp+0x1f2> .byte 197,61,249,195 // vpsubw %ymm3,%ymm8,%ymm8 .byte 196,66,93,11,200 // vpmulhrsw %ymm8,%ymm4,%ymm9 .byte 196,66,125,29,201 // vpabsw %ymm9,%ymm9 @@ -38658,7 +38547,7 @@ FUNCTION(_sk_dstatop_hsw_lowp) _sk_dstatop_hsw_lowp: .byte 196,98,93,11,195 // vpmulhrsw %ymm3,%ymm4,%ymm8 .byte 196,66,125,29,192 // vpabsw %ymm8,%ymm8 - .byte 196,98,125,121,13,0,5,0,0 // vpbroadcastw 0x500(%rip),%ymm9 # 17ec <_sk_xor__hsw_lowp+0x210> + .byte 196,98,125,121,13,228,4,0,0 // vpbroadcastw 0x4e4(%rip),%ymm9 # 178c <_sk_xor__hsw_lowp+0x1f4> .byte 197,53,249,207 // vpsubw %ymm7,%ymm9,%ymm9 .byte 196,194,125,11,193 // vpmulhrsw %ymm9,%ymm0,%ymm0 .byte 196,226,125,29,192 // vpabsw %ymm0,%ymm0 @@ -38715,7 +38604,7 @@ HIDDEN _sk_srcout_hsw_lowp .globl _sk_srcout_hsw_lowp FUNCTION(_sk_srcout_hsw_lowp) _sk_srcout_hsw_lowp: - .byte 196,98,125,121,5,63,4,0,0 // vpbroadcastw 0x43f(%rip),%ymm8 # 17ee <_sk_xor__hsw_lowp+0x212> + .byte 196,98,125,121,5,35,4,0,0 // vpbroadcastw 0x423(%rip),%ymm8 # 178e <_sk_xor__hsw_lowp+0x1f6> .byte 197,61,249,199 // vpsubw %ymm7,%ymm8,%ymm8 .byte 196,194,125,11,192 // vpmulhrsw %ymm8,%ymm0,%ymm0 .byte 196,226,125,29,192 // vpabsw %ymm0,%ymm0 @@ -38732,7 +38621,7 @@ HIDDEN _sk_dstout_hsw_lowp .globl _sk_dstout_hsw_lowp FUNCTION(_sk_dstout_hsw_lowp) _sk_dstout_hsw_lowp: - .byte 196,226,125,121,5,8,4,0,0 // vpbroadcastw 0x408(%rip),%ymm0 # 17f0 <_sk_xor__hsw_lowp+0x214> + .byte 196,226,125,121,5,236,3,0,0 // vpbroadcastw 0x3ec(%rip),%ymm0 # 1790 <_sk_xor__hsw_lowp+0x1f8> .byte 197,253,249,219 // vpsubw %ymm3,%ymm0,%ymm3 .byte 196,226,93,11,195 // vpmulhrsw %ymm3,%ymm4,%ymm0 .byte 196,226,125,29,192 // vpabsw %ymm0,%ymm0 @@ -38749,7 +38638,7 @@ HIDDEN _sk_srcover_hsw_lowp .globl _sk_srcover_hsw_lowp FUNCTION(_sk_srcover_hsw_lowp) _sk_srcover_hsw_lowp: - .byte 196,98,125,121,5,209,3,0,0 // vpbroadcastw 0x3d1(%rip),%ymm8 # 17f2 <_sk_xor__hsw_lowp+0x216> + .byte 196,98,125,121,5,181,3,0,0 // vpbroadcastw 0x3b5(%rip),%ymm8 # 1792 <_sk_xor__hsw_lowp+0x1fa> .byte 197,61,249,195 // vpsubw %ymm3,%ymm8,%ymm8 .byte 196,66,93,11,200 // vpmulhrsw %ymm8,%ymm4,%ymm9 .byte 196,66,125,29,201 // vpabsw %ymm9,%ymm9 @@ -38770,7 +38659,7 @@ HIDDEN _sk_dstover_hsw_lowp .globl _sk_dstover_hsw_lowp FUNCTION(_sk_dstover_hsw_lowp) _sk_dstover_hsw_lowp: - .byte 196,98,125,121,5,138,3,0,0 // vpbroadcastw 0x38a(%rip),%ymm8 # 17f4 <_sk_xor__hsw_lowp+0x218> + .byte 196,98,125,121,5,110,3,0,0 // vpbroadcastw 0x36e(%rip),%ymm8 # 1794 <_sk_xor__hsw_lowp+0x1fc> .byte 197,61,249,199 // vpsubw %ymm7,%ymm8,%ymm8 .byte 196,194,125,11,192 // vpmulhrsw %ymm8,%ymm0,%ymm0 .byte 196,226,125,29,192 // vpabsw %ymm0,%ymm0 @@ -38806,7 +38695,7 @@ HIDDEN _sk_multiply_hsw_lowp .globl _sk_multiply_hsw_lowp FUNCTION(_sk_multiply_hsw_lowp) _sk_multiply_hsw_lowp: - .byte 196,98,125,121,5,23,3,0,0 // vpbroadcastw 0x317(%rip),%ymm8 # 17f6 <_sk_xor__hsw_lowp+0x21a> + .byte 196,98,125,121,5,251,2,0,0 // vpbroadcastw 0x2fb(%rip),%ymm8 # 1796 <_sk_xor__hsw_lowp+0x1fe> .byte 197,61,249,207 // vpsubw %ymm7,%ymm8,%ymm9 .byte 196,66,125,11,209 // vpmulhrsw %ymm9,%ymm0,%ymm10 .byte 196,66,125,29,210 // vpabsw %ymm10,%ymm10 @@ -38848,7 +38737,7 @@ HIDDEN _sk_screen_hsw_lowp .globl _sk_screen_hsw_lowp FUNCTION(_sk_screen_hsw_lowp) _sk_screen_hsw_lowp: - .byte 196,98,125,121,5,104,2,0,0 // vpbroadcastw 0x268(%rip),%ymm8 # 17f8 <_sk_xor__hsw_lowp+0x21c> + .byte 196,98,125,121,5,76,2,0,0 // vpbroadcastw 0x24c(%rip),%ymm8 # 1798 <_sk_xor__hsw_lowp+0x200> .byte 197,61,249,200 // vpsubw %ymm0,%ymm8,%ymm9 .byte 196,98,53,11,204 // vpmulhrsw %ymm4,%ymm9,%ymm9 .byte 196,66,125,29,201 // vpabsw %ymm9,%ymm9 @@ -38872,7 +38761,7 @@ HIDDEN _sk_xor__hsw_lowp .globl _sk_xor__hsw_lowp FUNCTION(_sk_xor__hsw_lowp) _sk_xor__hsw_lowp: - .byte 196,98,125,121,5,21,2,0,0 // vpbroadcastw 0x215(%rip),%ymm8 # 17fa <_sk_xor__hsw_lowp+0x21e> + .byte 196,98,125,121,5,249,1,0,0 // vpbroadcastw 0x1f9(%rip),%ymm8 # 179a <_sk_xor__hsw_lowp+0x202> .byte 197,61,249,207 // vpsubw %ymm7,%ymm8,%ymm9 .byte 196,194,125,11,193 // vpmulhrsw %ymm9,%ymm0,%ymm0 .byte 196,226,125,29,192 // vpabsw %ymm0,%ymm0 @@ -38942,7 +38831,7 @@ BALIGN32 .byte 255 // (bad) .byte 255 // (bad) .byte 255,17 // callq *(%rcx) - .byte 18,21,22,25,26,29 // adc 0x1d1a1916(%rip),%dl # 1d1a2fed <_sk_xor__hsw_lowp+0x1d1a1a11> + .byte 18,21,22,25,26,29 // adc 0x1d1a1916(%rip),%dl # 1d1a2f8d <_sk_xor__hsw_lowp+0x1d1a19f5> .byte 30 // (bad) .byte 255 // (bad) .byte 255 // (bad) @@ -39046,7 +38935,7 @@ BALIGN32 .byte 255 // (bad) .byte 255 // (bad) .byte 255,17 // callq *(%rcx) - .byte 18,21,22,25,26,29 // adc 0x1d1a1916(%rip),%dl # 1d1a30ad <_sk_xor__hsw_lowp+0x1d1a1ad1> + .byte 18,21,22,25,26,29 // adc 0x1d1a1916(%rip),%dl # 1d1a304d <_sk_xor__hsw_lowp+0x1d1a1ab5> .byte 30 // (bad) .byte 255 // (bad) .byte 255 // (bad) @@ -39125,9 +39014,9 @@ _sk_start_pipeline_ssse3_lowp: .byte 65,84 // push %r12 .byte 83 // push %rbx .byte 80 // push %rax - .byte 76,137,195 // mov %r8,%rbx + .byte 77,137,196 // mov %r8,%r12 .byte 73,137,215 // mov %rdx,%r15 - .byte 73,137,244 // mov %rsi,%r12 + .byte 72,137,243 // mov %rsi,%rbx .byte 73,137,254 // mov %rdi,%r14 .byte 72,137,206 // mov %rcx,%rsi .byte 72,173 // lods %ds:(%rsi),%rax @@ -39136,21 +39025,13 @@ _sk_start_pipeline_ssse3_lowp: .byte 76,57,249 // cmp %r15,%rcx .byte 118,5 // jbe 30 <_sk_start_pipeline_ssse3_lowp+0x30> .byte 76,137,242 // mov %r14,%rdx - .byte 235,72 // jmp 78 <_sk_start_pipeline_ssse3_lowp+0x78> + .byte 235,45 // jmp 5d <_sk_start_pipeline_ssse3_lowp+0x5d> .byte 76,137,125,208 // mov %r15,-0x30(%rbp) - .byte 65,184,0,0,0,0 // mov $0x0,%r8d - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,87,201 // xorps %xmm1,%xmm1 - .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 15,87,228 // xorps %xmm4,%xmm4 - .byte 15,87,237 // xorps %xmm5,%xmm5 - .byte 15,87,246 // xorps %xmm6,%xmm6 - .byte 15,87,255 // xorps %xmm7,%xmm7 - .byte 72,137,223 // mov %rbx,%rdi + .byte 69,49,192 // xor %r8d,%r8d + .byte 76,137,231 // mov %r12,%rdi .byte 73,137,247 // mov %rsi,%r15 .byte 76,137,242 // mov %r14,%rdx - .byte 76,137,225 // mov %r12,%rcx + .byte 72,137,217 // mov %rbx,%rcx .byte 65,255,213 // callq *%r13 .byte 76,137,254 // mov %r15,%rsi .byte 76,139,125,208 // mov -0x30(%rbp),%r15 @@ -39158,20 +39039,12 @@ _sk_start_pipeline_ssse3_lowp: .byte 73,131,198,16 // add $0x10,%r14 .byte 77,57,254 // cmp %r15,%r14 .byte 73,137,214 // mov %rdx,%r14 - .byte 118,188 // jbe 34 <_sk_start_pipeline_ssse3_lowp+0x34> + .byte 118,215 // jbe 34 <_sk_start_pipeline_ssse3_lowp+0x34> .byte 77,137,248 // mov %r15,%r8 .byte 73,41,208 // sub %rdx,%r8 - .byte 116,33 // je a1 <_sk_start_pipeline_ssse3_lowp+0xa1> - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,87,201 // xorps %xmm1,%xmm1 - .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 15,87,228 // xorps %xmm4,%xmm4 - .byte 15,87,237 // xorps %xmm5,%xmm5 - .byte 15,87,246 // xorps %xmm6,%xmm6 - .byte 15,87,255 // xorps %xmm7,%xmm7 - .byte 72,137,223 // mov %rbx,%rdi - .byte 76,137,225 // mov %r12,%rcx + .byte 116,9 // je 6e <_sk_start_pipeline_ssse3_lowp+0x6e> + .byte 76,137,231 // mov %r12,%rdi + .byte 72,137,217 // mov %rbx,%rcx .byte 65,255,213 // callq *%r13 .byte 76,137,248 // mov %r15,%rax .byte 72,131,196,8 // add $0x8,%rsp @@ -39195,7 +39068,7 @@ FUNCTION(_sk_constant_color_ssse3_lowp) _sk_constant_color_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 15,16,24 // movups (%rax),%xmm3 - .byte 15,88,29,96,18,0,0 // addps 0x1260(%rip),%xmm3 # 1320 <_sk_xor__ssse3_lowp+0x9b> + .byte 15,88,29,99,18,0,0 // addps 0x1263(%rip),%xmm3 # 12f0 <_sk_xor__ssse3_lowp+0x9f> .byte 242,15,112,195,0 // pshuflw $0x0,%xmm3,%xmm0 .byte 102,15,112,192,80 // pshufd $0x50,%xmm0,%xmm0 .byte 242,15,112,203,170 // pshuflw $0xaa,%xmm3,%xmm1 @@ -39212,7 +39085,7 @@ HIDDEN _sk_set_rgb_ssse3_lowp FUNCTION(_sk_set_rgb_ssse3_lowp) _sk_set_rgb_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax - .byte 243,15,16,21,42,20,0,0 // movss 0x142a(%rip),%xmm2 # 1520 <_sk_xor__ssse3_lowp+0x29b> + .byte 243,15,16,21,45,20,0,0 // movss 0x142d(%rip),%xmm2 # 14f0 <_sk_xor__ssse3_lowp+0x29f> .byte 243,15,16,0 // movss (%rax),%xmm0 .byte 243,15,88,194 // addss %xmm2,%xmm0 .byte 102,65,15,126,193 // movd %xmm0,%r9d @@ -39253,19 +39126,19 @@ _sk_load_8888_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,191,0,0,0 // jne 239 <_sk_load_8888_ssse3_lowp+0xcd> + .byte 15,133,191,0,0,0 // jne 206 <_sk_load_8888_ssse3_lowp+0xcd> .byte 69,15,16,68,147,16 // movups 0x10(%r11,%rdx,4),%xmm8 .byte 102,65,15,16,28,147 // movupd (%r11,%rdx,4),%xmm3 - .byte 102,15,111,13,162,17,0,0 // movdqa 0x11a2(%rip),%xmm1 # 1330 <_sk_xor__ssse3_lowp+0xab> + .byte 102,15,111,13,165,17,0,0 // movdqa 0x11a5(%rip),%xmm1 # 1300 <_sk_xor__ssse3_lowp+0xaf> .byte 102,15,40,195 // movapd %xmm3,%xmm0 .byte 102,15,56,0,193 // pshufb %xmm1,%xmm0 .byte 102,65,15,111,208 // movdqa %xmm8,%xmm2 .byte 102,15,56,0,209 // pshufb %xmm1,%xmm2 .byte 102,15,108,194 // punpcklqdq %xmm2,%xmm0 .byte 102,15,113,240,8 // psllw $0x8,%xmm0 - .byte 102,68,15,111,13,141,17,0,0 // movdqa 0x118d(%rip),%xmm9 # 1340 <_sk_xor__ssse3_lowp+0xbb> + .byte 102,68,15,111,13,144,17,0,0 // movdqa 0x1190(%rip),%xmm9 # 1310 <_sk_xor__ssse3_lowp+0xbf> .byte 102,65,15,228,193 // pmulhuw %xmm9,%xmm0 - .byte 102,68,15,111,21,143,17,0,0 // movdqa 0x118f(%rip),%xmm10 # 1350 <_sk_xor__ssse3_lowp+0xcb> + .byte 102,68,15,111,21,146,17,0,0 // movdqa 0x1192(%rip),%xmm10 # 1320 <_sk_xor__ssse3_lowp+0xcf> .byte 102,15,40,203 // movapd %xmm3,%xmm1 .byte 102,65,15,56,0,202 // pshufb %xmm10,%xmm1 .byte 102,65,15,111,208 // movdqa %xmm8,%xmm2 @@ -39273,7 +39146,7 @@ _sk_load_8888_ssse3_lowp: .byte 102,15,108,202 // punpcklqdq %xmm2,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 .byte 102,65,15,228,201 // pmulhuw %xmm9,%xmm1 - .byte 102,68,15,111,21,115,17,0,0 // movdqa 0x1173(%rip),%xmm10 # 1360 <_sk_xor__ssse3_lowp+0xdb> + .byte 102,68,15,111,21,118,17,0,0 // movdqa 0x1176(%rip),%xmm10 # 1330 <_sk_xor__ssse3_lowp+0xdf> .byte 102,15,40,211 // movapd %xmm3,%xmm2 .byte 102,65,15,56,0,210 // pshufb %xmm10,%xmm2 .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 @@ -39281,7 +39154,7 @@ _sk_load_8888_ssse3_lowp: .byte 102,65,15,108,211 // punpcklqdq %xmm11,%xmm2 .byte 102,15,113,242,8 // psllw $0x8,%xmm2 .byte 102,65,15,228,209 // pmulhuw %xmm9,%xmm2 - .byte 102,68,15,111,21,86,17,0,0 // movdqa 0x1156(%rip),%xmm10 # 1370 <_sk_xor__ssse3_lowp+0xeb> + .byte 102,68,15,111,21,89,17,0,0 // movdqa 0x1159(%rip),%xmm10 # 1340 <_sk_xor__ssse3_lowp+0xef> .byte 102,65,15,56,0,218 // pshufb %xmm10,%xmm3 .byte 102,69,15,56,0,194 // pshufb %xmm10,%xmm8 .byte 102,65,15,108,216 // punpcklqdq %xmm8,%xmm3 @@ -39295,18 +39168,18 @@ _sk_load_8888_ssse3_lowp: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,48,255,255,255 // ja 186 <_sk_load_8888_ssse3_lowp+0x1a> + .byte 15,135,48,255,255,255 // ja 153 <_sk_load_8888_ssse3_lowp+0x1a> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,95,0,0,0 // lea 0x5f(%rip),%r10 # 2c0 <_sk_load_8888_ssse3_lowp+0x154> + .byte 76,141,21,94,0,0,0 // lea 0x5e(%rip),%r10 # 28c <_sk_load_8888_ssse3_lowp+0x153> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 243,65,15,16,28,147 // movss (%r11,%rdx,4),%xmm3 - .byte 233,17,255,255,255 // jmpq 186 <_sk_load_8888_ssse3_lowp+0x1a> + .byte 233,17,255,255,255 // jmpq 153 <_sk_load_8888_ssse3_lowp+0x1a> .byte 102,65,15,110,68,147,8 // movd 0x8(%r11,%rdx,4),%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,65,15,18,28,147 // movlpd (%r11,%rdx,4),%xmm3 - .byte 233,250,254,255,255 // jmpq 186 <_sk_load_8888_ssse3_lowp+0x1a> + .byte 233,250,254,255,255 // jmpq 153 <_sk_load_8888_ssse3_lowp+0x1a> .byte 102,65,15,110,68,147,24 // movd 0x18(%r11,%rdx,4),%xmm0 .byte 102,68,15,112,192,69 // pshufd $0x45,%xmm0,%xmm8 .byte 243,65,15,16,68,147,20 // movss 0x14(%r11,%rdx,4),%xmm0 @@ -39315,25 +39188,24 @@ _sk_load_8888_ssse3_lowp: .byte 68,15,40,192 // movaps %xmm0,%xmm8 .byte 243,65,15,16,68,147,16 // movss 0x10(%r11,%rdx,4),%xmm0 .byte 243,68,15,16,192 // movss %xmm0,%xmm8 - .byte 233,193,254,255,255 // jmpq 180 <_sk_load_8888_ssse3_lowp+0x14> - .byte 144 // nop - .byte 170 // stos %al,%es:(%rdi) + .byte 233,193,254,255,255 // jmpq 14d <_sk_load_8888_ssse3_lowp+0x14> + .byte 171 // stos %eax,%es:(%rdi) .byte 255 // (bad) .byte 255 // (bad) - .byte 255,193 // inc %ecx + .byte 255,194 // inc %edx .byte 255 // (bad) .byte 255 // (bad) - .byte 255,181,255,255,255,192 // pushq -0x3f000001(%rbp) + .byte 255,182,255,255,255,193 // pushq -0x3e000001(%rsi) .byte 254 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 238 // out %al,(%dx) + .byte 239 // out %eax,(%dx) .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 217,255 // fcos + .byte 218,255 // (bad) .byte 255 // (bad) - .byte 255,204 // dec %esp + .byte 255,205 // dec %ebp .byte 255 // (bad) .byte 255 // (bad) .byte 255 // .byte 0xff @@ -39346,7 +39218,7 @@ _sk_store_8888_ssse3_lowp: .byte 76,139,24 // mov (%rax),%r11 .byte 102,68,15,111,192 // movdqa %xmm0,%xmm8 .byte 102,65,15,113,208,7 // psrlw $0x7,%xmm8 - .byte 102,68,15,111,21,139,16,0,0 // movdqa 0x108b(%rip),%xmm10 # 1380 <_sk_xor__ssse3_lowp+0xfb> + .byte 102,68,15,111,21,143,16,0,0 // movdqa 0x108f(%rip),%xmm10 # 1350 <_sk_xor__ssse3_lowp+0xff> .byte 102,69,15,234,194 // pminsw %xmm10,%xmm8 .byte 102,69,15,239,219 // pxor %xmm11,%xmm11 .byte 102,69,15,111,232 // movdqa %xmm8,%xmm13 @@ -39383,7 +39255,7 @@ _sk_store_8888_ssse3_lowp: .byte 102,69,15,235,198 // por %xmm14,%xmm8 .byte 102,69,15,235,193 // por %xmm9,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,17 // jne 3c3 <_sk_store_8888_ssse3_lowp+0xe7> + .byte 117,17 // jne 38f <_sk_store_8888_ssse3_lowp+0xe7> .byte 243,69,15,127,4,147 // movdqu %xmm8,(%r11,%rdx,4) .byte 243,69,15,127,84,147,16 // movdqu %xmm10,0x10(%r11,%rdx,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39392,25 +39264,25 @@ _sk_store_8888_ssse3_lowp: .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,236 // ja 3bf <_sk_store_8888_ssse3_lowp+0xe3> + .byte 119,236 // ja 38b <_sk_store_8888_ssse3_lowp+0xe3> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,82,0,0,0 // lea 0x52(%rip),%r10 # 430 <_sk_store_8888_ssse3_lowp+0x154> + .byte 76,141,21,82,0,0,0 // lea 0x52(%rip),%r10 # 3fc <_sk_store_8888_ssse3_lowp+0x154> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 102,69,15,126,4,147 // movd %xmm8,(%r11,%rdx,4) - .byte 235,208 // jmp 3bf <_sk_store_8888_ssse3_lowp+0xe3> + .byte 235,208 // jmp 38b <_sk_store_8888_ssse3_lowp+0xe3> .byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9 .byte 102,69,15,126,76,147,8 // movd %xmm9,0x8(%r11,%rdx,4) .byte 102,69,15,214,4,147 // movq %xmm8,(%r11,%rdx,4) - .byte 235,187 // jmp 3bf <_sk_store_8888_ssse3_lowp+0xe3> + .byte 235,187 // jmp 38b <_sk_store_8888_ssse3_lowp+0xe3> .byte 102,69,15,112,202,78 // pshufd $0x4e,%xmm10,%xmm9 .byte 102,69,15,126,76,147,24 // movd %xmm9,0x18(%r11,%rdx,4) .byte 102,69,15,112,202,229 // pshufd $0xe5,%xmm10,%xmm9 .byte 102,69,15,126,76,147,20 // movd %xmm9,0x14(%r11,%rdx,4) .byte 102,69,15,126,84,147,16 // movd %xmm10,0x10(%r11,%rdx,4) .byte 243,69,15,127,4,147 // movdqu %xmm8,(%r11,%rdx,4) - .byte 235,146 // jmp 3bf <_sk_store_8888_ssse3_lowp+0xe3> + .byte 235,146 // jmp 38b <_sk_store_8888_ssse3_lowp+0xe3> .byte 15,31,0 // nopl (%rax) .byte 183,255 // mov $0xff,%bh .byte 255 // (bad) @@ -39440,11 +39312,11 @@ _sk_load_a8_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,37 // jne 47b <_sk_load_a8_ssse3_lowp+0x2f> + .byte 117,37 // jne 447 <_sk_load_a8_ssse3_lowp+0x2f> .byte 243,65,15,126,28,19 // movq (%r11,%rdx,1),%xmm3 .byte 102,15,96,216 // punpcklbw %xmm0,%xmm3 .byte 102,15,113,243,8 // psllw $0x8,%xmm3 - .byte 102,15,228,29,35,15,0,0 // pmulhuw 0xf23(%rip),%xmm3 # 1390 <_sk_xor__ssse3_lowp+0x10b> + .byte 102,15,228,29,39,15,0,0 // pmulhuw 0xf27(%rip),%xmm3 # 1360 <_sk_xor__ssse3_lowp+0x10f> .byte 72,173 // lods %ds:(%rsi),%rax .byte 102,15,87,192 // xorpd %xmm0,%xmm0 .byte 15,87,201 // xorps %xmm1,%xmm1 @@ -39455,15 +39327,15 @@ _sk_load_a8_ssse3_lowp: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,209 // ja 460 <_sk_load_a8_ssse3_lowp+0x14> + .byte 119,209 // ja 42c <_sk_load_a8_ssse3_lowp+0x14> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,110,0,0,0 // lea 0x6e(%rip),%r10 # 508 <_sk_load_a8_ssse3_lowp+0xbc> + .byte 76,141,21,110,0,0,0 // lea 0x6e(%rip),%r10 # 4d4 <_sk_load_a8_ssse3_lowp+0xbc> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 102,15,110,216 // movd %eax,%xmm3 - .byte 235,178 // jmp 460 <_sk_load_a8_ssse3_lowp+0x14> + .byte 235,178 // jmp 42c <_sk_load_a8_ssse3_lowp+0x14> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3 @@ -39471,7 +39343,7 @@ _sk_load_a8_ssse3_lowp: .byte 102,15,110,192 // movd %eax,%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 243,15,16,216 // movss %xmm0,%xmm3 - .byte 235,144 // jmp 460 <_sk_load_a8_ssse3_lowp+0x14> + .byte 235,144 // jmp 42c <_sk_load_a8_ssse3_lowp+0x14> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3 @@ -39482,7 +39354,7 @@ _sk_load_a8_ssse3_lowp: .byte 102,65,15,110,4,19 // movd (%r11,%rdx,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 242,15,16,216 // movsd %xmm0,%xmm3 - .byte 233,88,255,255,255 // jmpq 460 <_sk_load_a8_ssse3_lowp+0x14> + .byte 233,88,255,255,255 // jmpq 42c <_sk_load_a8_ssse3_lowp+0x14> .byte 155 // fwait .byte 255 // (bad) .byte 255 // (bad) @@ -39514,7 +39386,7 @@ _sk_store_a8_ssse3_lowp: .byte 102,65,15,113,208,7 // psrlw $0x7,%xmm8 .byte 102,69,15,103,192 // packuswb %xmm8,%xmm8 .byte 77,133,192 // test %r8,%r8 - .byte 117,10 // jne 548 <_sk_store_a8_ssse3_lowp+0x24> + .byte 117,10 // jne 514 <_sk_store_a8_ssse3_lowp+0x24> .byte 242,69,15,17,4,19 // movsd %xmm8,(%r11,%rdx,1) .byte 72,173 // lods %ds:(%rsi),%rax .byte 255,224 // jmpq *%rax @@ -39522,24 +39394,24 @@ _sk_store_a8_ssse3_lowp: .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,236 // ja 544 <_sk_store_a8_ssse3_lowp+0x20> + .byte 119,236 // ja 510 <_sk_store_a8_ssse3_lowp+0x20> .byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8 .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,136,0,0,0 // lea 0x88(%rip),%r10 # 5f0 <_sk_store_a8_ssse3_lowp+0xcc> + .byte 76,141,21,136,0,0,0 // lea 0x88(%rip),%r10 # 5bc <_sk_store_a8_ssse3_lowp+0xcc> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 102,68,15,127,68,36,168 // movdqa %xmm8,-0x58(%rsp) .byte 138,68,36,168 // mov -0x58(%rsp),%al .byte 65,136,4,19 // mov %al,(%r11,%rdx,1) - .byte 235,194 // jmp 544 <_sk_store_a8_ssse3_lowp+0x20> + .byte 235,194 // jmp 510 <_sk_store_a8_ssse3_lowp+0x20> .byte 102,68,15,127,68,36,184 // movdqa %xmm8,-0x48(%rsp) .byte 138,68,36,188 // mov -0x44(%rsp),%al .byte 65,136,68,19,2 // mov %al,0x2(%r11,%rdx,1) - .byte 102,68,15,56,0,5,20,14,0,0 // pshufb 0xe14(%rip),%xmm8 # 13b0 <_sk_xor__ssse3_lowp+0x12b> + .byte 102,68,15,56,0,5,24,14,0,0 // pshufb 0xe18(%rip),%xmm8 # 1380 <_sk_xor__ssse3_lowp+0x12f> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 102,65,137,4,19 // mov %ax,(%r11,%rdx,1) - .byte 235,156 // jmp 544 <_sk_store_a8_ssse3_lowp+0x20> + .byte 235,156 // jmp 510 <_sk_store_a8_ssse3_lowp+0x20> .byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp) .byte 138,68,36,244 // mov -0xc(%rsp),%al .byte 65,136,68,19,6 // mov %al,0x6(%r11,%rdx,1) @@ -39549,9 +39421,9 @@ _sk_store_a8_ssse3_lowp: .byte 102,68,15,127,68,36,200 // movdqa %xmm8,-0x38(%rsp) .byte 138,68,36,208 // mov -0x30(%rsp),%al .byte 65,136,68,19,4 // mov %al,0x4(%r11,%rdx,1) - .byte 102,68,15,56,0,5,190,13,0,0 // pshufb 0xdbe(%rip),%xmm8 # 13a0 <_sk_xor__ssse3_lowp+0x11b> + .byte 102,68,15,56,0,5,194,13,0,0 // pshufb 0xdc2(%rip),%xmm8 # 1370 <_sk_xor__ssse3_lowp+0x11f> .byte 102,69,15,126,4,19 // movd %xmm8,(%r11,%rdx,1) - .byte 233,87,255,255,255 // jmpq 544 <_sk_store_a8_ssse3_lowp+0x20> + .byte 233,87,255,255,255 // jmpq 510 <_sk_store_a8_ssse3_lowp+0x20> .byte 15,31,0 // nopl (%rax) .byte 129,255,255,255,162,255 // cmp $0xffa2ffff,%edi .byte 255 // (bad) @@ -39577,13 +39449,13 @@ _sk_load_g8_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,42 // jne 640 <_sk_load_g8_ssse3_lowp+0x34> + .byte 117,42 // jne 60c <_sk_load_g8_ssse3_lowp+0x34> .byte 243,65,15,126,4,19 // movq (%r11,%rdx,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,113,240,8 // psllw $0x8,%xmm0 - .byte 102,15,228,5,147,13,0,0 // pmulhuw 0xd93(%rip),%xmm0 # 13c0 <_sk_xor__ssse3_lowp+0x13b> + .byte 102,15,228,5,151,13,0,0 // pmulhuw 0xd97(%rip),%xmm0 # 1390 <_sk_xor__ssse3_lowp+0x13f> .byte 72,173 // lods %ds:(%rsi),%rax - .byte 15,40,29,154,13,0,0 // movaps 0xd9a(%rip),%xmm3 # 13d0 <_sk_xor__ssse3_lowp+0x14b> + .byte 15,40,29,158,13,0,0 // movaps 0xd9e(%rip),%xmm3 # 13a0 <_sk_xor__ssse3_lowp+0x14f> .byte 102,15,111,200 // movdqa %xmm0,%xmm1 .byte 102,15,111,208 // movdqa %xmm0,%xmm2 .byte 255,224 // jmpq *%rax @@ -39592,15 +39464,15 @@ _sk_load_g8_ssse3_lowp: .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,204 // ja 620 <_sk_load_g8_ssse3_lowp+0x14> + .byte 119,204 // ja 5ec <_sk_load_g8_ssse3_lowp+0x14> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 6d0 <_sk_load_g8_ssse3_lowp+0xc4> + .byte 76,141,21,113,0,0,0 // lea 0x71(%rip),%r10 # 69c <_sk_load_g8_ssse3_lowp+0xc4> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 102,15,110,192 // movd %eax,%xmm0 - .byte 235,173 // jmp 620 <_sk_load_g8_ssse3_lowp+0x14> + .byte 235,173 // jmp 5ec <_sk_load_g8_ssse3_lowp+0x14> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0 @@ -39608,7 +39480,7 @@ _sk_load_g8_ssse3_lowp: .byte 102,15,110,200 // movd %eax,%xmm1 .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 243,15,16,193 // movss %xmm1,%xmm0 - .byte 235,139 // jmp 620 <_sk_load_g8_ssse3_lowp+0x14> + .byte 235,139 // jmp 5ec <_sk_load_g8_ssse3_lowp+0x14> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0 @@ -39619,7 +39491,7 @@ _sk_load_g8_ssse3_lowp: .byte 102,65,15,110,12,19 // movd (%r11,%rdx,1),%xmm1 .byte 102,15,96,200 // punpcklbw %xmm0,%xmm1 .byte 242,15,16,193 // movsd %xmm1,%xmm0 - .byte 233,83,255,255,255 // jmpq 620 <_sk_load_g8_ssse3_lowp+0x14> + .byte 233,83,255,255,255 // jmpq 5ec <_sk_load_g8_ssse3_lowp+0x14> .byte 15,31,0 // nopl (%rax) .byte 152 // cwtl .byte 255 // (bad) @@ -39650,20 +39522,20 @@ _sk_srcover_rgba_8888_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,11,2,0,0 // jne 90a <_sk_srcover_rgba_8888_ssse3_lowp+0x21e> + .byte 15,133,11,2,0,0 // jne 8d6 <_sk_srcover_rgba_8888_ssse3_lowp+0x21e> .byte 69,15,16,68,147,16 // movups 0x10(%r11,%rdx,4),%xmm8 .byte 102,65,15,16,60,147 // movupd (%r11,%rdx,4),%xmm7 - .byte 102,15,111,45,205,12,0,0 // movdqa 0xccd(%rip),%xmm5 # 13e0 <_sk_xor__ssse3_lowp+0x15b> + .byte 102,15,111,45,209,12,0,0 // movdqa 0xcd1(%rip),%xmm5 # 13b0 <_sk_xor__ssse3_lowp+0x15f> .byte 102,15,40,231 // movapd %xmm7,%xmm4 .byte 102,15,56,0,229 // pshufb %xmm5,%xmm4 .byte 102,65,15,111,240 // movdqa %xmm8,%xmm6 .byte 102,15,56,0,245 // pshufb %xmm5,%xmm6 .byte 102,15,108,230 // punpcklqdq %xmm6,%xmm4 - .byte 102,15,111,13,190,12,0,0 // movdqa 0xcbe(%rip),%xmm1 # 13f0 <_sk_xor__ssse3_lowp+0x16b> + .byte 102,15,111,13,194,12,0,0 // movdqa 0xcc2(%rip),%xmm1 # 13c0 <_sk_xor__ssse3_lowp+0x16f> .byte 102,15,113,244,8 // psllw $0x8,%xmm4 - .byte 102,68,15,111,13,192,12,0,0 // movdqa 0xcc0(%rip),%xmm9 # 1400 <_sk_xor__ssse3_lowp+0x17b> + .byte 102,68,15,111,13,196,12,0,0 // movdqa 0xcc4(%rip),%xmm9 # 13d0 <_sk_xor__ssse3_lowp+0x17f> .byte 102,65,15,228,225 // pmulhuw %xmm9,%xmm4 - .byte 102,68,15,111,21,194,12,0,0 // movdqa 0xcc2(%rip),%xmm10 # 1410 <_sk_xor__ssse3_lowp+0x18b> + .byte 102,68,15,111,21,198,12,0,0 // movdqa 0xcc6(%rip),%xmm10 # 13e0 <_sk_xor__ssse3_lowp+0x18f> .byte 102,15,40,239 // movapd %xmm7,%xmm5 .byte 102,65,15,56,0,234 // pshufb %xmm10,%xmm5 .byte 102,65,15,111,240 // movdqa %xmm8,%xmm6 @@ -39671,7 +39543,7 @@ _sk_srcover_rgba_8888_ssse3_lowp: .byte 102,15,108,238 // punpcklqdq %xmm6,%xmm5 .byte 102,15,113,245,8 // psllw $0x8,%xmm5 .byte 102,65,15,228,233 // pmulhuw %xmm9,%xmm5 - .byte 102,68,15,111,21,166,12,0,0 // movdqa 0xca6(%rip),%xmm10 # 1420 <_sk_xor__ssse3_lowp+0x19b> + .byte 102,68,15,111,21,170,12,0,0 // movdqa 0xcaa(%rip),%xmm10 # 13f0 <_sk_xor__ssse3_lowp+0x19f> .byte 102,15,40,247 // movapd %xmm7,%xmm6 .byte 102,65,15,56,0,242 // pshufb %xmm10,%xmm6 .byte 102,69,15,111,216 // movdqa %xmm8,%xmm11 @@ -39679,13 +39551,13 @@ _sk_srcover_rgba_8888_ssse3_lowp: .byte 102,65,15,108,243 // punpcklqdq %xmm11,%xmm6 .byte 102,15,113,246,8 // psllw $0x8,%xmm6 .byte 102,65,15,228,241 // pmulhuw %xmm9,%xmm6 - .byte 102,68,15,111,21,137,12,0,0 // movdqa 0xc89(%rip),%xmm10 # 1430 <_sk_xor__ssse3_lowp+0x1ab> + .byte 102,68,15,111,21,141,12,0,0 // movdqa 0xc8d(%rip),%xmm10 # 1400 <_sk_xor__ssse3_lowp+0x1af> .byte 102,65,15,56,0,250 // pshufb %xmm10,%xmm7 .byte 102,69,15,56,0,194 // pshufb %xmm10,%xmm8 .byte 102,65,15,108,248 // punpcklqdq %xmm8,%xmm7 .byte 102,15,113,247,8 // psllw $0x8,%xmm7 .byte 102,65,15,228,249 // pmulhuw %xmm9,%xmm7 - .byte 102,68,15,111,29,117,12,0,0 // movdqa 0xc75(%rip),%xmm11 # 1440 <_sk_xor__ssse3_lowp+0x1bb> + .byte 102,68,15,111,29,121,12,0,0 // movdqa 0xc79(%rip),%xmm11 # 1410 <_sk_xor__ssse3_lowp+0x1bf> .byte 102,68,15,249,219 // psubw %xmm3,%xmm11 .byte 102,68,15,111,196 // movdqa %xmm4,%xmm8 .byte 102,69,15,56,11,195 // pmulhrsw %xmm11,%xmm8 @@ -39741,7 +39613,7 @@ _sk_srcover_rgba_8888_ssse3_lowp: .byte 102,65,15,235,192 // por %xmm8,%xmm0 .byte 102,15,235,194 // por %xmm2,%xmm0 .byte 77,133,192 // test %r8,%r8 - .byte 117,97 // jne 946 <_sk_srcover_rgba_8888_ssse3_lowp+0x25a> + .byte 117,97 // jne 912 <_sk_srcover_rgba_8888_ssse3_lowp+0x25a> .byte 243,65,15,127,4,147 // movdqu %xmm0,(%r11,%rdx,4) .byte 243,65,15,127,76,147,16 // movdqu %xmm1,0x10(%r11,%rdx,4) .byte 72,173 // lods %ds:(%rsi),%rax @@ -39756,30 +39628,30 @@ _sk_srcover_rgba_8888_ssse3_lowp: .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,228,253,255,255 // ja 70b <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> + .byte 15,135,228,253,255,255 // ja 6d7 <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,206,0,0,0 // lea 0xce(%rip),%r10 # a00 <_sk_srcover_rgba_8888_ssse3_lowp+0x314> + .byte 76,141,21,206,0,0,0 // lea 0xce(%rip),%r10 # 9cc <_sk_srcover_rgba_8888_ssse3_lowp+0x314> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 243,65,15,16,60,147 // movss (%r11,%rdx,4),%xmm7 - .byte 233,197,253,255,255 // jmpq 70b <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> + .byte 233,197,253,255,255 // jmpq 6d7 <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> .byte 69,137,193 // mov %r8d,%r9d .byte 65,128,225,7 // and $0x7,%r9b .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,156 // ja 8f2 <_sk_srcover_rgba_8888_ssse3_lowp+0x206> + .byte 119,156 // ja 8be <_sk_srcover_rgba_8888_ssse3_lowp+0x206> .byte 65,15,182,193 // movzbl %r9b,%eax - .byte 76,141,13,187,0,0,0 // lea 0xbb(%rip),%r9 # a1c <_sk_srcover_rgba_8888_ssse3_lowp+0x330> + .byte 76,141,13,187,0,0,0 // lea 0xbb(%rip),%r9 # 9e8 <_sk_srcover_rgba_8888_ssse3_lowp+0x330> .byte 73,99,4,129 // movslq (%r9,%rax,4),%rax .byte 76,1,200 // add %r9,%rax .byte 255,224 // jmpq *%rax .byte 102,65,15,126,4,147 // movd %xmm0,(%r11,%rdx,4) - .byte 235,128 // jmp 8f2 <_sk_srcover_rgba_8888_ssse3_lowp+0x206> + .byte 235,128 // jmp 8be <_sk_srcover_rgba_8888_ssse3_lowp+0x206> .byte 102,65,15,110,100,147,8 // movd 0x8(%r11,%rdx,4),%xmm4 .byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7 .byte 102,65,15,18,60,147 // movlpd (%r11,%rdx,4),%xmm7 - .byte 233,130,253,255,255 // jmpq 70b <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> + .byte 233,130,253,255,255 // jmpq 6d7 <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> .byte 102,65,15,110,100,147,24 // movd 0x18(%r11,%rdx,4),%xmm4 .byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8 .byte 243,65,15,16,100,147,20 // movss 0x14(%r11,%rdx,4),%xmm4 @@ -39788,27 +39660,27 @@ _sk_srcover_rgba_8888_ssse3_lowp: .byte 68,15,40,196 // movaps %xmm4,%xmm8 .byte 243,65,15,16,100,147,16 // movss 0x10(%r11,%rdx,4),%xmm4 .byte 243,68,15,16,196 // movss %xmm4,%xmm8 - .byte 233,73,253,255,255 // jmpq 705 <_sk_srcover_rgba_8888_ssse3_lowp+0x19> + .byte 233,73,253,255,255 // jmpq 6d1 <_sk_srcover_rgba_8888_ssse3_lowp+0x19> .byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1 .byte 102,65,15,126,76,147,8 // movd %xmm1,0x8(%r11,%rdx,4) .byte 102,65,15,214,4,147 // movq %xmm0,(%r11,%rdx,4) - .byte 233,31,255,255,255 // jmpq 8f2 <_sk_srcover_rgba_8888_ssse3_lowp+0x206> + .byte 233,31,255,255,255 // jmpq 8be <_sk_srcover_rgba_8888_ssse3_lowp+0x206> .byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2 .byte 102,65,15,126,84,147,24 // movd %xmm2,0x18(%r11,%rdx,4) .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2 .byte 102,65,15,126,84,147,20 // movd %xmm2,0x14(%r11,%rdx,4) .byte 102,65,15,126,76,147,16 // movd %xmm1,0x10(%r11,%rdx,4) .byte 243,65,15,127,4,147 // movdqu %xmm0,(%r11,%rdx,4) - .byte 233,245,254,255,255 // jmpq 8f2 <_sk_srcover_rgba_8888_ssse3_lowp+0x206> + .byte 233,245,254,255,255 // jmpq 8be <_sk_srcover_rgba_8888_ssse3_lowp+0x206> .byte 15,31,0 // nopl (%rax) .byte 59,255 // cmp %edi,%edi .byte 255 // (bad) .byte 255 // (bad) - .byte 126,255 // jle a05 <_sk_srcover_rgba_8888_ssse3_lowp+0x319> + .byte 126,255 // jle 9d1 <_sk_srcover_rgba_8888_ssse3_lowp+0x319> .byte 255 // (bad) .byte 255,114,255 // pushq -0x1(%rdx) .byte 255 // (bad) - .byte 255,5,253,255,255,171 // incl -0x54000003(%rip) # ffffffffac000a0e <_sk_xor__ssse3_lowp+0xffffffffabfff789> + .byte 255,5,253,255,255,171 // incl -0x54000003(%rip) # ffffffffac0009da <_sk_xor__ssse3_lowp+0xffffffffabfff789> .byte 255 // (bad) .byte 255 // (bad) .byte 255,150,255,255,255,137 // callq *-0x76000001(%rsi) @@ -39838,7 +39710,7 @@ FUNCTION(_sk_scale_1_float_ssse3_lowp) _sk_scale_1_float_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 243,68,15,16,0 // movss (%rax),%xmm8 - .byte 243,68,15,88,5,220,10,0,0 // addss 0xadc(%rip),%xmm8 # 1524 <_sk_xor__ssse3_lowp+0x29f> + .byte 243,68,15,88,5,224,10,0,0 // addss 0xae0(%rip),%xmm8 # 14f4 <_sk_xor__ssse3_lowp+0x2a3> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 242,69,15,112,192,0 // pshuflw $0x0,%xmm8,%xmm8 @@ -39861,11 +39733,11 @@ _sk_scale_u8_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 117,74 // jne ae2 <_sk_scale_u8_ssse3_lowp+0x54> + .byte 117,74 // jne aae <_sk_scale_u8_ssse3_lowp+0x54> .byte 243,69,15,126,4,19 // movq (%r11,%rdx,1),%xmm8 .byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8 .byte 102,65,15,113,240,8 // psllw $0x8,%xmm8 - .byte 102,68,15,228,5,158,9,0,0 // pmulhuw 0x99e(%rip),%xmm8 # 1450 <_sk_xor__ssse3_lowp+0x1cb> + .byte 102,68,15,228,5,162,9,0,0 // pmulhuw 0x9a2(%rip),%xmm8 # 1420 <_sk_xor__ssse3_lowp+0x1cf> .byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0 .byte 102,15,56,29,192 // pabsw %xmm0,%xmm0 .byte 102,65,15,56,11,200 // pmulhrsw %xmm8,%xmm1 @@ -39881,15 +39753,15 @@ _sk_scale_u8_ssse3_lowp: .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 119,172 // ja aa3 <_sk_scale_u8_ssse3_lowp+0x15> + .byte 119,172 // ja a6f <_sk_scale_u8_ssse3_lowp+0x15> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,126,0,0,0 // lea 0x7e(%rip),%r10 # b80 <_sk_scale_u8_ssse3_lowp+0xf2> + .byte 76,141,21,126,0,0,0 // lea 0x7e(%rip),%r10 # b4c <_sk_scale_u8_ssse3_lowp+0xf2> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 235,140 // jmp aa3 <_sk_scale_u8_ssse3_lowp+0x15> + .byte 235,140 // jmp a6f <_sk_scale_u8_ssse3_lowp+0x15> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,68,15,196,192,2 // pinsrw $0x2,%eax,%xmm8 @@ -39897,7 +39769,7 @@ _sk_scale_u8_ssse3_lowp: .byte 102,68,15,110,200 // movd %eax,%xmm9 .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9 .byte 243,69,15,16,193 // movss %xmm9,%xmm8 - .byte 233,98,255,255,255 // jmpq aa3 <_sk_scale_u8_ssse3_lowp+0x15> + .byte 233,98,255,255,255 // jmpq a6f <_sk_scale_u8_ssse3_lowp+0x15> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,68,15,196,192,6 // pinsrw $0x6,%eax,%xmm8 @@ -39908,7 +39780,7 @@ _sk_scale_u8_ssse3_lowp: .byte 102,69,15,110,12,19 // movd (%r11,%rdx,1),%xmm9 .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9 .byte 242,69,15,16,193 // movsd %xmm9,%xmm8 - .byte 233,36,255,255,255 // jmpq aa3 <_sk_scale_u8_ssse3_lowp+0x15> + .byte 233,36,255,255,255 // jmpq a6f <_sk_scale_u8_ssse3_lowp+0x15> .byte 144 // nop .byte 139,255 // mov %edi,%edi .byte 255 // (bad) @@ -39936,14 +39808,14 @@ FUNCTION(_sk_lerp_1_float_ssse3_lowp) _sk_lerp_1_float_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 243,68,15,16,0 // movss (%rax),%xmm8 - .byte 243,68,15,88,5,124,9,0,0 // addss 0x97c(%rip),%xmm8 # 1528 <_sk_xor__ssse3_lowp+0x2a3> + .byte 243,68,15,88,5,128,9,0,0 // addss 0x980(%rip),%xmm8 # 14f8 <_sk_xor__ssse3_lowp+0x2a7> .byte 102,68,15,126,192 // movd %xmm8,%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 .byte 242,69,15,112,192,0 // pshuflw $0x0,%xmm8,%xmm8 .byte 102,69,15,112,192,80 // pshufd $0x50,%xmm8,%xmm8 .byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0 .byte 102,68,15,56,29,200 // pabsw %xmm0,%xmm9 - .byte 102,68,15,111,21,137,8,0,0 // movdqa 0x889(%rip),%xmm10 # 1460 <_sk_xor__ssse3_lowp+0x1db> + .byte 102,68,15,111,21,141,8,0,0 // movdqa 0x88d(%rip),%xmm10 # 1430 <_sk_xor__ssse3_lowp+0x1df> .byte 102,69,15,249,208 // psubw %xmm8,%xmm10 .byte 102,15,111,196 // movdqa %xmm4,%xmm0 .byte 102,65,15,56,11,194 // pmulhrsw %xmm10,%xmm0 @@ -39976,14 +39848,14 @@ _sk_lerp_u8_ssse3_lowp: .byte 72,173 // lods %ds:(%rsi),%rax .byte 76,139,24 // mov (%rax),%r11 .byte 77,133,192 // test %r8,%r8 - .byte 15,133,169,0,0,0 // jne d08 <_sk_lerp_u8_ssse3_lowp+0xb7> + .byte 15,133,169,0,0,0 // jne cd4 <_sk_lerp_u8_ssse3_lowp+0xb7> .byte 243,69,15,126,4,19 // movq (%r11,%rdx,1),%xmm8 .byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8 .byte 102,65,15,113,240,8 // psllw $0x8,%xmm8 - .byte 102,68,15,228,5,247,7,0,0 // pmulhuw 0x7f7(%rip),%xmm8 # 1470 <_sk_xor__ssse3_lowp+0x1eb> + .byte 102,68,15,228,5,251,7,0,0 // pmulhuw 0x7fb(%rip),%xmm8 # 1440 <_sk_xor__ssse3_lowp+0x1ef> .byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0 .byte 102,68,15,56,29,200 // pabsw %xmm0,%xmm9 - .byte 102,68,15,111,21,242,7,0,0 // movdqa 0x7f2(%rip),%xmm10 # 1480 <_sk_xor__ssse3_lowp+0x1fb> + .byte 102,68,15,111,21,246,7,0,0 // movdqa 0x7f6(%rip),%xmm10 # 1450 <_sk_xor__ssse3_lowp+0x1ff> .byte 102,69,15,249,208 // psubw %xmm8,%xmm10 .byte 102,15,111,196 // movdqa %xmm4,%xmm0 .byte 102,65,15,56,11,194 // pmulhrsw %xmm10,%xmm0 @@ -40013,15 +39885,15 @@ _sk_lerp_u8_ssse3_lowp: .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 65,254,201 // dec %r9b .byte 65,128,249,6 // cmp $0x6,%r9b - .byte 15,135,73,255,255,255 // ja c6a <_sk_lerp_u8_ssse3_lowp+0x19> + .byte 15,135,73,255,255,255 // ja c36 <_sk_lerp_u8_ssse3_lowp+0x19> .byte 69,15,182,201 // movzbl %r9b,%r9d - .byte 76,141,21,128,0,0,0 // lea 0x80(%rip),%r10 # dac <_sk_lerp_u8_ssse3_lowp+0x15b> + .byte 76,141,21,128,0,0,0 // lea 0x80(%rip),%r10 # d78 <_sk_lerp_u8_ssse3_lowp+0x15b> .byte 75,99,4,138 // movslq (%r10,%r9,4),%rax .byte 76,1,208 // add %r10,%rax .byte 255,224 // jmpq *%rax .byte 65,15,182,4,19 // movzbl (%r11,%rdx,1),%eax .byte 102,68,15,110,192 // movd %eax,%xmm8 - .byte 233,38,255,255,255 // jmpq c6a <_sk_lerp_u8_ssse3_lowp+0x19> + .byte 233,38,255,255,255 // jmpq c36 <_sk_lerp_u8_ssse3_lowp+0x19> .byte 65,15,182,68,19,2 // movzbl 0x2(%r11,%rdx,1),%eax .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,68,15,196,192,2 // pinsrw $0x2,%eax,%xmm8 @@ -40029,7 +39901,7 @@ _sk_lerp_u8_ssse3_lowp: .byte 102,68,15,110,200 // movd %eax,%xmm9 .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9 .byte 243,69,15,16,193 // movss %xmm9,%xmm8 - .byte 233,252,254,255,255 // jmpq c6a <_sk_lerp_u8_ssse3_lowp+0x19> + .byte 233,252,254,255,255 // jmpq c36 <_sk_lerp_u8_ssse3_lowp+0x19> .byte 65,15,182,68,19,6 // movzbl 0x6(%r11,%rdx,1),%eax .byte 102,69,15,239,192 // pxor %xmm8,%xmm8 .byte 102,68,15,196,192,6 // pinsrw $0x6,%eax,%xmm8 @@ -40040,14 +39912,14 @@ _sk_lerp_u8_ssse3_lowp: .byte 102,69,15,110,12,19 // movd (%r11,%rdx,1),%xmm9 .byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9 .byte 242,69,15,16,193 // movsd %xmm9,%xmm8 - .byte 233,190,254,255,255 // jmpq c6a <_sk_lerp_u8_ssse3_lowp+0x19> + .byte 233,190,254,255,255 // jmpq c36 <_sk_lerp_u8_ssse3_lowp+0x19> .byte 137,255 // mov %edi,%edi .byte 255 // (bad) .byte 255,169,255,255,255,152 // ljmp *-0x67000001(%rcx) .byte 255 // (bad) .byte 255 // (bad) .byte 255 // (bad) - .byte 235,255 // jmp db9 <_sk_lerp_u8_ssse3_lowp+0x168> + .byte 235,255 // jmp d85 <_sk_lerp_u8_ssse3_lowp+0x168> .byte 255 // (bad) .byte 255 // (bad) .byte 223,255 // (bad) @@ -40128,7 +40000,7 @@ FUNCTION(_sk_srcatop_ssse3_lowp) _sk_srcatop_ssse3_lowp: .byte 102,15,56,11,199 // pmulhrsw %xmm7,%xmm0 .byte 102,68,15,56,29,192 // pabsw %xmm0,%xmm8 - .byte 102,68,15,111,13,69,6,0,0 // movdqa 0x645(%rip),%xmm9 # 1490 <_sk_xor__ssse3_lowp+0x20b> + .byte 102,68,15,111,13,73,6,0,0 // movdqa 0x649(%rip),%xmm9 # 1460 <_sk_xor__ssse3_lowp+0x20f> .byte 102,68,15,249,203 // psubw %xmm3,%xmm9 .byte 102,15,111,196 // movdqa %xmm4,%xmm0 .byte 102,65,15,56,11,193 // pmulhrsw %xmm9,%xmm0 @@ -40161,7 +40033,7 @@ _sk_dstatop_ssse3_lowp: .byte 102,68,15,111,196 // movdqa %xmm4,%xmm8 .byte 102,68,15,56,11,195 // pmulhrsw %xmm3,%xmm8 .byte 102,69,15,56,29,192 // pabsw %xmm8,%xmm8 - .byte 102,68,15,111,13,196,5,0,0 // movdqa 0x5c4(%rip),%xmm9 # 14a0 <_sk_xor__ssse3_lowp+0x21b> + .byte 102,68,15,111,13,200,5,0,0 // movdqa 0x5c8(%rip),%xmm9 # 1470 <_sk_xor__ssse3_lowp+0x21f> .byte 102,68,15,249,207 // psubw %xmm7,%xmm9 .byte 102,65,15,56,11,193 // pmulhrsw %xmm9,%xmm0 .byte 102,15,56,29,192 // pabsw %xmm0,%xmm0 @@ -40224,7 +40096,7 @@ HIDDEN _sk_srcout_ssse3_lowp .globl _sk_srcout_ssse3_lowp FUNCTION(_sk_srcout_ssse3_lowp) _sk_srcout_ssse3_lowp: - .byte 102,68,15,111,5,234,4,0,0 // movdqa 0x4ea(%rip),%xmm8 # 14b0 <_sk_xor__ssse3_lowp+0x22b> + .byte 102,68,15,111,5,238,4,0,0 // movdqa 0x4ee(%rip),%xmm8 # 1480 <_sk_xor__ssse3_lowp+0x22f> .byte 102,68,15,249,199 // psubw %xmm7,%xmm8 .byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0 .byte 102,15,56,29,192 // pabsw %xmm0,%xmm0 @@ -40241,7 +40113,7 @@ HIDDEN _sk_dstout_ssse3_lowp .globl _sk_dstout_ssse3_lowp FUNCTION(_sk_dstout_ssse3_lowp) _sk_dstout_ssse3_lowp: - .byte 102,68,15,111,5,187,4,0,0 // movdqa 0x4bb(%rip),%xmm8 # 14c0 <_sk_xor__ssse3_lowp+0x23b> + .byte 102,68,15,111,5,191,4,0,0 // movdqa 0x4bf(%rip),%xmm8 # 1490 <_sk_xor__ssse3_lowp+0x23f> .byte 102,68,15,249,195 // psubw %xmm3,%xmm8 .byte 102,15,111,196 // movdqa %xmm4,%xmm0 .byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0 @@ -40261,7 +40133,7 @@ HIDDEN _sk_srcover_ssse3_lowp .globl _sk_srcover_ssse3_lowp FUNCTION(_sk_srcover_ssse3_lowp) _sk_srcover_ssse3_lowp: - .byte 102,68,15,111,5,128,4,0,0 // movdqa 0x480(%rip),%xmm8 # 14d0 <_sk_xor__ssse3_lowp+0x24b> + .byte 102,68,15,111,5,132,4,0,0 // movdqa 0x484(%rip),%xmm8 # 14a0 <_sk_xor__ssse3_lowp+0x24f> .byte 102,68,15,249,195 // psubw %xmm3,%xmm8 .byte 102,68,15,111,204 // movdqa %xmm4,%xmm9 .byte 102,69,15,56,11,200 // pmulhrsw %xmm8,%xmm9 @@ -40285,7 +40157,7 @@ HIDDEN _sk_dstover_ssse3_lowp .globl _sk_dstover_ssse3_lowp FUNCTION(_sk_dstover_ssse3_lowp) _sk_dstover_ssse3_lowp: - .byte 102,68,15,111,5,43,4,0,0 // movdqa 0x42b(%rip),%xmm8 # 14e0 <_sk_xor__ssse3_lowp+0x25b> + .byte 102,68,15,111,5,47,4,0,0 // movdqa 0x42f(%rip),%xmm8 # 14b0 <_sk_xor__ssse3_lowp+0x25f> .byte 102,68,15,249,199 // psubw %xmm7,%xmm8 .byte 102,65,15,56,11,192 // pmulhrsw %xmm8,%xmm0 .byte 102,15,56,29,192 // pabsw %xmm0,%xmm0 @@ -40321,7 +40193,7 @@ HIDDEN _sk_multiply_ssse3_lowp .globl _sk_multiply_ssse3_lowp FUNCTION(_sk_multiply_ssse3_lowp) _sk_multiply_ssse3_lowp: - .byte 102,68,15,111,5,192,3,0,0 // movdqa 0x3c0(%rip),%xmm8 # 14f0 <_sk_xor__ssse3_lowp+0x26b> + .byte 102,68,15,111,5,196,3,0,0 // movdqa 0x3c4(%rip),%xmm8 # 14c0 <_sk_xor__ssse3_lowp+0x26f> .byte 102,69,15,111,200 // movdqa %xmm8,%xmm9 .byte 102,68,15,249,207 // psubw %xmm7,%xmm9 .byte 102,68,15,111,208 // movdqa %xmm0,%xmm10 @@ -40370,7 +40242,7 @@ HIDDEN _sk_screen_ssse3_lowp .globl _sk_screen_ssse3_lowp FUNCTION(_sk_screen_ssse3_lowp) _sk_screen_ssse3_lowp: - .byte 102,68,15,111,5,230,2,0,0 // movdqa 0x2e6(%rip),%xmm8 # 1500 <_sk_xor__ssse3_lowp+0x27b> + .byte 102,68,15,111,5,234,2,0,0 // movdqa 0x2ea(%rip),%xmm8 # 14d0 <_sk_xor__ssse3_lowp+0x27f> .byte 102,69,15,111,200 // movdqa %xmm8,%xmm9 .byte 102,68,15,249,200 // psubw %xmm0,%xmm9 .byte 102,68,15,56,11,204 // pmulhrsw %xmm4,%xmm9 @@ -40397,7 +40269,7 @@ HIDDEN _sk_xor__ssse3_lowp .globl _sk_xor__ssse3_lowp FUNCTION(_sk_xor__ssse3_lowp) _sk_xor__ssse3_lowp: - .byte 102,68,15,111,5,130,2,0,0 // movdqa 0x282(%rip),%xmm8 # 1510 <_sk_xor__ssse3_lowp+0x28b> + .byte 102,68,15,111,5,134,2,0,0 // movdqa 0x286(%rip),%xmm8 # 14e0 <_sk_xor__ssse3_lowp+0x28f> .byte 102,69,15,111,200 // movdqa %xmm8,%xmm9 .byte 102,68,15,249,207 // psubw %xmm7,%xmm9 .byte 102,65,15,56,11,193 // pmulhrsw %xmm9,%xmm0 @@ -40440,7 +40312,7 @@ BALIGN16 .byte 12,13 // or $0xd,%al .byte 12,13 // or $0xd,%al .byte 14 // (bad) - .byte 15,129,128,129,128,129 // jno ffffffff818094c5 <_sk_xor__ssse3_lowp+0xffffffff81808240> + .byte 15,129,128,129,128,129 // jno ffffffff81809495 <_sk_xor__ssse3_lowp+0xffffffff81808244> .byte 128,129,128,129,128,129,128 // addb $0x80,-0x7e7f7e80(%rcx) .byte 129,128,129,128,1,2,5,6,9,10 // addl $0xa090605,0x2018081(%rax) .byte 13,14,9,10,13 // or $0xd0a090e,%eax @@ -40586,7 +40458,7 @@ _sk_start_pipeline_sse2: .byte 83 // push %ebx .byte 87 // push %edi .byte 86 // push %esi - .byte 131,236,108 // sub $0x6c,%esp + .byte 131,236,12 // sub $0xc,%esp .byte 139,125,16 // mov 0x10(%ebp),%edi .byte 139,117,8 // mov 0x8(%ebp),%esi .byte 139,85,20 // mov 0x14(%ebp),%edx @@ -40597,22 +40469,13 @@ _sk_start_pipeline_sse2: .byte 139,93,24 // mov 0x18(%ebp),%ebx .byte 118,4 // jbe 25 <_sk_start_pipeline_sse2+0x25> .byte 137,240 // mov %esi,%eax - .byte 235,89 // jmp 7e <_sk_start_pipeline_sse2+0x7e> - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp) - .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp) - .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp) - .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp) - .byte 139,69,12 // mov 0xc(%ebp),%eax - .byte 137,68,36,12 // mov %eax,0xc(%esp) - .byte 137,116,36,8 // mov %esi,0x8(%esp) - .byte 137,84,36,4 // mov %edx,0x4(%esp) - .byte 137,28,36 // mov %ebx,(%esp) - .byte 199,68,36,16,0,0,0,0 // movl $0x0,0x10(%esp) - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,87,201 // xorps %xmm1,%xmm1 - .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 15,87,219 // xorps %xmm3,%xmm3 + .byte 235,42 // jmp 4f <_sk_start_pipeline_sse2+0x4f> + .byte 131,236,76 // sub $0x4c,%esp + .byte 106,0 // push $0x0 + .byte 255,117,12 // pushl 0xc(%ebp) + .byte 86 // push %esi + .byte 82 // push %edx + .byte 83 // push %ebx .byte 137,207 // mov %ecx,%edi .byte 137,211 // mov %edx,%ebx .byte 255,215 // call *%edi @@ -40620,30 +40483,25 @@ _sk_start_pipeline_sse2: .byte 139,93,24 // mov 0x18(%ebp),%ebx .byte 137,249 // mov %edi,%ecx .byte 139,125,16 // mov 0x10(%ebp),%edi + .byte 131,196,96 // add $0x60,%esp .byte 141,70,4 // lea 0x4(%esi),%eax .byte 131,198,8 // add $0x8,%esi .byte 57,254 // cmp %edi,%esi .byte 137,198 // mov %eax,%esi - .byte 118,167 // jbe 25 <_sk_start_pipeline_sse2+0x25> + .byte 118,214 // jbe 25 <_sk_start_pipeline_sse2+0x25> .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 41,199 // sub %eax,%edi - .byte 116,56 // je bd <_sk_start_pipeline_sse2+0xbd> - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp) - .byte 15,41,68,36,64 // movaps %xmm0,0x40(%esp) - .byte 15,41,68,36,48 // movaps %xmm0,0x30(%esp) - .byte 15,41,68,36,32 // movaps %xmm0,0x20(%esp) - .byte 137,124,36,16 // mov %edi,0x10(%esp) - .byte 137,116,36,12 // mov %esi,0xc(%esp) - .byte 137,68,36,8 // mov %eax,0x8(%esp) - .byte 137,84,36,4 // mov %edx,0x4(%esp) - .byte 137,28,36 // mov %ebx,(%esp) - .byte 15,87,192 // xorps %xmm0,%xmm0 - .byte 15,87,201 // xorps %xmm1,%xmm1 - .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 15,87,219 // xorps %xmm3,%xmm3 + .byte 116,15 // je 65 <_sk_start_pipeline_sse2+0x65> + .byte 131,236,76 // sub $0x4c,%esp + .byte 87 // push %edi + .byte 86 // push %esi + .byte 80 // push %eax + .byte 82 // push %edx + .byte 83 // push %ebx .byte 255,209 // call *%ecx .byte 131,196,108 // add $0x6c,%esp + .byte 235,3 // jmp 68 <_sk_start_pipeline_sse2+0x68> + .byte 131,196,12 // add $0xc,%esp .byte 94 // pop %esi .byte 95 // pop %edi .byte 91 // pop %ebx @@ -40666,7 +40524,7 @@ _sk_seed_shader_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call d4 <_sk_seed_shader_sse2+0xe> + .byte 232,0,0,0,0 // call 7c <_sk_seed_shader_sse2+0xe> .byte 89 // pop %ecx .byte 139,85,20 // mov 0x14(%ebp),%edx .byte 139,69,8 // mov 0x8(%ebp),%eax @@ -40674,7 +40532,7 @@ _sk_seed_shader_sse2: .byte 102,15,110,199 // movd %edi,%xmm0 .byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0 .byte 15,91,200 // cvtdq2ps %xmm0,%xmm1 - .byte 15,40,145,140,126,0,0 // movaps 0x7e8c(%ecx),%xmm2 + .byte 15,40,145,148,126,0,0 // movaps 0x7e94(%ecx),%xmm2 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,16,0 // movups (%eax),%xmm0 .byte 15,88,193 // addps %xmm1,%xmm0 @@ -40696,7 +40554,7 @@ _sk_seed_shader_sse2: .byte 137,68,36,4 // mov %eax,0x4(%esp) .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 137,4,36 // mov %eax,(%esp) - .byte 15,40,145,156,126,0,0 // movaps 0x7e9c(%ecx),%xmm2 + .byte 15,40,145,164,126,0,0 // movaps 0x7ea4(%ecx),%xmm2 .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 255,19 // call *(%ebx) .byte 131,196,108 // add $0x6c,%esp @@ -40720,7 +40578,7 @@ _sk_dither_sse2: .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp) .byte 15,41,77,216 // movaps %xmm1,-0x28(%ebp) .byte 15,40,208 // movaps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 173 <_sk_dither_sse2+0x20> + .byte 232,0,0,0,0 // call 11b <_sk_dither_sse2+0x20> .byte 94 // pop %esi .byte 139,77,20 // mov 0x14(%ebp),%ecx .byte 139,69,8 // mov 0x8(%ebp),%eax @@ -40732,15 +40590,15 @@ _sk_dither_sse2: .byte 102,15,110,225 // movd %ecx,%xmm4 .byte 102,15,112,252,0 // pshufd $0x0,%xmm4,%xmm7 .byte 102,15,239,253 // pxor %xmm5,%xmm7 - .byte 102,15,111,182,13,126,0,0 // movdqa 0x7e0d(%esi),%xmm6 + .byte 102,15,111,182,21,126,0,0 // movdqa 0x7e15(%esi),%xmm6 .byte 102,15,111,207 // movdqa %xmm7,%xmm1 .byte 102,15,219,206 // pand %xmm6,%xmm1 .byte 102,15,219,245 // pand %xmm5,%xmm6 - .byte 102,15,111,134,45,126,0,0 // movdqa 0x7e2d(%esi),%xmm0 + .byte 102,15,111,134,53,126,0,0 // movdqa 0x7e35(%esi),%xmm0 .byte 102,15,111,231 // movdqa %xmm7,%xmm4 .byte 102,15,219,224 // pand %xmm0,%xmm4 .byte 102,15,219,197 // pand %xmm5,%xmm0 - .byte 102,15,111,158,29,126,0,0 // movdqa 0x7e1d(%esi),%xmm3 + .byte 102,15,111,158,37,126,0,0 // movdqa 0x7e25(%esi),%xmm3 .byte 102,15,219,251 // pand %xmm3,%xmm7 .byte 102,15,219,235 // pand %xmm3,%xmm5 .byte 102,15,114,246,4 // pslld $0x4,%xmm6 @@ -40756,8 +40614,8 @@ _sk_dither_sse2: .byte 102,15,235,224 // por %xmm0,%xmm4 .byte 102,15,235,231 // por %xmm7,%xmm4 .byte 15,91,196 // cvtdq2ps %xmm4,%xmm0 - .byte 15,89,134,61,126,0,0 // mulps 0x7e3d(%esi),%xmm0 - .byte 15,88,134,77,126,0,0 // addps 0x7e4d(%esi),%xmm0 + .byte 15,89,134,69,126,0,0 // mulps 0x7e45(%esi),%xmm0 + .byte 15,88,134,85,126,0,0 // addps 0x7e55(%esi),%xmm0 .byte 139,55 // mov (%edi),%esi .byte 243,15,16,14 // movss (%esi),%xmm1 .byte 139,117,24 // mov 0x18(%ebp),%esi @@ -40986,11 +40844,11 @@ _sk_srcatop_sse2: .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,40,225 // movaps %xmm1,%xmm4 .byte 15,40,208 // movaps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 485 <_sk_srcatop_sse2+0x17> + .byte 232,0,0,0,0 // call 42d <_sk_srcatop_sse2+0x17> .byte 88 // pop %eax .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 .byte 15,89,208 // mulps %xmm0,%xmm2 - .byte 15,40,136,75,123,0,0 // movaps 0x7b4b(%eax),%xmm1 + .byte 15,40,136,83,123,0,0 // movaps 0x7b53(%eax),%xmm1 .byte 15,92,203 // subps %xmm3,%xmm1 .byte 15,40,249 // movaps %xmm1,%xmm7 .byte 15,89,125,40 // mulps 0x28(%ebp),%xmm7 @@ -41047,11 +40905,11 @@ _sk_dstatop_sse2: .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp .byte 15,40,235 // movaps %xmm3,%xmm5 - .byte 232,0,0,0,0 // call 52f <_sk_dstatop_sse2+0x11> + .byte 232,0,0,0,0 // call 4d7 <_sk_dstatop_sse2+0x11> .byte 88 // pop %eax .byte 15,40,245 // movaps %xmm5,%xmm6 .byte 15,89,117,40 // mulps 0x28(%ebp),%xmm6 - .byte 15,40,184,177,122,0,0 // movaps 0x7ab1(%eax),%xmm7 + .byte 15,40,184,185,122,0,0 // movaps 0x7ab9(%eax),%xmm7 .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7 .byte 15,89,199 // mulps %xmm7,%xmm0 .byte 15,88,198 // addps %xmm6,%xmm0 @@ -41188,7 +41046,7 @@ _sk_srcout_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 6a3 <_sk_srcout_sse2+0xe> + .byte 232,0,0,0,0 // call 64b <_sk_srcout_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -41197,7 +41055,7 @@ _sk_srcout_sse2: .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6 - .byte 15,40,184,77,121,0,0 // movaps 0x794d(%eax),%xmm7 + .byte 15,40,184,85,121,0,0 // movaps 0x7955(%eax),%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,89,199 // mulps %xmm7,%xmm0 .byte 15,89,207 // mulps %xmm7,%xmm1 @@ -41233,13 +41091,13 @@ _sk_dstout_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 71b <_sk_dstout_sse2+0xe> + .byte 232,0,0,0,0 // call 6c3 <_sk_dstout_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 139,125,24 // mov 0x18(%ebp),%edi - .byte 15,40,160,229,120,0,0 // movaps 0x78e5(%eax),%xmm4 + .byte 15,40,160,237,120,0,0 // movaps 0x78ed(%eax),%xmm4 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6 @@ -41286,10 +41144,10 @@ _sk_srcover_sse2: .byte 15,40,226 // movaps %xmm2,%xmm4 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 232,0,0,0,0 // call 7ab <_sk_srcover_sse2+0x17> + .byte 232,0,0,0,0 // call 753 <_sk_srcover_sse2+0x17> .byte 88 // pop %eax .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5 - .byte 15,40,128,101,120,0,0 // movaps 0x7865(%eax),%xmm0 + .byte 15,40,128,109,120,0,0 // movaps 0x786d(%eax),%xmm0 .byte 15,92,195 // subps %xmm3,%xmm0 .byte 15,40,248 // movaps %xmm0,%xmm7 .byte 15,89,253 // mulps %xmm5,%xmm7 @@ -41341,13 +41199,13 @@ _sk_dstover_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 842 <_sk_dstover_sse2+0xe> + .byte 232,0,0,0,0 // call 7ea <_sk_dstover_sse2+0xe> .byte 90 // pop %edx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 139,125,24 // mov 0x18(%ebp),%edi - .byte 15,40,162,222,119,0,0 // movaps 0x77de(%edx),%xmm4 + .byte 15,40,162,230,119,0,0 // movaps 0x77e6(%edx),%xmm4 .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 @@ -41433,9 +41291,9 @@ _sk_multiply_sse2: .byte 129,236,140,0,0,0 // sub $0x8c,%esp .byte 15,41,85,200 // movaps %xmm2,-0x38(%ebp) .byte 15,40,232 // movaps %xmm0,%xmm5 - .byte 232,0,0,0,0 // call 938 <_sk_multiply_sse2+0x18> + .byte 232,0,0,0,0 // call 8e0 <_sk_multiply_sse2+0x18> .byte 88 // pop %eax - .byte 15,40,144,248,118,0,0 // movaps 0x76f8(%eax),%xmm2 + .byte 15,40,144,0,119,0,0 // movaps 0x7700(%eax),%xmm2 .byte 15,40,250 // movaps %xmm2,%xmm7 .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7 .byte 15,40,231 // movaps %xmm7,%xmm4 @@ -41609,9 +41467,9 @@ _sk_xor__sse2: .byte 86 // push %esi .byte 131,236,124 // sub $0x7c,%esp .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) - .byte 232,0,0,0,0 // call b1f <_sk_xor__sse2+0x12> + .byte 232,0,0,0,0 // call ac7 <_sk_xor__sse2+0x12> .byte 88 // pop %eax - .byte 15,40,176,33,117,0,0 // movaps 0x7521(%eax),%xmm6 + .byte 15,40,176,41,117,0,0 // movaps 0x7529(%eax),%xmm6 .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7 .byte 15,89,199 // mulps %xmm7,%xmm0 @@ -41695,9 +41553,9 @@ _sk_darken_sse2: .byte 15,95,213 // maxps %xmm5,%xmm2 .byte 15,88,227 // addps %xmm3,%xmm4 .byte 15,92,226 // subps %xmm2,%xmm4 - .byte 232,0,0,0,0 // call c19 <_sk_darken_sse2+0x63> + .byte 232,0,0,0,0 // call bc1 <_sk_darken_sse2+0x63> .byte 88 // pop %eax - .byte 15,40,144,55,116,0,0 // movaps 0x7437(%eax),%xmm2 + .byte 15,40,144,63,116,0,0 // movaps 0x743f(%eax),%xmm2 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -41765,9 +41623,9 @@ _sk_lighten_sse2: .byte 15,93,213 // minps %xmm5,%xmm2 .byte 15,88,227 // addps %xmm3,%xmm4 .byte 15,92,226 // subps %xmm2,%xmm4 - .byte 232,0,0,0,0 // call cde <_sk_lighten_sse2+0x63> + .byte 232,0,0,0,0 // call c86 <_sk_lighten_sse2+0x63> .byte 88 // pop %eax - .byte 15,40,144,130,115,0,0 // movaps 0x7382(%eax),%xmm2 + .byte 15,40,144,138,115,0,0 // movaps 0x738a(%eax),%xmm2 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -41838,9 +41696,9 @@ _sk_difference_sse2: .byte 15,88,227 // addps %xmm3,%xmm4 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 15,92,226 // subps %xmm2,%xmm4 - .byte 232,0,0,0,0 // call dac <_sk_difference_sse2+0x6c> + .byte 232,0,0,0,0 // call d54 <_sk_difference_sse2+0x6c> .byte 88 // pop %eax - .byte 15,40,144,196,114,0,0 // movaps 0x72c4(%eax),%xmm2 + .byte 15,40,144,204,114,0,0 // movaps 0x72cc(%eax),%xmm2 .byte 15,92,214 // subps %xmm6,%xmm2 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -41883,7 +41741,7 @@ _sk_exclusion_sse2: .byte 131,236,108 // sub $0x6c,%esp .byte 15,40,225 // movaps %xmm1,%xmm4 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 232,0,0,0,0 // call e22 <_sk_exclusion_sse2+0x14> + .byte 232,0,0,0,0 // call dca <_sk_exclusion_sse2+0x14> .byte 88 // pop %eax .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 @@ -41902,7 +41760,7 @@ _sk_exclusion_sse2: .byte 15,89,213 // mulps %xmm5,%xmm2 .byte 15,88,210 // addps %xmm2,%xmm2 .byte 15,92,226 // subps %xmm2,%xmm4 - .byte 15,40,144,94,114,0,0 // movaps 0x725e(%eax),%xmm2 + .byte 15,40,144,102,114,0,0 // movaps 0x7266(%eax),%xmm2 .byte 15,92,211 // subps %xmm3,%xmm2 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -41945,7 +41803,7 @@ _sk_colorburn_sse2: .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) .byte 15,41,77,200 // movaps %xmm1,-0x38(%ebp) .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 232,0,0,0,0 // call ed3 <_sk_colorburn_sse2+0x1c> + .byte 232,0,0,0,0 // call e7b <_sk_colorburn_sse2+0x1c> .byte 88 // pop %eax .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4 .byte 15,40,196 // movaps %xmm4,%xmm0 @@ -41958,7 +41816,7 @@ _sk_colorburn_sse2: .byte 15,40,196 // movaps %xmm4,%xmm0 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,92,238 // subps %xmm6,%xmm5 - .byte 15,40,176,189,113,0,0 // movaps 0x71bd(%eax),%xmm6 + .byte 15,40,176,197,113,0,0 // movaps 0x71c5(%eax),%xmm6 .byte 15,40,230 // movaps %xmm6,%xmm4 .byte 15,92,224 // subps %xmm0,%xmm4 .byte 15,40,220 // movaps %xmm4,%xmm3 @@ -42090,7 +41948,7 @@ _sk_colordodge_sse2: .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) .byte 15,41,77,184 // movaps %xmm1,-0x48(%ebp) .byte 15,40,232 // movaps %xmm0,%xmm5 - .byte 232,0,0,0,0 // call 1095 <_sk_colordodge_sse2+0x1f> + .byte 232,0,0,0,0 // call 103d <_sk_colordodge_sse2+0x1f> .byte 88 // pop %eax .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1 @@ -42101,7 +41959,7 @@ _sk_colordodge_sse2: .byte 15,94,212 // divps %xmm4,%xmm2 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,93,226 // minps %xmm2,%xmm4 - .byte 15,40,152,11,112,0,0 // movaps 0x700b(%eax),%xmm3 + .byte 15,40,152,19,112,0,0 // movaps 0x7013(%eax),%xmm3 .byte 15,40,211 // movaps %xmm3,%xmm2 .byte 15,92,208 // subps %xmm0,%xmm2 .byte 15,41,85,216 // movaps %xmm2,-0x28(%ebp) @@ -42225,9 +42083,9 @@ _sk_hardlight_sse2: .byte 15,40,250 // movaps %xmm2,%xmm7 .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 15,40,224 // movaps %xmm0,%xmm4 - .byte 232,0,0,0,0 // call 1237 <_sk_hardlight_sse2+0x1a> + .byte 232,0,0,0,0 // call 11df <_sk_hardlight_sse2+0x1a> .byte 88 // pop %eax - .byte 15,40,176,121,110,0,0 // movaps 0x6e79(%eax),%xmm6 + .byte 15,40,176,129,110,0,0 // movaps 0x6e81(%eax),%xmm6 .byte 15,40,206 // movaps %xmm6,%xmm1 .byte 15,92,77,88 // subps 0x58(%ebp),%xmm1 .byte 15,41,77,184 // movaps %xmm1,-0x48(%ebp) @@ -42351,10 +42209,10 @@ _sk_overlay_sse2: .byte 129,236,156,0,0,0 // sub $0x9c,%esp .byte 15,41,85,184 // movaps %xmm2,-0x48(%ebp) .byte 15,40,224 // movaps %xmm0,%xmm4 - .byte 232,0,0,0,0 // call 13c2 <_sk_overlay_sse2+0x18> + .byte 232,0,0,0,0 // call 136a <_sk_overlay_sse2+0x18> .byte 88 // pop %eax .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 - .byte 15,40,144,254,108,0,0 // movaps 0x6cfe(%eax),%xmm2 + .byte 15,40,144,6,109,0,0 // movaps 0x6d06(%eax),%xmm2 .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,92,232 // subps %xmm0,%xmm5 .byte 15,40,248 // movaps %xmm0,%xmm7 @@ -42495,20 +42353,20 @@ _sk_softlight_sse2: .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 15,89,210 // mulps %xmm2,%xmm2 .byte 15,88,208 // addps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 1591 <_sk_softlight_sse2+0x51> + .byte 232,0,0,0,0 // call 1539 <_sk_softlight_sse2+0x51> .byte 88 // pop %eax .byte 15,40,233 // movaps %xmm1,%xmm5 - .byte 15,40,128,79,107,0,0 // movaps 0x6b4f(%eax),%xmm0 + .byte 15,40,128,87,107,0,0 // movaps 0x6b57(%eax),%xmm0 .byte 15,41,133,120,255,255,255 // movaps %xmm0,-0x88(%ebp) .byte 15,88,232 // addps %xmm0,%xmm5 .byte 15,89,234 // mulps %xmm2,%xmm5 - .byte 15,40,184,63,107,0,0 // movaps 0x6b3f(%eax),%xmm7 + .byte 15,40,184,71,107,0,0 // movaps 0x6b47(%eax),%xmm7 .byte 15,41,125,216 // movaps %xmm7,-0x28(%ebp) .byte 15,92,249 // subps %xmm1,%xmm7 .byte 15,82,209 // rsqrtps %xmm1,%xmm2 .byte 15,83,242 // rcpps %xmm2,%xmm6 .byte 15,92,241 // subps %xmm1,%xmm6 - .byte 15,40,128,95,107,0,0 // movaps 0x6b5f(%eax),%xmm0 + .byte 15,40,128,103,107,0,0 // movaps 0x6b67(%eax),%xmm0 .byte 15,41,69,168 // movaps %xmm0,-0x58(%ebp) .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 15,88,205 // addps %xmm5,%xmm1 @@ -42714,14 +42572,14 @@ _sk_hue_sse2: .byte 15,40,226 // movaps %xmm2,%xmm4 .byte 15,93,231 // minps %xmm7,%xmm4 .byte 15,92,220 // subps %xmm4,%xmm3 - .byte 232,0,0,0,0 // call 1862 <_sk_hue_sse2+0x3f> + .byte 232,0,0,0,0 // call 180a <_sk_hue_sse2+0x3f> .byte 88 // pop %eax .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,89,230 // mulps %xmm6,%xmm4 .byte 15,41,101,200 // movaps %xmm4,-0x38(%ebp) .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 15,89,238 // mulps %xmm6,%xmm5 - .byte 15,40,184,206,104,0,0 // movaps 0x68ce(%eax),%xmm7 + .byte 15,40,184,214,104,0,0 // movaps 0x68d6(%eax),%xmm7 .byte 15,41,125,168 // movaps %xmm7,-0x58(%ebp) .byte 15,92,125,88 // subps 0x58(%ebp),%xmm7 .byte 15,89,199 // mulps %xmm7,%xmm0 @@ -42751,15 +42609,15 @@ _sk_hue_sse2: .byte 15,89,243 // mulps %xmm3,%xmm6 .byte 15,89,235 // mulps %xmm3,%xmm5 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,40,152,158,104,0,0 // movaps 0x689e(%eax),%xmm3 + .byte 15,40,152,166,104,0,0 // movaps 0x68a6(%eax),%xmm3 .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 15,40,77,40 // movaps 0x28(%ebp),%xmm1 .byte 15,89,203 // mulps %xmm3,%xmm1 - .byte 15,40,160,174,104,0,0 // movaps 0x68ae(%eax),%xmm4 + .byte 15,40,160,182,104,0,0 // movaps 0x68b6(%eax),%xmm4 .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7 .byte 15,89,252 // mulps %xmm4,%xmm7 .byte 15,88,249 // addps %xmm1,%xmm7 - .byte 15,40,152,190,104,0,0 // movaps 0x68be(%eax),%xmm3 + .byte 15,40,152,198,104,0,0 // movaps 0x68c6(%eax),%xmm3 .byte 15,40,77,72 // movaps 0x48(%ebp),%xmm1 .byte 15,89,203 // mulps %xmm3,%xmm1 .byte 15,88,207 // addps %xmm7,%xmm1 @@ -42972,17 +42830,17 @@ _sk_saturation_sse2: .byte 15,89,238 // mulps %xmm6,%xmm5 .byte 15,89,222 // mulps %xmm6,%xmm3 .byte 15,89,254 // mulps %xmm6,%xmm7 - .byte 232,0,0,0,0 // call 1bb0 <_sk_saturation_sse2+0x8e> + .byte 232,0,0,0,0 // call 1b58 <_sk_saturation_sse2+0x8e> .byte 88 // pop %eax - .byte 15,40,176,144,101,0,0 // movaps 0x6590(%eax),%xmm6 + .byte 15,40,176,152,101,0,0 // movaps 0x6598(%eax),%xmm6 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,89,214 // mulps %xmm6,%xmm2 - .byte 15,40,160,160,101,0,0 // movaps 0x65a0(%eax),%xmm4 + .byte 15,40,160,168,101,0,0 // movaps 0x65a8(%eax),%xmm4 .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1 .byte 15,89,204 // mulps %xmm4,%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2 - .byte 15,89,144,176,101,0,0 // mulps 0x65b0(%eax),%xmm2 + .byte 15,89,144,184,101,0,0 // mulps 0x65b8(%eax),%xmm2 .byte 15,88,209 // addps %xmm1,%xmm2 .byte 15,94,232 // divps %xmm0,%xmm5 .byte 15,94,216 // divps %xmm0,%xmm3 @@ -42998,7 +42856,7 @@ _sk_saturation_sse2: .byte 15,89,252 // mulps %xmm4,%xmm7 .byte 15,88,249 // addps %xmm1,%xmm7 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 15,89,136,176,101,0,0 // mulps 0x65b0(%eax),%xmm1 + .byte 15,89,136,184,101,0,0 // mulps 0x65b8(%eax),%xmm1 .byte 15,88,207 // addps %xmm7,%xmm1 .byte 15,89,85,216 // mulps -0x28(%ebp),%xmm2 .byte 15,92,209 // subps %xmm1,%xmm2 @@ -43018,7 +42876,7 @@ _sk_saturation_sse2: .byte 15,89,245 // mulps %xmm5,%xmm6 .byte 15,89,227 // mulps %xmm3,%xmm4 .byte 15,88,230 // addps %xmm6,%xmm4 - .byte 15,40,128,176,101,0,0 // movaps 0x65b0(%eax),%xmm0 + .byte 15,40,128,184,101,0,0 // movaps 0x65b8(%eax),%xmm0 .byte 15,89,194 // mulps %xmm2,%xmm0 .byte 15,88,196 // addps %xmm4,%xmm0 .byte 15,41,69,136 // movaps %xmm0,-0x78(%ebp) @@ -43041,7 +42899,7 @@ _sk_saturation_sse2: .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 .byte 15,89,200 // mulps %xmm0,%xmm1 - .byte 15,40,144,192,101,0,0 // movaps 0x65c0(%eax),%xmm2 + .byte 15,40,144,200,101,0,0 // movaps 0x65c8(%eax),%xmm2 .byte 15,41,85,152 // movaps %xmm2,-0x68(%ebp) .byte 15,92,212 // subps %xmm4,%xmm2 .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) @@ -43167,19 +43025,19 @@ _sk_color_sse2: .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp) .byte 15,41,149,72,255,255,255 // movaps %xmm2,-0xb8(%ebp) .byte 15,40,233 // movaps %xmm1,%xmm5 - .byte 232,0,0,0,0 // call 1e37 <_sk_color_sse2+0x1f> + .byte 232,0,0,0,0 // call 1ddf <_sk_color_sse2+0x1f> .byte 88 // pop %eax .byte 15,40,85,56 // movaps 0x38(%ebp),%xmm2 .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 - .byte 15,40,152,73,99,0,0 // movaps 0x6349(%eax),%xmm3 + .byte 15,40,152,81,99,0,0 // movaps 0x6351(%eax),%xmm3 .byte 15,89,227 // mulps %xmm3,%xmm4 .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) - .byte 15,40,176,89,99,0,0 // movaps 0x6359(%eax),%xmm6 + .byte 15,40,176,97,99,0,0 // movaps 0x6361(%eax),%xmm6 .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,41,117,184 // movaps %xmm6,-0x48(%ebp) .byte 15,88,212 // addps %xmm4,%xmm2 .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4 - .byte 15,40,184,105,99,0,0 // movaps 0x6369(%eax),%xmm7 + .byte 15,40,184,113,99,0,0 // movaps 0x6371(%eax),%xmm7 .byte 15,41,189,56,255,255,255 // movaps %xmm7,-0xc8(%ebp) .byte 15,89,231 // mulps %xmm7,%xmm4 .byte 15,88,226 // addps %xmm2,%xmm4 @@ -43194,7 +43052,7 @@ _sk_color_sse2: .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,89,214 // mulps %xmm6,%xmm2 .byte 15,88,212 // addps %xmm4,%xmm2 - .byte 15,40,136,121,99,0,0 // movaps 0x6379(%eax),%xmm1 + .byte 15,40,136,129,99,0,0 // movaps 0x6381(%eax),%xmm1 .byte 15,41,77,168 // movaps %xmm1,-0x58(%ebp) .byte 15,40,225 // movaps %xmm1,%xmm4 .byte 15,40,93,88 // movaps 0x58(%ebp),%xmm3 @@ -43373,19 +43231,19 @@ _sk_luminosity_sse2: .byte 15,40,243 // movaps %xmm3,%xmm6 .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,40,216 // movaps %xmm0,%xmm3 - .byte 232,0,0,0,0 // call 20ea <_sk_luminosity_sse2+0x1a> + .byte 232,0,0,0,0 // call 2092 <_sk_luminosity_sse2+0x1a> .byte 88 // pop %eax - .byte 15,40,160,214,96,0,0 // movaps 0x60d6(%eax),%xmm4 + .byte 15,40,160,222,96,0,0 // movaps 0x60de(%eax),%xmm4 .byte 15,41,101,216 // movaps %xmm4,-0x28(%ebp) .byte 15,40,211 // movaps %xmm3,%xmm2 .byte 15,89,212 // mulps %xmm4,%xmm2 - .byte 15,40,128,230,96,0,0 // movaps 0x60e6(%eax),%xmm0 + .byte 15,40,128,238,96,0,0 // movaps 0x60ee(%eax),%xmm0 .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) .byte 15,40,225 // movaps %xmm1,%xmm4 .byte 15,89,224 // mulps %xmm0,%xmm4 .byte 15,88,226 // addps %xmm2,%xmm4 .byte 15,40,85,88 // movaps 0x58(%ebp),%xmm2 - .byte 15,40,184,6,97,0,0 // movaps 0x6106(%eax),%xmm7 + .byte 15,40,184,14,97,0,0 // movaps 0x610e(%eax),%xmm7 .byte 15,41,125,152 // movaps %xmm7,-0x68(%ebp) .byte 15,92,250 // subps %xmm2,%xmm7 .byte 15,89,223 // mulps %xmm7,%xmm3 @@ -43395,7 +43253,7 @@ _sk_luminosity_sse2: .byte 15,89,253 // mulps %xmm5,%xmm7 .byte 15,41,189,120,255,255,255 // movaps %xmm7,-0x88(%ebp) .byte 15,40,205 // movaps %xmm5,%xmm1 - .byte 15,40,128,246,96,0,0 // movaps 0x60f6(%eax),%xmm0 + .byte 15,40,128,254,96,0,0 // movaps 0x60fe(%eax),%xmm0 .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 15,88,204 // addps %xmm4,%xmm1 .byte 15,40,238 // movaps %xmm6,%xmm5 @@ -43570,7 +43428,7 @@ _sk_srcover_rgba_8888_sse2: .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) .byte 102,15,127,77,184 // movdqa %xmm1,-0x48(%ebp) .byte 102,15,127,69,200 // movdqa %xmm0,-0x38(%ebp) - .byte 232,0,0,0,0 // call 237e <_sk_srcover_rgba_8888_sse2+0x1f> + .byte 232,0,0,0,0 // call 2326 <_sk_srcover_rgba_8888_sse2+0x1f> .byte 95 // pop %edi .byte 139,85,24 // mov 0x18(%ebp),%edx .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -43578,9 +43436,9 @@ _sk_srcover_rgba_8888_sse2: .byte 139,48 // mov (%eax),%esi .byte 139,54 // mov (%esi),%esi .byte 133,210 // test %edx,%edx - .byte 15,133,40,1,0,0 // jne 24bc <_sk_srcover_rgba_8888_sse2+0x15d> + .byte 15,133,40,1,0,0 // jne 2464 <_sk_srcover_rgba_8888_sse2+0x15d> .byte 243,15,111,12,142 // movdqu (%esi,%ecx,4),%xmm1 - .byte 102,15,111,135,130,94,0,0 // movdqa 0x5e82(%edi),%xmm0 + .byte 102,15,111,135,138,94,0,0 // movdqa 0x5e8a(%edi),%xmm0 .byte 102,15,111,225 // movdqa %xmm1,%xmm4 .byte 102,15,219,224 // pand %xmm0,%xmm4 .byte 102,15,111,249 // movdqa %xmm1,%xmm7 @@ -43590,9 +43448,9 @@ _sk_srcover_rgba_8888_sse2: .byte 102,15,114,213,16 // psrld $0x10,%xmm5 .byte 102,15,219,232 // pand %xmm0,%xmm5 .byte 15,91,244 // cvtdq2ps %xmm4,%xmm6 - .byte 15,40,167,146,94,0,0 // movaps 0x5e92(%edi),%xmm4 + .byte 15,40,167,154,94,0,0 // movaps 0x5e9a(%edi),%xmm4 .byte 15,92,227 // subps %xmm3,%xmm4 - .byte 15,40,135,162,94,0,0 // movaps 0x5ea2(%edi),%xmm0 + .byte 15,40,135,170,94,0,0 // movaps 0x5eaa(%edi),%xmm0 .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp) .byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2 .byte 15,89,208 // mulps %xmm0,%xmm2 @@ -43632,7 +43490,7 @@ _sk_srcover_rgba_8888_sse2: .byte 139,93,20 // mov 0x14(%ebp),%ebx .byte 139,125,8 // mov 0x8(%ebp),%edi .byte 133,210 // test %edx,%edx - .byte 15,133,131,0,0,0 // jne 24ed <_sk_srcover_rgba_8888_sse2+0x18e> + .byte 15,133,131,0,0,0 // jne 2495 <_sk_srcover_rgba_8888_sse2+0x18e> .byte 243,15,127,28,142 // movdqu %xmm3,(%esi,%ecx,4) .byte 141,112,8 // lea 0x8(%eax),%esi .byte 15,41,84,36,80 // movaps %xmm2,0x50(%esp) @@ -43660,35 +43518,35 @@ _sk_srcover_rgba_8888_sse2: .byte 137,211 // mov %edx,%ebx .byte 128,227,3 // and $0x3,%bl .byte 128,251,1 // cmp $0x1,%bl - .byte 116,94 // je 2524 <_sk_srcover_rgba_8888_sse2+0x1c5> + .byte 116,94 // je 24cc <_sk_srcover_rgba_8888_sse2+0x1c5> .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 128,251,2 // cmp $0x2,%bl - .byte 116,20 // je 24e3 <_sk_srcover_rgba_8888_sse2+0x184> + .byte 116,20 // je 248b <_sk_srcover_rgba_8888_sse2+0x184> .byte 128,251,3 // cmp $0x3,%bl - .byte 15,133,193,254,255,255 // jne 2399 <_sk_srcover_rgba_8888_sse2+0x3a> + .byte 15,133,193,254,255,255 // jne 2341 <_sk_srcover_rgba_8888_sse2+0x3a> .byte 102,15,110,68,142,8 // movd 0x8(%esi,%ecx,4),%xmm0 .byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1 .byte 102,15,18,12,142 // movlpd (%esi,%ecx,4),%xmm1 - .byte 233,172,254,255,255 // jmp 2399 <_sk_srcover_rgba_8888_sse2+0x3a> + .byte 233,172,254,255,255 // jmp 2341 <_sk_srcover_rgba_8888_sse2+0x3a> .byte 137,208 // mov %edx,%eax .byte 136,69,216 // mov %al,-0x28(%ebp) .byte 128,101,216,3 // andb $0x3,-0x28(%ebp) .byte 128,125,216,1 // cmpb $0x1,-0x28(%ebp) - .byte 116,50 // je 252e <_sk_srcover_rgba_8888_sse2+0x1cf> + .byte 116,50 // je 24d6 <_sk_srcover_rgba_8888_sse2+0x1cf> .byte 128,125,216,2 // cmpb $0x2,-0x28(%ebp) .byte 139,69,12 // mov 0xc(%ebp),%eax - .byte 116,21 // je 251a <_sk_srcover_rgba_8888_sse2+0x1bb> + .byte 116,21 // je 24c2 <_sk_srcover_rgba_8888_sse2+0x1bb> .byte 128,125,216,3 // cmpb $0x3,-0x28(%ebp) - .byte 15,133,96,255,255,255 // jne 246f <_sk_srcover_rgba_8888_sse2+0x110> + .byte 15,133,96,255,255,255 // jne 2417 <_sk_srcover_rgba_8888_sse2+0x110> .byte 102,15,112,203,78 // pshufd $0x4e,%xmm3,%xmm1 .byte 102,15,126,76,142,8 // movd %xmm1,0x8(%esi,%ecx,4) .byte 102,15,214,28,142 // movq %xmm3,(%esi,%ecx,4) - .byte 233,75,255,255,255 // jmp 246f <_sk_srcover_rgba_8888_sse2+0x110> + .byte 233,75,255,255,255 // jmp 2417 <_sk_srcover_rgba_8888_sse2+0x110> .byte 102,15,110,12,142 // movd (%esi,%ecx,4),%xmm1 - .byte 233,107,254,255,255 // jmp 2399 <_sk_srcover_rgba_8888_sse2+0x3a> + .byte 233,107,254,255,255 // jmp 2341 <_sk_srcover_rgba_8888_sse2+0x3a> .byte 102,15,126,28,142 // movd %xmm3,(%esi,%ecx,4) .byte 139,69,12 // mov 0xc(%ebp),%eax - .byte 233,52,255,255,255 // jmp 246f <_sk_srcover_rgba_8888_sse2+0x110> + .byte 233,52,255,255,255 // jmp 2417 <_sk_srcover_rgba_8888_sse2+0x110> HIDDEN _sk_clamp_0_sse2 .globl _sk_clamp_0_sse2 @@ -43742,7 +43600,7 @@ _sk_clamp_1_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 25b4 <_sk_clamp_1_sse2+0xe> + .byte 232,0,0,0,0 // call 255c <_sk_clamp_1_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -43751,7 +43609,7 @@ _sk_clamp_1_sse2: .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6 - .byte 15,40,184,124,92,0,0 // movaps 0x5c7c(%eax),%xmm7 + .byte 15,40,184,132,92,0,0 // movaps 0x5c84(%eax),%xmm7 .byte 15,93,199 // minps %xmm7,%xmm0 .byte 15,93,207 // minps %xmm7,%xmm1 .byte 15,93,215 // minps %xmm7,%xmm2 @@ -43786,7 +43644,7 @@ _sk_clamp_a_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 2629 <_sk_clamp_a_sse2+0xe> + .byte 232,0,0,0,0 // call 25d1 <_sk_clamp_a_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -43796,7 +43654,7 @@ _sk_clamp_a_sse2: .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6 .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7 - .byte 15,93,152,23,92,0,0 // minps 0x5c17(%eax),%xmm3 + .byte 15,93,152,31,92,0,0 // minps 0x5c1f(%eax),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 15,93,195 // minps %xmm3,%xmm0 .byte 15,93,203 // minps %xmm3,%xmm1 @@ -44064,7 +43922,7 @@ _sk_unpremul_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 28ee <_sk_unpremul_sse2+0xe> + .byte 232,0,0,0,0 // call 2896 <_sk_unpremul_sse2+0xe> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -44073,7 +43931,7 @@ _sk_unpremul_sse2: .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 .byte 15,87,246 // xorps %xmm6,%xmm6 - .byte 15,40,185,98,89,0,0 // movaps 0x5962(%ecx),%xmm7 + .byte 15,40,185,106,89,0,0 // movaps 0x596a(%ecx),%xmm7 .byte 15,94,251 // divps %xmm3,%xmm7 .byte 15,194,243,4 // cmpneqps %xmm3,%xmm6 .byte 15,84,247 // andps %xmm7,%xmm6 @@ -44115,23 +43973,23 @@ _sk_from_srgb_sse2: .byte 15,40,242 // movaps %xmm2,%xmm6 .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 15,40,208 // movaps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 297d <_sk_from_srgb_sse2+0x1e> + .byte 232,0,0,0,0 // call 2925 <_sk_from_srgb_sse2+0x1e> .byte 88 // pop %eax .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,89,219 // mulps %xmm3,%xmm3 - .byte 15,40,160,243,88,0,0 // movaps 0x58f3(%eax),%xmm4 + .byte 15,40,160,251,88,0,0 // movaps 0x58fb(%eax),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 - .byte 15,40,136,3,89,0,0 // movaps 0x5903(%eax),%xmm1 + .byte 15,40,136,11,89,0,0 // movaps 0x590b(%eax),%xmm1 .byte 15,41,77,200 // movaps %xmm1,-0x38(%ebp) .byte 15,88,193 // addps %xmm1,%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,40,152,227,88,0,0 // movaps 0x58e3(%eax),%xmm3 + .byte 15,40,152,235,88,0,0 // movaps 0x58eb(%eax),%xmm3 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,89,203 // mulps %xmm3,%xmm1 - .byte 15,40,184,19,89,0,0 // movaps 0x5913(%eax),%xmm7 + .byte 15,40,184,27,89,0,0 // movaps 0x591b(%eax),%xmm7 .byte 15,41,125,216 // movaps %xmm7,-0x28(%ebp) .byte 15,88,199 // addps %xmm7,%xmm0 - .byte 15,40,184,35,89,0,0 // movaps 0x5923(%eax),%xmm7 + .byte 15,40,184,43,89,0,0 // movaps 0x592b(%eax),%xmm7 .byte 15,194,215,1 // cmpltps %xmm7,%xmm2 .byte 15,84,202 // andps %xmm2,%xmm1 .byte 15,85,208 // andnps %xmm0,%xmm2 @@ -44205,28 +44063,28 @@ _sk_to_srgb_sse2: .byte 15,40,250 // movaps %xmm2,%xmm7 .byte 15,40,241 // movaps %xmm1,%xmm6 .byte 15,40,208 // movaps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 2a9d <_sk_to_srgb_sse2+0x1e> + .byte 232,0,0,0,0 // call 2a45 <_sk_to_srgb_sse2+0x1e> .byte 88 // pop %eax .byte 15,82,218 // rsqrtps %xmm2,%xmm3 - .byte 15,40,160,35,88,0,0 // movaps 0x5823(%eax),%xmm4 + .byte 15,40,160,43,88,0,0 // movaps 0x582b(%eax),%xmm4 .byte 15,40,235 // movaps %xmm3,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 - .byte 15,40,128,51,88,0,0 // movaps 0x5833(%eax),%xmm0 + .byte 15,40,128,59,88,0,0 // movaps 0x583b(%eax),%xmm0 .byte 15,41,69,216 // movaps %xmm0,-0x28(%ebp) .byte 15,88,232 // addps %xmm0,%xmm5 .byte 15,89,235 // mulps %xmm3,%xmm5 - .byte 15,40,128,67,88,0,0 // movaps 0x5843(%eax),%xmm0 + .byte 15,40,128,75,88,0,0 // movaps 0x584b(%eax),%xmm0 .byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp) .byte 15,88,232 // addps %xmm0,%xmm5 - .byte 15,40,128,83,88,0,0 // movaps 0x5853(%eax),%xmm0 + .byte 15,40,128,91,88,0,0 // movaps 0x585b(%eax),%xmm0 .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) .byte 15,88,216 // addps %xmm0,%xmm3 .byte 15,83,195 // rcpps %xmm3,%xmm0 .byte 15,89,197 // mulps %xmm5,%xmm0 - .byte 15,40,168,19,88,0,0 // movaps 0x5813(%eax),%xmm5 + .byte 15,40,168,27,88,0,0 // movaps 0x581b(%eax),%xmm5 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,89,205 // mulps %xmm5,%xmm1 - .byte 15,40,152,99,88,0,0 // movaps 0x5863(%eax),%xmm3 + .byte 15,40,152,107,88,0,0 // movaps 0x586b(%eax),%xmm3 .byte 15,194,211,1 // cmpltps %xmm3,%xmm2 .byte 15,84,202 // andps %xmm2,%xmm1 .byte 15,85,208 // andnps %xmm0,%xmm2 @@ -44303,7 +44161,7 @@ _sk_rgb_to_hsl_sse2: .byte 15,41,93,184 // movaps %xmm3,-0x48(%ebp) .byte 15,40,233 // movaps %xmm1,%xmm5 .byte 15,40,224 // movaps %xmm0,%xmm4 - .byte 232,0,0,0,0 // call 2bdc <_sk_rgb_to_hsl_sse2+0x1b> + .byte 232,0,0,0,0 // call 2b84 <_sk_rgb_to_hsl_sse2+0x1b> .byte 88 // pop %eax .byte 15,40,204 // movaps %xmm4,%xmm1 .byte 15,95,205 // maxps %xmm5,%xmm1 @@ -44315,13 +44173,13 @@ _sk_rgb_to_hsl_sse2: .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,92,199 // subps %xmm7,%xmm0 .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) - .byte 15,40,152,52,87,0,0 // movaps 0x5734(%eax),%xmm3 + .byte 15,40,152,60,87,0,0 // movaps 0x573c(%eax),%xmm3 .byte 15,94,216 // divps %xmm0,%xmm3 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 15,92,194 // subps %xmm2,%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 .byte 15,194,234,1 // cmpltps %xmm2,%xmm5 - .byte 15,84,168,68,87,0,0 // andps 0x5744(%eax),%xmm5 + .byte 15,84,168,76,87,0,0 // andps 0x574c(%eax),%xmm5 .byte 15,88,232 // addps %xmm0,%xmm5 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,194,196,0 // cmpeqps %xmm4,%xmm0 @@ -44331,9 +44189,9 @@ _sk_rgb_to_hsl_sse2: .byte 15,92,101,216 // subps -0x28(%ebp),%xmm4 .byte 15,89,211 // mulps %xmm3,%xmm2 .byte 15,89,227 // mulps %xmm3,%xmm4 - .byte 15,40,152,84,87,0,0 // movaps 0x5754(%eax),%xmm3 + .byte 15,40,152,92,87,0,0 // movaps 0x575c(%eax),%xmm3 .byte 15,88,211 // addps %xmm3,%xmm2 - .byte 15,88,160,100,87,0,0 // addps 0x5764(%eax),%xmm4 + .byte 15,88,160,108,87,0,0 // addps 0x576c(%eax),%xmm4 .byte 15,84,214 // andps %xmm6,%xmm2 .byte 15,85,244 // andnps %xmm4,%xmm6 .byte 15,86,242 // orps %xmm2,%xmm6 @@ -44348,7 +44206,7 @@ _sk_rgb_to_hsl_sse2: .byte 15,194,231,4 // cmpneqps %xmm7,%xmm4 .byte 15,92,217 // subps %xmm1,%xmm3 .byte 15,88,207 // addps %xmm7,%xmm1 - .byte 15,40,168,132,87,0,0 // movaps 0x5784(%eax),%xmm5 + .byte 15,40,168,140,87,0,0 // movaps 0x578c(%eax),%xmm5 .byte 15,92,223 // subps %xmm7,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,89,213 // mulps %xmm5,%xmm2 @@ -44361,7 +44219,7 @@ _sk_rgb_to_hsl_sse2: .byte 15,40,77,200 // movaps -0x38(%ebp),%xmm1 .byte 15,94,205 // divps %xmm5,%xmm1 .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 - .byte 15,89,128,116,87,0,0 // mulps 0x5774(%eax),%xmm0 + .byte 15,89,128,124,87,0,0 // mulps 0x577c(%eax),%xmm0 .byte 15,84,196 // andps %xmm4,%xmm0 .byte 15,84,204 // andps %xmm4,%xmm1 .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4 @@ -44397,9 +44255,9 @@ _sk_hsl_to_rgb_sse2: .byte 129,236,44,1,0,0 // sub $0x12c,%esp .byte 15,41,157,40,255,255,255 // movaps %xmm3,-0xd8(%ebp) .byte 15,41,69,200 // movaps %xmm0,-0x38(%ebp) - .byte 232,0,0,0,0 // call 2d11 <_sk_hsl_to_rgb_sse2+0x1c> + .byte 232,0,0,0,0 // call 2cb9 <_sk_hsl_to_rgb_sse2+0x1c> .byte 88 // pop %eax - .byte 15,40,152,95,86,0,0 // movaps 0x565f(%eax),%xmm3 + .byte 15,40,152,103,86,0,0 // movaps 0x5667(%eax),%xmm3 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 15,40,243 // movaps %xmm3,%xmm6 .byte 15,41,181,72,255,255,255 // movaps %xmm6,-0xb8(%ebp) @@ -44413,13 +44271,13 @@ _sk_hsl_to_rgb_sse2: .byte 15,84,236 // andps %xmm4,%xmm5 .byte 15,85,225 // andnps %xmm1,%xmm4 .byte 15,86,229 // orps %xmm5,%xmm4 - .byte 15,40,136,111,86,0,0 // movaps 0x566f(%eax),%xmm1 + .byte 15,40,136,119,86,0,0 // movaps 0x5677(%eax),%xmm1 .byte 15,88,200 // addps %xmm0,%xmm1 .byte 243,15,91,193 // cvttps2dq %xmm1,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,217 // movaps %xmm1,%xmm3 .byte 15,194,216,1 // cmpltps %xmm0,%xmm3 - .byte 15,40,168,127,86,0,0 // movaps 0x567f(%eax),%xmm5 + .byte 15,40,168,135,86,0,0 // movaps 0x5687(%eax),%xmm5 .byte 15,41,173,104,255,255,255 // movaps %xmm5,-0x98(%ebp) .byte 15,84,221 // andps %xmm5,%xmm3 .byte 15,92,195 // subps %xmm3,%xmm0 @@ -44430,19 +44288,19 @@ _sk_hsl_to_rgb_sse2: .byte 15,41,101,184 // movaps %xmm4,-0x48(%ebp) .byte 15,88,237 // addps %xmm5,%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 - .byte 15,40,144,143,86,0,0 // movaps 0x568f(%eax),%xmm2 + .byte 15,40,144,151,86,0,0 // movaps 0x5697(%eax),%xmm2 .byte 15,41,85,168 // movaps %xmm2,-0x58(%ebp) .byte 15,194,209,2 // cmpleps %xmm1,%xmm2 .byte 15,92,229 // subps %xmm5,%xmm4 .byte 15,40,198 // movaps %xmm6,%xmm0 .byte 15,194,193,2 // cmpleps %xmm1,%xmm0 - .byte 15,40,176,191,86,0,0 // movaps 0x56bf(%eax),%xmm6 + .byte 15,40,176,199,86,0,0 // movaps 0x56c7(%eax),%xmm6 .byte 15,41,181,88,255,255,255 // movaps %xmm6,-0xa8(%ebp) .byte 15,194,241,2 // cmpleps %xmm1,%xmm6 - .byte 15,40,152,159,86,0,0 // movaps 0x569f(%eax),%xmm3 + .byte 15,40,152,167,86,0,0 // movaps 0x56a7(%eax),%xmm3 .byte 15,41,93,152 // movaps %xmm3,-0x68(%ebp) .byte 15,89,203 // mulps %xmm3,%xmm1 - .byte 15,40,184,175,86,0,0 // movaps 0x56af(%eax),%xmm7 + .byte 15,40,184,183,86,0,0 // movaps 0x56b7(%eax),%xmm7 .byte 15,41,125,136 // movaps %xmm7,-0x78(%ebp) .byte 15,92,249 // subps %xmm1,%xmm7 .byte 15,89,252 // mulps %xmm4,%xmm7 @@ -44467,18 +44325,18 @@ _sk_hsl_to_rgb_sse2: .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,194,200,1 // cmpltps %xmm0,%xmm1 - .byte 15,84,136,127,86,0,0 // andps 0x567f(%eax),%xmm1 + .byte 15,84,136,135,86,0,0 // andps 0x5687(%eax),%xmm1 .byte 15,92,193 // subps %xmm1,%xmm0 .byte 15,40,202 // movaps %xmm2,%xmm1 .byte 15,92,200 // subps %xmm0,%xmm1 - .byte 15,40,128,143,86,0,0 // movaps 0x568f(%eax),%xmm0 + .byte 15,40,128,151,86,0,0 // movaps 0x5697(%eax),%xmm0 .byte 15,194,193,2 // cmpleps %xmm1,%xmm0 - .byte 15,40,144,95,86,0,0 // movaps 0x565f(%eax),%xmm2 + .byte 15,40,144,103,86,0,0 // movaps 0x5667(%eax),%xmm2 .byte 15,194,209,2 // cmpleps %xmm1,%xmm2 - .byte 15,40,152,191,86,0,0 // movaps 0x56bf(%eax),%xmm3 + .byte 15,40,152,199,86,0,0 // movaps 0x56c7(%eax),%xmm3 .byte 15,194,217,2 // cmpleps %xmm1,%xmm3 - .byte 15,89,136,159,86,0,0 // mulps 0x569f(%eax),%xmm1 - .byte 15,40,176,175,86,0,0 // movaps 0x56af(%eax),%xmm6 + .byte 15,89,136,167,86,0,0 // mulps 0x56a7(%eax),%xmm1 + .byte 15,40,176,183,86,0,0 // movaps 0x56b7(%eax),%xmm6 .byte 15,92,241 // subps %xmm1,%xmm6 .byte 15,89,244 // mulps %xmm4,%xmm6 .byte 15,88,245 // addps %xmm5,%xmm6 @@ -44498,7 +44356,7 @@ _sk_hsl_to_rgb_sse2: .byte 15,40,117,216 // movaps -0x28(%ebp),%xmm6 .byte 15,85,243 // andnps %xmm3,%xmm6 .byte 15,40,85,200 // movaps -0x38(%ebp),%xmm2 - .byte 15,88,144,207,86,0,0 // addps 0x56cf(%eax),%xmm2 + .byte 15,88,144,215,86,0,0 // addps 0x56d7(%eax),%xmm2 .byte 243,15,91,194 // cvttps2dq %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 .byte 15,40,202 // movaps %xmm2,%xmm1 @@ -44622,7 +44480,7 @@ _sk_scale_u8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 3017 <_sk_scale_u8_sse2+0xe> + .byte 232,0,0,0,0 // call 2fbf <_sk_scale_u8_sse2+0xe> .byte 91 // pop %ebx .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7 .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 @@ -44634,13 +44492,13 @@ _sk_scale_u8_sse2: .byte 139,9 // mov (%ecx),%ecx .byte 133,210 // test %edx,%edx .byte 139,125,16 // mov 0x10(%ebp),%edi - .byte 117,106 // jne 30a2 <_sk_scale_u8_sse2+0x99> + .byte 117,106 // jne 304a <_sk_scale_u8_sse2+0x99> .byte 102,15,110,36,57 // movd (%ecx,%edi,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,163,217,83,0,0 // pand 0x53d9(%ebx),%xmm4 + .byte 102,15,219,163,225,83,0,0 // pand 0x53e1(%ebx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,163,233,83,0,0 // mulps 0x53e9(%ebx),%xmm4 + .byte 15,89,163,241,83,0,0 // mulps 0x53f1(%ebx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 15,89,204 // mulps %xmm4,%xmm1 .byte 15,89,212 // mulps %xmm4,%xmm2 @@ -44668,13 +44526,13 @@ _sk_scale_u8_sse2: .byte 136,85,243 // mov %dl,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,65 // je 30f0 <_sk_scale_u8_sse2+0xe7> + .byte 116,65 // je 3098 <_sk_scale_u8_sse2+0xe7> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 116,23 // je 30d3 <_sk_scale_u8_sse2+0xca> + .byte 116,23 // je 307b <_sk_scale_u8_sse2+0xca> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 117,131 // jne 3045 <_sk_scale_u8_sse2+0x3c> + .byte 117,131 // jne 2fed <_sk_scale_u8_sse2+0x3c> .byte 15,182,116,57,2 // movzbl 0x2(%ecx,%edi,1),%esi .byte 102,15,110,230 // movd %esi,%xmm4 .byte 139,117,20 // mov 0x14(%ebp),%esi @@ -44685,11 +44543,11 @@ _sk_scale_u8_sse2: .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5 - .byte 233,85,255,255,255 // jmp 3045 <_sk_scale_u8_sse2+0x3c> + .byte 233,85,255,255,255 // jmp 2fed <_sk_scale_u8_sse2+0x3c> .byte 15,182,12,57 // movzbl (%ecx,%edi,1),%ecx .byte 102,15,110,225 // movd %ecx,%xmm4 .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 233,69,255,255,255 // jmp 3045 <_sk_scale_u8_sse2+0x3c> + .byte 233,69,255,255,255 // jmp 2fed <_sk_scale_u8_sse2+0x3c> HIDDEN _sk_lerp_1_float_sse2 .globl _sk_lerp_1_float_sse2 @@ -44754,7 +44612,7 @@ _sk_lerp_u8_sse2: .byte 86 // push %esi .byte 131,236,124 // sub $0x7c,%esp .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) - .byte 232,0,0,0,0 // call 319e <_sk_lerp_u8_sse2+0x12> + .byte 232,0,0,0,0 // call 3146 <_sk_lerp_u8_sse2+0x12> .byte 91 // pop %ebx .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5 .byte 139,85,24 // mov 0x18(%ebp),%edx @@ -44764,13 +44622,13 @@ _sk_lerp_u8_sse2: .byte 139,9 // mov (%ecx),%ecx .byte 133,210 // test %edx,%edx .byte 139,125,16 // mov 0x10(%ebp),%edi - .byte 15,133,143,0,0,0 // jne 324a <_sk_lerp_u8_sse2+0xbe> + .byte 15,133,143,0,0,0 // jne 31f2 <_sk_lerp_u8_sse2+0xbe> .byte 102,15,110,36,57 // movd (%ecx,%edi,1),%xmm4 .byte 102,15,96,224 // punpcklbw %xmm0,%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 - .byte 102,15,219,163,114,82,0,0 // pand 0x5272(%ebx),%xmm4 + .byte 102,15,219,163,122,82,0,0 // pand 0x527a(%ebx),%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,163,130,82,0,0 // mulps 0x5282(%ebx),%xmm4 + .byte 15,89,163,138,82,0,0 // mulps 0x528a(%ebx),%xmm4 .byte 15,92,197 // subps %xmm5,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 @@ -44809,13 +44667,13 @@ _sk_lerp_u8_sse2: .byte 136,85,243 // mov %dl,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,69 // je 329c <_sk_lerp_u8_sse2+0x110> + .byte 116,69 // je 3244 <_sk_lerp_u8_sse2+0x110> .byte 102,15,239,228 // pxor %xmm4,%xmm4 .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 116,27 // je 327f <_sk_lerp_u8_sse2+0xf3> + .byte 116,27 // je 3227 <_sk_lerp_u8_sse2+0xf3> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 15,133,90,255,255,255 // jne 31c8 <_sk_lerp_u8_sse2+0x3c> + .byte 15,133,90,255,255,255 // jne 3170 <_sk_lerp_u8_sse2+0x3c> .byte 15,182,116,57,2 // movzbl 0x2(%ecx,%edi,1),%esi .byte 102,15,110,230 // movd %esi,%xmm4 .byte 139,117,20 // mov 0x14(%ebp),%esi @@ -44826,11 +44684,11 @@ _sk_lerp_u8_sse2: .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,229 // movsd %xmm5,%xmm4 .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5 - .byte 233,44,255,255,255 // jmp 31c8 <_sk_lerp_u8_sse2+0x3c> + .byte 233,44,255,255,255 // jmp 3170 <_sk_lerp_u8_sse2+0x3c> .byte 15,182,12,57 // movzbl (%ecx,%edi,1),%ecx .byte 102,15,110,225 // movd %ecx,%xmm4 .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 233,28,255,255,255 // jmp 31c8 <_sk_lerp_u8_sse2+0x3c> + .byte 233,28,255,255,255 // jmp 3170 <_sk_lerp_u8_sse2+0x3c> HIDDEN _sk_lerp_565_sse2 .globl _sk_lerp_565_sse2 @@ -44842,7 +44700,7 @@ _sk_lerp_565_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 32ba <_sk_lerp_565_sse2+0xe> + .byte 232,0,0,0,0 // call 3262 <_sk_lerp_565_sse2+0xe> .byte 91 // pop %ebx .byte 139,85,24 // mov 0x18(%ebp),%edx .byte 139,117,20 // mov 0x14(%ebp),%esi @@ -44851,20 +44709,20 @@ _sk_lerp_565_sse2: .byte 139,9 // mov (%ecx),%ecx .byte 133,210 // test %edx,%edx .byte 139,125,16 // mov 0x10(%ebp),%edi - .byte 15,133,212,0,0,0 // jne 33a7 <_sk_lerp_565_sse2+0xfb> + .byte 15,133,212,0,0,0 // jne 334f <_sk_lerp_565_sse2+0xfb> .byte 243,15,126,52,121 // movq (%ecx,%edi,2),%xmm6 .byte 102,15,97,240 // punpcklwd %xmm0,%xmm6 - .byte 102,15,111,163,118,81,0,0 // movdqa 0x5176(%ebx),%xmm4 + .byte 102,15,111,163,126,81,0,0 // movdqa 0x517e(%ebx),%xmm4 .byte 102,15,219,230 // pand %xmm6,%xmm4 .byte 15,91,228 // cvtdq2ps %xmm4,%xmm4 - .byte 15,89,163,134,81,0,0 // mulps 0x5186(%ebx),%xmm4 - .byte 102,15,111,187,150,81,0,0 // movdqa 0x5196(%ebx),%xmm7 + .byte 15,89,163,142,81,0,0 // mulps 0x518e(%ebx),%xmm4 + .byte 102,15,111,187,158,81,0,0 // movdqa 0x519e(%ebx),%xmm7 .byte 102,15,219,254 // pand %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 - .byte 15,89,187,166,81,0,0 // mulps 0x51a6(%ebx),%xmm7 - .byte 102,15,219,179,182,81,0,0 // pand 0x51b6(%ebx),%xmm6 + .byte 15,89,187,174,81,0,0 // mulps 0x51ae(%ebx),%xmm7 + .byte 102,15,219,179,190,81,0,0 // pand 0x51be(%ebx),%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 - .byte 15,89,179,198,81,0,0 // mulps 0x51c6(%ebx),%xmm6 + .byte 15,89,179,206,81,0,0 // mulps 0x51ce(%ebx),%xmm6 .byte 15,40,109,40 // movaps 0x28(%ebp),%xmm5 .byte 15,92,197 // subps %xmm5,%xmm0 .byte 15,89,196 // mulps %xmm4,%xmm0 @@ -44912,13 +44770,13 @@ _sk_lerp_565_sse2: .byte 136,85,243 // mov %dl,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,58 // je 33ee <_sk_lerp_565_sse2+0x142> + .byte 116,58 // je 3396 <_sk_lerp_565_sse2+0x142> .byte 102,15,239,246 // pxor %xmm6,%xmm6 .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 116,27 // je 33dc <_sk_lerp_565_sse2+0x130> + .byte 116,27 // je 3384 <_sk_lerp_565_sse2+0x130> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 15,133,17,255,255,255 // jne 32dc <_sk_lerp_565_sse2+0x30> + .byte 15,133,17,255,255,255 // jne 3284 <_sk_lerp_565_sse2+0x30> .byte 15,183,116,121,4 // movzwl 0x4(%ecx,%edi,2),%esi .byte 102,15,110,230 // movd %esi,%xmm4 .byte 139,117,20 // mov 0x14(%ebp),%esi @@ -44926,11 +44784,11 @@ _sk_lerp_565_sse2: .byte 102,15,110,36,121 // movd (%ecx,%edi,2),%xmm4 .byte 102,15,97,224 // punpcklwd %xmm0,%xmm4 .byte 242,15,16,244 // movsd %xmm4,%xmm6 - .byte 233,238,254,255,255 // jmp 32dc <_sk_lerp_565_sse2+0x30> + .byte 233,238,254,255,255 // jmp 3284 <_sk_lerp_565_sse2+0x30> .byte 15,183,12,121 // movzwl (%ecx,%edi,2),%ecx .byte 102,15,110,241 // movd %ecx,%xmm6 .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 233,222,254,255,255 // jmp 32dc <_sk_lerp_565_sse2+0x30> + .byte 233,222,254,255,255 // jmp 3284 <_sk_lerp_565_sse2+0x30> HIDDEN _sk_load_tables_sse2 .globl _sk_load_tables_sse2 @@ -44942,7 +44800,7 @@ _sk_load_tables_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 340c <_sk_load_tables_sse2+0xe> + .byte 232,0,0,0,0 // call 33b4 <_sk_load_tables_sse2+0xe> .byte 94 // pop %esi .byte 139,69,24 // mov 0x18(%ebp),%eax .byte 139,93,16 // mov 0x10(%ebp),%ebx @@ -44950,9 +44808,9 @@ _sk_load_tables_sse2: .byte 133,192 // test %eax,%eax .byte 139,17 // mov (%ecx),%edx .byte 139,58 // mov (%edx),%edi - .byte 15,133,75,1,0,0 // jne 356d <_sk_load_tables_sse2+0x16f> + .byte 15,133,75,1,0,0 // jne 3515 <_sk_load_tables_sse2+0x16f> .byte 243,15,111,28,159 // movdqu (%edi,%ebx,4),%xmm3 - .byte 102,15,111,150,132,80,0,0 // movdqa 0x5084(%esi),%xmm2 + .byte 102,15,111,150,140,80,0,0 // movdqa 0x508c(%esi),%xmm2 .byte 102,15,111,195 // movdqa %xmm3,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 102,15,112,200,229 // pshufd $0xe5,%xmm0,%xmm1 @@ -45008,7 +44866,7 @@ _sk_load_tables_sse2: .byte 15,20,215 // unpcklps %xmm7,%xmm2 .byte 102,15,114,211,24 // psrld $0x18,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,158,148,80,0,0 // mulps 0x5094(%esi),%xmm3 + .byte 15,89,158,156,80,0,0 // mulps 0x509c(%esi),%xmm3 .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 137,206 // mov %ecx,%esi .byte 141,78,8 // lea 0x8(%esi),%ecx @@ -45037,18 +44895,18 @@ _sk_load_tables_sse2: .byte 137,193 // mov %eax,%ecx .byte 128,225,3 // and $0x3,%cl .byte 128,249,1 // cmp $0x1,%cl - .byte 116,39 // je 359e <_sk_load_tables_sse2+0x1a0> + .byte 116,39 // je 3546 <_sk_load_tables_sse2+0x1a0> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 128,249,2 // cmp $0x2,%cl - .byte 116,20 // je 3594 <_sk_load_tables_sse2+0x196> + .byte 116,20 // je 353c <_sk_load_tables_sse2+0x196> .byte 128,249,3 // cmp $0x3,%cl - .byte 15,133,158,254,255,255 // jne 3427 <_sk_load_tables_sse2+0x29> + .byte 15,133,158,254,255,255 // jne 33cf <_sk_load_tables_sse2+0x29> .byte 102,15,110,68,159,8 // movd 0x8(%edi,%ebx,4),%xmm0 .byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3 .byte 102,15,18,28,159 // movlpd (%edi,%ebx,4),%xmm3 - .byte 233,137,254,255,255 // jmp 3427 <_sk_load_tables_sse2+0x29> + .byte 233,137,254,255,255 // jmp 33cf <_sk_load_tables_sse2+0x29> .byte 102,15,110,28,159 // movd (%edi,%ebx,4),%xmm3 - .byte 233,127,254,255,255 // jmp 3427 <_sk_load_tables_sse2+0x29> + .byte 233,127,254,255,255 // jmp 33cf <_sk_load_tables_sse2+0x29> HIDDEN _sk_load_tables_u16_be_sse2 .globl _sk_load_tables_u16_be_sse2 @@ -45060,7 +44918,7 @@ _sk_load_tables_u16_be_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 129,236,140,0,0,0 // sub $0x8c,%esp - .byte 232,0,0,0,0 // call 35b9 <_sk_load_tables_u16_be_sse2+0x11> + .byte 232,0,0,0,0 // call 3561 <_sk_load_tables_u16_be_sse2+0x11> .byte 95 // pop %edi .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,69,12 // mov 0xc(%ebp),%eax @@ -45069,7 +44927,7 @@ _sk_load_tables_u16_be_sse2: .byte 139,11 // mov (%ebx),%ecx .byte 141,52,149,0,0,0,0 // lea 0x0(,%edx,4),%esi .byte 186,255,0,255,0 // mov $0xff00ff,%edx - .byte 15,133,229,1,0,0 // jne 37bf <_sk_load_tables_u16_be_sse2+0x217> + .byte 15,133,229,1,0,0 // jne 3767 <_sk_load_tables_u16_be_sse2+0x217> .byte 102,15,16,4,113 // movupd (%ecx,%esi,2),%xmm0 .byte 243,15,111,76,113,16 // movdqu 0x10(%ecx,%esi,2),%xmm1 .byte 102,15,40,216 // movapd %xmm0,%xmm3 @@ -45166,7 +45024,7 @@ _sk_load_tables_u16_be_sse2: .byte 243,15,126,93,208 // movq -0x30(%ebp),%xmm3 .byte 102,15,97,223 // punpcklwd %xmm7,%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,159,247,78,0,0 // mulps 0x4ef7(%edi),%xmm3 + .byte 15,89,159,255,78,0,0 // mulps 0x4eff(%edi),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 137,193 // mov %eax,%ecx .byte 141,65,8 // lea 0x8(%ecx),%eax @@ -45198,12 +45056,12 @@ _sk_load_tables_u16_be_sse2: .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 139,69,24 // mov 0x18(%ebp),%eax .byte 131,248,1 // cmp $0x1,%eax - .byte 15,132,17,254,255,255 // je 35e5 <_sk_load_tables_u16_be_sse2+0x3d> + .byte 15,132,17,254,255,255 // je 358d <_sk_load_tables_u16_be_sse2+0x3d> .byte 102,15,22,68,113,8 // movhpd 0x8(%ecx,%esi,2),%xmm0 .byte 131,248,3 // cmp $0x3,%eax - .byte 15,130,2,254,255,255 // jb 35e5 <_sk_load_tables_u16_be_sse2+0x3d> + .byte 15,130,2,254,255,255 // jb 358d <_sk_load_tables_u16_be_sse2+0x3d> .byte 243,15,126,76,113,16 // movq 0x10(%ecx,%esi,2),%xmm1 - .byte 233,247,253,255,255 // jmp 35e5 <_sk_load_tables_u16_be_sse2+0x3d> + .byte 233,247,253,255,255 // jmp 358d <_sk_load_tables_u16_be_sse2+0x3d> HIDDEN _sk_load_tables_rgb_u16_be_sse2 .globl _sk_load_tables_rgb_u16_be_sse2 @@ -45215,7 +45073,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,124 // sub $0x7c,%esp - .byte 232,0,0,0,0 // call 37fc <_sk_load_tables_rgb_u16_be_sse2+0xe> + .byte 232,0,0,0,0 // call 37a4 <_sk_load_tables_rgb_u16_be_sse2+0xe> .byte 88 // pop %eax .byte 137,69,240 // mov %eax,-0x10(%ebp) .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -45225,7 +45083,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 139,19 // mov (%ebx),%edx .byte 141,60,73 // lea (%ecx,%ecx,2),%edi .byte 190,255,0,255,0 // mov $0xff00ff,%esi - .byte 15,133,198,1,0,0 // jne 39e2 <_sk_load_tables_rgb_u16_be_sse2+0x1f4> + .byte 15,133,198,1,0,0 // jne 398a <_sk_load_tables_rgb_u16_be_sse2+0x1f4> .byte 243,15,111,12,122 // movdqu (%edx,%edi,2),%xmm1 .byte 243,15,111,92,122,8 // movdqu 0x8(%edx,%edi,2),%xmm3 .byte 102,15,115,219,4 // psrldq $0x4,%xmm3 @@ -45335,7 +45193,7 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 137,4,36 // mov %eax,(%esp) .byte 139,69,240 // mov -0x10(%ebp),%eax - .byte 15,40,152,196,76,0,0 // movaps 0x4cc4(%eax),%xmm3 + .byte 15,40,152,204,76,0,0 // movaps 0x4ccc(%eax),%xmm3 .byte 15,40,197 // movaps %xmm5,%xmm0 .byte 255,81,4 // call *0x4(%ecx) .byte 131,196,124 // add $0x7c,%esp @@ -45349,20 +45207,20 @@ _sk_load_tables_rgb_u16_be_sse2: .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 139,69,24 // mov 0x18(%ebp),%eax .byte 131,248,1 // cmp $0x1,%eax - .byte 117,13 // jne 3a07 <_sk_load_tables_rgb_u16_be_sse2+0x219> + .byte 117,13 // jne 39af <_sk_load_tables_rgb_u16_be_sse2+0x219> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,55,254,255,255 // jmp 383e <_sk_load_tables_rgb_u16_be_sse2+0x50> + .byte 233,55,254,255,255 // jmp 37e6 <_sk_load_tables_rgb_u16_be_sse2+0x50> .byte 102,15,110,68,122,6 // movd 0x6(%edx,%edi,2),%xmm0 .byte 102,15,196,68,122,10,2 // pinsrw $0x2,0xa(%edx,%edi,2),%xmm0 .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 131,248,3 // cmp $0x3,%eax - .byte 114,18 // jb 3a2f <_sk_load_tables_rgb_u16_be_sse2+0x241> + .byte 114,18 // jb 39d7 <_sk_load_tables_rgb_u16_be_sse2+0x241> .byte 102,15,110,92,122,12 // movd 0xc(%edx,%edi,2),%xmm3 .byte 102,15,196,92,122,16,2 // pinsrw $0x2,0x10(%edx,%edi,2),%xmm3 - .byte 233,15,254,255,255 // jmp 383e <_sk_load_tables_rgb_u16_be_sse2+0x50> + .byte 233,15,254,255,255 // jmp 37e6 <_sk_load_tables_rgb_u16_be_sse2+0x50> .byte 102,15,239,219 // pxor %xmm3,%xmm3 - .byte 233,6,254,255,255 // jmp 383e <_sk_load_tables_rgb_u16_be_sse2+0x50> + .byte 233,6,254,255,255 // jmp 37e6 <_sk_load_tables_rgb_u16_be_sse2+0x50> HIDDEN _sk_byte_tables_sse2 .globl _sk_byte_tables_sse2 @@ -45374,11 +45232,11 @@ _sk_byte_tables_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 3a46 <_sk_byte_tables_sse2+0xe> + .byte 232,0,0,0,0 // call 39ee <_sk_byte_tables_sse2+0xe> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,8 // mov (%eax),%ecx - .byte 15,40,170,138,74,0,0 // movaps 0x4a8a(%edx),%xmm5 + .byte 15,40,170,146,74,0,0 // movaps 0x4a92(%edx),%xmm5 .byte 15,89,197 // mulps %xmm5,%xmm0 .byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0 .byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4 @@ -45400,7 +45258,7 @@ _sk_byte_tables_sse2: .byte 102,15,196,192,0 // pinsrw $0x0,%eax,%xmm0 .byte 139,65,4 // mov 0x4(%ecx),%eax .byte 102,15,196,195,1 // pinsrw $0x1,%ebx,%xmm0 - .byte 15,40,162,154,74,0,0 // movaps 0x4a9a(%edx),%xmm4 + .byte 15,40,162,162,74,0,0 // movaps 0x4aa2(%edx),%xmm4 .byte 15,89,205 // mulps %xmm5,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6 @@ -45539,12 +45397,12 @@ _sk_byte_tables_rgb_sse2: .byte 15,182,60,31 // movzbl (%edi,%ebx,1),%edi .byte 193,231,8 // shl $0x8,%edi .byte 9,215 // or %edx,%edi - .byte 232,0,0,0,0 // call 3c82 <_sk_byte_tables_rgb_sse2+0x65> + .byte 232,0,0,0,0 // call 3c2a <_sk_byte_tables_rgb_sse2+0x65> .byte 90 // pop %edx .byte 102,15,196,199,0 // pinsrw $0x0,%edi,%xmm0 .byte 139,121,4 // mov 0x4(%ecx),%edi .byte 102,15,196,198,1 // pinsrw $0x1,%esi,%xmm0 - .byte 15,40,170,110,72,0,0 // movaps 0x486e(%edx),%xmm5 + .byte 15,40,170,118,72,0,0 // movaps 0x4876(%edx),%xmm5 .byte 15,89,204 // mulps %xmm4,%xmm1 .byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1 .byte 102,15,112,241,78 // pshufd $0x4e,%xmm1,%xmm6 @@ -45873,7 +45731,7 @@ _sk_parametric_r_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 408b <_sk_parametric_r_sse2+0xe> + .byte 232,0,0,0,0 // call 4033 <_sk_parametric_r_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -45888,15 +45746,15 @@ _sk_parametric_r_sse2: .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4 - .byte 15,89,166,117,68,0,0 // mulps 0x4475(%esi),%xmm4 - .byte 15,84,182,133,68,0,0 // andps 0x4485(%esi),%xmm6 - .byte 15,86,182,149,68,0,0 // orps 0x4495(%esi),%xmm6 - .byte 15,88,166,165,68,0,0 // addps 0x44a5(%esi),%xmm4 - .byte 15,40,190,181,68,0,0 // movaps 0x44b5(%esi),%xmm7 + .byte 15,89,166,125,68,0,0 // mulps 0x447d(%esi),%xmm4 + .byte 15,84,182,141,68,0,0 // andps 0x448d(%esi),%xmm6 + .byte 15,86,182,157,68,0,0 // orps 0x449d(%esi),%xmm6 + .byte 15,88,166,173,68,0,0 // addps 0x44ad(%esi),%xmm4 + .byte 15,40,190,189,68,0,0 // movaps 0x44bd(%esi),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 - .byte 15,88,182,197,68,0,0 // addps 0x44c5(%esi),%xmm6 - .byte 15,40,190,213,68,0,0 // movaps 0x44d5(%esi),%xmm7 + .byte 15,88,182,205,68,0,0 // addps 0x44cd(%esi),%xmm6 + .byte 15,40,190,221,68,0,0 // movaps 0x44dd(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -45904,21 +45762,21 @@ _sk_parametric_r_sse2: .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,174,229,68,0,0 // movaps 0x44e5(%esi),%xmm5 + .byte 15,40,174,237,68,0,0 // movaps 0x44ed(%esi),%xmm5 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 - .byte 15,88,166,245,68,0,0 // addps 0x44f5(%esi),%xmm4 - .byte 15,40,182,5,69,0,0 // movaps 0x4505(%esi),%xmm6 + .byte 15,88,166,253,68,0,0 // addps 0x44fd(%esi),%xmm4 + .byte 15,40,182,13,69,0,0 // movaps 0x450d(%esi),%xmm6 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,92,230 // subps %xmm6,%xmm4 - .byte 15,40,182,21,69,0,0 // movaps 0x4515(%esi),%xmm6 + .byte 15,40,182,29,69,0,0 // movaps 0x451d(%esi),%xmm6 .byte 15,92,247 // subps %xmm7,%xmm6 - .byte 15,40,190,37,69,0,0 // movaps 0x4525(%esi),%xmm7 + .byte 15,40,190,45,69,0,0 // movaps 0x452d(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,88,252 // addps %xmm4,%xmm7 - .byte 15,89,190,53,69,0,0 // mulps 0x4535(%esi),%xmm7 + .byte 15,89,190,61,69,0,0 // mulps 0x453d(%esi),%xmm7 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 @@ -45972,7 +45830,7 @@ _sk_parametric_g_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 41ed <_sk_parametric_g_sse2+0xe> + .byte 232,0,0,0,0 // call 4195 <_sk_parametric_g_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -45987,15 +45845,15 @@ _sk_parametric_g_sse2: .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4 - .byte 15,89,166,227,67,0,0 // mulps 0x43e3(%esi),%xmm4 - .byte 15,84,182,243,67,0,0 // andps 0x43f3(%esi),%xmm6 - .byte 15,86,182,3,68,0,0 // orps 0x4403(%esi),%xmm6 - .byte 15,88,166,19,68,0,0 // addps 0x4413(%esi),%xmm4 - .byte 15,40,190,35,68,0,0 // movaps 0x4423(%esi),%xmm7 + .byte 15,89,166,235,67,0,0 // mulps 0x43eb(%esi),%xmm4 + .byte 15,84,182,251,67,0,0 // andps 0x43fb(%esi),%xmm6 + .byte 15,86,182,11,68,0,0 // orps 0x440b(%esi),%xmm6 + .byte 15,88,166,27,68,0,0 // addps 0x441b(%esi),%xmm4 + .byte 15,40,190,43,68,0,0 // movaps 0x442b(%esi),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 - .byte 15,88,182,51,68,0,0 // addps 0x4433(%esi),%xmm6 - .byte 15,40,190,67,68,0,0 // movaps 0x4443(%esi),%xmm7 + .byte 15,88,182,59,68,0,0 // addps 0x443b(%esi),%xmm6 + .byte 15,40,190,75,68,0,0 // movaps 0x444b(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -46003,21 +45861,21 @@ _sk_parametric_g_sse2: .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,174,83,68,0,0 // movaps 0x4453(%esi),%xmm5 + .byte 15,40,174,91,68,0,0 // movaps 0x445b(%esi),%xmm5 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 - .byte 15,88,166,99,68,0,0 // addps 0x4463(%esi),%xmm4 - .byte 15,40,182,115,68,0,0 // movaps 0x4473(%esi),%xmm6 + .byte 15,88,166,107,68,0,0 // addps 0x446b(%esi),%xmm4 + .byte 15,40,182,123,68,0,0 // movaps 0x447b(%esi),%xmm6 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,92,230 // subps %xmm6,%xmm4 - .byte 15,40,182,131,68,0,0 // movaps 0x4483(%esi),%xmm6 + .byte 15,40,182,139,68,0,0 // movaps 0x448b(%esi),%xmm6 .byte 15,92,247 // subps %xmm7,%xmm6 - .byte 15,40,190,147,68,0,0 // movaps 0x4493(%esi),%xmm7 + .byte 15,40,190,155,68,0,0 // movaps 0x449b(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,88,252 // addps %xmm4,%xmm7 - .byte 15,89,190,163,68,0,0 // mulps 0x44a3(%esi),%xmm7 + .byte 15,89,190,171,68,0,0 // mulps 0x44ab(%esi),%xmm7 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 @@ -46071,7 +45929,7 @@ _sk_parametric_b_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 434f <_sk_parametric_b_sse2+0xe> + .byte 232,0,0,0,0 // call 42f7 <_sk_parametric_b_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -46086,15 +45944,15 @@ _sk_parametric_b_sse2: .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4 - .byte 15,89,166,81,67,0,0 // mulps 0x4351(%esi),%xmm4 - .byte 15,84,182,97,67,0,0 // andps 0x4361(%esi),%xmm6 - .byte 15,86,182,113,67,0,0 // orps 0x4371(%esi),%xmm6 - .byte 15,88,166,129,67,0,0 // addps 0x4381(%esi),%xmm4 - .byte 15,40,190,145,67,0,0 // movaps 0x4391(%esi),%xmm7 + .byte 15,89,166,89,67,0,0 // mulps 0x4359(%esi),%xmm4 + .byte 15,84,182,105,67,0,0 // andps 0x4369(%esi),%xmm6 + .byte 15,86,182,121,67,0,0 // orps 0x4379(%esi),%xmm6 + .byte 15,88,166,137,67,0,0 // addps 0x4389(%esi),%xmm4 + .byte 15,40,190,153,67,0,0 // movaps 0x4399(%esi),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 - .byte 15,88,182,161,67,0,0 // addps 0x43a1(%esi),%xmm6 - .byte 15,40,190,177,67,0,0 // movaps 0x43b1(%esi),%xmm7 + .byte 15,88,182,169,67,0,0 // addps 0x43a9(%esi),%xmm6 + .byte 15,40,190,185,67,0,0 // movaps 0x43b9(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -46102,21 +45960,21 @@ _sk_parametric_b_sse2: .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,174,193,67,0,0 // movaps 0x43c1(%esi),%xmm5 + .byte 15,40,174,201,67,0,0 // movaps 0x43c9(%esi),%xmm5 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 - .byte 15,88,166,209,67,0,0 // addps 0x43d1(%esi),%xmm4 - .byte 15,40,182,225,67,0,0 // movaps 0x43e1(%esi),%xmm6 + .byte 15,88,166,217,67,0,0 // addps 0x43d9(%esi),%xmm4 + .byte 15,40,182,233,67,0,0 // movaps 0x43e9(%esi),%xmm6 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,92,230 // subps %xmm6,%xmm4 - .byte 15,40,182,241,67,0,0 // movaps 0x43f1(%esi),%xmm6 + .byte 15,40,182,249,67,0,0 // movaps 0x43f9(%esi),%xmm6 .byte 15,92,247 // subps %xmm7,%xmm6 - .byte 15,40,190,1,68,0,0 // movaps 0x4401(%esi),%xmm7 + .byte 15,40,190,9,68,0,0 // movaps 0x4409(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,88,252 // addps %xmm4,%xmm7 - .byte 15,89,190,17,68,0,0 // mulps 0x4411(%esi),%xmm7 + .byte 15,89,190,25,68,0,0 // mulps 0x4419(%esi),%xmm7 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 @@ -46170,7 +46028,7 @@ _sk_parametric_a_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 44b1 <_sk_parametric_a_sse2+0xe> + .byte 232,0,0,0,0 // call 4459 <_sk_parametric_a_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -46185,15 +46043,15 @@ _sk_parametric_a_sse2: .byte 15,88,244 // addps %xmm4,%xmm6 .byte 15,198,237,0 // shufps $0x0,%xmm5,%xmm5 .byte 15,91,230 // cvtdq2ps %xmm6,%xmm4 - .byte 15,89,166,191,66,0,0 // mulps 0x42bf(%esi),%xmm4 - .byte 15,84,182,207,66,0,0 // andps 0x42cf(%esi),%xmm6 - .byte 15,86,182,223,66,0,0 // orps 0x42df(%esi),%xmm6 - .byte 15,88,166,239,66,0,0 // addps 0x42ef(%esi),%xmm4 - .byte 15,40,190,255,66,0,0 // movaps 0x42ff(%esi),%xmm7 + .byte 15,89,166,199,66,0,0 // mulps 0x42c7(%esi),%xmm4 + .byte 15,84,182,215,66,0,0 // andps 0x42d7(%esi),%xmm6 + .byte 15,86,182,231,66,0,0 // orps 0x42e7(%esi),%xmm6 + .byte 15,88,166,247,66,0,0 // addps 0x42f7(%esi),%xmm4 + .byte 15,40,190,7,67,0,0 // movaps 0x4307(%esi),%xmm7 .byte 15,89,254 // mulps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 - .byte 15,88,182,15,67,0,0 // addps 0x430f(%esi),%xmm6 - .byte 15,40,190,31,67,0,0 // movaps 0x431f(%esi),%xmm7 + .byte 15,88,182,23,67,0,0 // addps 0x4317(%esi),%xmm6 + .byte 15,40,190,39,67,0,0 // movaps 0x4327(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,92,231 // subps %xmm7,%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -46201,21 +46059,21 @@ _sk_parametric_a_sse2: .byte 15,91,245 // cvtdq2ps %xmm5,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,174,47,67,0,0 // movaps 0x432f(%esi),%xmm5 + .byte 15,40,174,55,67,0,0 // movaps 0x4337(%esi),%xmm5 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,252 // movaps %xmm4,%xmm7 .byte 15,92,254 // subps %xmm6,%xmm7 - .byte 15,88,166,63,67,0,0 // addps 0x433f(%esi),%xmm4 - .byte 15,40,182,79,67,0,0 // movaps 0x434f(%esi),%xmm6 + .byte 15,88,166,71,67,0,0 // addps 0x4347(%esi),%xmm4 + .byte 15,40,182,87,67,0,0 // movaps 0x4357(%esi),%xmm6 .byte 15,89,247 // mulps %xmm7,%xmm6 .byte 15,92,230 // subps %xmm6,%xmm4 - .byte 15,40,182,95,67,0,0 // movaps 0x435f(%esi),%xmm6 + .byte 15,40,182,103,67,0,0 // movaps 0x4367(%esi),%xmm6 .byte 15,92,247 // subps %xmm7,%xmm6 - .byte 15,40,190,111,67,0,0 // movaps 0x436f(%esi),%xmm7 + .byte 15,40,190,119,67,0,0 // movaps 0x4377(%esi),%xmm7 .byte 15,94,254 // divps %xmm6,%xmm7 .byte 15,88,252 // addps %xmm4,%xmm7 - .byte 15,89,190,127,67,0,0 // mulps 0x437f(%esi),%xmm7 + .byte 15,89,190,135,67,0,0 // mulps 0x4387(%esi),%xmm7 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 243,15,16,103,16 // movss 0x10(%edi),%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 @@ -46272,31 +46130,31 @@ _sk_lab_to_xyz_sse2: .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,208 // movaps %xmm0,%xmm2 - .byte 232,0,0,0,0 // call 461d <_sk_lab_to_xyz_sse2+0x18> + .byte 232,0,0,0,0 // call 45c5 <_sk_lab_to_xyz_sse2+0x18> .byte 88 // pop %eax - .byte 15,89,144,35,66,0,0 // mulps 0x4223(%eax),%xmm2 - .byte 15,40,160,51,66,0,0 // movaps 0x4233(%eax),%xmm4 + .byte 15,89,144,43,66,0,0 // mulps 0x422b(%eax),%xmm2 + .byte 15,40,160,59,66,0,0 // movaps 0x423b(%eax),%xmm4 .byte 15,89,204 // mulps %xmm4,%xmm1 - .byte 15,40,168,67,66,0,0 // movaps 0x4243(%eax),%xmm5 + .byte 15,40,168,75,66,0,0 // movaps 0x424b(%eax),%xmm5 .byte 15,88,205 // addps %xmm5,%xmm1 .byte 15,89,220 // mulps %xmm4,%xmm3 .byte 15,88,221 // addps %xmm5,%xmm3 - .byte 15,88,144,83,66,0,0 // addps 0x4253(%eax),%xmm2 - .byte 15,89,144,99,66,0,0 // mulps 0x4263(%eax),%xmm2 - .byte 15,89,136,115,66,0,0 // mulps 0x4273(%eax),%xmm1 + .byte 15,88,144,91,66,0,0 // addps 0x425b(%eax),%xmm2 + .byte 15,89,144,107,66,0,0 // mulps 0x426b(%eax),%xmm2 + .byte 15,89,136,123,66,0,0 // mulps 0x427b(%eax),%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 - .byte 15,89,152,131,66,0,0 // mulps 0x4283(%eax),%xmm3 + .byte 15,89,152,139,66,0,0 // mulps 0x428b(%eax),%xmm3 .byte 15,40,234 // movaps %xmm2,%xmm5 .byte 15,92,235 // subps %xmm3,%xmm5 .byte 15,40,193 // movaps %xmm1,%xmm0 .byte 15,89,192 // mulps %xmm0,%xmm0 .byte 15,89,193 // mulps %xmm1,%xmm0 - .byte 15,40,152,147,66,0,0 // movaps 0x4293(%eax),%xmm3 + .byte 15,40,152,155,66,0,0 // movaps 0x429b(%eax),%xmm3 .byte 15,40,227 // movaps %xmm3,%xmm4 .byte 15,194,224,1 // cmpltps %xmm0,%xmm4 - .byte 15,40,176,163,66,0,0 // movaps 0x42a3(%eax),%xmm6 + .byte 15,40,176,171,66,0,0 // movaps 0x42ab(%eax),%xmm6 .byte 15,88,206 // addps %xmm6,%xmm1 - .byte 15,40,184,179,66,0,0 // movaps 0x42b3(%eax),%xmm7 + .byte 15,40,184,187,66,0,0 // movaps 0x42bb(%eax),%xmm7 .byte 15,89,207 // mulps %xmm7,%xmm1 .byte 15,84,196 // andps %xmm4,%xmm0 .byte 15,85,225 // andnps %xmm1,%xmm4 @@ -46328,8 +46186,8 @@ _sk_lab_to_xyz_sse2: .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 .byte 15,86,216 // orps %xmm0,%xmm3 .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 - .byte 15,89,160,195,66,0,0 // mulps 0x42c3(%eax),%xmm4 - .byte 15,89,152,211,66,0,0 // mulps 0x42d3(%eax),%xmm3 + .byte 15,89,160,203,66,0,0 // mulps 0x42cb(%eax),%xmm4 + .byte 15,89,152,219,66,0,0 // mulps 0x42db(%eax),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 141,88,4 // lea 0x4(%eax),%ebx .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp) @@ -46362,7 +46220,7 @@ _sk_load_a8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 474c <_sk_load_a8_sse2+0xe> + .byte 232,0,0,0,0 // call 46f4 <_sk_load_a8_sse2+0xe> .byte 94 // pop %esi .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4 .byte 15,40,85,72 // movaps 0x48(%ebp),%xmm2 @@ -46375,13 +46233,13 @@ _sk_load_a8_sse2: .byte 139,9 // mov (%ecx),%ecx .byte 133,210 // test %edx,%edx .byte 139,93,16 // mov 0x10(%ebp),%ebx - .byte 117,98 // jne 47d4 <_sk_load_a8_sse2+0x96> + .byte 117,98 // jne 477c <_sk_load_a8_sse2+0x96> .byte 102,15,110,28,25 // movd (%ecx,%ebx,1),%xmm3 .byte 102,15,96,216 // punpcklbw %xmm0,%xmm3 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,219,158,180,65,0,0 // pand 0x41b4(%esi),%xmm3 + .byte 102,15,219,158,188,65,0,0 // pand 0x41bc(%esi),%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,158,196,65,0,0 // mulps 0x41c4(%esi),%xmm3 + .byte 15,89,158,204,65,0,0 // mulps 0x41cc(%esi),%xmm3 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp) .byte 15,41,84,36,64 // movaps %xmm2,0x40(%esp) @@ -46406,13 +46264,13 @@ _sk_load_a8_sse2: .byte 136,85,243 // mov %dl,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,61 // je 481e <_sk_load_a8_sse2+0xe0> + .byte 116,61 // je 47c6 <_sk_load_a8_sse2+0xe0> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 116,23 // je 4805 <_sk_load_a8_sse2+0xc7> + .byte 116,23 // je 47ad <_sk_load_a8_sse2+0xc7> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 117,139 // jne 477f <_sk_load_a8_sse2+0x41> + .byte 117,139 // jne 4727 <_sk_load_a8_sse2+0x41> .byte 15,182,124,25,2 // movzbl 0x2(%ecx,%ebx,1),%edi .byte 102,15,110,223 // movd %edi,%xmm3 .byte 139,125,20 // mov 0x14(%ebp),%edi @@ -46422,11 +46280,11 @@ _sk_load_a8_sse2: .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,221 // movsd %xmm5,%xmm3 - .byte 233,97,255,255,255 // jmp 477f <_sk_load_a8_sse2+0x41> + .byte 233,97,255,255,255 // jmp 4727 <_sk_load_a8_sse2+0x41> .byte 15,182,12,25 // movzbl (%ecx,%ebx,1),%ecx .byte 102,15,110,217 // movd %ecx,%xmm3 .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 233,81,255,255,255 // jmp 477f <_sk_load_a8_sse2+0x41> + .byte 233,81,255,255,255 // jmp 4727 <_sk_load_a8_sse2+0x41> HIDDEN _sk_gather_a8_sse2 .globl _sk_gather_a8_sse2 @@ -46465,7 +46323,7 @@ _sk_gather_a8_sse2: .byte 102,15,126,206 // movd %xmm1,%esi .byte 15,182,12,10 // movzbl (%edx,%ecx,1),%ecx .byte 15,182,20,50 // movzbl (%edx,%esi,1),%edx - .byte 232,0,0,0,0 // call 48a8 <_sk_gather_a8_sse2+0x7a> + .byte 232,0,0,0,0 // call 4850 <_sk_gather_a8_sse2+0x7a> .byte 94 // pop %esi .byte 193,226,8 // shl $0x8,%edx .byte 9,202 // or %ecx,%edx @@ -46478,7 +46336,7 @@ _sk_gather_a8_sse2: .byte 102,15,96,193 // punpcklbw %xmm1,%xmm0 .byte 102,15,97,193 // punpcklwd %xmm1,%xmm0 .byte 15,91,216 // cvtdq2ps %xmm0,%xmm3 - .byte 15,89,158,120,64,0,0 // mulps 0x4078(%esi),%xmm3 + .byte 15,89,158,128,64,0,0 // mulps 0x4080(%esi),%xmm3 .byte 139,117,24 // mov 0x18(%ebp),%esi .byte 15,40,69,40 // movaps 0x28(%ebp),%xmm0 .byte 15,40,77,56 // movaps 0x38(%ebp),%xmm1 @@ -46515,7 +46373,7 @@ _sk_store_a8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 129,236,156,0,0,0 // sub $0x9c,%esp - .byte 232,0,0,0,0 // call 4939 <_sk_store_a8_sse2+0x11> + .byte 232,0,0,0,0 // call 48e1 <_sk_store_a8_sse2+0x11> .byte 89 // pop %ecx .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6 .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 @@ -46524,7 +46382,7 @@ _sk_store_a8_sse2: .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,48 // mov (%eax),%esi .byte 139,30 // mov (%esi),%ebx - .byte 15,40,161,247,63,0,0 // movaps 0x3ff7(%ecx),%xmm4 + .byte 15,40,161,255,63,0,0 // movaps 0x3fff(%ecx),%xmm4 .byte 15,89,227 // mulps %xmm3,%xmm4 .byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4 .byte 102,15,114,244,16 // pslld $0x10,%xmm4 @@ -46535,7 +46393,7 @@ _sk_store_a8_sse2: .byte 133,255 // test %edi,%edi .byte 139,125,16 // mov 0x10(%ebp),%edi .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7 - .byte 117,70 // jne 49c2 <_sk_store_a8_sse2+0x9a> + .byte 117,70 // jne 496a <_sk_store_a8_sse2+0x9a> .byte 102,15,126,225 // movd %xmm4,%ecx .byte 137,12,59 // mov %ecx,(%ebx,%edi,1) .byte 141,72,8 // lea 0x8(%eax),%ecx @@ -46562,30 +46420,30 @@ _sk_store_a8_sse2: .byte 137,240 // mov %esi,%eax .byte 36,3 // and $0x3,%al .byte 60,1 // cmp $0x1,%al - .byte 116,69 // je 4a17 <_sk_store_a8_sse2+0xef> + .byte 116,69 // je 49bf <_sk_store_a8_sse2+0xef> .byte 136,69,243 // mov %al,-0xd(%ebp) .byte 60,2 // cmp $0x2,%al .byte 139,69,12 // mov 0xc(%ebp),%eax - .byte 116,21 // je 49f1 <_sk_store_a8_sse2+0xc9> + .byte 116,21 // je 4999 <_sk_store_a8_sse2+0xc9> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 117,161 // jne 4983 <_sk_store_a8_sse2+0x5b> + .byte 117,161 // jne 492b <_sk_store_a8_sse2+0x5b> .byte 102,15,127,101,200 // movdqa %xmm4,-0x38(%ebp) .byte 138,85,208 // mov -0x30(%ebp),%dl .byte 136,84,59,2 // mov %dl,0x2(%ebx,%edi,1) .byte 139,85,20 // mov 0x14(%ebp),%edx .byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4 - .byte 102,15,219,161,7,64,0,0 // pand 0x4007(%ecx),%xmm4 + .byte 102,15,219,161,15,64,0,0 // pand 0x400f(%ecx),%xmm4 .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,15,103,228 // packuswb %xmm4,%xmm4 .byte 102,15,126,225 // movd %xmm4,%ecx .byte 102,137,12,59 // mov %cx,(%ebx,%edi,1) - .byte 233,108,255,255,255 // jmp 4983 <_sk_store_a8_sse2+0x5b> + .byte 233,108,255,255,255 // jmp 492b <_sk_store_a8_sse2+0x5b> .byte 102,15,127,101,216 // movdqa %xmm4,-0x28(%ebp) .byte 138,77,216 // mov -0x28(%ebp),%cl .byte 136,12,59 // mov %cl,(%ebx,%edi,1) .byte 139,69,12 // mov 0xc(%ebp),%eax - .byte 233,89,255,255,255 // jmp 4983 <_sk_store_a8_sse2+0x5b> + .byte 233,89,255,255,255 // jmp 492b <_sk_store_a8_sse2+0x5b> HIDDEN _sk_load_g8_sse2 .globl _sk_load_g8_sse2 @@ -46597,7 +46455,7 @@ _sk_load_g8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 4a38 <_sk_load_g8_sse2+0xe> + .byte 232,0,0,0,0 // call 49e0 <_sk_load_g8_sse2+0xe> .byte 88 // pop %eax .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4 .byte 15,40,93,72 // movaps 0x48(%ebp),%xmm3 @@ -46610,13 +46468,13 @@ _sk_load_g8_sse2: .byte 139,18 // mov (%edx),%edx .byte 133,219 // test %ebx,%ebx .byte 139,125,16 // mov 0x10(%ebp),%edi - .byte 117,100 // jne 4ac1 <_sk_load_g8_sse2+0x97> + .byte 117,100 // jne 4a69 <_sk_load_g8_sse2+0x97> .byte 102,15,110,4,58 // movd (%edx,%edi,1),%xmm0 .byte 102,15,96,192 // punpcklbw %xmm0,%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 - .byte 102,15,219,128,24,63,0,0 // pand 0x3f18(%eax),%xmm0 + .byte 102,15,219,128,32,63,0,0 // pand 0x3f20(%eax),%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,128,40,63,0,0 // mulps 0x3f28(%eax),%xmm0 + .byte 15,89,128,48,63,0,0 // mulps 0x3f30(%eax),%xmm0 .byte 141,81,8 // lea 0x8(%ecx),%edx .byte 15,41,100,36,80 // movaps %xmm4,0x50(%esp) .byte 15,41,92,36,64 // movaps %xmm3,0x40(%esp) @@ -46628,7 +46486,7 @@ _sk_load_g8_sse2: .byte 137,84,36,4 // mov %edx,0x4(%esp) .byte 139,85,8 // mov 0x8(%ebp),%edx .byte 137,20,36 // mov %edx,(%esp) - .byte 15,40,152,56,63,0,0 // movaps 0x3f38(%eax),%xmm3 + .byte 15,40,152,64,63,0,0 // movaps 0x3f40(%eax),%xmm3 .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,81,4 // call *0x4(%ecx) @@ -46641,13 +46499,13 @@ _sk_load_g8_sse2: .byte 136,93,243 // mov %bl,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,61 // je 4b0b <_sk_load_g8_sse2+0xe1> + .byte 116,61 // je 4ab3 <_sk_load_g8_sse2+0xe1> .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,93,24 // mov 0x18(%ebp),%ebx - .byte 116,23 // je 4af2 <_sk_load_g8_sse2+0xc8> + .byte 116,23 // je 4a9a <_sk_load_g8_sse2+0xc8> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 117,137 // jne 4a6a <_sk_load_g8_sse2+0x40> + .byte 117,137 // jne 4a12 <_sk_load_g8_sse2+0x40> .byte 15,182,116,58,2 // movzbl 0x2(%edx,%edi,1),%esi .byte 102,15,110,198 // movd %esi,%xmm0 .byte 139,117,20 // mov 0x14(%ebp),%esi @@ -46657,11 +46515,11 @@ _sk_load_g8_sse2: .byte 102,15,96,232 // punpcklbw %xmm0,%xmm5 .byte 102,15,97,232 // punpcklwd %xmm0,%xmm5 .byte 242,15,16,197 // movsd %xmm5,%xmm0 - .byte 233,95,255,255,255 // jmp 4a6a <_sk_load_g8_sse2+0x40> + .byte 233,95,255,255,255 // jmp 4a12 <_sk_load_g8_sse2+0x40> .byte 15,182,20,58 // movzbl (%edx,%edi,1),%edx .byte 102,15,110,194 // movd %edx,%xmm0 .byte 139,93,24 // mov 0x18(%ebp),%ebx - .byte 233,79,255,255,255 // jmp 4a6a <_sk_load_g8_sse2+0x40> + .byte 233,79,255,255,255 // jmp 4a12 <_sk_load_g8_sse2+0x40> HIDDEN _sk_gather_g8_sse2 .globl _sk_gather_g8_sse2 @@ -46700,7 +46558,7 @@ _sk_gather_g8_sse2: .byte 102,15,126,206 // movd %xmm1,%esi .byte 15,182,12,10 // movzbl (%edx,%ecx,1),%ecx .byte 15,182,20,50 // movzbl (%edx,%esi,1),%edx - .byte 232,0,0,0,0 // call 4b95 <_sk_gather_g8_sse2+0x7a> + .byte 232,0,0,0,0 // call 4b3d <_sk_gather_g8_sse2+0x7a> .byte 94 // pop %esi .byte 193,226,8 // shl $0x8,%edx .byte 9,202 // or %ecx,%edx @@ -46716,7 +46574,7 @@ _sk_gather_g8_sse2: .byte 102,15,96,197 // punpcklbw %xmm5,%xmm0 .byte 102,15,97,197 // punpcklwd %xmm5,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,134,235,61,0,0 // mulps 0x3deb(%esi),%xmm0 + .byte 15,89,134,243,61,0,0 // mulps 0x3df3(%esi),%xmm0 .byte 139,93,24 // mov 0x18(%ebp),%ebx .byte 137,193 // mov %eax,%ecx .byte 141,65,8 // lea 0x8(%ecx),%eax @@ -46730,7 +46588,7 @@ _sk_gather_g8_sse2: .byte 137,68,36,4 // mov %eax,0x4(%esp) .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 137,4,36 // mov %eax,(%esp) - .byte 15,40,158,251,61,0,0 // movaps 0x3dfb(%esi),%xmm3 + .byte 15,40,158,3,62,0,0 // movaps 0x3e03(%esi),%xmm3 .byte 15,40,200 // movaps %xmm0,%xmm1 .byte 15,40,208 // movaps %xmm0,%xmm2 .byte 255,81,4 // call *0x4(%ecx) @@ -46751,7 +46609,7 @@ _sk_gather_i8_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 4c29 <_sk_gather_i8_sse2+0xe> + .byte 232,0,0,0,0 // call 4bd1 <_sk_gather_i8_sse2+0xe> .byte 88 // pop %eax .byte 137,69,240 // mov %eax,-0x10(%ebp) .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7 @@ -46759,10 +46617,10 @@ _sk_gather_i8_sse2: .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,16 // mov (%eax),%edx .byte 133,210 // test %edx,%edx - .byte 116,7 // je 4c45 <_sk_gather_i8_sse2+0x2a> + .byte 116,7 // je 4bed <_sk_gather_i8_sse2+0x2a> .byte 131,192,4 // add $0x4,%eax .byte 137,209 // mov %edx,%ecx - .byte 235,6 // jmp 4c4b <_sk_gather_i8_sse2+0x30> + .byte 235,6 // jmp 4bf3 <_sk_gather_i8_sse2+0x30> .byte 139,72,4 // mov 0x4(%eax),%ecx .byte 131,192,8 // add $0x8,%eax .byte 139,49 // mov (%ecx),%esi @@ -46813,11 +46671,11 @@ _sk_gather_i8_sse2: .byte 102,15,98,232 // punpckldq %xmm0,%xmm5 .byte 102,15,98,233 // punpckldq %xmm1,%xmm5 .byte 139,77,240 // mov -0x10(%ebp),%ecx - .byte 102,15,111,145,119,61,0,0 // movdqa 0x3d77(%ecx),%xmm2 + .byte 102,15,111,145,127,61,0,0 // movdqa 0x3d7f(%ecx),%xmm2 .byte 102,15,111,197 // movdqa %xmm5,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,161,135,61,0,0 // movaps 0x3d87(%ecx),%xmm4 + .byte 15,40,161,143,61,0,0 // movaps 0x3d8f(%ecx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -46866,7 +46724,7 @@ _sk_load_565_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 4db6 <_sk_load_565_sse2+0xe> + .byte 232,0,0,0,0 // call 4d5e <_sk_load_565_sse2+0xe> .byte 88 // pop %eax .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6 .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 @@ -46879,20 +46737,20 @@ _sk_load_565_sse2: .byte 139,18 // mov (%edx),%edx .byte 133,219 // test %ebx,%ebx .byte 139,125,16 // mov 0x10(%ebp),%edi - .byte 15,133,134,0,0,0 // jne 4e65 <_sk_load_565_sse2+0xbd> + .byte 15,133,134,0,0,0 // jne 4e0d <_sk_load_565_sse2+0xbd> .byte 243,15,126,20,122 // movq (%edx,%edi,2),%xmm2 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,128,10,60,0,0 // movdqa 0x3c0a(%eax),%xmm0 + .byte 102,15,111,128,18,60,0,0 // movdqa 0x3c12(%eax),%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,128,26,60,0,0 // mulps 0x3c1a(%eax),%xmm0 - .byte 102,15,111,136,42,60,0,0 // movdqa 0x3c2a(%eax),%xmm1 + .byte 15,89,128,34,60,0,0 // mulps 0x3c22(%eax),%xmm0 + .byte 102,15,111,136,50,60,0,0 // movdqa 0x3c32(%eax),%xmm1 .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,136,58,60,0,0 // mulps 0x3c3a(%eax),%xmm1 - .byte 102,15,219,144,74,60,0,0 // pand 0x3c4a(%eax),%xmm2 + .byte 15,89,136,66,60,0,0 // mulps 0x3c42(%eax),%xmm1 + .byte 102,15,219,144,82,60,0,0 // pand 0x3c52(%eax),%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,144,90,60,0,0 // mulps 0x3c5a(%eax),%xmm2 + .byte 15,89,144,98,60,0,0 // mulps 0x3c62(%eax),%xmm2 .byte 141,81,8 // lea 0x8(%ecx),%edx .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp) .byte 15,41,108,36,64 // movaps %xmm5,0x40(%esp) @@ -46904,7 +46762,7 @@ _sk_load_565_sse2: .byte 137,84,36,4 // mov %edx,0x4(%esp) .byte 139,85,8 // mov 0x8(%ebp),%edx .byte 137,20,36 // mov %edx,(%esp) - .byte 15,40,152,106,60,0,0 // movaps 0x3c6a(%eax),%xmm3 + .byte 15,40,152,114,60,0,0 // movaps 0x3c72(%eax),%xmm3 .byte 255,81,4 // call *0x4(%ecx) .byte 131,196,108 // add $0x6c,%esp .byte 94 // pop %esi @@ -46915,13 +46773,13 @@ _sk_load_565_sse2: .byte 136,93,243 // mov %bl,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,58 // je 4eac <_sk_load_565_sse2+0x104> + .byte 116,58 // je 4e54 <_sk_load_565_sse2+0x104> .byte 102,15,239,210 // pxor %xmm2,%xmm2 .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,93,24 // mov 0x18(%ebp),%ebx - .byte 116,27 // je 4e9a <_sk_load_565_sse2+0xf2> + .byte 116,27 // je 4e42 <_sk_load_565_sse2+0xf2> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 15,133,95,255,255,255 // jne 4de8 <_sk_load_565_sse2+0x40> + .byte 15,133,95,255,255,255 // jne 4d90 <_sk_load_565_sse2+0x40> .byte 15,183,116,122,4 // movzwl 0x4(%edx,%edi,2),%esi .byte 102,15,110,198 // movd %esi,%xmm0 .byte 139,117,20 // mov 0x14(%ebp),%esi @@ -46929,11 +46787,11 @@ _sk_load_565_sse2: .byte 102,15,110,4,122 // movd (%edx,%edi,2),%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 .byte 242,15,16,208 // movsd %xmm0,%xmm2 - .byte 233,60,255,255,255 // jmp 4de8 <_sk_load_565_sse2+0x40> + .byte 233,60,255,255,255 // jmp 4d90 <_sk_load_565_sse2+0x40> .byte 15,183,20,122 // movzwl (%edx,%edi,2),%edx .byte 102,15,110,210 // movd %edx,%xmm2 .byte 139,93,24 // mov 0x18(%ebp),%ebx - .byte 233,44,255,255,255 // jmp 4de8 <_sk_load_565_sse2+0x40> + .byte 233,44,255,255,255 // jmp 4d90 <_sk_load_565_sse2+0x40> HIDDEN _sk_gather_565_sse2 .globl _sk_gather_565_sse2 @@ -46945,7 +46803,7 @@ _sk_gather_565_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 4eca <_sk_gather_565_sse2+0xe> + .byte 232,0,0,0,0 // call 4e72 <_sk_gather_565_sse2+0xe> .byte 88 // pop %eax .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,50 // mov (%edx),%esi @@ -46982,17 +46840,17 @@ _sk_gather_565_sse2: .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6 .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,208 // punpcklwd %xmm0,%xmm2 - .byte 102,15,111,128,102,59,0,0 // movdqa 0x3b66(%eax),%xmm0 + .byte 102,15,111,128,110,59,0,0 // movdqa 0x3b6e(%eax),%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,128,118,59,0,0 // mulps 0x3b76(%eax),%xmm0 - .byte 102,15,111,136,134,59,0,0 // movdqa 0x3b86(%eax),%xmm1 + .byte 15,89,128,126,59,0,0 // mulps 0x3b7e(%eax),%xmm0 + .byte 102,15,111,136,142,59,0,0 // movdqa 0x3b8e(%eax),%xmm1 .byte 102,15,219,202 // pand %xmm2,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,136,150,59,0,0 // mulps 0x3b96(%eax),%xmm1 - .byte 102,15,219,144,166,59,0,0 // pand 0x3ba6(%eax),%xmm2 + .byte 15,89,136,158,59,0,0 // mulps 0x3b9e(%eax),%xmm1 + .byte 102,15,219,144,174,59,0,0 // pand 0x3bae(%eax),%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,144,182,59,0,0 // mulps 0x3bb6(%eax),%xmm2 + .byte 15,89,144,190,59,0,0 // mulps 0x3bbe(%eax),%xmm2 .byte 139,93,24 // mov 0x18(%ebp),%ebx .byte 141,74,8 // lea 0x8(%edx),%ecx .byte 15,41,116,36,80 // movaps %xmm6,0x50(%esp) @@ -47005,7 +46863,7 @@ _sk_gather_565_sse2: .byte 137,76,36,4 // mov %ecx,0x4(%esp) .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 137,12,36 // mov %ecx,(%esp) - .byte 15,40,152,198,59,0,0 // movaps 0x3bc6(%eax),%xmm3 + .byte 15,40,152,206,59,0,0 // movaps 0x3bce(%eax),%xmm3 .byte 255,82,4 // call *0x4(%edx) .byte 131,196,108 // add $0x6c,%esp .byte 94 // pop %esi @@ -47024,14 +46882,14 @@ _sk_store_565_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 4fec <_sk_store_565_sse2+0xe> + .byte 232,0,0,0,0 // call 4f94 <_sk_store_565_sse2+0xe> .byte 88 // pop %eax - .byte 15,40,160,180,58,0,0 // movaps 0x3ab4(%eax),%xmm4 + .byte 15,40,160,188,58,0,0 // movaps 0x3abc(%eax),%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5 .byte 102,15,114,245,11 // pslld $0xb,%xmm5 - .byte 15,40,176,196,58,0,0 // movaps 0x3ac4(%eax),%xmm6 + .byte 15,40,176,204,58,0,0 // movaps 0x3acc(%eax),%xmm6 .byte 15,89,241 // mulps %xmm1,%xmm6 .byte 102,15,91,246 // cvtps2dq %xmm6,%xmm6 .byte 102,15,114,246,5 // pslld $0x5,%xmm6 @@ -47053,7 +46911,7 @@ _sk_store_565_sse2: .byte 133,219 // test %ebx,%ebx .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7 .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 - .byte 117,82 // jne 50ad <_sk_store_565_sse2+0xcf> + .byte 117,82 // jne 5055 <_sk_store_565_sse2+0xcf> .byte 102,15,126,226 // movd %xmm4,%edx .byte 102,15,126,238 // movd %xmm5,%esi .byte 137,20,79 // mov %edx,(%edi,%ecx,2) @@ -47084,20 +46942,20 @@ _sk_store_565_sse2: .byte 137,218 // mov %ebx,%edx .byte 128,226,3 // and $0x3,%dl .byte 128,250,1 // cmp $0x1,%dl - .byte 116,37 // je 50e5 <_sk_store_565_sse2+0x107> + .byte 116,37 // je 508d <_sk_store_565_sse2+0x107> .byte 128,250,2 // cmp $0x2,%dl - .byte 116,15 // je 50d4 <_sk_store_565_sse2+0xf6> + .byte 116,15 // je 507c <_sk_store_565_sse2+0xf6> .byte 128,250,3 // cmp $0x3,%dl - .byte 117,160 // jne 506a <_sk_store_565_sse2+0x8c> + .byte 117,160 // jne 5012 <_sk_store_565_sse2+0x8c> .byte 102,15,197,212,4 // pextrw $0x4,%xmm4,%edx .byte 102,137,84,79,4 // mov %dx,0x4(%edi,%ecx,2) .byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4 .byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4 .byte 102,15,126,36,79 // movd %xmm4,(%edi,%ecx,2) - .byte 235,133 // jmp 506a <_sk_store_565_sse2+0x8c> + .byte 235,133 // jmp 5012 <_sk_store_565_sse2+0x8c> .byte 102,15,126,226 // movd %xmm4,%edx .byte 102,137,20,79 // mov %dx,(%edi,%ecx,2) - .byte 233,120,255,255,255 // jmp 506a <_sk_store_565_sse2+0x8c> + .byte 233,120,255,255,255 // jmp 5012 <_sk_store_565_sse2+0x8c> HIDDEN _sk_load_4444_sse2 .globl _sk_load_4444_sse2 @@ -47109,7 +46967,7 @@ _sk_load_4444_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 5100 <_sk_load_4444_sse2+0xe> + .byte 232,0,0,0,0 // call 50a8 <_sk_load_4444_sse2+0xe> .byte 94 // pop %esi .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7 .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6 @@ -47122,24 +46980,24 @@ _sk_load_4444_sse2: .byte 139,9 // mov (%ecx),%ecx .byte 133,210 // test %edx,%edx .byte 139,93,16 // mov 0x10(%ebp),%ebx - .byte 15,133,149,0,0,0 // jne 51be <_sk_load_4444_sse2+0xcc> + .byte 15,133,149,0,0,0 // jne 5166 <_sk_load_4444_sse2+0xcc> .byte 243,15,126,28,89 // movq (%ecx,%ebx,2),%xmm3 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,134,192,57,0,0 // movdqa 0x39c0(%esi),%xmm0 + .byte 102,15,111,134,200,57,0,0 // movdqa 0x39c8(%esi),%xmm0 .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,134,208,57,0,0 // mulps 0x39d0(%esi),%xmm0 - .byte 102,15,111,142,224,57,0,0 // movdqa 0x39e0(%esi),%xmm1 + .byte 15,89,134,216,57,0,0 // mulps 0x39d8(%esi),%xmm0 + .byte 102,15,111,142,232,57,0,0 // movdqa 0x39e8(%esi),%xmm1 .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,142,240,57,0,0 // mulps 0x39f0(%esi),%xmm1 - .byte 102,15,111,150,0,58,0,0 // movdqa 0x3a00(%esi),%xmm2 + .byte 15,89,142,248,57,0,0 // mulps 0x39f8(%esi),%xmm1 + .byte 102,15,111,150,8,58,0,0 // movdqa 0x3a08(%esi),%xmm2 .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,150,16,58,0,0 // mulps 0x3a10(%esi),%xmm2 - .byte 102,15,219,158,32,58,0,0 // pand 0x3a20(%esi),%xmm3 + .byte 15,89,150,24,58,0,0 // mulps 0x3a18(%esi),%xmm2 + .byte 102,15,219,158,40,58,0,0 // pand 0x3a28(%esi),%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,158,48,58,0,0 // mulps 0x3a30(%esi),%xmm3 + .byte 15,89,158,56,58,0,0 // mulps 0x3a38(%esi),%xmm3 .byte 141,72,8 // lea 0x8(%eax),%ecx .byte 15,41,124,36,80 // movaps %xmm7,0x50(%esp) .byte 15,41,116,36,64 // movaps %xmm6,0x40(%esp) @@ -47161,13 +47019,13 @@ _sk_load_4444_sse2: .byte 136,85,243 // mov %dl,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,58 // je 5205 <_sk_load_4444_sse2+0x113> + .byte 116,58 // je 51ad <_sk_load_4444_sse2+0x113> .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 116,27 // je 51f3 <_sk_load_4444_sse2+0x101> + .byte 116,27 // je 519b <_sk_load_4444_sse2+0x101> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 15,133,80,255,255,255 // jne 5132 <_sk_load_4444_sse2+0x40> + .byte 15,133,80,255,255,255 // jne 50da <_sk_load_4444_sse2+0x40> .byte 15,183,124,89,4 // movzwl 0x4(%ecx,%ebx,2),%edi .byte 102,15,110,199 // movd %edi,%xmm0 .byte 139,125,20 // mov 0x14(%ebp),%edi @@ -47175,11 +47033,11 @@ _sk_load_4444_sse2: .byte 102,15,110,4,89 // movd (%ecx,%ebx,2),%xmm0 .byte 102,15,97,192 // punpcklwd %xmm0,%xmm0 .byte 242,15,16,216 // movsd %xmm0,%xmm3 - .byte 233,45,255,255,255 // jmp 5132 <_sk_load_4444_sse2+0x40> + .byte 233,45,255,255,255 // jmp 50da <_sk_load_4444_sse2+0x40> .byte 15,183,12,89 // movzwl (%ecx,%ebx,2),%ecx .byte 102,15,110,217 // movd %ecx,%xmm3 .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 233,29,255,255,255 // jmp 5132 <_sk_load_4444_sse2+0x40> + .byte 233,29,255,255,255 // jmp 50da <_sk_load_4444_sse2+0x40> HIDDEN _sk_gather_4444_sse2 .globl _sk_gather_4444_sse2 @@ -47191,7 +47049,7 @@ _sk_gather_4444_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 5223 <_sk_gather_4444_sse2+0xe> + .byte 232,0,0,0,0 // call 51cb <_sk_gather_4444_sse2+0xe> .byte 90 // pop %edx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,12 // mov 0xc(%ebp),%ecx @@ -47225,21 +47083,21 @@ _sk_gather_4444_sse2: .byte 139,125,20 // mov 0x14(%ebp),%edi .byte 102,15,239,192 // pxor %xmm0,%xmm0 .byte 102,15,97,216 // punpcklwd %xmm0,%xmm3 - .byte 102,15,111,130,29,57,0,0 // movdqa 0x391d(%edx),%xmm0 + .byte 102,15,111,130,37,57,0,0 // movdqa 0x3925(%edx),%xmm0 .byte 102,15,219,195 // pand %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,89,130,45,57,0,0 // mulps 0x392d(%edx),%xmm0 - .byte 102,15,111,138,61,57,0,0 // movdqa 0x393d(%edx),%xmm1 + .byte 15,89,130,53,57,0,0 // mulps 0x3935(%edx),%xmm0 + .byte 102,15,111,138,69,57,0,0 // movdqa 0x3945(%edx),%xmm1 .byte 102,15,219,203 // pand %xmm3,%xmm1 .byte 15,91,201 // cvtdq2ps %xmm1,%xmm1 - .byte 15,89,138,77,57,0,0 // mulps 0x394d(%edx),%xmm1 - .byte 102,15,111,146,93,57,0,0 // movdqa 0x395d(%edx),%xmm2 + .byte 15,89,138,85,57,0,0 // mulps 0x3955(%edx),%xmm1 + .byte 102,15,111,146,101,57,0,0 // movdqa 0x3965(%edx),%xmm2 .byte 102,15,219,211 // pand %xmm3,%xmm2 .byte 15,91,210 // cvtdq2ps %xmm2,%xmm2 - .byte 15,89,146,109,57,0,0 // mulps 0x396d(%edx),%xmm2 - .byte 102,15,219,154,125,57,0,0 // pand 0x397d(%edx),%xmm3 + .byte 15,89,146,117,57,0,0 // mulps 0x3975(%edx),%xmm2 + .byte 102,15,219,154,133,57,0,0 // pand 0x3985(%edx),%xmm3 .byte 15,91,219 // cvtdq2ps %xmm3,%xmm3 - .byte 15,89,154,141,57,0,0 // mulps 0x398d(%edx),%xmm3 + .byte 15,89,154,149,57,0,0 // mulps 0x3995(%edx),%xmm3 .byte 139,85,24 // mov 0x18(%ebp),%edx .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 .byte 15,40,109,56 // movaps 0x38(%ebp),%xmm5 @@ -47273,9 +47131,9 @@ _sk_store_4444_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 5354 <_sk_store_4444_sse2+0xe> + .byte 232,0,0,0,0 // call 52fc <_sk_store_4444_sse2+0xe> .byte 88 // pop %eax - .byte 15,40,160,108,56,0,0 // movaps 0x386c(%eax),%xmm4 + .byte 15,40,160,116,56,0,0 // movaps 0x3874(%eax),%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5 @@ -47307,7 +47165,7 @@ _sk_store_4444_sse2: .byte 133,219 // test %ebx,%ebx .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7 .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 - .byte 117,82 // jne 5424 <_sk_store_4444_sse2+0xde> + .byte 117,82 // jne 53cc <_sk_store_4444_sse2+0xde> .byte 102,15,126,226 // movd %xmm4,%edx .byte 102,15,126,238 // movd %xmm5,%esi .byte 137,20,79 // mov %edx,(%edi,%ecx,2) @@ -47338,20 +47196,20 @@ _sk_store_4444_sse2: .byte 137,218 // mov %ebx,%edx .byte 128,226,3 // and $0x3,%dl .byte 128,250,1 // cmp $0x1,%dl - .byte 116,37 // je 545c <_sk_store_4444_sse2+0x116> + .byte 116,37 // je 5404 <_sk_store_4444_sse2+0x116> .byte 128,250,2 // cmp $0x2,%dl - .byte 116,15 // je 544b <_sk_store_4444_sse2+0x105> + .byte 116,15 // je 53f3 <_sk_store_4444_sse2+0x105> .byte 128,250,3 // cmp $0x3,%dl - .byte 117,160 // jne 53e1 <_sk_store_4444_sse2+0x9b> + .byte 117,160 // jne 5389 <_sk_store_4444_sse2+0x9b> .byte 102,15,197,212,4 // pextrw $0x4,%xmm4,%edx .byte 102,137,84,79,4 // mov %dx,0x4(%edi,%ecx,2) .byte 102,15,112,228,212 // pshufd $0xd4,%xmm4,%xmm4 .byte 242,15,112,228,232 // pshuflw $0xe8,%xmm4,%xmm4 .byte 102,15,126,36,79 // movd %xmm4,(%edi,%ecx,2) - .byte 235,133 // jmp 53e1 <_sk_store_4444_sse2+0x9b> + .byte 235,133 // jmp 5389 <_sk_store_4444_sse2+0x9b> .byte 102,15,126,226 // movd %xmm4,%edx .byte 102,137,20,79 // mov %dx,(%edi,%ecx,2) - .byte 233,120,255,255,255 // jmp 53e1 <_sk_store_4444_sse2+0x9b> + .byte 233,120,255,255,255 // jmp 5389 <_sk_store_4444_sse2+0x9b> HIDDEN _sk_load_8888_sse2 .globl _sk_load_8888_sse2 @@ -47363,7 +47221,7 @@ _sk_load_8888_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 5477 <_sk_load_8888_sse2+0xe> + .byte 232,0,0,0,0 // call 541f <_sk_load_8888_sse2+0xe> .byte 91 // pop %ebx .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7 .byte 15,40,117,72 // movaps 0x48(%ebp),%xmm6 @@ -47374,13 +47232,13 @@ _sk_load_8888_sse2: .byte 133,210 // test %edx,%edx .byte 139,125,16 // mov 0x10(%ebp),%edi .byte 139,117,8 // mov 0x8(%ebp),%esi - .byte 15,133,147,0,0,0 // jne 552b <_sk_load_8888_sse2+0xc2> + .byte 15,133,147,0,0,0 // jne 54d3 <_sk_load_8888_sse2+0xc2> .byte 243,15,111,44,185 // movdqu (%ecx,%edi,4),%xmm5 - .byte 102,15,111,147,89,55,0,0 // movdqa 0x3759(%ebx),%xmm2 + .byte 102,15,111,147,97,55,0,0 // movdqa 0x3761(%ebx),%xmm2 .byte 102,15,111,197 // movdqa %xmm5,%xmm0 .byte 102,15,219,194 // pand %xmm2,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,163,105,55,0,0 // movaps 0x3769(%ebx),%xmm4 + .byte 15,40,163,113,55,0,0 // movaps 0x3771(%ebx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,114,209,8 // psrld $0x8,%xmm1 @@ -47418,20 +47276,20 @@ _sk_load_8888_sse2: .byte 136,85,243 // mov %dl,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,44 // je 5564 <_sk_load_8888_sse2+0xfb> + .byte 116,44 // je 550c <_sk_load_8888_sse2+0xfb> .byte 102,15,239,237 // pxor %xmm5,%xmm5 .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 116,21 // je 555a <_sk_load_8888_sse2+0xf1> + .byte 116,21 // je 5502 <_sk_load_8888_sse2+0xf1> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 15,133,78,255,255,255 // jne 549d <_sk_load_8888_sse2+0x34> + .byte 15,133,78,255,255,255 // jne 5445 <_sk_load_8888_sse2+0x34> .byte 102,15,110,68,185,8 // movd 0x8(%ecx,%edi,4),%xmm0 .byte 102,15,112,232,69 // pshufd $0x45,%xmm0,%xmm5 .byte 102,15,18,44,185 // movlpd (%ecx,%edi,4),%xmm5 - .byte 233,57,255,255,255 // jmp 549d <_sk_load_8888_sse2+0x34> + .byte 233,57,255,255,255 // jmp 5445 <_sk_load_8888_sse2+0x34> .byte 102,15,110,44,185 // movd (%ecx,%edi,4),%xmm5 .byte 139,85,24 // mov 0x18(%ebp),%edx - .byte 233,44,255,255,255 // jmp 549d <_sk_load_8888_sse2+0x34> + .byte 233,44,255,255,255 // jmp 5445 <_sk_load_8888_sse2+0x34> HIDDEN _sk_gather_8888_sse2 .globl _sk_gather_8888_sse2 @@ -47443,7 +47301,7 @@ _sk_gather_8888_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 557f <_sk_gather_8888_sse2+0xe> + .byte 232,0,0,0,0 // call 5527 <_sk_gather_8888_sse2+0xe> .byte 90 // pop %edx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,12 // mov 0xc(%ebp),%ecx @@ -47473,8 +47331,8 @@ _sk_gather_8888_sse2: .byte 102,15,110,4,183 // movd (%edi,%esi,4),%xmm0 .byte 139,117,16 // mov 0x10(%ebp),%esi .byte 139,125,20 // mov 0x14(%ebp),%edi - .byte 102,15,111,162,113,54,0,0 // movdqa 0x3671(%edx),%xmm4 - .byte 15,40,170,129,54,0,0 // movaps 0x3681(%edx),%xmm5 + .byte 102,15,111,162,121,54,0,0 // movdqa 0x3679(%edx),%xmm4 + .byte 15,40,170,137,54,0,0 // movaps 0x3689(%edx),%xmm5 .byte 139,85,24 // mov 0x18(%ebp),%edx .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 .byte 15,40,125,56 // movaps 0x38(%ebp),%xmm7 @@ -47528,9 +47386,9 @@ _sk_store_8888_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 56a4 <_sk_store_8888_sse2+0xe> + .byte 232,0,0,0,0 // call 564c <_sk_store_8888_sse2+0xe> .byte 88 // pop %eax - .byte 15,40,160,108,53,0,0 // movaps 0x356c(%eax),%xmm4 + .byte 15,40,160,116,53,0,0 // movaps 0x3574(%eax),%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,89,236 // mulps %xmm4,%xmm5 .byte 102,15,91,237 // cvtps2dq %xmm5,%xmm5 @@ -47559,7 +47417,7 @@ _sk_store_8888_sse2: .byte 133,219 // test %ebx,%ebx .byte 139,85,8 // mov 0x8(%ebp),%edx .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7 - .byte 117,62 // jne 574d <_sk_store_8888_sse2+0xb7> + .byte 117,62 // jne 56f5 <_sk_store_8888_sse2+0xb7> .byte 243,15,127,36,143 // movdqu %xmm4,(%edi,%ecx,4) .byte 141,120,8 // lea 0x8(%eax),%edi .byte 15,40,101,88 // movaps 0x58(%ebp),%xmm4 @@ -47583,20 +47441,20 @@ _sk_store_8888_sse2: .byte 136,85,243 // mov %dl,-0xd(%ebp) .byte 128,101,243,3 // andb $0x3,-0xd(%ebp) .byte 128,125,243,1 // cmpb $0x1,-0xd(%ebp) - .byte 116,37 // je 5781 <_sk_store_8888_sse2+0xeb> + .byte 116,37 // je 5729 <_sk_store_8888_sse2+0xeb> .byte 128,125,243,2 // cmpb $0x2,-0xd(%ebp) .byte 139,85,8 // mov 0x8(%ebp),%edx - .byte 116,21 // je 577a <_sk_store_8888_sse2+0xe4> + .byte 116,21 // je 5722 <_sk_store_8888_sse2+0xe4> .byte 128,125,243,3 // cmpb $0x3,-0xd(%ebp) - .byte 117,169 // jne 5714 <_sk_store_8888_sse2+0x7e> + .byte 117,169 // jne 56bc <_sk_store_8888_sse2+0x7e> .byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5 .byte 102,15,126,108,143,8 // movd %xmm5,0x8(%edi,%ecx,4) .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 .byte 102,15,214,36,143 // movq %xmm4,(%edi,%ecx,4) - .byte 235,147 // jmp 5714 <_sk_store_8888_sse2+0x7e> + .byte 235,147 // jmp 56bc <_sk_store_8888_sse2+0x7e> .byte 102,15,126,36,143 // movd %xmm4,(%edi,%ecx,4) .byte 139,85,8 // mov 0x8(%ebp),%edx - .byte 235,137 // jmp 5714 <_sk_store_8888_sse2+0x7e> + .byte 235,137 // jmp 56bc <_sk_store_8888_sse2+0x7e> HIDDEN _sk_load_f16_sse2 .globl _sk_load_f16_sse2 @@ -47608,7 +47466,7 @@ _sk_load_f16_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 129,236,188,0,0,0 // sub $0xbc,%esp - .byte 232,0,0,0,0 // call 579c <_sk_load_f16_sse2+0x11> + .byte 232,0,0,0,0 // call 5744 <_sk_load_f16_sse2+0x11> .byte 91 // pop %ebx .byte 139,85,24 // mov 0x18(%ebp),%edx .byte 139,69,12 // mov 0xc(%ebp),%eax @@ -47617,7 +47475,7 @@ _sk_load_f16_sse2: .byte 133,210 // test %edx,%edx .byte 139,125,16 // mov 0x10(%ebp),%edi .byte 139,117,8 // mov 0x8(%ebp),%esi - .byte 15,133,220,1,0,0 // jne 5991 <_sk_load_f16_sse2+0x206> + .byte 15,133,220,1,0,0 // jne 5939 <_sk_load_f16_sse2+0x206> .byte 102,15,16,4,249 // movupd (%ecx,%edi,8),%xmm0 .byte 243,15,111,76,249,16 // movdqu 0x10(%ecx,%edi,8),%xmm1 .byte 102,15,40,208 // movapd %xmm0,%xmm2 @@ -47645,7 +47503,7 @@ _sk_load_f16_sse2: .byte 102,15,126,69,232 // movd %xmm0,-0x18(%ebp) .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,97,243 // punpcklwd %xmm3,%xmm6 - .byte 102,15,111,171,132,52,0,0 // movdqa 0x3484(%ebx),%xmm5 + .byte 102,15,111,171,140,52,0,0 // movdqa 0x348c(%ebx),%xmm5 .byte 102,15,111,214 // movdqa %xmm6,%xmm2 .byte 102,15,219,213 // pand %xmm5,%xmm2 .byte 102,15,239,242 // pxor %xmm2,%xmm6 @@ -47679,15 +47537,15 @@ _sk_load_f16_sse2: .byte 102,15,111,199 // movdqa %xmm7,%xmm0 .byte 102,15,114,240,13 // pslld $0xd,%xmm0 .byte 102,15,235,197 // por %xmm5,%xmm0 - .byte 102,15,111,155,148,52,0,0 // movdqa 0x3494(%ebx),%xmm3 + .byte 102,15,111,155,156,52,0,0 // movdqa 0x349c(%ebx),%xmm3 .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,254,227 // paddd %xmm3,%xmm4 .byte 102,15,254,195 // paddd %xmm3,%xmm0 - .byte 102,15,111,155,164,52,0,0 // movdqa 0x34a4(%ebx),%xmm3 + .byte 102,15,111,155,172,52,0,0 // movdqa 0x34ac(%ebx),%xmm3 .byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp) .byte 102,15,239,243 // pxor %xmm3,%xmm6 - .byte 102,15,111,155,180,52,0,0 // movdqa 0x34b4(%ebx),%xmm3 + .byte 102,15,111,155,188,52,0,0 // movdqa 0x34bc(%ebx),%xmm3 .byte 102,15,111,235 // movdqa %xmm3,%xmm5 .byte 102,15,102,238 // pcmpgtd %xmm6,%xmm5 .byte 102,15,223,233 // pandn %xmm1,%xmm5 @@ -47730,12 +47588,12 @@ _sk_load_f16_sse2: .byte 242,15,16,4,249 // movsd (%ecx,%edi,8),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,250,1 // cmp $0x1,%edx - .byte 15,132,29,254,255,255 // je 57c0 <_sk_load_f16_sse2+0x35> + .byte 15,132,29,254,255,255 // je 5768 <_sk_load_f16_sse2+0x35> .byte 102,15,22,68,249,8 // movhpd 0x8(%ecx,%edi,8),%xmm0 .byte 131,250,3 // cmp $0x3,%edx - .byte 15,130,14,254,255,255 // jb 57c0 <_sk_load_f16_sse2+0x35> + .byte 15,130,14,254,255,255 // jb 5768 <_sk_load_f16_sse2+0x35> .byte 243,15,126,76,249,16 // movq 0x10(%ecx,%edi,8),%xmm1 - .byte 233,3,254,255,255 // jmp 57c0 <_sk_load_f16_sse2+0x35> + .byte 233,3,254,255,255 // jmp 5768 <_sk_load_f16_sse2+0x35> HIDDEN _sk_gather_f16_sse2 .globl _sk_gather_f16_sse2 @@ -47747,7 +47605,7 @@ _sk_gather_f16_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 129,236,204,0,0,0 // sub $0xcc,%esp - .byte 232,0,0,0,0 // call 59ce <_sk_gather_f16_sse2+0x11> + .byte 232,0,0,0,0 // call 5976 <_sk_gather_f16_sse2+0x11> .byte 89 // pop %ecx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 139,48 // mov (%eax),%esi @@ -47810,7 +47668,7 @@ _sk_gather_f16_sse2: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,111,236 // movdqa %xmm4,%xmm5 .byte 102,15,97,235 // punpcklwd %xmm3,%xmm5 - .byte 102,15,111,161,146,50,0,0 // movdqa 0x3292(%ecx),%xmm4 + .byte 102,15,111,161,154,50,0,0 // movdqa 0x329a(%ecx),%xmm4 .byte 102,15,111,197 // movdqa %xmm5,%xmm0 .byte 102,15,219,196 // pand %xmm4,%xmm0 .byte 102,15,239,232 // pxor %xmm0,%xmm5 @@ -47844,16 +47702,16 @@ _sk_gather_f16_sse2: .byte 102,15,111,200 // movdqa %xmm0,%xmm1 .byte 102,15,114,241,13 // pslld $0xd,%xmm1 .byte 102,15,235,204 // por %xmm4,%xmm1 - .byte 102,15,111,153,162,50,0,0 // movdqa 0x32a2(%ecx),%xmm3 + .byte 102,15,111,153,170,50,0,0 // movdqa 0x32aa(%ecx),%xmm3 .byte 102,15,254,235 // paddd %xmm3,%xmm5 .byte 102,15,254,243 // paddd %xmm3,%xmm6 .byte 102,15,254,251 // paddd %xmm3,%xmm7 .byte 102,15,254,203 // paddd %xmm3,%xmm1 - .byte 102,15,111,153,178,50,0,0 // movdqa 0x32b2(%ecx),%xmm3 + .byte 102,15,111,153,186,50,0,0 // movdqa 0x32ba(%ecx),%xmm3 .byte 102,15,127,93,184 // movdqa %xmm3,-0x48(%ebp) .byte 102,15,111,85,136 // movdqa -0x78(%ebp),%xmm2 .byte 102,15,239,211 // pxor %xmm3,%xmm2 - .byte 102,15,111,153,194,50,0,0 // movdqa 0x32c2(%ecx),%xmm3 + .byte 102,15,111,153,202,50,0,0 // movdqa 0x32ca(%ecx),%xmm3 .byte 102,15,111,227 // movdqa %xmm3,%xmm4 .byte 102,15,102,226 // pcmpgtd %xmm2,%xmm4 .byte 102,15,223,229 // pandn %xmm5,%xmm4 @@ -47910,20 +47768,20 @@ _sk_store_f16_sse2: .byte 129,236,188,0,0,0 // sub $0xbc,%esp .byte 15,41,93,200 // movaps %xmm3,-0x38(%ebp) .byte 102,15,111,250 // movdqa %xmm2,%xmm7 - .byte 232,0,0,0,0 // call 5c6b <_sk_store_f16_sse2+0x19> + .byte 232,0,0,0,0 // call 5c13 <_sk_store_f16_sse2+0x19> .byte 88 // pop %eax - .byte 102,15,111,176,53,48,0,0 // movdqa 0x3035(%eax),%xmm6 + .byte 102,15,111,176,61,48,0,0 // movdqa 0x303d(%eax),%xmm6 .byte 102,15,111,208 // movdqa %xmm0,%xmm2 .byte 102,15,219,214 // pand %xmm6,%xmm2 .byte 102,15,127,69,184 // movdqa %xmm0,-0x48(%ebp) .byte 102,15,111,232 // movdqa %xmm0,%xmm5 .byte 102,15,239,234 // pxor %xmm2,%xmm5 - .byte 102,15,111,160,69,48,0,0 // movdqa 0x3045(%eax),%xmm4 + .byte 102,15,111,160,77,48,0,0 // movdqa 0x304d(%eax),%xmm4 .byte 102,15,114,210,16 // psrld $0x10,%xmm2 .byte 102,15,111,196 // movdqa %xmm4,%xmm0 .byte 102,15,102,197 // pcmpgtd %xmm5,%xmm0 .byte 102,15,114,213,13 // psrld $0xd,%xmm5 - .byte 102,15,111,152,85,48,0,0 // movdqa 0x3055(%eax),%xmm3 + .byte 102,15,111,152,93,48,0,0 // movdqa 0x305d(%eax),%xmm3 .byte 102,15,254,211 // paddd %xmm3,%xmm2 .byte 102,15,254,213 // paddd %xmm5,%xmm2 .byte 102,15,114,242,16 // pslld $0x10,%xmm2 @@ -47988,7 +47846,7 @@ _sk_store_f16_sse2: .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 .byte 102,15,111,200 // movdqa %xmm0,%xmm1 .byte 102,15,98,205 // punpckldq %xmm5,%xmm1 - .byte 117,82 // jne 5e07 <_sk_store_f16_sse2+0x1b5> + .byte 117,82 // jne 5daf <_sk_store_f16_sse2+0x1b5> .byte 15,17,12,203 // movups %xmm1,(%ebx,%ecx,8) .byte 102,15,106,197 // punpckhdq %xmm5,%xmm0 .byte 243,15,127,68,203,16 // movdqu %xmm0,0x10(%ebx,%ecx,8) @@ -48014,13 +47872,13 @@ _sk_store_f16_sse2: .byte 195 // ret .byte 102,15,214,12,203 // movq %xmm1,(%ebx,%ecx,8) .byte 131,255,1 // cmp $0x1,%edi - .byte 116,178 // je 5dc3 <_sk_store_f16_sse2+0x171> + .byte 116,178 // je 5d6b <_sk_store_f16_sse2+0x171> .byte 102,15,23,76,203,8 // movhpd %xmm1,0x8(%ebx,%ecx,8) .byte 131,255,3 // cmp $0x3,%edi - .byte 114,167 // jb 5dc3 <_sk_store_f16_sse2+0x171> + .byte 114,167 // jb 5d6b <_sk_store_f16_sse2+0x171> .byte 102,15,106,197 // punpckhdq %xmm5,%xmm0 .byte 102,15,214,68,203,16 // movq %xmm0,0x10(%ebx,%ecx,8) - .byte 235,155 // jmp 5dc3 <_sk_store_f16_sse2+0x171> + .byte 235,155 // jmp 5d6b <_sk_store_f16_sse2+0x171> HIDDEN _sk_load_u16_be_sse2 .globl _sk_load_u16_be_sse2 @@ -48032,7 +47890,7 @@ _sk_load_u16_be_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 129,236,140,0,0,0 // sub $0x8c,%esp - .byte 232,0,0,0,0 // call 5e39 <_sk_load_u16_be_sse2+0x11> + .byte 232,0,0,0,0 // call 5de1 <_sk_load_u16_be_sse2+0x11> .byte 91 // pop %ebx .byte 15,40,125,88 // movaps 0x58(%ebp),%xmm7 .byte 139,85,24 // mov 0x18(%ebp),%edx @@ -48042,7 +47900,7 @@ _sk_load_u16_be_sse2: .byte 133,210 // test %edx,%edx .byte 139,125,16 // mov 0x10(%ebp),%edi .byte 141,52,189,0,0,0,0 // lea 0x0(,%edi,4),%esi - .byte 15,133,66,1,0,0 // jne 5f9c <_sk_load_u16_be_sse2+0x174> + .byte 15,133,66,1,0,0 // jne 5f44 <_sk_load_u16_be_sse2+0x174> .byte 102,15,16,4,113 // movupd (%ecx,%esi,2),%xmm0 .byte 243,15,111,76,113,16 // movdqu 0x10(%ecx,%esi,2),%xmm1 .byte 102,15,40,208 // movapd %xmm0,%xmm2 @@ -48063,7 +47921,7 @@ _sk_load_u16_be_sse2: .byte 102,15,239,219 // pxor %xmm3,%xmm3 .byte 102,15,97,195 // punpcklwd %xmm3,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,163,151,46,0,0 // movaps 0x2e97(%ebx),%xmm4 + .byte 15,40,163,159,46,0,0 // movaps 0x2e9f(%ebx),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,205 // movdqa %xmm5,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -48124,12 +47982,12 @@ _sk_load_u16_be_sse2: .byte 242,15,16,4,113 // movsd (%ecx,%esi,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,250,1 // cmp $0x1,%edx - .byte 15,132,183,254,255,255 // je 5e65 <_sk_load_u16_be_sse2+0x3d> + .byte 15,132,183,254,255,255 // je 5e0d <_sk_load_u16_be_sse2+0x3d> .byte 102,15,22,68,113,8 // movhpd 0x8(%ecx,%esi,2),%xmm0 .byte 131,250,3 // cmp $0x3,%edx - .byte 15,130,168,254,255,255 // jb 5e65 <_sk_load_u16_be_sse2+0x3d> + .byte 15,130,168,254,255,255 // jb 5e0d <_sk_load_u16_be_sse2+0x3d> .byte 243,15,126,76,113,16 // movq 0x10(%ecx,%esi,2),%xmm1 - .byte 233,157,254,255,255 // jmp 5e65 <_sk_load_u16_be_sse2+0x3d> + .byte 233,157,254,255,255 // jmp 5e0d <_sk_load_u16_be_sse2+0x3d> HIDDEN _sk_load_rgb_u16_be_sse2 .globl _sk_load_rgb_u16_be_sse2 @@ -48141,7 +47999,7 @@ _sk_load_rgb_u16_be_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,124 // sub $0x7c,%esp - .byte 232,0,0,0,0 // call 5fd6 <_sk_load_rgb_u16_be_sse2+0xe> + .byte 232,0,0,0,0 // call 5f7e <_sk_load_rgb_u16_be_sse2+0xe> .byte 88 // pop %eax .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6 .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 @@ -48152,7 +48010,7 @@ _sk_load_rgb_u16_be_sse2: .byte 133,246 // test %esi,%esi .byte 139,93,16 // mov 0x10(%ebp),%ebx .byte 141,60,91 // lea (%ebx,%ebx,2),%edi - .byte 15,133,32,1,0,0 // jne 6117 <_sk_load_rgb_u16_be_sse2+0x14f> + .byte 15,133,32,1,0,0 // jne 60bf <_sk_load_rgb_u16_be_sse2+0x14f> .byte 243,15,111,20,122 // movdqu (%edx,%edi,2),%xmm2 .byte 243,15,111,124,122,8 // movdqu 0x8(%edx,%edi,2),%xmm7 .byte 102,15,115,223,4 // psrldq $0x4,%xmm7 @@ -48177,7 +48035,7 @@ _sk_load_rgb_u16_be_sse2: .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 102,15,97,199 // punpcklwd %xmm7,%xmm0 .byte 15,91,192 // cvtdq2ps %xmm0,%xmm0 - .byte 15,40,160,10,45,0,0 // movaps 0x2d0a(%eax),%xmm4 + .byte 15,40,160,18,45,0,0 // movaps 0x2d12(%eax),%xmm4 .byte 15,89,196 // mulps %xmm4,%xmm0 .byte 102,15,111,203 // movdqa %xmm3,%xmm1 .byte 102,15,113,241,8 // psllw $0x8,%xmm1 @@ -48215,7 +48073,7 @@ _sk_load_rgb_u16_be_sse2: .byte 137,84,36,4 // mov %edx,0x4(%esp) .byte 139,85,8 // mov 0x8(%ebp),%edx .byte 137,20,36 // mov %edx,(%esp) - .byte 15,40,152,26,45,0,0 // movaps 0x2d1a(%eax),%xmm3 + .byte 15,40,152,34,45,0,0 // movaps 0x2d22(%eax),%xmm3 .byte 255,81,4 // call *0x4(%ecx) .byte 131,196,124 // add $0x7c,%esp .byte 94 // pop %esi @@ -48227,20 +48085,20 @@ _sk_load_rgb_u16_be_sse2: .byte 102,15,196,84,122,4,2 // pinsrw $0x2,0x4(%edx,%edi,2),%xmm2 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,254,1 // cmp $0x1,%esi - .byte 117,13 // jne 6139 <_sk_load_rgb_u16_be_sse2+0x171> + .byte 117,13 // jne 60e1 <_sk_load_rgb_u16_be_sse2+0x171> .byte 102,15,239,255 // pxor %xmm7,%xmm7 .byte 102,15,239,192 // pxor %xmm0,%xmm0 - .byte 233,224,254,255,255 // jmp 6019 <_sk_load_rgb_u16_be_sse2+0x51> + .byte 233,224,254,255,255 // jmp 5fc1 <_sk_load_rgb_u16_be_sse2+0x51> .byte 102,15,110,68,122,6 // movd 0x6(%edx,%edi,2),%xmm0 .byte 102,15,196,68,122,10,2 // pinsrw $0x2,0xa(%edx,%edi,2),%xmm0 .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,254,3 // cmp $0x3,%esi - .byte 114,18 // jb 6161 <_sk_load_rgb_u16_be_sse2+0x199> + .byte 114,18 // jb 6109 <_sk_load_rgb_u16_be_sse2+0x199> .byte 102,15,110,124,122,12 // movd 0xc(%edx,%edi,2),%xmm7 .byte 102,15,196,124,122,16,2 // pinsrw $0x2,0x10(%edx,%edi,2),%xmm7 - .byte 233,184,254,255,255 // jmp 6019 <_sk_load_rgb_u16_be_sse2+0x51> + .byte 233,184,254,255,255 // jmp 5fc1 <_sk_load_rgb_u16_be_sse2+0x51> .byte 102,15,239,255 // pxor %xmm7,%xmm7 - .byte 233,175,254,255,255 // jmp 6019 <_sk_load_rgb_u16_be_sse2+0x51> + .byte 233,175,254,255,255 // jmp 5fc1 <_sk_load_rgb_u16_be_sse2+0x51> HIDDEN _sk_store_u16_be_sse2 .globl _sk_store_u16_be_sse2 @@ -48253,9 +48111,9 @@ _sk_store_u16_be_sse2: .byte 86 // push %esi .byte 131,236,124 // sub $0x7c,%esp .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) - .byte 232,0,0,0,0 // call 617c <_sk_store_u16_be_sse2+0x12> + .byte 232,0,0,0,0 // call 6124 <_sk_store_u16_be_sse2+0x12> .byte 88 // pop %eax - .byte 15,40,176,132,43,0,0 // movaps 0x2b84(%eax),%xmm6 + .byte 15,40,176,140,43,0,0 // movaps 0x2b8c(%eax),%xmm6 .byte 15,40,224 // movaps %xmm0,%xmm4 .byte 15,89,230 // mulps %xmm6,%xmm4 .byte 102,15,91,228 // cvtps2dq %xmm4,%xmm4 @@ -48309,7 +48167,7 @@ _sk_store_u16_be_sse2: .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 .byte 102,15,111,220 // movdqa %xmm4,%xmm3 .byte 102,15,98,221 // punpckldq %xmm5,%xmm3 - .byte 117,82 // jne 62af <_sk_store_u16_be_sse2+0x145> + .byte 117,82 // jne 6257 <_sk_store_u16_be_sse2+0x145> .byte 15,17,28,83 // movups %xmm3,(%ebx,%edx,2) .byte 102,15,106,229 // punpckhdq %xmm5,%xmm4 .byte 243,15,127,100,83,16 // movdqu %xmm4,0x10(%ebx,%edx,2) @@ -48336,13 +48194,13 @@ _sk_store_u16_be_sse2: .byte 195 // ret .byte 102,15,214,28,83 // movq %xmm3,(%ebx,%edx,2) .byte 131,255,1 // cmp $0x1,%edi - .byte 116,178 // je 626b <_sk_store_u16_be_sse2+0x101> + .byte 116,178 // je 6213 <_sk_store_u16_be_sse2+0x101> .byte 102,15,23,92,83,8 // movhpd %xmm3,0x8(%ebx,%edx,2) .byte 131,255,3 // cmp $0x3,%edi - .byte 114,167 // jb 626b <_sk_store_u16_be_sse2+0x101> + .byte 114,167 // jb 6213 <_sk_store_u16_be_sse2+0x101> .byte 102,15,106,229 // punpckhdq %xmm5,%xmm4 .byte 102,15,214,100,83,16 // movq %xmm4,0x10(%ebx,%edx,2) - .byte 235,155 // jmp 626b <_sk_store_u16_be_sse2+0x101> + .byte 235,155 // jmp 6213 <_sk_store_u16_be_sse2+0x101> HIDDEN _sk_load_f32_sse2 .globl _sk_load_f32_sse2 @@ -48367,7 +48225,7 @@ _sk_load_f32_sse2: .byte 139,125,20 // mov 0x14(%ebp),%edi .byte 133,210 // test %edx,%edx .byte 141,52,141,0,0,0,0 // lea 0x0(,%ecx,4),%esi - .byte 117,117 // jne 637a <_sk_load_f32_sse2+0xaa> + .byte 117,117 // jne 6322 <_sk_load_f32_sse2+0xaa> .byte 15,16,84,179,16 // movups 0x10(%ebx,%esi,4),%xmm2 .byte 15,16,92,179,32 // movups 0x20(%ebx,%esi,4),%xmm3 .byte 15,16,68,179,48 // movups 0x30(%ebx,%esi,4),%xmm0 @@ -48405,17 +48263,17 @@ _sk_load_f32_sse2: .byte 195 // ret .byte 15,87,192 // xorps %xmm0,%xmm0 .byte 131,250,1 // cmp $0x1,%edx - .byte 117,8 // jne 638a <_sk_load_f32_sse2+0xba> + .byte 117,8 // jne 6332 <_sk_load_f32_sse2+0xba> .byte 15,87,219 // xorps %xmm3,%xmm3 .byte 15,87,210 // xorps %xmm2,%xmm2 - .byte 235,138 // jmp 6314 <_sk_load_f32_sse2+0x44> + .byte 235,138 // jmp 62bc <_sk_load_f32_sse2+0x44> .byte 15,16,84,179,16 // movups 0x10(%ebx,%esi,4),%xmm2 .byte 131,250,3 // cmp $0x3,%edx - .byte 114,10 // jb 639e <_sk_load_f32_sse2+0xce> + .byte 114,10 // jb 6346 <_sk_load_f32_sse2+0xce> .byte 15,16,92,179,32 // movups 0x20(%ebx,%esi,4),%xmm3 - .byte 233,118,255,255,255 // jmp 6314 <_sk_load_f32_sse2+0x44> + .byte 233,118,255,255,255 // jmp 62bc <_sk_load_f32_sse2+0x44> .byte 15,87,219 // xorps %xmm3,%xmm3 - .byte 233,110,255,255,255 // jmp 6314 <_sk_load_f32_sse2+0x44> + .byte 233,110,255,255,255 // jmp 62bc <_sk_load_f32_sse2+0x44> HIDDEN _sk_store_f32_sse2 .globl _sk_store_f32_sse2 @@ -48452,7 +48310,7 @@ _sk_store_f32_sse2: .byte 133,210 // test %edx,%edx .byte 139,93,8 // mov 0x8(%ebp),%ebx .byte 141,60,141,0,0,0,0 // lea 0x0(,%ecx,4),%edi - .byte 117,99 // jne 6463 <_sk_store_f32_sse2+0xbd> + .byte 117,99 // jne 640b <_sk_store_f32_sse2+0xbd> .byte 102,15,21,194 // unpckhpd %xmm2,%xmm0 .byte 15,17,100,190,16 // movups %xmm4,0x10(%esi,%edi,4) .byte 102,15,17,116,190,32 // movupd %xmm6,0x20(%esi,%edi,4) @@ -48482,12 +48340,12 @@ _sk_store_f32_sse2: .byte 93 // pop %ebp .byte 195 // ret .byte 131,250,1 // cmp $0x1,%edx - .byte 116,173 // je 6415 <_sk_store_f32_sse2+0x6f> + .byte 116,173 // je 63bd <_sk_store_f32_sse2+0x6f> .byte 15,17,100,190,16 // movups %xmm4,0x10(%esi,%edi,4) .byte 131,250,3 // cmp $0x3,%edx - .byte 114,163 // jb 6415 <_sk_store_f32_sse2+0x6f> + .byte 114,163 // jb 63bd <_sk_store_f32_sse2+0x6f> .byte 102,15,17,116,190,32 // movupd %xmm6,0x20(%esi,%edi,4) - .byte 235,155 // jmp 6415 <_sk_store_f32_sse2+0x6f> + .byte 235,155 // jmp 63bd <_sk_store_f32_sse2+0x6f> HIDDEN _sk_clamp_x_sse2 .globl _sk_clamp_x_sse2 @@ -48591,7 +48449,7 @@ _sk_repeat_x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 657e <_sk_repeat_x_sse2+0xe> + .byte 232,0,0,0,0 // call 6526 <_sk_repeat_x_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -48605,7 +48463,7 @@ _sk_repeat_x_sse2: .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,194,238,1 // cmpltps %xmm6,%xmm5 - .byte 15,84,174,146,39,0,0 // andps 0x2792(%esi),%xmm5 + .byte 15,84,174,154,39,0,0 // andps 0x279a(%esi),%xmm5 .byte 139,117,24 // mov 0x18(%ebp),%esi .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7 .byte 15,92,245 // subps %xmm5,%xmm6 @@ -48646,7 +48504,7 @@ _sk_repeat_y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 661d <_sk_repeat_y_sse2+0xe> + .byte 232,0,0,0,0 // call 65c5 <_sk_repeat_y_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -48660,7 +48518,7 @@ _sk_repeat_y_sse2: .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,194,238,1 // cmpltps %xmm6,%xmm5 - .byte 15,84,174,3,39,0,0 // andps 0x2703(%esi),%xmm5 + .byte 15,84,174,11,39,0,0 // andps 0x270b(%esi),%xmm5 .byte 139,117,24 // mov 0x18(%ebp),%esi .byte 15,40,125,40 // movaps 0x28(%ebp),%xmm7 .byte 15,92,245 // subps %xmm5,%xmm6 @@ -48701,7 +48559,7 @@ _sk_mirror_x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 66bc <_sk_mirror_x_sse2+0xe> + .byte 232,0,0,0,0 // call 6664 <_sk_mirror_x_sse2+0xe> .byte 95 // pop %edi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -48713,13 +48571,13 @@ _sk_mirror_x_sse2: .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 .byte 15,92,196 // subps %xmm4,%xmm0 - .byte 243,15,89,183,196,42,0,0 // mulss 0x2ac4(%edi),%xmm6 + .byte 243,15,89,183,204,42,0,0 // mulss 0x2acc(%edi),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,183,116,38,0,0 // andps 0x2674(%edi),%xmm6 + .byte 15,84,183,124,38,0,0 // andps 0x267c(%edi),%xmm6 .byte 139,125,24 // mov 0x18(%ebp),%edi .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 @@ -48765,7 +48623,7 @@ _sk_mirror_y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 677d <_sk_mirror_y_sse2+0xe> + .byte 232,0,0,0,0 // call 6725 <_sk_mirror_y_sse2+0xe> .byte 95 // pop %edi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -48777,13 +48635,13 @@ _sk_mirror_y_sse2: .byte 15,40,229 // movaps %xmm5,%xmm4 .byte 15,198,228,0 // shufps $0x0,%xmm4,%xmm4 .byte 15,92,204 // subps %xmm4,%xmm1 - .byte 243,15,89,183,7,42,0,0 // mulss 0x2a07(%edi),%xmm6 + .byte 243,15,89,183,15,42,0,0 // mulss 0x2a0f(%edi),%xmm6 .byte 15,198,246,0 // shufps $0x0,%xmm6,%xmm6 .byte 15,89,241 // mulps %xmm1,%xmm6 .byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,183,195,37,0,0 // andps 0x25c3(%edi),%xmm6 + .byte 15,84,183,203,37,0,0 // andps 0x25cb(%edi),%xmm6 .byte 139,125,24 // mov 0x18(%ebp),%edi .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 @@ -48829,7 +48687,7 @@ _sk_clamp_x_1_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 683e <_sk_clamp_x_1_sse2+0xe> + .byte 232,0,0,0,0 // call 67e6 <_sk_clamp_x_1_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -48841,7 +48699,7 @@ _sk_clamp_x_1_sse2: .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,95,224 // maxps %xmm0,%xmm4 .byte 15,40,69,88 // movaps 0x58(%ebp),%xmm0 - .byte 15,93,160,18,37,0,0 // minps 0x2512(%eax),%xmm4 + .byte 15,93,160,26,37,0,0 // minps 0x251a(%eax),%xmm4 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 141,88,4 // lea 0x4(%eax),%ebx .byte 15,41,68,36,80 // movaps %xmm0,0x50(%esp) @@ -48872,7 +48730,7 @@ _sk_repeat_x_1_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 68b0 <_sk_repeat_x_1_sse2+0xe> + .byte 232,0,0,0,0 // call 6858 <_sk_repeat_x_1_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -48884,7 +48742,7 @@ _sk_repeat_x_1_sse2: .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,40,248 // movaps %xmm0,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,84,184,176,36,0,0 // andps 0x24b0(%eax),%xmm7 + .byte 15,84,184,184,36,0,0 // andps 0x24b8(%eax),%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,40,125,72 // movaps 0x48(%ebp),%xmm7 .byte 15,92,198 // subps %xmm6,%xmm0 @@ -48918,21 +48776,21 @@ _sk_mirror_x_1_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 692d <_sk_mirror_x_1_sse2+0xe> + .byte 232,0,0,0,0 // call 68d5 <_sk_mirror_x_1_sse2+0xe> .byte 95 // pop %edi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx .byte 139,85,20 // mov 0x14(%ebp),%edx .byte 139,117,24 // mov 0x18(%ebp),%esi .byte 15,40,101,40 // movaps 0x28(%ebp),%xmm4 - .byte 15,40,175,67,36,0,0 // movaps 0x2443(%edi),%xmm5 + .byte 15,40,175,75,36,0,0 // movaps 0x244b(%edi),%xmm5 .byte 15,88,197 // addps %xmm5,%xmm0 - .byte 15,40,183,83,36,0,0 // movaps 0x2453(%edi),%xmm6 + .byte 15,40,183,91,36,0,0 // movaps 0x245b(%edi),%xmm6 .byte 15,89,240 // mulps %xmm0,%xmm6 .byte 243,15,91,254 // cvttps2dq %xmm6,%xmm7 .byte 15,91,255 // cvtdq2ps %xmm7,%xmm7 .byte 15,194,247,1 // cmpltps %xmm7,%xmm6 - .byte 15,84,183,99,36,0,0 // andps 0x2463(%edi),%xmm6 + .byte 15,84,183,107,36,0,0 // andps 0x246b(%edi),%xmm6 .byte 15,92,254 // subps %xmm6,%xmm7 .byte 15,40,117,56 // movaps 0x38(%ebp),%xmm6 .byte 15,88,255 // addps %xmm7,%xmm7 @@ -48973,7 +48831,7 @@ _sk_luminance_to_alpha_sse2: .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 232,0,0,0,0 // call 69cd <_sk_luminance_to_alpha_sse2+0x11> + .byte 232,0,0,0,0 // call 6975 <_sk_luminance_to_alpha_sse2+0x11> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -48983,9 +48841,9 @@ _sk_luminance_to_alpha_sse2: .byte 15,40,101,56 // movaps 0x38(%ebp),%xmm4 .byte 15,40,109,72 // movaps 0x48(%ebp),%xmm5 .byte 15,40,117,88 // movaps 0x58(%ebp),%xmm6 - .byte 15,89,128,211,35,0,0 // mulps 0x23d3(%eax),%xmm0 - .byte 15,89,136,227,35,0,0 // mulps 0x23e3(%eax),%xmm1 - .byte 15,89,152,243,35,0,0 // mulps 0x23f3(%eax),%xmm3 + .byte 15,89,128,219,35,0,0 // mulps 0x23db(%eax),%xmm0 + .byte 15,89,136,235,35,0,0 // mulps 0x23eb(%eax),%xmm1 + .byte 15,89,152,251,35,0,0 // mulps 0x23fb(%eax),%xmm3 .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 15,88,200 // addps %xmm0,%xmm1 .byte 15,88,217 // addps %xmm1,%xmm3 @@ -49435,7 +49293,7 @@ _sk_evenly_spaced_gradient_sse2: .byte 86 // push %esi .byte 129,236,156,0,0,0 // sub $0x9c,%esp .byte 15,41,69,184 // movaps %xmm0,-0x48(%ebp) - .byte 232,0,0,0,0 // call 6f83 <_sk_evenly_spaced_gradient_sse2+0x15> + .byte 232,0,0,0,0 // call 6f2b <_sk_evenly_spaced_gradient_sse2+0x15> .byte 90 // pop %edx .byte 139,77,12 // mov 0xc(%ebp),%ecx .byte 141,65,4 // lea 0x4(%ecx),%eax @@ -49446,12 +49304,12 @@ _sk_evenly_spaced_gradient_sse2: .byte 78 // dec %esi .byte 102,15,110,206 // movd %esi,%xmm1 .byte 102,15,112,201,0 // pshufd $0x0,%xmm1,%xmm1 - .byte 102,15,111,146,77,30,0,0 // movdqa 0x1e4d(%edx),%xmm2 + .byte 102,15,111,146,85,30,0,0 // movdqa 0x1e55(%edx),%xmm2 .byte 102,15,219,209 // pand %xmm1,%xmm2 - .byte 102,15,235,146,93,30,0,0 // por 0x1e5d(%edx),%xmm2 + .byte 102,15,235,146,101,30,0,0 // por 0x1e65(%edx),%xmm2 .byte 102,15,114,209,16 // psrld $0x10,%xmm1 - .byte 102,15,235,138,109,30,0,0 // por 0x1e6d(%edx),%xmm1 - .byte 15,88,138,125,30,0,0 // addps 0x1e7d(%edx),%xmm1 + .byte 102,15,235,138,117,30,0,0 // por 0x1e75(%edx),%xmm1 + .byte 15,88,138,133,30,0,0 // addps 0x1e85(%edx),%xmm1 .byte 15,88,202 // addps %xmm2,%xmm1 .byte 15,89,200 // mulps %xmm0,%xmm1 .byte 243,15,91,201 // cvttps2dq %xmm1,%xmm1 @@ -49574,7 +49432,7 @@ _sk_gauss_a_to_rgba_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 717a <_sk_gauss_a_to_rgba_sse2+0xe> + .byte 232,0,0,0,0 // call 7122 <_sk_gauss_a_to_rgba_sse2+0xe> .byte 90 // pop %edx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -49584,15 +49442,15 @@ _sk_gauss_a_to_rgba_sse2: .byte 15,40,85,56 // movaps 0x38(%ebp),%xmm2 .byte 15,40,101,72 // movaps 0x48(%ebp),%xmm4 .byte 15,40,109,88 // movaps 0x58(%ebp),%xmm5 - .byte 15,40,130,150,28,0,0 // movaps 0x1c96(%edx),%xmm0 + .byte 15,40,130,158,28,0,0 // movaps 0x1c9e(%edx),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,130,166,28,0,0 // addps 0x1ca6(%edx),%xmm0 + .byte 15,88,130,174,28,0,0 // addps 0x1cae(%edx),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,130,182,28,0,0 // addps 0x1cb6(%edx),%xmm0 + .byte 15,88,130,190,28,0,0 // addps 0x1cbe(%edx),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,130,198,28,0,0 // addps 0x1cc6(%edx),%xmm0 + .byte 15,88,130,206,28,0,0 // addps 0x1cce(%edx),%xmm0 .byte 15,89,195 // mulps %xmm3,%xmm0 - .byte 15,88,130,214,28,0,0 // addps 0x1cd6(%edx),%xmm0 + .byte 15,88,130,222,28,0,0 // addps 0x1cde(%edx),%xmm0 .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 141,90,4 // lea 0x4(%edx),%ebx .byte 15,41,108,36,80 // movaps %xmm5,0x50(%esp) @@ -49625,7 +49483,7 @@ _sk_gradient_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 129,236,156,0,0,0 // sub $0x9c,%esp - .byte 232,0,0,0,0 // call 7217 <_sk_gradient_sse2+0x11> + .byte 232,0,0,0,0 // call 71bf <_sk_gradient_sse2+0x11> .byte 90 // pop %edx .byte 139,69,12 // mov 0xc(%ebp),%eax .byte 141,72,4 // lea 0x4(%eax),%ecx @@ -49634,12 +49492,12 @@ _sk_gradient_sse2: .byte 139,7 // mov (%edi),%eax .byte 102,15,239,201 // pxor %xmm1,%xmm1 .byte 131,248,2 // cmp $0x2,%eax - .byte 114,43 // jb 7259 <_sk_gradient_sse2+0x53> + .byte 114,43 // jb 7201 <_sk_gradient_sse2+0x53> .byte 139,79,36 // mov 0x24(%edi),%ecx .byte 72 // dec %eax .byte 131,193,4 // add $0x4,%ecx .byte 102,15,239,201 // pxor %xmm1,%xmm1 - .byte 15,40,146,73,28,0,0 // movaps 0x1c49(%edx),%xmm2 + .byte 15,40,146,81,28,0,0 // movaps 0x1c51(%edx),%xmm2 .byte 243,15,16,25 // movss (%ecx),%xmm3 .byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3 .byte 15,194,216,2 // cmpleps %xmm0,%xmm3 @@ -49647,7 +49505,7 @@ _sk_gradient_sse2: .byte 102,15,254,203 // paddd %xmm3,%xmm1 .byte 131,193,4 // add $0x4,%ecx .byte 72 // dec %eax - .byte 117,231 // jne 7240 <_sk_gradient_sse2+0x3a> + .byte 117,231 // jne 71e8 <_sk_gradient_sse2+0x3a> .byte 102,15,126,203 // movd %xmm1,%ebx .byte 102,15,112,209,229 // pshufd $0xe5,%xmm1,%xmm2 .byte 102,15,126,208 // movd %xmm2,%eax @@ -49836,7 +49694,7 @@ _sk_xy_to_unit_angle_sse2: .byte 15,40,218 // movaps %xmm2,%xmm3 .byte 15,40,209 // movaps %xmm1,%xmm2 .byte 15,40,200 // movaps %xmm0,%xmm1 - .byte 232,0,0,0,0 // call 74d7 <_sk_xy_to_unit_angle_sse2+0x1b> + .byte 232,0,0,0,0 // call 747f <_sk_xy_to_unit_angle_sse2+0x1b> .byte 88 // pop %eax .byte 15,87,237 // xorps %xmm5,%xmm5 .byte 15,92,233 // subps %xmm1,%xmm5 @@ -49851,35 +49709,35 @@ _sk_xy_to_unit_angle_sse2: .byte 15,94,247 // divps %xmm7,%xmm6 .byte 15,40,254 // movaps %xmm6,%xmm7 .byte 15,89,255 // mulps %xmm7,%xmm7 - .byte 15,40,128,153,25,0,0 // movaps 0x1999(%eax),%xmm0 + .byte 15,40,128,161,25,0,0 // movaps 0x19a1(%eax),%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 15,88,128,169,25,0,0 // addps 0x19a9(%eax),%xmm0 + .byte 15,88,128,177,25,0,0 // addps 0x19b1(%eax),%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 - .byte 15,88,128,185,25,0,0 // addps 0x19b9(%eax),%xmm0 + .byte 15,88,128,193,25,0,0 // addps 0x19c1(%eax),%xmm0 .byte 15,89,199 // mulps %xmm7,%xmm0 .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 139,125,24 // mov 0x18(%ebp),%edi - .byte 15,88,128,201,25,0,0 // addps 0x19c9(%eax),%xmm0 + .byte 15,88,128,209,25,0,0 // addps 0x19d1(%eax),%xmm0 .byte 15,89,198 // mulps %xmm6,%xmm0 .byte 15,40,117,40 // movaps 0x28(%ebp),%xmm6 .byte 15,194,236,1 // cmpltps %xmm4,%xmm5 - .byte 15,40,184,217,25,0,0 // movaps 0x19d9(%eax),%xmm7 + .byte 15,40,184,225,25,0,0 // movaps 0x19e1(%eax),%xmm7 .byte 15,92,248 // subps %xmm0,%xmm7 .byte 15,84,253 // andps %xmm5,%xmm7 .byte 15,85,232 // andnps %xmm0,%xmm5 .byte 15,87,228 // xorps %xmm4,%xmm4 .byte 15,86,239 // orps %xmm7,%xmm5 .byte 15,194,204,1 // cmpltps %xmm4,%xmm1 - .byte 15,40,128,233,25,0,0 // movaps 0x19e9(%eax),%xmm0 + .byte 15,40,128,241,25,0,0 // movaps 0x19f1(%eax),%xmm0 .byte 15,92,197 // subps %xmm5,%xmm0 .byte 15,84,193 // andps %xmm1,%xmm0 .byte 15,85,205 // andnps %xmm5,%xmm1 .byte 15,86,200 // orps %xmm0,%xmm1 .byte 15,40,194 // movaps %xmm2,%xmm0 .byte 15,194,196,1 // cmpltps %xmm4,%xmm0 - .byte 15,40,168,249,25,0,0 // movaps 0x19f9(%eax),%xmm5 + .byte 15,40,168,1,26,0,0 // movaps 0x1a01(%eax),%xmm5 .byte 15,92,233 // subps %xmm1,%xmm5 .byte 15,84,232 // andps %xmm0,%xmm5 .byte 15,85,193 // andnps %xmm1,%xmm0 @@ -49966,16 +49824,16 @@ _sk_save_xy_sse2: .byte 131,236,124 // sub $0x7c,%esp .byte 15,41,93,216 // movaps %xmm3,-0x28(%ebp) .byte 15,40,218 // movaps %xmm2,%xmm3 - .byte 232,0,0,0,0 // call 7659 <_sk_save_xy_sse2+0x15> + .byte 232,0,0,0,0 // call 7601 <_sk_save_xy_sse2+0x15> .byte 88 // pop %eax - .byte 15,40,160,135,24,0,0 // movaps 0x1887(%eax),%xmm4 + .byte 15,40,160,143,24,0,0 // movaps 0x188f(%eax),%xmm4 .byte 15,40,232 // movaps %xmm0,%xmm5 .byte 15,88,236 // addps %xmm4,%xmm5 .byte 243,15,91,245 // cvttps2dq %xmm5,%xmm6 .byte 15,91,246 // cvtdq2ps %xmm6,%xmm6 .byte 15,40,253 // movaps %xmm5,%xmm7 .byte 15,194,254,1 // cmpltps %xmm6,%xmm7 - .byte 15,40,144,151,24,0,0 // movaps 0x1897(%eax),%xmm2 + .byte 15,40,144,159,24,0,0 // movaps 0x189f(%eax),%xmm2 .byte 15,84,250 // andps %xmm2,%xmm7 .byte 15,92,247 // subps %xmm7,%xmm6 .byte 15,92,238 // subps %xmm6,%xmm5 @@ -50079,15 +49937,15 @@ _sk_bilinear_nx_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 779e <_sk_bilinear_nx_sse2+0xe> + .byte 232,0,0,0,0 // call 7746 <_sk_bilinear_nx_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 139,62 // mov (%esi),%edi .byte 15,16,7 // movups (%edi),%xmm0 - .byte 15,88,128,98,23,0,0 // addps 0x1762(%eax),%xmm0 - .byte 15,40,160,114,23,0,0 // movaps 0x1772(%eax),%xmm4 + .byte 15,88,128,106,23,0,0 // addps 0x176a(%eax),%xmm0 + .byte 15,40,160,122,23,0,0 // movaps 0x177a(%eax),%xmm4 .byte 139,69,20 // mov 0x14(%ebp),%eax .byte 15,16,111,64 // movups 0x40(%edi),%xmm5 .byte 15,92,229 // subps %xmm5,%xmm4 @@ -50125,14 +49983,14 @@ _sk_bilinear_px_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 7822 <_sk_bilinear_px_sse2+0xe> + .byte 232,0,0,0,0 // call 77ca <_sk_bilinear_px_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 139,62 // mov (%esi),%edi .byte 15,16,7 // movups (%edi),%xmm0 - .byte 15,88,128,254,22,0,0 // addps 0x16fe(%eax),%xmm0 + .byte 15,88,128,6,23,0,0 // addps 0x1706(%eax),%xmm0 .byte 139,69,20 // mov 0x14(%ebp),%eax .byte 15,16,103,64 // movups 0x40(%edi),%xmm4 .byte 15,17,167,128,0,0,0 // movups %xmm4,0x80(%edi) @@ -50169,15 +50027,15 @@ _sk_bilinear_ny_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 789c <_sk_bilinear_ny_sse2+0xe> + .byte 232,0,0,0,0 // call 7844 <_sk_bilinear_ny_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 139,62 // mov (%esi),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 - .byte 15,88,136,148,22,0,0 // addps 0x1694(%eax),%xmm1 - .byte 15,40,160,164,22,0,0 // movaps 0x16a4(%eax),%xmm4 + .byte 15,88,136,156,22,0,0 // addps 0x169c(%eax),%xmm1 + .byte 15,40,160,172,22,0,0 // movaps 0x16ac(%eax),%xmm4 .byte 139,69,20 // mov 0x14(%ebp),%eax .byte 15,16,111,96 // movups 0x60(%edi),%xmm5 .byte 15,92,229 // subps %xmm5,%xmm4 @@ -50215,14 +50073,14 @@ _sk_bilinear_py_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 7921 <_sk_bilinear_py_sse2+0xe> + .byte 232,0,0,0,0 // call 78c9 <_sk_bilinear_py_sse2+0xe> .byte 88 // pop %eax .byte 139,77,8 // mov 0x8(%ebp),%ecx .byte 139,85,16 // mov 0x10(%ebp),%edx .byte 139,117,12 // mov 0xc(%ebp),%esi .byte 139,62 // mov (%esi),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 - .byte 15,88,136,47,22,0,0 // addps 0x162f(%eax),%xmm1 + .byte 15,88,136,55,22,0,0 // addps 0x1637(%eax),%xmm1 .byte 139,69,20 // mov 0x14(%ebp),%eax .byte 15,16,103,96 // movups 0x60(%edi),%xmm4 .byte 15,17,167,160,0,0,0 // movups %xmm4,0xa0(%edi) @@ -50259,7 +50117,7 @@ _sk_bicubic_n3x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 799c <_sk_bicubic_n3x_sse2+0xe> + .byte 232,0,0,0,0 // call 7944 <_sk_bicubic_n3x_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -50267,12 +50125,12 @@ _sk_bicubic_n3x_sse2: .byte 139,58 // mov (%edx),%edi .byte 15,16,7 // movups (%edi),%xmm0 .byte 15,16,103,64 // movups 0x40(%edi),%xmm4 - .byte 15,88,134,196,21,0,0 // addps 0x15c4(%esi),%xmm0 - .byte 15,40,174,212,21,0,0 // movaps 0x15d4(%esi),%xmm5 + .byte 15,88,134,204,21,0,0 // addps 0x15cc(%esi),%xmm0 + .byte 15,40,174,220,21,0,0 // movaps 0x15dc(%esi),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,40,229 // movaps %xmm5,%xmm4 - .byte 15,89,174,228,21,0,0 // mulps 0x15e4(%esi),%xmm5 - .byte 15,88,174,244,21,0,0 // addps 0x15f4(%esi),%xmm5 + .byte 15,89,174,236,21,0,0 // mulps 0x15ec(%esi),%xmm5 + .byte 15,88,174,252,21,0,0 // addps 0x15fc(%esi),%xmm5 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,89,228 // mulps %xmm4,%xmm4 .byte 15,89,236 // mulps %xmm4,%xmm5 @@ -50310,7 +50168,7 @@ _sk_bicubic_n1x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 7a37 <_sk_bicubic_n1x_sse2+0xe> + .byte 232,0,0,0,0 // call 79df <_sk_bicubic_n1x_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -50318,16 +50176,16 @@ _sk_bicubic_n1x_sse2: .byte 139,58 // mov (%edx),%edi .byte 15,16,7 // movups (%edi),%xmm0 .byte 15,16,103,64 // movups 0x40(%edi),%xmm4 - .byte 15,88,134,105,21,0,0 // addps 0x1569(%esi),%xmm0 - .byte 15,40,174,121,21,0,0 // movaps 0x1579(%esi),%xmm5 + .byte 15,88,134,113,21,0,0 // addps 0x1571(%esi),%xmm0 + .byte 15,40,174,129,21,0,0 // movaps 0x1581(%esi),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 - .byte 15,40,166,137,21,0,0 // movaps 0x1589(%esi),%xmm4 + .byte 15,40,166,145,21,0,0 // movaps 0x1591(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,153,21,0,0 // addps 0x1599(%esi),%xmm4 + .byte 15,88,166,161,21,0,0 // addps 0x15a1(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,169,21,0,0 // addps 0x15a9(%esi),%xmm4 + .byte 15,88,166,177,21,0,0 // addps 0x15b1(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,185,21,0,0 // addps 0x15b9(%esi),%xmm4 + .byte 15,88,166,193,21,0,0 // addps 0x15c1(%esi),%xmm4 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,17,167,128,0,0,0 // movups %xmm4,0x80(%edi) .byte 139,125,24 // mov 0x18(%ebp),%edi @@ -50363,21 +50221,21 @@ _sk_bicubic_p1x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 7ae0 <_sk_bicubic_p1x_sse2+0xe> + .byte 232,0,0,0,0 // call 7a88 <_sk_bicubic_p1x_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,58 // mov (%edx),%edi - .byte 15,40,166,32,21,0,0 // movaps 0x1520(%esi),%xmm4 + .byte 15,40,166,40,21,0,0 // movaps 0x1528(%esi),%xmm4 .byte 15,16,71,64 // movups 0x40(%edi),%xmm0 - .byte 15,40,174,48,21,0,0 // movaps 0x1530(%esi),%xmm5 + .byte 15,40,174,56,21,0,0 // movaps 0x1538(%esi),%xmm5 .byte 15,89,232 // mulps %xmm0,%xmm5 - .byte 15,88,174,64,21,0,0 // addps 0x1540(%esi),%xmm5 + .byte 15,88,174,72,21,0,0 // addps 0x1548(%esi),%xmm5 .byte 15,89,232 // mulps %xmm0,%xmm5 .byte 15,88,236 // addps %xmm4,%xmm5 .byte 15,89,232 // mulps %xmm0,%xmm5 - .byte 15,88,174,80,21,0,0 // addps 0x1550(%esi),%xmm5 + .byte 15,88,174,88,21,0,0 // addps 0x1558(%esi),%xmm5 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,16,7 // movups (%edi),%xmm0 .byte 15,17,175,128,0,0,0 // movups %xmm5,0x80(%edi) @@ -50415,7 +50273,7 @@ _sk_bicubic_p3x_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 7b7e <_sk_bicubic_p3x_sse2+0xe> + .byte 232,0,0,0,0 // call 7b26 <_sk_bicubic_p3x_sse2+0xe> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -50423,10 +50281,10 @@ _sk_bicubic_p3x_sse2: .byte 139,62 // mov (%esi),%edi .byte 15,16,7 // movups (%edi),%xmm0 .byte 15,16,103,64 // movups 0x40(%edi),%xmm4 - .byte 15,88,129,194,20,0,0 // addps 0x14c2(%ecx),%xmm0 + .byte 15,88,129,202,20,0,0 // addps 0x14ca(%ecx),%xmm0 .byte 15,40,236 // movaps %xmm4,%xmm5 - .byte 15,89,161,210,20,0,0 // mulps 0x14d2(%ecx),%xmm4 - .byte 15,88,161,226,20,0,0 // addps 0x14e2(%ecx),%xmm4 + .byte 15,89,161,218,20,0,0 // mulps 0x14da(%ecx),%xmm4 + .byte 15,88,161,234,20,0,0 // addps 0x14ea(%ecx),%xmm4 .byte 139,77,20 // mov 0x14(%ebp),%ecx .byte 15,89,237 // mulps %xmm5,%xmm5 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -50464,7 +50322,7 @@ _sk_bicubic_n3y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 7c0f <_sk_bicubic_n3y_sse2+0xe> + .byte 232,0,0,0,0 // call 7bb7 <_sk_bicubic_n3y_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -50472,12 +50330,12 @@ _sk_bicubic_n3y_sse2: .byte 139,58 // mov (%edx),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 .byte 15,16,103,96 // movups 0x60(%edi),%xmm4 - .byte 15,88,142,97,20,0,0 // addps 0x1461(%esi),%xmm1 - .byte 15,40,174,113,20,0,0 // movaps 0x1471(%esi),%xmm5 + .byte 15,88,142,105,20,0,0 // addps 0x1469(%esi),%xmm1 + .byte 15,40,174,121,20,0,0 // movaps 0x1479(%esi),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 .byte 15,40,229 // movaps %xmm5,%xmm4 - .byte 15,89,174,129,20,0,0 // mulps 0x1481(%esi),%xmm5 - .byte 15,88,174,145,20,0,0 // addps 0x1491(%esi),%xmm5 + .byte 15,89,174,137,20,0,0 // mulps 0x1489(%esi),%xmm5 + .byte 15,88,174,153,20,0,0 // addps 0x1499(%esi),%xmm5 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,89,228 // mulps %xmm4,%xmm4 .byte 15,89,236 // mulps %xmm4,%xmm5 @@ -50515,7 +50373,7 @@ _sk_bicubic_n1y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 7cab <_sk_bicubic_n1y_sse2+0xe> + .byte 232,0,0,0,0 // call 7c53 <_sk_bicubic_n1y_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx @@ -50523,16 +50381,16 @@ _sk_bicubic_n1y_sse2: .byte 139,58 // mov (%edx),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 .byte 15,16,103,96 // movups 0x60(%edi),%xmm4 - .byte 15,88,142,5,20,0,0 // addps 0x1405(%esi),%xmm1 - .byte 15,40,174,21,20,0,0 // movaps 0x1415(%esi),%xmm5 + .byte 15,88,142,13,20,0,0 // addps 0x140d(%esi),%xmm1 + .byte 15,40,174,29,20,0,0 // movaps 0x141d(%esi),%xmm5 .byte 15,92,236 // subps %xmm4,%xmm5 - .byte 15,40,166,37,20,0,0 // movaps 0x1425(%esi),%xmm4 + .byte 15,40,166,45,20,0,0 // movaps 0x142d(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,53,20,0,0 // addps 0x1435(%esi),%xmm4 + .byte 15,88,166,61,20,0,0 // addps 0x143d(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,69,20,0,0 // addps 0x1445(%esi),%xmm4 + .byte 15,88,166,77,20,0,0 // addps 0x144d(%esi),%xmm4 .byte 15,89,229 // mulps %xmm5,%xmm4 - .byte 15,88,166,85,20,0,0 // addps 0x1455(%esi),%xmm4 + .byte 15,88,166,93,20,0,0 // addps 0x145d(%esi),%xmm4 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,17,167,160,0,0,0 // movups %xmm4,0xa0(%edi) .byte 139,125,24 // mov 0x18(%ebp),%edi @@ -50568,21 +50426,21 @@ _sk_bicubic_p1y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 7d55 <_sk_bicubic_p1y_sse2+0xe> + .byte 232,0,0,0,0 // call 7cfd <_sk_bicubic_p1y_sse2+0xe> .byte 94 // pop %esi .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,77,16 // mov 0x10(%ebp),%ecx .byte 139,85,12 // mov 0xc(%ebp),%edx .byte 139,58 // mov (%edx),%edi - .byte 15,40,166,187,19,0,0 // movaps 0x13bb(%esi),%xmm4 + .byte 15,40,166,195,19,0,0 // movaps 0x13c3(%esi),%xmm4 .byte 15,16,79,96 // movups 0x60(%edi),%xmm1 - .byte 15,40,174,203,19,0,0 // movaps 0x13cb(%esi),%xmm5 + .byte 15,40,174,211,19,0,0 // movaps 0x13d3(%esi),%xmm5 .byte 15,89,233 // mulps %xmm1,%xmm5 - .byte 15,88,174,219,19,0,0 // addps 0x13db(%esi),%xmm5 + .byte 15,88,174,227,19,0,0 // addps 0x13e3(%esi),%xmm5 .byte 15,89,233 // mulps %xmm1,%xmm5 .byte 15,88,236 // addps %xmm4,%xmm5 .byte 15,89,233 // mulps %xmm1,%xmm5 - .byte 15,88,174,235,19,0,0 // addps 0x13eb(%esi),%xmm5 + .byte 15,88,174,243,19,0,0 // addps 0x13f3(%esi),%xmm5 .byte 139,117,20 // mov 0x14(%ebp),%esi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 .byte 15,17,175,160,0,0,0 // movups %xmm5,0xa0(%edi) @@ -50620,7 +50478,7 @@ _sk_bicubic_p3y_sse2: .byte 87 // push %edi .byte 86 // push %esi .byte 131,236,108 // sub $0x6c,%esp - .byte 232,0,0,0,0 // call 7df4 <_sk_bicubic_p3y_sse2+0xe> + .byte 232,0,0,0,0 // call 7d9c <_sk_bicubic_p3y_sse2+0xe> .byte 89 // pop %ecx .byte 139,69,8 // mov 0x8(%ebp),%eax .byte 139,85,16 // mov 0x10(%ebp),%edx @@ -50628,10 +50486,10 @@ _sk_bicubic_p3y_sse2: .byte 139,62 // mov (%esi),%edi .byte 15,16,79,32 // movups 0x20(%edi),%xmm1 .byte 15,16,103,96 // movups 0x60(%edi),%xmm4 - .byte 15,88,137,92,19,0,0 // addps 0x135c(%ecx),%xmm1 + .byte 15,88,137,100,19,0,0 // addps 0x1364(%ecx),%xmm1 .byte 15,40,236 // movaps %xmm4,%xmm5 - .byte 15,89,161,108,19,0,0 // mulps 0x136c(%ecx),%xmm4 - .byte 15,88,161,124,19,0,0 // addps 0x137c(%ecx),%xmm4 + .byte 15,89,161,116,19,0,0 // mulps 0x1374(%ecx),%xmm4 + .byte 15,88,161,132,19,0,0 // addps 0x1384(%ecx),%xmm4 .byte 139,77,20 // mov 0x14(%ebp),%ecx .byte 15,89,237 // mulps %xmm5,%xmm5 .byte 15,89,229 // mulps %xmm5,%xmm4 @@ -50881,11 +50739,11 @@ BALIGN16 .byte 0,224 // add %ah,%al .byte 64 // inc %eax .byte 0,0 // add %al,(%eax) - .byte 224,64 // loopne 8138 <.literal16+0x1d8> + .byte 224,64 // loopne 80e8 <.literal16+0x1d8> .byte 0,0 // add %al,(%eax) - .byte 224,64 // loopne 813c <.literal16+0x1dc> + .byte 224,64 // loopne 80ec <.literal16+0x1dc> .byte 0,0 // add %al,(%eax) - .byte 224,64 // loopne 8140 <.literal16+0x1e0> + .byte 224,64 // loopne 80f0 <.literal16+0x1e0> .byte 154,153,153,62,154,153,153 // lcall $0x9999,$0x9a3e9999 .byte 62,154,153,153,62,154,153,153 // ds lcall $0x9999,$0x9a3e9999 .byte 62,61,10,23,63,61 // ds cmp $0x3d3f170a,%eax @@ -50896,16 +50754,16 @@ BALIGN16 .byte 63 // aas .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8161 <.literal16+0x201> + .byte 225,61 // loope 8111 <.literal16+0x201> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8165 <.literal16+0x205> + .byte 225,61 // loope 8115 <.literal16+0x205> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8169 <.literal16+0x209> + .byte 225,61 // loope 8119 <.literal16+0x209> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 816d <.literal16+0x20d> + .byte 225,61 // loope 811d <.literal16+0x20d> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -50922,16 +50780,16 @@ BALIGN16 .byte 63 // aas .byte 61,10,23,63,174 // cmp $0xae3f170a,%eax .byte 71 // inc %edi - .byte 225,61 // loope 81a1 <.literal16+0x241> + .byte 225,61 // loope 8151 <.literal16+0x241> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 81a5 <.literal16+0x245> + .byte 225,61 // loope 8155 <.literal16+0x245> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 81a9 <.literal16+0x249> + .byte 225,61 // loope 8159 <.literal16+0x249> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 81ad <.literal16+0x24d> + .byte 225,61 // loope 815d <.literal16+0x24d> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -50948,16 +50806,16 @@ BALIGN16 .byte 63 // aas .byte 61,10,23,63,174 // cmp $0xae3f170a,%eax .byte 71 // inc %edi - .byte 225,61 // loope 81e1 <.literal16+0x281> + .byte 225,61 // loope 8191 <.literal16+0x281> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 81e5 <.literal16+0x285> + .byte 225,61 // loope 8195 <.literal16+0x285> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 81e9 <.literal16+0x289> + .byte 225,61 // loope 8199 <.literal16+0x289> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 81ed <.literal16+0x28d> + .byte 225,61 // loope 819d <.literal16+0x28d> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -50974,16 +50832,16 @@ BALIGN16 .byte 63 // aas .byte 61,10,23,63,174 // cmp $0xae3f170a,%eax .byte 71 // inc %edi - .byte 225,61 // loope 8221 <.literal16+0x2c1> + .byte 225,61 // loope 81d1 <.literal16+0x2c1> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8225 <.literal16+0x2c5> + .byte 225,61 // loope 81d5 <.literal16+0x2c5> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 8229 <.literal16+0x2c9> + .byte 225,61 // loope 81d9 <.literal16+0x2c9> .byte 174 // scas %es:(%edi),%al .byte 71 // inc %edi - .byte 225,61 // loope 822d <.literal16+0x2cd> + .byte 225,61 // loope 81dd <.literal16+0x2cd> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -51005,11 +50863,11 @@ BALIGN16 .byte 0,128,63,0,0,127 // add %al,0x7f00003f(%eax) .byte 67 // inc %ebx .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 826b <.literal16+0x30b> + .byte 127,67 // jg 821b <.literal16+0x30b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 826f <.literal16+0x30f> + .byte 127,67 // jg 821f <.literal16+0x30f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 8273 <.literal16+0x313> + .byte 127,67 // jg 8223 <.literal16+0x313> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -51239,13 +51097,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 8459 <.literal16+0x4f9> + .byte 224,7 // loopne 8409 <.literal16+0x4f9> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 845d <.literal16+0x4fd> + .byte 224,7 // loopne 840d <.literal16+0x4fd> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 8461 <.literal16+0x501> + .byte 224,7 // loopne 8411 <.literal16+0x501> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 8465 <.literal16+0x505> + .byte 224,7 // loopne 8415 <.literal16+0x505> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -51294,11 +51152,11 @@ BALIGN16 .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,127,67 // add %bh,0x43(%edi) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 851b <.literal16+0x5bb> + .byte 127,67 // jg 84cb <.literal16+0x5bb> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 851f <.literal16+0x5bf> + .byte 127,67 // jg 84cf <.literal16+0x5bf> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 8523 <.literal16+0x5c3> + .byte 127,67 // jg 84d3 <.literal16+0x5c3> .byte 129,128,128,59,129,128,128,59,129,128// addl $0x80813b80,-0x7f7ec480(%eax) .byte 128,59,129 // cmpb $0x81,(%ebx) .byte 128,128,59,129,128,128,59 // addb $0x3b,-0x7f7f7ec5(%eax) @@ -51313,16 +51171,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 8514 <.literal16+0x5b4> + .byte 127,0 // jg 84c4 <.literal16+0x5b4> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 8518 <.literal16+0x5b8> + .byte 127,0 // jg 84c8 <.literal16+0x5b8> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 851c <.literal16+0x5bc> + .byte 127,0 // jg 84cc <.literal16+0x5bc> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 8520 <.literal16+0x5c0> + .byte 127,0 // jg 84d0 <.literal16+0x5c0> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -51331,7 +51189,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 85a5 <.literal16+0x645> + .byte 119,115 // ja 8555 <.literal16+0x645> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -51342,7 +51200,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 8509 <.literal16+0x5a9> + .byte 117,191 // jne 84b9 <.literal16+0x5a9> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -51358,7 +51216,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3c546 <_sk_callback_sse2+0xe9a346ce> + .byte 233,220,63,163,233 // jmp e9a3c4f6 <_sk_callback_sse2+0xe9a346d6> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -51413,16 +51271,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 85e4 <.literal16+0x684> + .byte 127,0 // jg 8594 <.literal16+0x684> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 85e8 <.literal16+0x688> + .byte 127,0 // jg 8598 <.literal16+0x688> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 85ec <.literal16+0x68c> + .byte 127,0 // jg 859c <.literal16+0x68c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 85f0 <.literal16+0x690> + .byte 127,0 // jg 85a0 <.literal16+0x690> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -51431,7 +51289,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 8675 <.literal16+0x715> + .byte 119,115 // ja 8625 <.literal16+0x715> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -51442,7 +51300,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 85d9 <.literal16+0x679> + .byte 117,191 // jne 8589 <.literal16+0x679> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -51458,7 +51316,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3c616 <_sk_callback_sse2+0xe9a3479e> + .byte 233,220,63,163,233 // jmp e9a3c5c6 <_sk_callback_sse2+0xe9a347a6> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -51513,16 +51371,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 86b4 <.literal16+0x754> + .byte 127,0 // jg 8664 <.literal16+0x754> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 86b8 <.literal16+0x758> + .byte 127,0 // jg 8668 <.literal16+0x758> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 86bc <.literal16+0x75c> + .byte 127,0 // jg 866c <.literal16+0x75c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 86c0 <.literal16+0x760> + .byte 127,0 // jg 8670 <.literal16+0x760> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -51531,7 +51389,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 8745 <.literal16+0x7e5> + .byte 119,115 // ja 86f5 <.literal16+0x7e5> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -51542,7 +51400,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 86a9 <.literal16+0x749> + .byte 117,191 // jne 8659 <.literal16+0x749> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -51558,7 +51416,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3c6e6 <_sk_callback_sse2+0xe9a3486e> + .byte 233,220,63,163,233 // jmp e9a3c696 <_sk_callback_sse2+0xe9a34876> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -51613,16 +51471,16 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 52,255 // xor $0xff,%al .byte 255 // (bad) - .byte 127,0 // jg 8784 <.literal16+0x824> + .byte 127,0 // jg 8734 <.literal16+0x824> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 8788 <.literal16+0x828> + .byte 127,0 // jg 8738 <.literal16+0x828> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 878c <.literal16+0x82c> + .byte 127,0 // jg 873c <.literal16+0x82c> .byte 255 // (bad) .byte 255 // (bad) - .byte 127,0 // jg 8790 <.literal16+0x830> + .byte 127,0 // jg 8740 <.literal16+0x830> .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) @@ -51631,7 +51489,7 @@ BALIGN16 .byte 0,63 // add %bh,(%edi) .byte 0,0 // add %al,(%eax) .byte 0,63 // add %bh,(%edi) - .byte 119,115 // ja 8815 <.literal16+0x8b5> + .byte 119,115 // ja 87c5 <.literal16+0x8b5> .byte 248 // clc .byte 194,119,115 // ret $0x7377 .byte 248 // clc @@ -51642,7 +51500,7 @@ BALIGN16 .byte 194,117,191 // ret $0xbf75 .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas - .byte 117,191 // jne 8779 <.literal16+0x819> + .byte 117,191 // jne 8729 <.literal16+0x819> .byte 191,63,117,191,191 // mov $0xbfbf753f,%edi .byte 63 // aas .byte 249 // stc @@ -51658,7 +51516,7 @@ BALIGN16 .byte 68 // inc %esp .byte 180,62 // mov $0x3e,%ah .byte 163,233,220,63,163 // mov %eax,0xa33fdce9 - .byte 233,220,63,163,233 // jmp e9a3c7b6 <_sk_callback_sse2+0xe9a3493e> + .byte 233,220,63,163,233 // jmp e9a3c766 <_sk_callback_sse2+0xe9a34946> .byte 220,63 // fdivrl (%edi) .byte 163,233,220,63,0 // mov %eax,0x3fdce9 .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -51709,13 +51567,13 @@ BALIGN16 .byte 200,66,0,0 // enter $0x42,$0x0 .byte 200,66,0,0 // enter $0x42,$0x0 .byte 200,66,0,0 // enter $0x42,$0x0 - .byte 127,67 // jg 8897 <.literal16+0x937> + .byte 127,67 // jg 8847 <.literal16+0x937> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 889b <.literal16+0x93b> + .byte 127,67 // jg 884b <.literal16+0x93b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 889f <.literal16+0x93f> + .byte 127,67 // jg 884f <.literal16+0x93f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 88a3 <.literal16+0x943> + .byte 127,67 // jg 8853 <.literal16+0x943> .byte 0,0 // add %al,(%eax) .byte 0,195 // add %al,%bl .byte 0,0 // add %al,(%eax) @@ -51766,16 +51624,16 @@ BALIGN16 .byte 128,3,62 // addb $0x3e,(%ebx) .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 8923 <.literal16+0x9c3> + .byte 118,63 // jbe 88d3 <.literal16+0x9c3> .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 8927 <.literal16+0x9c7> + .byte 118,63 // jbe 88d7 <.literal16+0x9c7> .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 892b <.literal16+0x9cb> + .byte 118,63 // jbe 88db <.literal16+0x9cb> .byte 31 // pop %ds .byte 215 // xlat %ds:(%ebx) - .byte 118,63 // jbe 892f <.literal16+0x9cf> + .byte 118,63 // jbe 88df <.literal16+0x9cf> .byte 246,64,83,63 // testb $0x3f,0x53(%eax) .byte 246,64,83,63 // testb $0x3f,0x53(%eax) .byte 246,64,83,63 // testb $0x3f,0x53(%eax) @@ -51795,11 +51653,11 @@ BALIGN16 .byte 128,59,0 // cmpb $0x0,(%ebx) .byte 0,127,67 // add %bh,0x43(%edi) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 897b <.literal16+0xa1b> + .byte 127,67 // jg 892b <.literal16+0xa1b> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 897f <.literal16+0xa1f> + .byte 127,67 // jg 892f <.literal16+0xa1f> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 8983 <.literal16+0xa23> + .byte 127,67 // jg 8933 <.literal16+0xa23> .byte 255,0 // incl (%eax) .byte 0,0 // add %al,(%eax) .byte 0,0 // add %al,(%eax) @@ -51855,13 +51713,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 89e9 <.literal16+0xa89> + .byte 224,7 // loopne 8999 <.literal16+0xa89> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 89ed <.literal16+0xa8d> + .byte 224,7 // loopne 899d <.literal16+0xa8d> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 89f1 <.literal16+0xa91> + .byte 224,7 // loopne 89a1 <.literal16+0xa91> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 89f5 <.literal16+0xa95> + .byte 224,7 // loopne 89a5 <.literal16+0xa95> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -51907,13 +51765,13 @@ BALIGN16 .byte 132,55 // test %dh,(%edi) .byte 8,33 // or %ah,(%ecx) .byte 132,55 // test %dh,(%edi) - .byte 224,7 // loopne 8a59 <.literal16+0xaf9> + .byte 224,7 // loopne 8a09 <.literal16+0xaf9> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 8a5d <.literal16+0xafd> + .byte 224,7 // loopne 8a0d <.literal16+0xafd> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 8a61 <.literal16+0xb01> + .byte 224,7 // loopne 8a11 <.literal16+0xb01> .byte 0,0 // add %al,(%eax) - .byte 224,7 // loopne 8a65 <.literal16+0xb05> + .byte 224,7 // loopne 8a15 <.literal16+0xb05> .byte 0,0 // add %al,(%eax) .byte 33,8 // and %ecx,(%eax) .byte 2,58 // add (%edx),%bh @@ -51955,13 +51813,13 @@ BALIGN16 .byte 248 // clc .byte 65 // inc %ecx .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 8af6 <.literal16+0xb96> + .byte 124,66 // jl 8aa6 <.literal16+0xb96> .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 8afa <.literal16+0xb9a> + .byte 124,66 // jl 8aaa <.literal16+0xb9a> .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 8afe <.literal16+0xb9e> + .byte 124,66 // jl 8aae <.literal16+0xb9e> .byte 0,0 // add %al,(%eax) - .byte 124,66 // jl 8b02 <.literal16+0xba2> + .byte 124,66 // jl 8ab2 <.literal16+0xba2> .byte 0,240 // add %dh,%al .byte 0,0 // add %al,(%eax) .byte 0,240 // add %dh,%al @@ -52051,13 +51909,13 @@ BALIGN16 .byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%eax) .byte 61,137,136,136,61 // cmp $0x3d888889,%eax .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo 8c05 <.literal16+0xca5> + .byte 112,65 // jo 8bb5 <.literal16+0xca5> .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo 8c09 <.literal16+0xca9> + .byte 112,65 // jo 8bb9 <.literal16+0xca9> .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo 8c0d <.literal16+0xcad> + .byte 112,65 // jo 8bbd <.literal16+0xcad> .byte 0,0 // add %al,(%eax) - .byte 112,65 // jo 8c11 <.literal16+0xcb1> + .byte 112,65 // jo 8bc1 <.literal16+0xcb1> .byte 255,0 // incl (%eax) .byte 0,0 // add %al,(%eax) .byte 255,0 // incl (%eax) @@ -52079,11 +51937,11 @@ BALIGN16 .byte 128,59,129 // cmpb $0x81,(%ebx) .byte 128,128,59,0,0,127,67 // addb $0x43,0x7f00003b(%eax) .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 8c5b <.literal16+0xcfb> + .byte 127,67 // jg 8c0b <.literal16+0xcfb> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 8c5f <.literal16+0xcff> + .byte 127,67 // jg 8c0f <.literal16+0xcff> .byte 0,0 // add %al,(%eax) - .byte 127,67 // jg 8c63 <.literal16+0xd03> + .byte 127,67 // jg 8c13 <.literal16+0xd03> .byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax) .byte 0,0 // add %al,(%eax) .byte 0,128,0,0,0,128 // add %al,-0x80000000(%eax) @@ -52162,13 +52020,13 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 255 // (bad) - .byte 127,71 // jg 8d4b <.literal16+0xdeb> + .byte 127,71 // jg 8cfb <.literal16+0xdeb> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 8d4f <.literal16+0xdef> + .byte 127,71 // jg 8cff <.literal16+0xdef> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 8d53 <.literal16+0xdf3> + .byte 127,71 // jg 8d03 <.literal16+0xdf3> .byte 0,255 // add %bh,%bh - .byte 127,71 // jg 8d57 <.literal16+0xdf7> + .byte 127,71 // jg 8d07 <.literal16+0xdf7> .byte 0,0 // add %al,(%eax) .byte 128,63,0 // cmpb $0x0,(%edi) .byte 0,128,63,0,0,128 // add %al,-0x7fffffc1(%eax) @@ -52276,7 +52134,7 @@ BALIGN16 .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110 .byte 17,192 // adc %eax,%eax .byte 45,16,17,192,18 // sub $0x12c01110,%eax - .byte 120,57 // js 8e5c <.literal16+0xefc> + .byte 120,57 // js 8e0c <.literal16+0xefc> .byte 64 // inc %eax .byte 18,120,57 // adc 0x39(%eax),%bh .byte 64 // inc %eax @@ -52410,11 +52268,11 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 128,63,114 // cmpb $0x72,(%edi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 8fa2 <.literal16+0x1042> + .byte 62,114,28 // jb,pt 8f52 <.literal16+0x1042> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 8fa6 <.literal16+0x1046> + .byte 62,114,28 // jb,pt 8f56 <.literal16+0x1046> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 8faa <.literal16+0x104a> + .byte 62,114,28 // jb,pt 8f5a <.literal16+0x104a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -52493,13 +52351,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%edi) .byte 0,192 // add %al,%al .byte 63 // aas - .byte 114,28 // jb 906e <.literal16+0x110e> + .byte 114,28 // jb 901e <.literal16+0x110e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 9072 <.literal16+0x1112> + .byte 62,114,28 // jb,pt 9022 <.literal16+0x1112> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 9076 <.literal16+0x1116> + .byte 62,114,28 // jb,pt 9026 <.literal16+0x1116> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 907a <.literal16+0x111a> + .byte 62,114,28 // jb,pt 902a <.literal16+0x111a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -52520,11 +52378,11 @@ BALIGN16 .byte 0,0 // add %al,(%eax) .byte 128,63,114 // cmpb $0x72,(%edi) .byte 28,199 // sbb $0xc7,%al - .byte 62,114,28 // jb,pt 90b2 <.literal16+0x1152> + .byte 62,114,28 // jb,pt 9062 <.literal16+0x1152> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 90b6 <.literal16+0x1156> + .byte 62,114,28 // jb,pt 9066 <.literal16+0x1156> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 90ba <.literal16+0x115a> + .byte 62,114,28 // jb,pt 906a <.literal16+0x115a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) @@ -52603,13 +52461,13 @@ BALIGN16 .byte 192,63,0 // sarb $0x0,(%edi) .byte 0,192 // add %al,%al .byte 63 // aas - .byte 114,28 // jb 917e <.literal16+0x121e> + .byte 114,28 // jb 912e <.literal16+0x121e> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 9182 <_sk_callback_sse2+0x130a> + .byte 62,114,28 // jb,pt 9132 <_sk_callback_sse2+0x1312> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 9186 <_sk_callback_sse2+0x130e> + .byte 62,114,28 // jb,pt 9136 <_sk_callback_sse2+0x1316> .byte 199 // (bad) - .byte 62,114,28 // jb,pt 918a <_sk_callback_sse2+0x1312> + .byte 62,114,28 // jb,pt 913a <_sk_callback_sse2+0x131a> .byte 199 // (bad) .byte 62,171 // ds stos %eax,%es:(%edi) .byte 170 // stos %al,%es:(%edi) diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S index 51b23da617..4c93ee9fb5 100644 --- a/src/jumper/SkJumper_generated_win.S +++ b/src/jumper/SkJumper_generated_win.S @@ -33,50 +33,34 @@ _sk_start_pipeline_hsw LABEL PROC DB 197,248,41,189,48,255,255,255 ; vmovaps %xmm7,-0xd0(%rbp) DB 197,248,41,181,32,255,255,255 ; vmovaps %xmm6,-0xe0(%rbp) DB 72,137,211 ; mov %rdx,%rbx - DB 73,137,207 ; mov %rcx,%r15 + DB 73,137,204 ; mov %rcx,%r12 DB 76,139,117,48 ; mov 0x30(%rbp),%r14 DB 76,137,206 ; mov %r9,%rsi DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,197 ; mov %rax,%r13 - DB 73,137,244 ; mov %rsi,%r12 - DB 73,141,79,8 ; lea 0x8(%r15),%rcx + DB 73,137,247 ; mov %rsi,%r15 + DB 73,141,76,36,8 ; lea 0x8(%r12),%rcx DB 76,57,193 ; cmp %r8,%rcx - DB 118,5 ; jbe 7d <_sk_start_pipeline_hsw+0x7d> - DB 76,137,250 ; mov %r15,%rdx - DB 235,83 ; jmp d0 <_sk_start_pipeline_hsw+0xd0> + DB 118,5 ; jbe 7e <_sk_start_pipeline_hsw+0x7e> + DB 76,137,226 ; mov %r12,%rdx + DB 235,49 ; jmp af <_sk_start_pipeline_hsw+0xaf> DB 76,137,133,24,255,255,255 ; mov %r8,-0xe8(%rbp) - DB 65,184,0,0,0,0 ; mov $0x0,%r8d - DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 - DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 - DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2 - DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 - DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 - DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 - DB 197,204,87,246 ; vxorps %ymm6,%ymm6,%ymm6 - DB 197,196,87,255 ; vxorps %ymm7,%ymm7,%ymm7 + DB 69,49,192 ; xor %r8d,%r8d DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi - DB 76,137,250 ; mov %r15,%rdx + DB 76,137,254 ; mov %r15,%rsi + DB 76,137,226 ; mov %r12,%rdx DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 76,139,133,24,255,255,255 ; mov -0xe8(%rbp),%r8 - DB 73,141,87,8 ; lea 0x8(%r15),%rdx - DB 73,131,199,16 ; add $0x10,%r15 - DB 77,57,199 ; cmp %r8,%r15 - DB 73,137,215 ; mov %rdx,%r15 - DB 118,180 ; jbe 84 <_sk_start_pipeline_hsw+0x84> + DB 73,141,84,36,8 ; lea 0x8(%r12),%rdx + DB 73,131,196,16 ; add $0x10,%r12 + DB 77,57,196 ; cmp %r8,%r12 + DB 73,137,212 ; mov %rdx,%r12 + DB 118,214 ; jbe 85 <_sk_start_pipeline_hsw+0x85> DB 73,41,208 ; sub %rdx,%r8 - DB 116,44 ; je 101 <_sk_start_pipeline_hsw+0x101> - DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 - DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 - DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2 - DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 - DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 - DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 - DB 197,204,87,246 ; vxorps %ymm6,%ymm6,%ymm6 - DB 197,196,87,255 ; vxorps %ymm7,%ymm7,%ymm7 + DB 116,12 ; je c0 <_sk_start_pipeline_hsw+0xc0> DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi + DB 76,137,254 ; mov %r15,%rsi DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6 @@ -110,7 +94,7 @@ _sk_seed_shader_hsw LABEL PROC DB 197,249,110,194 ; vmovd %edx,%xmm0 DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,225,75,0,0 ; vbroadcastss 0x4be1(%rip),%ymm1 # 4d54 <_sk_callback_hsw+0x12c> + DB 196,226,125,24,13,226,75,0,0 ; vbroadcastss 0x4be2(%rip),%ymm1 # 4d14 <_sk_callback_hsw+0x12c> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0 DB 197,249,110,209 ; vmovd %ecx,%xmm2 @@ -118,7 +102,7 @@ _sk_seed_shader_hsw LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,21,193,75,0,0 ; vbroadcastss 0x4bc1(%rip),%ymm2 # 4d58 <_sk_callback_hsw+0x130> + DB 196,226,125,24,21,194,75,0,0 ; vbroadcastss 0x4bc2(%rip),%ymm2 # 4d18 <_sk_callback_hsw+0x130> DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 @@ -135,13 +119,13 @@ _sk_dither_hsw LABEL PROC DB 197,121,110,201 ; vmovd %ecx,%xmm9 DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9 DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9 - DB 196,98,125,88,21,136,75,0,0 ; vpbroadcastd 0x4b88(%rip),%ymm10 # 4d5c <_sk_callback_hsw+0x134> + DB 196,98,125,88,21,137,75,0,0 ; vpbroadcastd 0x4b89(%rip),%ymm10 # 4d1c <_sk_callback_hsw+0x134> DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11 DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11 DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10 DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10 - DB 196,98,125,88,37,109,75,0,0 ; vpbroadcastd 0x4b6d(%rip),%ymm12 # 4d60 <_sk_callback_hsw+0x138> - DB 196,98,125,88,45,104,75,0,0 ; vpbroadcastd 0x4b68(%rip),%ymm13 # 4d64 <_sk_callback_hsw+0x13c> + DB 196,98,125,88,37,110,75,0,0 ; vpbroadcastd 0x4b6e(%rip),%ymm12 # 4d20 <_sk_callback_hsw+0x138> + DB 196,98,125,88,45,105,75,0,0 ; vpbroadcastd 0x4b69(%rip),%ymm13 # 4d24 <_sk_callback_hsw+0x13c> DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14 DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14 DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13 @@ -156,8 +140,8 @@ _sk_dither_hsw LABEL PROC DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8 DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,26,75,0,0 ; vbroadcastss 0x4b1a(%rip),%ymm9 # 4d68 <_sk_callback_hsw+0x140> - DB 196,98,125,24,21,21,75,0,0 ; vbroadcastss 0x4b15(%rip),%ymm10 # 4d6c <_sk_callback_hsw+0x144> + DB 196,98,125,24,13,27,75,0,0 ; vbroadcastss 0x4b1b(%rip),%ymm9 # 4d28 <_sk_callback_hsw+0x140> + DB 196,98,125,24,21,22,75,0,0 ; vbroadcastss 0x4b16(%rip),%ymm10 # 4d2c <_sk_callback_hsw+0x144> DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10 DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8 DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 @@ -216,7 +200,7 @@ _sk_clear_hsw LABEL PROC PUBLIC _sk_srcatop_hsw _sk_srcatop_hsw LABEL PROC DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0 - DB 196,98,125,24,5,109,74,0,0 ; vbroadcastss 0x4a6d(%rip),%ymm8 # 4d70 <_sk_callback_hsw+0x148> + DB 196,98,125,24,5,110,74,0,0 ; vbroadcastss 0x4a6e(%rip),%ymm8 # 4d30 <_sk_callback_hsw+0x148> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0 DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1 @@ -230,7 +214,7 @@ _sk_srcatop_hsw LABEL PROC PUBLIC _sk_dstatop_hsw _sk_dstatop_hsw LABEL PROC - DB 196,98,125,24,5,64,74,0,0 ; vbroadcastss 0x4a40(%rip),%ymm8 # 4d74 <_sk_callback_hsw+0x14c> + DB 196,98,125,24,5,65,74,0,0 ; vbroadcastss 0x4a41(%rip),%ymm8 # 4d34 <_sk_callback_hsw+0x14c> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0 @@ -263,7 +247,7 @@ _sk_dstin_hsw LABEL PROC PUBLIC _sk_srcout_hsw _sk_srcout_hsw LABEL PROC - DB 196,98,125,24,5,231,73,0,0 ; vbroadcastss 0x49e7(%rip),%ymm8 # 4d78 <_sk_callback_hsw+0x150> + DB 196,98,125,24,5,232,73,0,0 ; vbroadcastss 0x49e8(%rip),%ymm8 # 4d38 <_sk_callback_hsw+0x150> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -274,7 +258,7 @@ _sk_srcout_hsw LABEL PROC PUBLIC _sk_dstout_hsw _sk_dstout_hsw LABEL PROC - DB 196,226,125,24,5,202,73,0,0 ; vbroadcastss 0x49ca(%rip),%ymm0 # 4d7c <_sk_callback_hsw+0x154> + DB 196,226,125,24,5,203,73,0,0 ; vbroadcastss 0x49cb(%rip),%ymm0 # 4d3c <_sk_callback_hsw+0x154> DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3 DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0 DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1 @@ -285,7 +269,7 @@ _sk_dstout_hsw LABEL PROC PUBLIC _sk_srcover_hsw _sk_srcover_hsw LABEL PROC - DB 196,98,125,24,5,173,73,0,0 ; vbroadcastss 0x49ad(%rip),%ymm8 # 4d80 <_sk_callback_hsw+0x158> + DB 196,98,125,24,5,174,73,0,0 ; vbroadcastss 0x49ae(%rip),%ymm8 # 4d40 <_sk_callback_hsw+0x158> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0 DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1 @@ -296,7 +280,7 @@ _sk_srcover_hsw LABEL PROC PUBLIC _sk_dstover_hsw _sk_dstover_hsw LABEL PROC - DB 196,98,125,24,5,140,73,0,0 ; vbroadcastss 0x498c(%rip),%ymm8 # 4d84 <_sk_callback_hsw+0x15c> + DB 196,98,125,24,5,141,73,0,0 ; vbroadcastss 0x498d(%rip),%ymm8 # 4d44 <_sk_callback_hsw+0x15c> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0 DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1 @@ -316,7 +300,7 @@ _sk_modulate_hsw LABEL PROC PUBLIC _sk_multiply_hsw _sk_multiply_hsw LABEL PROC - DB 196,98,125,24,5,87,73,0,0 ; vbroadcastss 0x4957(%rip),%ymm8 # 4d88 <_sk_callback_hsw+0x160> + DB 196,98,125,24,5,88,73,0,0 ; vbroadcastss 0x4958(%rip),%ymm8 # 4d48 <_sk_callback_hsw+0x160> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -358,7 +342,7 @@ _sk_screen_hsw LABEL PROC PUBLIC _sk_xor__hsw _sk_xor__hsw LABEL PROC - DB 196,98,125,24,5,210,72,0,0 ; vbroadcastss 0x48d2(%rip),%ymm8 # 4d8c <_sk_callback_hsw+0x164> + DB 196,98,125,24,5,211,72,0,0 ; vbroadcastss 0x48d3(%rip),%ymm8 # 4d4c <_sk_callback_hsw+0x164> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -390,7 +374,7 @@ _sk_darken_hsw LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,90,72,0,0 ; vbroadcastss 0x485a(%rip),%ymm8 # 4d90 <_sk_callback_hsw+0x168> + DB 196,98,125,24,5,91,72,0,0 ; vbroadcastss 0x485b(%rip),%ymm8 # 4d50 <_sk_callback_hsw+0x168> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -413,7 +397,7 @@ _sk_lighten_hsw LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,9,72,0,0 ; vbroadcastss 0x4809(%rip),%ymm8 # 4d94 <_sk_callback_hsw+0x16c> + DB 196,98,125,24,5,10,72,0,0 ; vbroadcastss 0x480a(%rip),%ymm8 # 4d54 <_sk_callback_hsw+0x16c> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -439,7 +423,7 @@ _sk_difference_hsw LABEL PROC DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,172,71,0,0 ; vbroadcastss 0x47ac(%rip),%ymm8 # 4d98 <_sk_callback_hsw+0x170> + DB 196,98,125,24,5,173,71,0,0 ; vbroadcastss 0x47ad(%rip),%ymm8 # 4d58 <_sk_callback_hsw+0x170> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -459,7 +443,7 @@ _sk_exclusion_hsw LABEL PROC DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,106,71,0,0 ; vbroadcastss 0x476a(%rip),%ymm8 # 4d9c <_sk_callback_hsw+0x174> + DB 196,98,125,24,5,107,71,0,0 ; vbroadcastss 0x476b(%rip),%ymm8 # 4d5c <_sk_callback_hsw+0x174> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -467,7 +451,7 @@ _sk_exclusion_hsw LABEL PROC PUBLIC _sk_colorburn_hsw _sk_colorburn_hsw LABEL PROC - DB 196,98,125,24,5,88,71,0,0 ; vbroadcastss 0x4758(%rip),%ymm8 # 4da0 <_sk_callback_hsw+0x178> + DB 196,98,125,24,5,89,71,0,0 ; vbroadcastss 0x4759(%rip),%ymm8 # 4d60 <_sk_callback_hsw+0x178> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11 DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10 @@ -523,7 +507,7 @@ _sk_colorburn_hsw LABEL PROC PUBLIC _sk_colordodge_hsw _sk_colordodge_hsw LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 - DB 196,98,125,24,13,99,70,0,0 ; vbroadcastss 0x4663(%rip),%ymm9 # 4da4 <_sk_callback_hsw+0x17c> + DB 196,98,125,24,13,100,70,0,0 ; vbroadcastss 0x4664(%rip),%ymm9 # 4d64 <_sk_callback_hsw+0x17c> DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9 @@ -574,7 +558,7 @@ _sk_colordodge_hsw LABEL PROC PUBLIC _sk_hardlight_hsw _sk_hardlight_hsw LABEL PROC - DB 196,98,125,24,5,132,69,0,0 ; vbroadcastss 0x4584(%rip),%ymm8 # 4da8 <_sk_callback_hsw+0x180> + DB 196,98,125,24,5,133,69,0,0 ; vbroadcastss 0x4585(%rip),%ymm8 # 4d68 <_sk_callback_hsw+0x180> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -623,7 +607,7 @@ _sk_hardlight_hsw LABEL PROC PUBLIC _sk_overlay_hsw _sk_overlay_hsw LABEL PROC - DB 196,98,125,24,5,188,68,0,0 ; vbroadcastss 0x44bc(%rip),%ymm8 # 4dac <_sk_callback_hsw+0x184> + DB 196,98,125,24,5,189,68,0,0 ; vbroadcastss 0x44bd(%rip),%ymm8 # 4d6c <_sk_callback_hsw+0x184> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -683,10 +667,10 @@ _sk_softlight_hsw LABEL PROC DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8 DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8 DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8 - DB 196,98,125,24,29,195,67,0,0 ; vbroadcastss 0x43c3(%rip),%ymm11 # 4db4 <_sk_callback_hsw+0x18c> + DB 196,98,125,24,29,196,67,0,0 ; vbroadcastss 0x43c4(%rip),%ymm11 # 4d74 <_sk_callback_hsw+0x18c> DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12 DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8 - DB 196,98,125,24,37,180,67,0,0 ; vbroadcastss 0x43b4(%rip),%ymm12 # 4db8 <_sk_callback_hsw+0x190> + DB 196,98,125,24,37,181,67,0,0 ; vbroadcastss 0x43b5(%rip),%ymm12 # 4d78 <_sk_callback_hsw+0x190> DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8 DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14 DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14 @@ -696,7 +680,7 @@ _sk_softlight_hsw LABEL PROC DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15 DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14 DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15 - DB 196,98,125,24,5,119,67,0,0 ; vbroadcastss 0x4377(%rip),%ymm8 # 4db0 <_sk_callback_hsw+0x188> + DB 196,98,125,24,5,120,67,0,0 ; vbroadcastss 0x4378(%rip),%ymm8 # 4d70 <_sk_callback_hsw+0x188> DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13 DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0 DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13 @@ -809,11 +793,11 @@ _sk_hue_hsw LABEL PROC DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10 DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10 DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - DB 196,98,125,24,53,118,65,0,0 ; vbroadcastss 0x4176(%rip),%ymm14 # 4dbc <_sk_callback_hsw+0x194> - DB 196,98,125,24,61,113,65,0,0 ; vbroadcastss 0x4171(%rip),%ymm15 # 4dc0 <_sk_callback_hsw+0x198> + DB 196,98,125,24,53,119,65,0,0 ; vbroadcastss 0x4177(%rip),%ymm14 # 4d7c <_sk_callback_hsw+0x194> + DB 196,98,125,24,61,114,65,0,0 ; vbroadcastss 0x4172(%rip),%ymm15 # 4d80 <_sk_callback_hsw+0x198> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13 - DB 196,226,125,24,5,98,65,0,0 ; vbroadcastss 0x4162(%rip),%ymm0 # 4dc4 <_sk_callback_hsw+0x19c> + DB 196,226,125,24,5,99,65,0,0 ; vbroadcastss 0x4163(%rip),%ymm0 # 4d84 <_sk_callback_hsw+0x19c> DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13 DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10 DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -868,7 +852,7 @@ _sk_hue_hsw LABEL PROC DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9 DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8 - DB 196,226,125,24,13,79,64,0,0 ; vbroadcastss 0x404f(%rip),%ymm1 # 4dc8 <_sk_callback_hsw+0x1a0> + DB 196,226,125,24,13,80,64,0,0 ; vbroadcastss 0x4050(%rip),%ymm1 # 4d88 <_sk_callback_hsw+0x1a0> DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11 @@ -922,11 +906,11 @@ _sk_saturation_hsw LABEL PROC DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10 DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10 DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12 - DB 196,98,125,24,53,96,63,0,0 ; vbroadcastss 0x3f60(%rip),%ymm14 # 4dcc <_sk_callback_hsw+0x1a4> - DB 196,98,125,24,61,91,63,0,0 ; vbroadcastss 0x3f5b(%rip),%ymm15 # 4dd0 <_sk_callback_hsw+0x1a8> + DB 196,98,125,24,53,97,63,0,0 ; vbroadcastss 0x3f61(%rip),%ymm14 # 4d8c <_sk_callback_hsw+0x1a4> + DB 196,98,125,24,61,92,63,0,0 ; vbroadcastss 0x3f5c(%rip),%ymm15 # 4d90 <_sk_callback_hsw+0x1a8> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13 - DB 196,226,125,24,5,76,63,0,0 ; vbroadcastss 0x3f4c(%rip),%ymm0 # 4dd4 <_sk_callback_hsw+0x1ac> + DB 196,226,125,24,5,77,63,0,0 ; vbroadcastss 0x3f4d(%rip),%ymm0 # 4d94 <_sk_callback_hsw+0x1ac> DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13 DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10 DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10 @@ -981,7 +965,7 @@ _sk_saturation_hsw LABEL PROC DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9 DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8 - DB 196,226,125,24,13,57,62,0,0 ; vbroadcastss 0x3e39(%rip),%ymm1 # 4dd8 <_sk_callback_hsw+0x1b0> + DB 196,226,125,24,13,58,62,0,0 ; vbroadcastss 0x3e3a(%rip),%ymm1 # 4d98 <_sk_callback_hsw+0x1b0> DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11 @@ -1009,11 +993,11 @@ _sk_color_hsw LABEL PROC DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8 DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10 DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11 - DB 196,98,125,24,45,204,61,0,0 ; vbroadcastss 0x3dcc(%rip),%ymm13 # 4ddc <_sk_callback_hsw+0x1b4> - DB 196,98,125,24,53,199,61,0,0 ; vbroadcastss 0x3dc7(%rip),%ymm14 # 4de0 <_sk_callback_hsw+0x1b8> + DB 196,98,125,24,45,205,61,0,0 ; vbroadcastss 0x3dcd(%rip),%ymm13 # 4d9c <_sk_callback_hsw+0x1b4> + DB 196,98,125,24,53,200,61,0,0 ; vbroadcastss 0x3dc8(%rip),%ymm14 # 4da0 <_sk_callback_hsw+0x1b8> DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12 DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12 - DB 196,98,125,24,61,184,61,0,0 ; vbroadcastss 0x3db8(%rip),%ymm15 # 4de4 <_sk_callback_hsw+0x1bc> + DB 196,98,125,24,61,185,61,0,0 ; vbroadcastss 0x3db9(%rip),%ymm15 # 4da4 <_sk_callback_hsw+0x1bc> DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12 DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9 DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -1069,7 +1053,7 @@ _sk_color_hsw LABEL PROC DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1 DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8 DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9 - DB 196,226,125,24,5,154,60,0,0 ; vbroadcastss 0x3c9a(%rip),%ymm0 # 4de8 <_sk_callback_hsw+0x1c0> + DB 196,226,125,24,5,155,60,0,0 ; vbroadcastss 0x3c9b(%rip),%ymm0 # 4da8 <_sk_callback_hsw+0x1c0> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -1097,11 +1081,11 @@ _sk_luminosity_hsw LABEL PROC DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8 DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10 DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11 - DB 196,98,125,24,45,45,60,0,0 ; vbroadcastss 0x3c2d(%rip),%ymm13 # 4dec <_sk_callback_hsw+0x1c4> - DB 196,98,125,24,53,40,60,0,0 ; vbroadcastss 0x3c28(%rip),%ymm14 # 4df0 <_sk_callback_hsw+0x1c8> + DB 196,98,125,24,45,46,60,0,0 ; vbroadcastss 0x3c2e(%rip),%ymm13 # 4dac <_sk_callback_hsw+0x1c4> + DB 196,98,125,24,53,41,60,0,0 ; vbroadcastss 0x3c29(%rip),%ymm14 # 4db0 <_sk_callback_hsw+0x1c8> DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12 DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12 - DB 196,98,125,24,61,25,60,0,0 ; vbroadcastss 0x3c19(%rip),%ymm15 # 4df4 <_sk_callback_hsw+0x1cc> + DB 196,98,125,24,61,26,60,0,0 ; vbroadcastss 0x3c1a(%rip),%ymm15 # 4db4 <_sk_callback_hsw+0x1cc> DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12 DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9 DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9 @@ -1157,7 +1141,7 @@ _sk_luminosity_hsw LABEL PROC DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1 DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8 DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9 - DB 196,226,125,24,5,251,58,0,0 ; vbroadcastss 0x3afb(%rip),%ymm0 # 4df8 <_sk_callback_hsw+0x1d0> + DB 196,226,125,24,5,252,58,0,0 ; vbroadcastss 0x3afc(%rip),%ymm0 # 4db8 <_sk_callback_hsw+0x1d0> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -1182,19 +1166,19 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,180,0,0,0 ; jne 140f <_sk_srcover_rgba_8888_hsw+0xcd> + DB 15,133,180,0,0,0 ; jne 13ce <_sk_srcover_rgba_8888_hsw+0xcd> DB 196,193,124,16,58 ; vmovups (%r10),%ymm7 - DB 197,196,84,37,24,62,0,0 ; vandps 0x3e18(%rip),%ymm7,%ymm4 # 5180 <_sk_callback_hsw+0x558> + DB 197,196,84,37,25,62,0,0 ; vandps 0x3e19(%rip),%ymm7,%ymm4 # 5140 <_sk_callback_hsw+0x558> DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 - DB 196,226,69,0,45,43,62,0,0 ; vpshufb 0x3e2b(%rip),%ymm7,%ymm5 # 51a0 <_sk_callback_hsw+0x578> + DB 196,226,69,0,45,44,62,0,0 ; vpshufb 0x3e2c(%rip),%ymm7,%ymm5 # 5160 <_sk_callback_hsw+0x578> DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5 - DB 196,226,69,0,53,62,62,0,0 ; vpshufb 0x3e3e(%rip),%ymm7,%ymm6 # 51c0 <_sk_callback_hsw+0x598> + DB 196,226,69,0,53,63,62,0,0 ; vpshufb 0x3e3f(%rip),%ymm7,%ymm6 # 5180 <_sk_callback_hsw+0x598> DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6 DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,100,58,0,0 ; vbroadcastss 0x3a64(%rip),%ymm8 # 4dfc <_sk_callback_hsw+0x1d4> + DB 196,98,125,24,5,101,58,0,0 ; vbroadcastss 0x3a65(%rip),%ymm8 # 4dbc <_sk_callback_hsw+0x1d4> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 - DB 196,98,125,24,13,91,58,0,0 ; vbroadcastss 0x3a5b(%rip),%ymm9 # 4e00 <_sk_callback_hsw+0x1d8> + DB 196,98,125,24,13,92,58,0,0 ; vbroadcastss 0x3a5c(%rip),%ymm9 # 4dc0 <_sk_callback_hsw+0x1d8> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0 DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1 @@ -1214,7 +1198,7 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 196,65,53,235,202 ; vpor %ymm10,%ymm9,%ymm9 DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,53 ; jne 1438 <_sk_srcover_rgba_8888_hsw+0xf6> + DB 117,53 ; jne 13f7 <_sk_srcover_rgba_8888_hsw+0xf6> DB 196,65,124,17,2 ; vmovups %ymm8,(%r10) DB 72,173 ; lods %ds:(%rsi),%rax DB 76,137,201 ; mov %r9,%rcx @@ -1227,7 +1211,7 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 196,225,249,110,224 ; vmovq %rax,%xmm4 DB 196,226,125,33,228 ; vpmovsxbd %xmm4,%ymm4 DB 196,194,93,44,58 ; vmaskmovps (%r10),%ymm4,%ymm7 - DB 233,40,255,255,255 ; jmpq 1360 <_sk_srcover_rgba_8888_hsw+0x1e> + DB 233,40,255,255,255 ; jmpq 131f <_sk_srcover_rgba_8888_hsw+0x1e> DB 185,8,0,0,0 ; mov $0x8,%ecx DB 68,41,193 ; sub %r8d,%ecx DB 192,225,3 ; shl $0x3,%cl @@ -1236,7 +1220,7 @@ _sk_srcover_rgba_8888_hsw LABEL PROC DB 196,97,249,110,200 ; vmovq %rax,%xmm9 DB 196,66,125,33,201 ; vpmovsxbd %xmm9,%ymm9 DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10) - DB 235,170 ; jmp 1408 <_sk_srcover_rgba_8888_hsw+0xc6> + DB 235,170 ; jmp 13c7 <_sk_srcover_rgba_8888_hsw+0xc6> PUBLIC _sk_clamp_0_hsw _sk_clamp_0_hsw LABEL PROC @@ -1250,7 +1234,7 @@ _sk_clamp_0_hsw LABEL PROC PUBLIC _sk_clamp_1_hsw _sk_clamp_1_hsw LABEL PROC - DB 196,98,125,24,5,128,57,0,0 ; vbroadcastss 0x3980(%rip),%ymm8 # 4e04 <_sk_callback_hsw+0x1dc> + DB 196,98,125,24,5,129,57,0,0 ; vbroadcastss 0x3981(%rip),%ymm8 # 4dc4 <_sk_callback_hsw+0x1dc> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 @@ -1260,7 +1244,7 @@ _sk_clamp_1_hsw LABEL PROC PUBLIC _sk_clamp_a_hsw _sk_clamp_a_hsw LABEL PROC - DB 196,98,125,24,5,99,57,0,0 ; vbroadcastss 0x3963(%rip),%ymm8 # 4e08 <_sk_callback_hsw+0x1e0> + DB 196,98,125,24,5,100,57,0,0 ; vbroadcastss 0x3964(%rip),%ymm8 # 4dc8 <_sk_callback_hsw+0x1e0> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0 DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1 @@ -1332,7 +1316,7 @@ PUBLIC _sk_unpremul_hsw _sk_unpremul_hsw LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9 - DB 196,98,125,24,21,171,56,0,0 ; vbroadcastss 0x38ab(%rip),%ymm10 # 4e0c <_sk_callback_hsw+0x1e4> + DB 196,98,125,24,21,172,56,0,0 ; vbroadcastss 0x38ac(%rip),%ymm10 # 4dcc <_sk_callback_hsw+0x1e4> DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10 DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 @@ -1343,16 +1327,16 @@ _sk_unpremul_hsw LABEL PROC PUBLIC _sk_from_srgb_hsw _sk_from_srgb_hsw LABEL PROC - DB 196,98,125,24,5,140,56,0,0 ; vbroadcastss 0x388c(%rip),%ymm8 # 4e10 <_sk_callback_hsw+0x1e8> + DB 196,98,125,24,5,141,56,0,0 ; vbroadcastss 0x388d(%rip),%ymm8 # 4dd0 <_sk_callback_hsw+0x1e8> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10 - DB 196,98,125,24,29,126,56,0,0 ; vbroadcastss 0x387e(%rip),%ymm11 # 4e14 <_sk_callback_hsw+0x1ec> - DB 196,98,125,24,37,121,56,0,0 ; vbroadcastss 0x3879(%rip),%ymm12 # 4e18 <_sk_callback_hsw+0x1f0> + DB 196,98,125,24,29,127,56,0,0 ; vbroadcastss 0x387f(%rip),%ymm11 # 4dd4 <_sk_callback_hsw+0x1ec> + DB 196,98,125,24,37,122,56,0,0 ; vbroadcastss 0x387a(%rip),%ymm12 # 4dd8 <_sk_callback_hsw+0x1f0> DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13 DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13 - DB 196,98,125,24,53,106,56,0,0 ; vbroadcastss 0x386a(%rip),%ymm14 # 4e1c <_sk_callback_hsw+0x1f4> + DB 196,98,125,24,53,107,56,0,0 ; vbroadcastss 0x386b(%rip),%ymm14 # 4ddc <_sk_callback_hsw+0x1f4> DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13 - DB 196,98,125,24,21,96,56,0,0 ; vbroadcastss 0x3860(%rip),%ymm10 # 4e20 <_sk_callback_hsw+0x1f8> + DB 196,98,125,24,21,97,56,0,0 ; vbroadcastss 0x3861(%rip),%ymm10 # 4de0 <_sk_callback_hsw+0x1f8> DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0 DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0 DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9 @@ -1374,19 +1358,19 @@ _sk_from_srgb_hsw LABEL PROC PUBLIC _sk_to_srgb_hsw _sk_to_srgb_hsw LABEL PROC DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9 - DB 196,98,125,24,5,4,56,0,0 ; vbroadcastss 0x3804(%rip),%ymm8 # 4e24 <_sk_callback_hsw+0x1fc> + DB 196,98,125,24,5,5,56,0,0 ; vbroadcastss 0x3805(%rip),%ymm8 # 4de4 <_sk_callback_hsw+0x1fc> DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10 - DB 196,98,125,24,29,250,55,0,0 ; vbroadcastss 0x37fa(%rip),%ymm11 # 4e28 <_sk_callback_hsw+0x200> - DB 196,98,125,24,37,245,55,0,0 ; vbroadcastss 0x37f5(%rip),%ymm12 # 4e2c <_sk_callback_hsw+0x204> + DB 196,98,125,24,29,251,55,0,0 ; vbroadcastss 0x37fb(%rip),%ymm11 # 4de8 <_sk_callback_hsw+0x200> + DB 196,98,125,24,37,246,55,0,0 ; vbroadcastss 0x37f6(%rip),%ymm12 # 4dec <_sk_callback_hsw+0x204> DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13 DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13 - DB 196,98,125,24,53,230,55,0,0 ; vbroadcastss 0x37e6(%rip),%ymm14 # 4e30 <_sk_callback_hsw+0x208> + DB 196,98,125,24,53,231,55,0,0 ; vbroadcastss 0x37e7(%rip),%ymm14 # 4df0 <_sk_callback_hsw+0x208> DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13 - DB 196,98,125,24,61,220,55,0,0 ; vbroadcastss 0x37dc(%rip),%ymm15 # 4e34 <_sk_callback_hsw+0x20c> + DB 196,98,125,24,61,221,55,0,0 ; vbroadcastss 0x37dd(%rip),%ymm15 # 4df4 <_sk_callback_hsw+0x20c> DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9 DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9 DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9 - DB 196,98,125,24,45,200,55,0,0 ; vbroadcastss 0x37c8(%rip),%ymm13 # 4e38 <_sk_callback_hsw+0x210> + DB 196,98,125,24,45,201,55,0,0 ; vbroadcastss 0x37c9(%rip),%ymm13 # 4df8 <_sk_callback_hsw+0x210> DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9 @@ -1418,26 +1402,26 @@ _sk_rgb_to_hsl_hsw LABEL PROC DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9 DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9 DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,29,61,55,0,0 ; vbroadcastss 0x373d(%rip),%ymm11 # 4e3c <_sk_callback_hsw+0x214> + DB 196,98,125,24,29,62,55,0,0 ; vbroadcastss 0x373e(%rip),%ymm11 # 4dfc <_sk_callback_hsw+0x214> DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11 DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12 DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13 - DB 196,98,125,24,53,42,55,0,0 ; vbroadcastss 0x372a(%rip),%ymm14 # 4e40 <_sk_callback_hsw+0x218> + DB 196,98,125,24,53,43,55,0,0 ; vbroadcastss 0x372b(%rip),%ymm14 # 4e00 <_sk_callback_hsw+0x218> DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15 DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13 DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12 DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2 DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13 - DB 196,98,125,24,53,17,55,0,0 ; vbroadcastss 0x3711(%rip),%ymm14 # 4e48 <_sk_callback_hsw+0x220> + DB 196,98,125,24,53,18,55,0,0 ; vbroadcastss 0x3712(%rip),%ymm14 # 4e08 <_sk_callback_hsw+0x220> DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13 - DB 196,98,125,24,53,255,54,0,0 ; vbroadcastss 0x36ff(%rip),%ymm14 # 4e44 <_sk_callback_hsw+0x21c> + DB 196,98,125,24,53,0,55,0,0 ; vbroadcastss 0x3700(%rip),%ymm14 # 4e04 <_sk_callback_hsw+0x21c> DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2 DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1 DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1 DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0 DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0 DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1 - DB 196,98,125,24,29,226,54,0,0 ; vbroadcastss 0x36e2(%rip),%ymm11 # 4e50 <_sk_callback_hsw+0x228> + DB 196,98,125,24,29,227,54,0,0 ; vbroadcastss 0x36e3(%rip),%ymm11 # 4e10 <_sk_callback_hsw+0x228> DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2 DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11 DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12 @@ -1447,7 +1431,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1 DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0 DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1 - DB 196,98,125,24,5,165,54,0,0 ; vbroadcastss 0x36a5(%rip),%ymm8 # 4e4c <_sk_callback_hsw+0x224> + DB 196,98,125,24,5,166,54,0,0 ; vbroadcastss 0x36a6(%rip),%ymm8 # 4e0c <_sk_callback_hsw+0x224> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -1462,30 +1446,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp) DB 197,252,40,233 ; vmovaps %ymm1,%ymm5 DB 197,252,40,224 ; vmovaps %ymm0,%ymm4 - DB 196,98,125,24,5,108,54,0,0 ; vbroadcastss 0x366c(%rip),%ymm8 # 4e54 <_sk_callback_hsw+0x22c> + DB 196,98,125,24,5,109,54,0,0 ; vbroadcastss 0x366d(%rip),%ymm8 # 4e14 <_sk_callback_hsw+0x22c> DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9 DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10 DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11 DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9 DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10 - DB 196,98,125,24,13,79,54,0,0 ; vbroadcastss 0x364f(%rip),%ymm9 # 4e58 <_sk_callback_hsw+0x230> + DB 196,98,125,24,13,80,54,0,0 ; vbroadcastss 0x3650(%rip),%ymm9 # 4e18 <_sk_callback_hsw+0x230> DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9 - DB 196,98,125,24,29,69,54,0,0 ; vbroadcastss 0x3645(%rip),%ymm11 # 4e5c <_sk_callback_hsw+0x234> + DB 196,98,125,24,29,70,54,0,0 ; vbroadcastss 0x3646(%rip),%ymm11 # 4e1c <_sk_callback_hsw+0x234> DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11 DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12 DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15 DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11 - DB 196,98,125,24,45,47,54,0,0 ; vbroadcastss 0x362f(%rip),%ymm13 # 4e64 <_sk_callback_hsw+0x23c> + DB 196,98,125,24,45,48,54,0,0 ; vbroadcastss 0x3630(%rip),%ymm13 # 4e24 <_sk_callback_hsw+0x23c> DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0 - DB 196,98,125,24,53,37,54,0,0 ; vbroadcastss 0x3625(%rip),%ymm14 # 4e68 <_sk_callback_hsw+0x240> + DB 196,98,125,24,53,38,54,0,0 ; vbroadcastss 0x3626(%rip),%ymm14 # 4e28 <_sk_callback_hsw+0x240> DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12 DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12 - DB 196,226,125,24,29,11,54,0,0 ; vbroadcastss 0x360b(%rip),%ymm3 # 4e60 <_sk_callback_hsw+0x238> + DB 196,226,125,24,29,12,54,0,0 ; vbroadcastss 0x360c(%rip),%ymm3 # 4e20 <_sk_callback_hsw+0x238> DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7 DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7 DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12 DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7 - DB 196,98,125,24,37,246,53,0,0 ; vbroadcastss 0x35f6(%rip),%ymm12 # 4e6c <_sk_callback_hsw+0x244> + DB 196,98,125,24,37,247,53,0,0 ; vbroadcastss 0x35f7(%rip),%ymm12 # 4e2c <_sk_callback_hsw+0x244> DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15 DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0 DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15 @@ -1501,7 +1485,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0 DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7 DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1 - DB 196,226,125,24,5,162,53,0,0 ; vbroadcastss 0x35a2(%rip),%ymm0 # 4e70 <_sk_callback_hsw+0x248> + DB 196,226,125,24,5,163,53,0,0 ; vbroadcastss 0x35a3(%rip),%ymm0 # 4e30 <_sk_callback_hsw+0x248> DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0 DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 @@ -1545,12 +1529,12 @@ _sk_scale_u8_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,58 ; jne 19b5 <_sk_scale_u8_hsw+0x44> + DB 117,58 ; jne 1974 <_sk_scale_u8_hsw+0x44> DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8 - DB 197,57,219,5,215,57,0,0 ; vpand 0x39d7(%rip),%xmm8,%xmm8 # 5360 <_sk_callback_hsw+0x738> + DB 197,57,219,5,216,57,0,0 ; vpand 0x39d8(%rip),%xmm8,%xmm8 # 5320 <_sk_callback_hsw+0x738> DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,216,52,0,0 ; vbroadcastss 0x34d8(%rip),%ymm9 # 4e74 <_sk_callback_hsw+0x24c> + DB 196,98,125,24,13,217,52,0,0 ; vbroadcastss 0x34d9(%rip),%ymm9 # 4e34 <_sk_callback_hsw+0x24c> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -1563,15 +1547,15 @@ _sk_scale_u8_hsw LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,183 ; ja 1981 <_sk_scale_u8_hsw+0x10> + DB 119,183 ; ja 1940 <_sk_scale_u8_hsw+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 1a50 <_sk_scale_u8_hsw+0xdf> + DB 76,141,21,124,0,0,0 ; lea 0x7c(%rip),%r10 # 1a10 <_sk_scale_u8_hsw+0xe0> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 235,152 ; jmp 1981 <_sk_scale_u8_hsw+0x10> + DB 235,152 ; jmp 1940 <_sk_scale_u8_hsw+0x10> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -1579,7 +1563,7 @@ _sk_scale_u8_hsw LABEL PROC DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8 - DB 233,111,255,255,255 ; jmpq 1981 <_sk_scale_u8_hsw+0x10> + DB 233,111,255,255,255 ; jmpq 1940 <_sk_scale_u8_hsw+0x10> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -1590,21 +1574,24 @@ _sk_scale_u8_hsw LABEL PROC DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8 - DB 233,51,255,255,255 ; jmpq 1981 <_sk_scale_u8_hsw+0x10> - DB 102,144 ; xchg %ax,%ax - DB 142,255 ; mov %edi,%? + DB 233,51,255,255,255 ; jmpq 1940 <_sk_scale_u8_hsw+0x10> + DB 15,31,0 ; nopl (%rax) + DB 141 ; (bad) DB 255 ; (bad) - DB 255,169,255,255,255,153 ; ljmp *-0x66000001(%rcx) + DB 255 ; (bad) + DB 255,168,255,255,255,152 ; ljmp *-0x67000001(%rax) + DB 255 ; (bad) + DB 255 ; (bad) + DB 255,231 ; jmpq *%rdi DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,221 ; callq ffffffffde001a60 <_sk_callback_hsw+0xffffffffddffce38> + DB 220,255 ; fdivr %st,%st(7) + DB 255 ; (bad) + DB 255,209 ; callq *%rcx DB 255 ; (bad) DB 255 ; (bad) - DB 255,210 ; callq *%rdx - DB 255 ; (bad) - DB 255 ; (bad) - DB 255,194 ; inc %edx + DB 255,193 ; inc %ecx DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -1629,12 +1616,12 @@ _sk_lerp_u8_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,78 ; jne 1af3 <_sk_lerp_u8_hsw+0x58> + DB 117,78 ; jne 1ab3 <_sk_lerp_u8_hsw+0x58> DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8 - DB 197,57,219,5,189,56,0,0 ; vpand 0x38bd(%rip),%xmm8,%xmm8 # 5370 <_sk_callback_hsw+0x748> + DB 197,57,219,5,189,56,0,0 ; vpand 0x38bd(%rip),%xmm8,%xmm8 # 5330 <_sk_callback_hsw+0x748> DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,178,51,0,0 ; vbroadcastss 0x33b2(%rip),%ymm9 # 4e78 <_sk_callback_hsw+0x250> + DB 196,98,125,24,13,178,51,0,0 ; vbroadcastss 0x33b2(%rip),%ymm9 # 4e38 <_sk_callback_hsw+0x250> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0 @@ -1651,15 +1638,15 @@ _sk_lerp_u8_hsw LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,163 ; ja 1aab <_sk_lerp_u8_hsw+0x10> + DB 119,163 ; ja 1a6b <_sk_lerp_u8_hsw+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,121,0,0,0 ; lea 0x79(%rip),%r10 # 1b8c <_sk_lerp_u8_hsw+0xf1> + DB 76,141,21,121,0,0,0 ; lea 0x79(%rip),%r10 # 1b4c <_sk_lerp_u8_hsw+0xf1> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 235,132 ; jmp 1aab <_sk_lerp_u8_hsw+0x10> + DB 235,132 ; jmp 1a6b <_sk_lerp_u8_hsw+0x10> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -1667,7 +1654,7 @@ _sk_lerp_u8_hsw LABEL PROC DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8 - DB 233,91,255,255,255 ; jmpq 1aab <_sk_lerp_u8_hsw+0x10> + DB 233,91,255,255,255 ; jmpq 1a6b <_sk_lerp_u8_hsw+0x10> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -1678,7 +1665,7 @@ _sk_lerp_u8_hsw LABEL PROC DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8 - DB 233,31,255,255,255 ; jmpq 1aab <_sk_lerp_u8_hsw+0x10> + DB 233,31,255,255,255 ; jmpq 1a6b <_sk_lerp_u8_hsw+0x10> DB 144 ; nop DB 255 ; (bad) DB 255 ; (bad) @@ -1705,23 +1692,23 @@ _sk_lerp_565_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,169,0,0,0 ; jne 1c5f <_sk_lerp_565_hsw+0xb7> + DB 15,133,169,0,0,0 ; jne 1c1f <_sk_lerp_565_hsw+0xb7> DB 196,65,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm8 DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8 - DB 196,98,125,88,13,178,50,0,0 ; vpbroadcastd 0x32b2(%rip),%ymm9 # 4e7c <_sk_callback_hsw+0x254> + DB 196,98,125,88,13,178,50,0,0 ; vpbroadcastd 0x32b2(%rip),%ymm9 # 4e3c <_sk_callback_hsw+0x254> DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9 DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9 - DB 196,98,125,24,21,163,50,0,0 ; vbroadcastss 0x32a3(%rip),%ymm10 # 4e80 <_sk_callback_hsw+0x258> + DB 196,98,125,24,21,163,50,0,0 ; vbroadcastss 0x32a3(%rip),%ymm10 # 4e40 <_sk_callback_hsw+0x258> DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 - DB 196,98,125,88,21,153,50,0,0 ; vpbroadcastd 0x3299(%rip),%ymm10 # 4e84 <_sk_callback_hsw+0x25c> + DB 196,98,125,88,21,153,50,0,0 ; vpbroadcastd 0x3299(%rip),%ymm10 # 4e44 <_sk_callback_hsw+0x25c> DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10 DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10 - DB 196,98,125,24,29,138,50,0,0 ; vbroadcastss 0x328a(%rip),%ymm11 # 4e88 <_sk_callback_hsw+0x260> + DB 196,98,125,24,29,138,50,0,0 ; vbroadcastss 0x328a(%rip),%ymm11 # 4e48 <_sk_callback_hsw+0x260> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 - DB 196,98,125,88,29,128,50,0,0 ; vpbroadcastd 0x3280(%rip),%ymm11 # 4e8c <_sk_callback_hsw+0x264> + DB 196,98,125,88,29,128,50,0,0 ; vpbroadcastd 0x3280(%rip),%ymm11 # 4e4c <_sk_callback_hsw+0x264> DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,29,113,50,0,0 ; vbroadcastss 0x3271(%rip),%ymm11 # 4e90 <_sk_callback_hsw+0x268> + DB 196,98,125,24,29,113,50,0,0 ; vbroadcastss 0x3271(%rip),%ymm11 # 4e50 <_sk_callback_hsw+0x268> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,226,53,168,196 ; vfmadd213ps %ymm4,%ymm9,%ymm0 @@ -1742,27 +1729,27 @@ _sk_lerp_565_hsw LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,68,255,255,255 ; ja 1bbc <_sk_lerp_565_hsw+0x14> + DB 15,135,68,255,255,255 ; ja 1b7c <_sk_lerp_565_hsw+0x14> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,101,0,0,0 ; lea 0x65(%rip),%r10 # 1ce8 <_sk_lerp_565_hsw+0x140> + DB 76,141,21,101,0,0,0 ; lea 0x65(%rip),%r10 # 1ca8 <_sk_lerp_565_hsw+0x140> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 233,34,255,255,255 ; jmpq 1bbc <_sk_lerp_565_hsw+0x14> + DB 233,34,255,255,255 ; jmpq 1b7c <_sk_lerp_565_hsw+0x14> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,65,57,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8 DB 196,65,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm9 DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8 - DB 233,4,255,255,255 ; jmpq 1bbc <_sk_lerp_565_hsw+0x14> + DB 233,4,255,255,255 ; jmpq 1b7c <_sk_lerp_565_hsw+0x14> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,65,57,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm8,%xmm8 DB 196,65,57,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm8,%xmm8 DB 196,65,57,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm8,%xmm8 DB 196,65,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm9 DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8 - DB 233,214,254,255,255 ; jmpq 1bbc <_sk_lerp_565_hsw+0x14> + DB 233,214,254,255,255 ; jmpq 1b7c <_sk_lerp_565_hsw+0x14> DB 102,144 ; xchg %ax,%ax DB 164 ; movsb %ds:(%rsi),%es:(%rdi) DB 255 ; (bad) @@ -1793,23 +1780,23 @@ _sk_load_tables_hsw LABEL PROC DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,105 ; jne 1d82 <_sk_load_tables_hsw+0x7e> + DB 117,105 ; jne 1d42 <_sk_load_tables_hsw+0x7e> DB 196,193,124,16,26 ; vmovups (%r10),%ymm3 - DB 197,228,84,13,186,52,0,0 ; vandps 0x34ba(%rip),%ymm3,%ymm1 # 51e0 <_sk_callback_hsw+0x5b8> + DB 197,228,84,13,186,52,0,0 ; vandps 0x34ba(%rip),%ymm3,%ymm1 # 51a0 <_sk_callback_hsw+0x5b8> DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8 DB 72,139,72,8 ; mov 0x8(%rax),%rcx DB 76,139,80,16 ; mov 0x10(%rax),%r10 DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2 DB 196,226,109,146,4,137 ; vgatherdps %ymm2,(%rcx,%ymm1,4),%ymm0 - DB 196,226,101,0,21,186,52,0,0 ; vpshufb 0x34ba(%rip),%ymm3,%ymm2 # 5200 <_sk_callback_hsw+0x5d8> + DB 196,226,101,0,21,186,52,0,0 ; vpshufb 0x34ba(%rip),%ymm3,%ymm2 # 51c0 <_sk_callback_hsw+0x5d8> DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9 DB 196,194,53,146,12,146 ; vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1 DB 72,139,64,24 ; mov 0x18(%rax),%rax - DB 196,98,101,0,13,194,52,0,0 ; vpshufb 0x34c2(%rip),%ymm3,%ymm9 # 5220 <_sk_callback_hsw+0x5f8> + DB 196,98,101,0,13,194,52,0,0 ; vpshufb 0x34c2(%rip),%ymm3,%ymm9 # 51e0 <_sk_callback_hsw+0x5f8> DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,30,49,0,0 ; vbroadcastss 0x311e(%rip),%ymm8 # 4e94 <_sk_callback_hsw+0x26c> + DB 196,98,125,24,5,30,49,0,0 ; vbroadcastss 0x311e(%rip),%ymm8 # 4e54 <_sk_callback_hsw+0x26c> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 76,137,201 ; mov %r9,%rcx @@ -1822,7 +1809,7 @@ _sk_load_tables_hsw LABEL PROC DB 196,193,249,110,195 ; vmovq %r11,%xmm0 DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0 DB 196,194,125,44,26 ; vmaskmovps (%r10),%ymm0,%ymm3 - DB 233,115,255,255,255 ; jmpq 1d1e <_sk_load_tables_hsw+0x1a> + DB 233,115,255,255,255 ; jmpq 1cde <_sk_load_tables_hsw+0x1a> PUBLIC _sk_load_tables_u16_be_hsw _sk_load_tables_u16_be_hsw LABEL PROC @@ -1830,7 +1817,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,201,0,0,0 ; jne 1e8a <_sk_load_tables_u16_be_hsw+0xdf> + DB 15,133,201,0,0,0 ; jne 1e4a <_sk_load_tables_u16_be_hsw+0xdf> DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8 DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2 DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3 @@ -1846,7 +1833,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1 DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2 DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8 - DB 197,121,111,21,110,53,0,0 ; vmovdqa 0x356e(%rip),%xmm10 # 5380 <_sk_callback_hsw+0x758> + DB 197,121,111,21,110,53,0,0 ; vmovdqa 0x356e(%rip),%xmm10 # 5340 <_sk_callback_hsw+0x758> DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0 DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1 DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11 @@ -1868,36 +1855,36 @@ _sk_load_tables_u16_be_hsw LABEL PROC DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3 DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,23,48,0,0 ; vbroadcastss 0x3017(%rip),%ymm8 # 4e98 <_sk_callback_hsw+0x270> + DB 196,98,125,24,5,23,48,0,0 ; vbroadcastss 0x3017(%rip),%ymm8 # 4e58 <_sk_callback_hsw+0x270> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je 1ef0 <_sk_load_tables_u16_be_hsw+0x145> + DB 116,85 ; je 1eb0 <_sk_load_tables_u16_be_hsw+0x145> DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb 1ef0 <_sk_load_tables_u16_be_hsw+0x145> + DB 114,72 ; jb 1eb0 <_sk_load_tables_u16_be_hsw+0x145> DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je 1efd <_sk_load_tables_u16_be_hsw+0x152> + DB 116,72 ; je 1ebd <_sk_load_tables_u16_be_hsw+0x152> DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb 1efd <_sk_load_tables_u16_be_hsw+0x152> + DB 114,59 ; jb 1ebd <_sk_load_tables_u16_be_hsw+0x152> DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,9,255,255,255 ; je 1ddc <_sk_load_tables_u16_be_hsw+0x31> + DB 15,132,9,255,255,255 ; je 1d9c <_sk_load_tables_u16_be_hsw+0x31> DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,248,254,255,255 ; jb 1ddc <_sk_load_tables_u16_be_hsw+0x31> + DB 15,130,248,254,255,255 ; jb 1d9c <_sk_load_tables_u16_be_hsw+0x31> DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9 - DB 233,236,254,255,255 ; jmpq 1ddc <_sk_load_tables_u16_be_hsw+0x31> + DB 233,236,254,255,255 ; jmpq 1d9c <_sk_load_tables_u16_be_hsw+0x31> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,223,254,255,255 ; jmpq 1ddc <_sk_load_tables_u16_be_hsw+0x31> + DB 233,223,254,255,255 ; jmpq 1d9c <_sk_load_tables_u16_be_hsw+0x31> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,214,254,255,255 ; jmpq 1ddc <_sk_load_tables_u16_be_hsw+0x31> + DB 233,214,254,255,255 ; jmpq 1d9c <_sk_load_tables_u16_be_hsw+0x31> PUBLIC _sk_load_tables_rgb_u16_be_hsw _sk_load_tables_rgb_u16_be_hsw LABEL PROC @@ -1905,7 +1892,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,193,0,0,0 ; jne 1fd9 <_sk_load_tables_rgb_u16_be_hsw+0xd3> + DB 15,133,193,0,0,0 ; jne 1f99 <_sk_load_tables_rgb_u16_be_hsw+0xd3> DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0 DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2 DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1 @@ -1926,7 +1913,7 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3 DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2 DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8 - DB 197,121,111,13,14,52,0,0 ; vmovdqa 0x340e(%rip),%xmm9 # 5390 <_sk_callback_hsw+0x768> + DB 197,121,111,13,14,52,0,0 ; vmovdqa 0x340e(%rip),%xmm9 # 5350 <_sk_callback_hsw+0x768> DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0 DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1 DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3 @@ -1943,46 +1930,46 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8 DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,197,46,0,0 ; vbroadcastss 0x2ec5(%rip),%ymm3 # 4e9c <_sk_callback_hsw+0x274> + DB 196,226,125,24,29,197,46,0,0 ; vbroadcastss 0x2ec5(%rip),%ymm3 # 4e5c <_sk_callback_hsw+0x274> DB 255,224 ; jmpq *%rax DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0 DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,5 ; jne 1ff2 <_sk_load_tables_rgb_u16_be_hsw+0xec> - DB 233,90,255,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 117,5 ; jne 1fb2 <_sk_load_tables_rgb_u16_be_hsw+0xec> + DB 233,90,255,255,255 ; jmpq 1f0c <_sk_load_tables_rgb_u16_be_hsw+0x46> DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1 DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,26 ; jb 2021 <_sk_load_tables_rgb_u16_be_hsw+0x11b> + DB 114,26 ; jb 1fe1 <_sk_load_tables_rgb_u16_be_hsw+0x11b> DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1 DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 117,10 ; jne 2026 <_sk_load_tables_rgb_u16_be_hsw+0x120> - DB 233,43,255,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46> - DB 233,38,255,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 117,10 ; jne 1fe6 <_sk_load_tables_rgb_u16_be_hsw+0x120> + DB 233,43,255,255,255 ; jmpq 1f0c <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 233,38,255,255,255 ; jmpq 1f0c <_sk_load_tables_rgb_u16_be_hsw+0x46> DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1 DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,26 ; jb 2055 <_sk_load_tables_rgb_u16_be_hsw+0x14f> + DB 114,26 ; jb 2015 <_sk_load_tables_rgb_u16_be_hsw+0x14f> DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1 DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 117,10 ; jne 205a <_sk_load_tables_rgb_u16_be_hsw+0x154> - DB 233,247,254,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46> - DB 233,242,254,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 117,10 ; jne 201a <_sk_load_tables_rgb_u16_be_hsw+0x154> + DB 233,247,254,255,255 ; jmpq 1f0c <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 233,242,254,255,255 ; jmpq 1f0c <_sk_load_tables_rgb_u16_be_hsw+0x46> DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3 DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,20 ; jb 2083 <_sk_load_tables_rgb_u16_be_hsw+0x17d> + DB 114,20 ; jb 2043 <_sk_load_tables_rgb_u16_be_hsw+0x17d> DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3 DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3 - DB 233,201,254,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46> - DB 233,196,254,255,255 ; jmpq 1f4c <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 233,201,254,255,255 ; jmpq 1f0c <_sk_load_tables_rgb_u16_be_hsw+0x46> + DB 233,196,254,255,255 ; jmpq 1f0c <_sk_load_tables_rgb_u16_be_hsw+0x46> PUBLIC _sk_byte_tables_hsw _sk_byte_tables_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,13,46,0,0 ; vbroadcastss 0x2e0d(%rip),%ymm8 # 4ea0 <_sk_callback_hsw+0x278> + DB 196,98,125,24,5,13,46,0,0 ; vbroadcastss 0x2e0d(%rip),%ymm8 # 4e60 <_sk_callback_hsw+0x278> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9 DB 196,65,249,126,201 ; vmovq %xmm9,%r9 @@ -2104,7 +2091,7 @@ _sk_byte_tables_hsw LABEL PROC DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,178,43,0,0 ; vbroadcastss 0x2bb2(%rip),%ymm8 # 4ea4 <_sk_callback_hsw+0x27c> + DB 196,98,125,24,5,178,43,0,0 ; vbroadcastss 0x2bb2(%rip),%ymm8 # 4e64 <_sk_callback_hsw+0x27c> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 @@ -2218,7 +2205,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,158,41,0,0 ; vbroadcastss 0x299e(%rip),%ymm8 # 4ea8 <_sk_callback_hsw+0x280> + DB 196,98,125,24,5,158,41,0,0 ; vbroadcastss 0x299e(%rip),%ymm8 # 4e68 <_sk_callback_hsw+0x280> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 @@ -2307,33 +2294,33 @@ _sk_parametric_r_hsw LABEL PROC DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10 DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,120,40,0,0 ; vbroadcastss 0x2878(%rip),%ymm12 # 4eac <_sk_callback_hsw+0x284> - DB 196,98,125,24,45,115,40,0,0 ; vbroadcastss 0x2873(%rip),%ymm13 # 4eb0 <_sk_callback_hsw+0x288> + DB 196,98,125,24,37,120,40,0,0 ; vbroadcastss 0x2878(%rip),%ymm12 # 4e6c <_sk_callback_hsw+0x284> + DB 196,98,125,24,45,115,40,0,0 ; vbroadcastss 0x2873(%rip),%ymm13 # 4e70 <_sk_callback_hsw+0x288> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,105,40,0,0 ; vbroadcastss 0x2869(%rip),%ymm13 # 4eb4 <_sk_callback_hsw+0x28c> + DB 196,98,125,24,45,105,40,0,0 ; vbroadcastss 0x2869(%rip),%ymm13 # 4e74 <_sk_callback_hsw+0x28c> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,95,40,0,0 ; vbroadcastss 0x285f(%rip),%ymm13 # 4eb8 <_sk_callback_hsw+0x290> + DB 196,98,125,24,45,95,40,0,0 ; vbroadcastss 0x285f(%rip),%ymm13 # 4e78 <_sk_callback_hsw+0x290> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,85,40,0,0 ; vbroadcastss 0x2855(%rip),%ymm11 # 4ebc <_sk_callback_hsw+0x294> + DB 196,98,125,24,29,85,40,0,0 ; vbroadcastss 0x2855(%rip),%ymm11 # 4e7c <_sk_callback_hsw+0x294> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,75,40,0,0 ; vbroadcastss 0x284b(%rip),%ymm12 # 4ec0 <_sk_callback_hsw+0x298> + DB 196,98,125,24,37,75,40,0,0 ; vbroadcastss 0x284b(%rip),%ymm12 # 4e80 <_sk_callback_hsw+0x298> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,65,40,0,0 ; vbroadcastss 0x2841(%rip),%ymm12 # 4ec4 <_sk_callback_hsw+0x29c> + DB 196,98,125,24,37,65,40,0,0 ; vbroadcastss 0x2841(%rip),%ymm12 # 4e84 <_sk_callback_hsw+0x29c> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,34,40,0,0 ; vbroadcastss 0x2822(%rip),%ymm11 # 4ec8 <_sk_callback_hsw+0x2a0> + DB 196,98,125,24,29,34,40,0,0 ; vbroadcastss 0x2822(%rip),%ymm11 # 4e88 <_sk_callback_hsw+0x2a0> DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0 - DB 196,98,125,24,29,24,40,0,0 ; vbroadcastss 0x2818(%rip),%ymm11 # 4ecc <_sk_callback_hsw+0x2a4> + DB 196,98,125,24,29,24,40,0,0 ; vbroadcastss 0x2818(%rip),%ymm11 # 4e8c <_sk_callback_hsw+0x2a4> DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11 - DB 196,226,125,24,5,14,40,0,0 ; vbroadcastss 0x280e(%rip),%ymm0 # 4ed0 <_sk_callback_hsw+0x2a8> + DB 196,226,125,24,5,14,40,0,0 ; vbroadcastss 0x280e(%rip),%ymm0 # 4e90 <_sk_callback_hsw+0x2a8> DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0 - DB 196,98,125,24,21,4,40,0,0 ; vbroadcastss 0x2804(%rip),%ymm10 # 4ed4 <_sk_callback_hsw+0x2ac> + DB 196,98,125,24,21,4,40,0,0 ; vbroadcastss 0x2804(%rip),%ymm10 # 4e94 <_sk_callback_hsw+0x2ac> DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0 DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0 - DB 196,98,125,24,21,247,39,0,0 ; vbroadcastss 0x27f7(%rip),%ymm10 # 4ed8 <_sk_callback_hsw+0x2b0> + DB 196,98,125,24,21,247,39,0,0 ; vbroadcastss 0x27f7(%rip),%ymm10 # 4e98 <_sk_callback_hsw+0x2b0> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2341,7 +2328,7 @@ _sk_parametric_r_hsw LABEL PROC DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,206,39,0,0 ; vbroadcastss 0x27ce(%rip),%ymm8 # 4edc <_sk_callback_hsw+0x2b4> + DB 196,98,125,24,5,206,39,0,0 ; vbroadcastss 0x27ce(%rip),%ymm8 # 4e9c <_sk_callback_hsw+0x2b4> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2359,33 +2346,33 @@ _sk_parametric_g_hsw LABEL PROC DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10 DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,134,39,0,0 ; vbroadcastss 0x2786(%rip),%ymm12 # 4ee0 <_sk_callback_hsw+0x2b8> - DB 196,98,125,24,45,129,39,0,0 ; vbroadcastss 0x2781(%rip),%ymm13 # 4ee4 <_sk_callback_hsw+0x2bc> + DB 196,98,125,24,37,134,39,0,0 ; vbroadcastss 0x2786(%rip),%ymm12 # 4ea0 <_sk_callback_hsw+0x2b8> + DB 196,98,125,24,45,129,39,0,0 ; vbroadcastss 0x2781(%rip),%ymm13 # 4ea4 <_sk_callback_hsw+0x2bc> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,119,39,0,0 ; vbroadcastss 0x2777(%rip),%ymm13 # 4ee8 <_sk_callback_hsw+0x2c0> + DB 196,98,125,24,45,119,39,0,0 ; vbroadcastss 0x2777(%rip),%ymm13 # 4ea8 <_sk_callback_hsw+0x2c0> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,109,39,0,0 ; vbroadcastss 0x276d(%rip),%ymm13 # 4eec <_sk_callback_hsw+0x2c4> + DB 196,98,125,24,45,109,39,0,0 ; vbroadcastss 0x276d(%rip),%ymm13 # 4eac <_sk_callback_hsw+0x2c4> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,99,39,0,0 ; vbroadcastss 0x2763(%rip),%ymm11 # 4ef0 <_sk_callback_hsw+0x2c8> + DB 196,98,125,24,29,99,39,0,0 ; vbroadcastss 0x2763(%rip),%ymm11 # 4eb0 <_sk_callback_hsw+0x2c8> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,89,39,0,0 ; vbroadcastss 0x2759(%rip),%ymm12 # 4ef4 <_sk_callback_hsw+0x2cc> + DB 196,98,125,24,37,89,39,0,0 ; vbroadcastss 0x2759(%rip),%ymm12 # 4eb4 <_sk_callback_hsw+0x2cc> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,79,39,0,0 ; vbroadcastss 0x274f(%rip),%ymm12 # 4ef8 <_sk_callback_hsw+0x2d0> + DB 196,98,125,24,37,79,39,0,0 ; vbroadcastss 0x274f(%rip),%ymm12 # 4eb8 <_sk_callback_hsw+0x2d0> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1 DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10 DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10 - DB 196,98,125,24,29,48,39,0,0 ; vbroadcastss 0x2730(%rip),%ymm11 # 4efc <_sk_callback_hsw+0x2d4> + DB 196,98,125,24,29,48,39,0,0 ; vbroadcastss 0x2730(%rip),%ymm11 # 4ebc <_sk_callback_hsw+0x2d4> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,38,39,0,0 ; vbroadcastss 0x2726(%rip),%ymm11 # 4f00 <_sk_callback_hsw+0x2d8> + DB 196,98,125,24,29,38,39,0,0 ; vbroadcastss 0x2726(%rip),%ymm11 # 4ec0 <_sk_callback_hsw+0x2d8> DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11 - DB 196,226,125,24,13,28,39,0,0 ; vbroadcastss 0x271c(%rip),%ymm1 # 4f04 <_sk_callback_hsw+0x2dc> + DB 196,226,125,24,13,28,39,0,0 ; vbroadcastss 0x271c(%rip),%ymm1 # 4ec4 <_sk_callback_hsw+0x2dc> DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1 - DB 196,98,125,24,21,18,39,0,0 ; vbroadcastss 0x2712(%rip),%ymm10 # 4f08 <_sk_callback_hsw+0x2e0> + DB 196,98,125,24,21,18,39,0,0 ; vbroadcastss 0x2712(%rip),%ymm10 # 4ec8 <_sk_callback_hsw+0x2e0> DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1 DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1 - DB 196,98,125,24,21,5,39,0,0 ; vbroadcastss 0x2705(%rip),%ymm10 # 4f0c <_sk_callback_hsw+0x2e4> + DB 196,98,125,24,21,5,39,0,0 ; vbroadcastss 0x2705(%rip),%ymm10 # 4ecc <_sk_callback_hsw+0x2e4> DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1 DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2393,7 +2380,7 @@ _sk_parametric_g_hsw LABEL PROC DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,5,220,38,0,0 ; vbroadcastss 0x26dc(%rip),%ymm8 # 4f10 <_sk_callback_hsw+0x2e8> + DB 196,98,125,24,5,220,38,0,0 ; vbroadcastss 0x26dc(%rip),%ymm8 # 4ed0 <_sk_callback_hsw+0x2e8> DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2411,33 +2398,33 @@ _sk_parametric_b_hsw LABEL PROC DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10 DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,148,38,0,0 ; vbroadcastss 0x2694(%rip),%ymm12 # 4f14 <_sk_callback_hsw+0x2ec> - DB 196,98,125,24,45,143,38,0,0 ; vbroadcastss 0x268f(%rip),%ymm13 # 4f18 <_sk_callback_hsw+0x2f0> + DB 196,98,125,24,37,148,38,0,0 ; vbroadcastss 0x2694(%rip),%ymm12 # 4ed4 <_sk_callback_hsw+0x2ec> + DB 196,98,125,24,45,143,38,0,0 ; vbroadcastss 0x268f(%rip),%ymm13 # 4ed8 <_sk_callback_hsw+0x2f0> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,133,38,0,0 ; vbroadcastss 0x2685(%rip),%ymm13 # 4f1c <_sk_callback_hsw+0x2f4> + DB 196,98,125,24,45,133,38,0,0 ; vbroadcastss 0x2685(%rip),%ymm13 # 4edc <_sk_callback_hsw+0x2f4> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,123,38,0,0 ; vbroadcastss 0x267b(%rip),%ymm13 # 4f20 <_sk_callback_hsw+0x2f8> + DB 196,98,125,24,45,123,38,0,0 ; vbroadcastss 0x267b(%rip),%ymm13 # 4ee0 <_sk_callback_hsw+0x2f8> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,113,38,0,0 ; vbroadcastss 0x2671(%rip),%ymm11 # 4f24 <_sk_callback_hsw+0x2fc> + DB 196,98,125,24,29,113,38,0,0 ; vbroadcastss 0x2671(%rip),%ymm11 # 4ee4 <_sk_callback_hsw+0x2fc> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,103,38,0,0 ; vbroadcastss 0x2667(%rip),%ymm12 # 4f28 <_sk_callback_hsw+0x300> + DB 196,98,125,24,37,103,38,0,0 ; vbroadcastss 0x2667(%rip),%ymm12 # 4ee8 <_sk_callback_hsw+0x300> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,93,38,0,0 ; vbroadcastss 0x265d(%rip),%ymm12 # 4f2c <_sk_callback_hsw+0x304> + DB 196,98,125,24,37,93,38,0,0 ; vbroadcastss 0x265d(%rip),%ymm12 # 4eec <_sk_callback_hsw+0x304> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10 DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10 - DB 196,98,125,24,29,62,38,0,0 ; vbroadcastss 0x263e(%rip),%ymm11 # 4f30 <_sk_callback_hsw+0x308> + DB 196,98,125,24,29,62,38,0,0 ; vbroadcastss 0x263e(%rip),%ymm11 # 4ef0 <_sk_callback_hsw+0x308> DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 - DB 196,98,125,24,29,52,38,0,0 ; vbroadcastss 0x2634(%rip),%ymm11 # 4f34 <_sk_callback_hsw+0x30c> + DB 196,98,125,24,29,52,38,0,0 ; vbroadcastss 0x2634(%rip),%ymm11 # 4ef4 <_sk_callback_hsw+0x30c> DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11 - DB 196,226,125,24,21,42,38,0,0 ; vbroadcastss 0x262a(%rip),%ymm2 # 4f38 <_sk_callback_hsw+0x310> + DB 196,226,125,24,21,42,38,0,0 ; vbroadcastss 0x262a(%rip),%ymm2 # 4ef8 <_sk_callback_hsw+0x310> DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2 - DB 196,98,125,24,21,32,38,0,0 ; vbroadcastss 0x2620(%rip),%ymm10 # 4f3c <_sk_callback_hsw+0x314> + DB 196,98,125,24,21,32,38,0,0 ; vbroadcastss 0x2620(%rip),%ymm10 # 4efc <_sk_callback_hsw+0x314> DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2 DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2 - DB 196,98,125,24,21,19,38,0,0 ; vbroadcastss 0x2613(%rip),%ymm10 # 4f40 <_sk_callback_hsw+0x318> + DB 196,98,125,24,21,19,38,0,0 ; vbroadcastss 0x2613(%rip),%ymm10 # 4f00 <_sk_callback_hsw+0x318> DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2445,7 +2432,7 @@ _sk_parametric_b_hsw LABEL PROC DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,234,37,0,0 ; vbroadcastss 0x25ea(%rip),%ymm8 # 4f44 <_sk_callback_hsw+0x31c> + DB 196,98,125,24,5,234,37,0,0 ; vbroadcastss 0x25ea(%rip),%ymm8 # 4f04 <_sk_callback_hsw+0x31c> DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2463,33 +2450,33 @@ _sk_parametric_a_hsw LABEL PROC DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10 DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3 DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11 - DB 196,98,125,24,37,162,37,0,0 ; vbroadcastss 0x25a2(%rip),%ymm12 # 4f48 <_sk_callback_hsw+0x320> - DB 196,98,125,24,45,157,37,0,0 ; vbroadcastss 0x259d(%rip),%ymm13 # 4f4c <_sk_callback_hsw+0x324> + DB 196,98,125,24,37,162,37,0,0 ; vbroadcastss 0x25a2(%rip),%ymm12 # 4f08 <_sk_callback_hsw+0x320> + DB 196,98,125,24,45,157,37,0,0 ; vbroadcastss 0x259d(%rip),%ymm13 # 4f0c <_sk_callback_hsw+0x324> DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,147,37,0,0 ; vbroadcastss 0x2593(%rip),%ymm13 # 4f50 <_sk_callback_hsw+0x328> + DB 196,98,125,24,45,147,37,0,0 ; vbroadcastss 0x2593(%rip),%ymm13 # 4f10 <_sk_callback_hsw+0x328> DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10 - DB 196,98,125,24,45,137,37,0,0 ; vbroadcastss 0x2589(%rip),%ymm13 # 4f54 <_sk_callback_hsw+0x32c> + DB 196,98,125,24,45,137,37,0,0 ; vbroadcastss 0x2589(%rip),%ymm13 # 4f14 <_sk_callback_hsw+0x32c> DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13 - DB 196,98,125,24,29,127,37,0,0 ; vbroadcastss 0x257f(%rip),%ymm11 # 4f58 <_sk_callback_hsw+0x330> + DB 196,98,125,24,29,127,37,0,0 ; vbroadcastss 0x257f(%rip),%ymm11 # 4f18 <_sk_callback_hsw+0x330> DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11 - DB 196,98,125,24,37,117,37,0,0 ; vbroadcastss 0x2575(%rip),%ymm12 # 4f5c <_sk_callback_hsw+0x334> + DB 196,98,125,24,37,117,37,0,0 ; vbroadcastss 0x2575(%rip),%ymm12 # 4f1c <_sk_callback_hsw+0x334> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,107,37,0,0 ; vbroadcastss 0x256b(%rip),%ymm12 # 4f60 <_sk_callback_hsw+0x338> + DB 196,98,125,24,37,107,37,0,0 ; vbroadcastss 0x256b(%rip),%ymm12 # 4f20 <_sk_callback_hsw+0x338> DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10 DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3 DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10 DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10 - DB 196,98,125,24,29,76,37,0,0 ; vbroadcastss 0x254c(%rip),%ymm11 # 4f64 <_sk_callback_hsw+0x33c> + DB 196,98,125,24,29,76,37,0,0 ; vbroadcastss 0x254c(%rip),%ymm11 # 4f24 <_sk_callback_hsw+0x33c> DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3 - DB 196,98,125,24,29,66,37,0,0 ; vbroadcastss 0x2542(%rip),%ymm11 # 4f68 <_sk_callback_hsw+0x340> + DB 196,98,125,24,29,66,37,0,0 ; vbroadcastss 0x2542(%rip),%ymm11 # 4f28 <_sk_callback_hsw+0x340> DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11 - DB 196,226,125,24,29,56,37,0,0 ; vbroadcastss 0x2538(%rip),%ymm3 # 4f6c <_sk_callback_hsw+0x344> + DB 196,226,125,24,29,56,37,0,0 ; vbroadcastss 0x2538(%rip),%ymm3 # 4f2c <_sk_callback_hsw+0x344> DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3 - DB 196,98,125,24,21,46,37,0,0 ; vbroadcastss 0x252e(%rip),%ymm10 # 4f70 <_sk_callback_hsw+0x348> + DB 196,98,125,24,21,46,37,0,0 ; vbroadcastss 0x252e(%rip),%ymm10 # 4f30 <_sk_callback_hsw+0x348> DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3 DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3 - DB 196,98,125,24,21,33,37,0,0 ; vbroadcastss 0x2521(%rip),%ymm10 # 4f74 <_sk_callback_hsw+0x34c> + DB 196,98,125,24,21,33,37,0,0 ; vbroadcastss 0x2521(%rip),%ymm10 # 4f34 <_sk_callback_hsw+0x34c> DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3 DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -2497,33 +2484,33 @@ _sk_parametric_a_hsw LABEL PROC DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3 - DB 196,98,125,24,5,248,36,0,0 ; vbroadcastss 0x24f8(%rip),%ymm8 # 4f78 <_sk_callback_hsw+0x350> + DB 196,98,125,24,5,248,36,0,0 ; vbroadcastss 0x24f8(%rip),%ymm8 # 4f38 <_sk_callback_hsw+0x350> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax PUBLIC _sk_lab_to_xyz_hsw _sk_lab_to_xyz_hsw LABEL PROC - DB 196,98,125,24,5,234,36,0,0 ; vbroadcastss 0x24ea(%rip),%ymm8 # 4f7c <_sk_callback_hsw+0x354> - DB 196,98,125,24,13,229,36,0,0 ; vbroadcastss 0x24e5(%rip),%ymm9 # 4f80 <_sk_callback_hsw+0x358> - DB 196,98,125,24,21,224,36,0,0 ; vbroadcastss 0x24e0(%rip),%ymm10 # 4f84 <_sk_callback_hsw+0x35c> + DB 196,98,125,24,5,234,36,0,0 ; vbroadcastss 0x24ea(%rip),%ymm8 # 4f3c <_sk_callback_hsw+0x354> + DB 196,98,125,24,13,229,36,0,0 ; vbroadcastss 0x24e5(%rip),%ymm9 # 4f40 <_sk_callback_hsw+0x358> + DB 196,98,125,24,21,224,36,0,0 ; vbroadcastss 0x24e0(%rip),%ymm10 # 4f44 <_sk_callback_hsw+0x35c> DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1 DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2 - DB 196,98,125,24,13,209,36,0,0 ; vbroadcastss 0x24d1(%rip),%ymm9 # 4f88 <_sk_callback_hsw+0x360> + DB 196,98,125,24,13,209,36,0,0 ; vbroadcastss 0x24d1(%rip),%ymm9 # 4f48 <_sk_callback_hsw+0x360> DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9 - DB 196,226,125,24,5,199,36,0,0 ; vbroadcastss 0x24c7(%rip),%ymm0 # 4f8c <_sk_callback_hsw+0x364> + DB 196,226,125,24,5,199,36,0,0 ; vbroadcastss 0x24c7(%rip),%ymm0 # 4f4c <_sk_callback_hsw+0x364> DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 - DB 196,98,125,24,5,190,36,0,0 ; vbroadcastss 0x24be(%rip),%ymm8 # 4f90 <_sk_callback_hsw+0x368> + DB 196,98,125,24,5,190,36,0,0 ; vbroadcastss 0x24be(%rip),%ymm8 # 4f50 <_sk_callback_hsw+0x368> DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8 - DB 196,98,125,24,13,180,36,0,0 ; vbroadcastss 0x24b4(%rip),%ymm9 # 4f94 <_sk_callback_hsw+0x36c> + DB 196,98,125,24,13,180,36,0,0 ; vbroadcastss 0x24b4(%rip),%ymm9 # 4f54 <_sk_callback_hsw+0x36c> DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9 DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 - DB 196,226,125,24,21,161,36,0,0 ; vbroadcastss 0x24a1(%rip),%ymm2 # 4f98 <_sk_callback_hsw+0x370> + DB 196,226,125,24,21,161,36,0,0 ; vbroadcastss 0x24a1(%rip),%ymm2 # 4f58 <_sk_callback_hsw+0x370> DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10 - DB 196,98,125,24,29,151,36,0,0 ; vbroadcastss 0x2497(%rip),%ymm11 # 4f9c <_sk_callback_hsw+0x374> + DB 196,98,125,24,29,151,36,0,0 ; vbroadcastss 0x2497(%rip),%ymm11 # 4f5c <_sk_callback_hsw+0x374> DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8 - DB 196,98,125,24,37,141,36,0,0 ; vbroadcastss 0x248d(%rip),%ymm12 # 4fa0 <_sk_callback_hsw+0x378> + DB 196,98,125,24,37,141,36,0,0 ; vbroadcastss 0x248d(%rip),%ymm12 # 4f60 <_sk_callback_hsw+0x378> DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8 DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8 DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1 @@ -2538,9 +2525,9 @@ _sk_lab_to_xyz_hsw LABEL PROC DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9 DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9 DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2 - DB 196,226,125,24,5,66,36,0,0 ; vbroadcastss 0x2442(%rip),%ymm0 # 4fa4 <_sk_callback_hsw+0x37c> + DB 196,226,125,24,5,66,36,0,0 ; vbroadcastss 0x2442(%rip),%ymm0 # 4f64 <_sk_callback_hsw+0x37c> DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,57,36,0,0 ; vbroadcastss 0x2439(%rip),%ymm8 # 4fa8 <_sk_callback_hsw+0x380> + DB 196,98,125,24,5,57,36,0,0 ; vbroadcastss 0x2439(%rip),%ymm8 # 4f68 <_sk_callback_hsw+0x380> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2550,12 +2537,12 @@ _sk_load_a8_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,52 ; jne 2bb6 <_sk_load_a8_hsw+0x3e> + DB 117,52 ; jne 2b76 <_sk_load_a8_hsw+0x3e> DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0 - DB 197,249,219,5,16,40,0,0 ; vpand 0x2810(%rip),%xmm0,%xmm0 # 53a0 <_sk_callback_hsw+0x778> + DB 197,249,219,5,16,40,0,0 ; vpand 0x2810(%rip),%xmm0,%xmm0 # 5360 <_sk_callback_hsw+0x778> DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,10,36,0,0 ; vbroadcastss 0x240a(%rip),%ymm1 # 4fac <_sk_callback_hsw+0x384> + DB 196,226,125,24,13,10,36,0,0 ; vbroadcastss 0x240a(%rip),%ymm1 # 4f6c <_sk_callback_hsw+0x384> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -2567,15 +2554,15 @@ _sk_load_a8_hsw LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,190 ; ja 2b88 <_sk_load_a8_hsw+0x10> + DB 119,190 ; ja 2b48 <_sk_load_a8_hsw+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 2c4c <_sk_load_a8_hsw+0xd4> + DB 76,141,21,119,0,0,0 ; lea 0x77(%rip),%r10 # 2c0c <_sk_load_a8_hsw+0xd4> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,159 ; jmp 2b88 <_sk_load_a8_hsw+0x10> + DB 235,159 ; jmp 2b48 <_sk_load_a8_hsw+0x10> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -2583,7 +2570,7 @@ _sk_load_a8_hsw LABEL PROC DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,119,255,255,255 ; jmpq 2b88 <_sk_load_a8_hsw+0x10> + DB 233,119,255,255,255 ; jmpq 2b48 <_sk_load_a8_hsw+0x10> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -2594,7 +2581,7 @@ _sk_load_a8_hsw LABEL PROC DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,60,255,255,255 ; jmpq 2b88 <_sk_load_a8_hsw+0x10> + DB 233,60,255,255,255 ; jmpq 2b48 <_sk_load_a8_hsw+0x10> DB 146 ; xchg %eax,%edx DB 255 ; (bad) DB 255 ; (bad) @@ -2653,7 +2640,7 @@ _sk_gather_a8_hsw LABEL PROC DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,146,34,0,0 ; vbroadcastss 0x2292(%rip),%ymm1 # 4fb0 <_sk_callback_hsw+0x388> + DB 196,226,125,24,13,146,34,0,0 ; vbroadcastss 0x2292(%rip),%ymm1 # 4f70 <_sk_callback_hsw+0x388> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -2665,14 +2652,14 @@ PUBLIC _sk_store_a8_hsw _sk_store_a8_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,116,34,0,0 ; vbroadcastss 0x2274(%rip),%ymm8 # 4fb4 <_sk_callback_hsw+0x38c> + DB 196,98,125,24,5,116,34,0,0 ; vbroadcastss 0x2274(%rip),%ymm8 # 4f74 <_sk_callback_hsw+0x38c> DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8 DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8 DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 2d69 <_sk_store_a8_hsw+0x37> + DB 117,10 ; jne 2d29 <_sk_store_a8_hsw+0x37> DB 196,65,123,17,4,19 ; vmovsd %xmm8,(%r11,%rdx,1) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -2680,25 +2667,25 @@ _sk_store_a8_hsw LABEL PROC DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,236 ; ja 2d65 <_sk_store_a8_hsw+0x33> + DB 119,236 ; ja 2d25 <_sk_store_a8_hsw+0x33> DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8 DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,87,0,0,0 ; lea 0x57(%rip),%r10 # 2de0 <_sk_store_a8_hsw+0xae> + DB 76,141,21,87,0,0,0 ; lea 0x57(%rip),%r10 # 2da0 <_sk_store_a8_hsw+0xae> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,20,4,19,0 ; vpextrb $0x0,%xmm8,(%r11,%rdx,1) - DB 235,202 ; jmp 2d65 <_sk_store_a8_hsw+0x33> + DB 235,202 ; jmp 2d25 <_sk_store_a8_hsw+0x33> DB 196,67,121,20,68,19,2,4 ; vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1) - DB 196,98,57,0,5,4,38,0,0 ; vpshufb 0x2604(%rip),%xmm8,%xmm8 # 53b0 <_sk_callback_hsw+0x788> + DB 196,98,57,0,5,4,38,0,0 ; vpshufb 0x2604(%rip),%xmm8,%xmm8 # 5370 <_sk_callback_hsw+0x788> DB 196,67,121,21,4,19,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,1) - DB 235,176 ; jmp 2d65 <_sk_store_a8_hsw+0x33> + DB 235,176 ; jmp 2d25 <_sk_store_a8_hsw+0x33> DB 196,67,121,20,68,19,6,12 ; vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1) DB 196,67,121,20,68,19,5,10 ; vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1) DB 196,67,121,20,68,19,4,8 ; vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1) - DB 196,98,57,0,5,234,37,0,0 ; vpshufb 0x25ea(%rip),%xmm8,%xmm8 # 53c0 <_sk_callback_hsw+0x798> + DB 196,98,57,0,5,234,37,0,0 ; vpshufb 0x25ea(%rip),%xmm8,%xmm8 # 5380 <_sk_callback_hsw+0x798> DB 196,65,121,126,4,19 ; vmovd %xmm8,(%r11,%rdx,1) - DB 235,135 ; jmp 2d65 <_sk_store_a8_hsw+0x33> + DB 235,135 ; jmp 2d25 <_sk_store_a8_hsw+0x33> DB 102,144 ; xchg %ax,%ax DB 178,255 ; mov $0xff,%dl DB 255 ; (bad) @@ -2725,15 +2712,15 @@ _sk_load_g8_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,57 ; jne 2e3f <_sk_load_g8_hsw+0x43> + DB 117,57 ; jne 2dff <_sk_load_g8_hsw+0x43> DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0 - DB 197,249,219,5,188,37,0,0 ; vpand 0x25bc(%rip),%xmm0,%xmm0 # 53d0 <_sk_callback_hsw+0x7a8> + DB 197,249,219,5,188,37,0,0 ; vpand 0x25bc(%rip),%xmm0,%xmm0 # 5390 <_sk_callback_hsw+0x7a8> DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,146,33,0,0 ; vbroadcastss 0x2192(%rip),%ymm1 # 4fb8 <_sk_callback_hsw+0x390> + DB 196,226,125,24,13,146,33,0,0 ; vbroadcastss 0x2192(%rip),%ymm1 # 4f78 <_sk_callback_hsw+0x390> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,135,33,0,0 ; vbroadcastss 0x2187(%rip),%ymm3 # 4fbc <_sk_callback_hsw+0x394> + DB 196,226,125,24,29,135,33,0,0 ; vbroadcastss 0x2187(%rip),%ymm3 # 4f7c <_sk_callback_hsw+0x394> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -2742,15 +2729,15 @@ _sk_load_g8_hsw LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,185 ; ja 2e0c <_sk_load_g8_hsw+0x10> + DB 119,185 ; ja 2dcc <_sk_load_g8_hsw+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # 2ed8 <_sk_load_g8_hsw+0xdc> + DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # 2e98 <_sk_load_g8_hsw+0xdc> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,154 ; jmp 2e0c <_sk_load_g8_hsw+0x10> + DB 235,154 ; jmp 2dcc <_sk_load_g8_hsw+0x10> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -2758,7 +2745,7 @@ _sk_load_g8_hsw LABEL PROC DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,114,255,255,255 ; jmpq 2e0c <_sk_load_g8_hsw+0x10> + DB 233,114,255,255,255 ; jmpq 2dcc <_sk_load_g8_hsw+0x10> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -2769,7 +2756,7 @@ _sk_load_g8_hsw LABEL PROC DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,55,255,255,255 ; jmpq 2e0c <_sk_load_g8_hsw+0x10> + DB 233,55,255,255,255 ; jmpq 2dcc <_sk_load_g8_hsw+0x10> DB 15,31,0 ; nopl (%rax) DB 143 ; (bad) DB 255 ; (bad) @@ -2829,10 +2816,10 @@ _sk_gather_g8_hsw LABEL PROC DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,22,32,0,0 ; vbroadcastss 0x2016(%rip),%ymm1 # 4fc0 <_sk_callback_hsw+0x398> + DB 196,226,125,24,13,22,32,0,0 ; vbroadcastss 0x2016(%rip),%ymm1 # 4f80 <_sk_callback_hsw+0x398> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,11,32,0,0 ; vbroadcastss 0x200b(%rip),%ymm3 # 4fc4 <_sk_callback_hsw+0x39c> + DB 196,226,125,24,29,11,32,0,0 ; vbroadcastss 0x200b(%rip),%ymm3 # 4f84 <_sk_callback_hsw+0x39c> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -2842,9 +2829,9 @@ _sk_gather_i8_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,193 ; mov %rax,%r9 DB 77,133,201 ; test %r9,%r9 - DB 116,5 ; je 2fd2 <_sk_gather_i8_hsw+0xf> + DB 116,5 ; je 2f92 <_sk_gather_i8_hsw+0xf> DB 76,137,200 ; mov %r9,%rax - DB 235,2 ; jmp 2fd4 <_sk_gather_i8_hsw+0x11> + DB 235,2 ; jmp 2f94 <_sk_gather_i8_hsw+0x11> DB 72,173 ; lods %ds:(%rsi),%rax DB 83 ; push %rbx DB 76,139,16 ; mov (%rax),%r10 @@ -2878,14 +2865,14 @@ _sk_gather_i8_hsw LABEL PROC DB 73,139,65,8 ; mov 0x8(%r9),%rax DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,226,117,144,28,128 ; vpgatherdd %ymm1,(%rax,%ymm0,4),%ymm3 - DB 197,229,219,5,199,33,0,0 ; vpand 0x21c7(%rip),%ymm3,%ymm0 # 5240 <_sk_callback_hsw+0x618> + DB 197,229,219,5,199,33,0,0 ; vpand 0x21c7(%rip),%ymm3,%ymm0 # 5200 <_sk_callback_hsw+0x618> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,66,31,0,0 ; vbroadcastss 0x1f42(%rip),%ymm8 # 4fc8 <_sk_callback_hsw+0x3a0> + DB 196,98,125,24,5,66,31,0,0 ; vbroadcastss 0x1f42(%rip),%ymm8 # 4f88 <_sk_callback_hsw+0x3a0> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,226,101,0,13,204,33,0,0 ; vpshufb 0x21cc(%rip),%ymm3,%ymm1 # 5260 <_sk_callback_hsw+0x638> + DB 196,226,101,0,13,204,33,0,0 ; vpshufb 0x21cc(%rip),%ymm3,%ymm1 # 5220 <_sk_callback_hsw+0x638> DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,226,101,0,21,218,33,0,0 ; vpshufb 0x21da(%rip),%ymm3,%ymm2 # 5280 <_sk_callback_hsw+0x658> + DB 196,226,101,0,21,218,33,0,0 ; vpshufb 0x21da(%rip),%ymm3,%ymm2 # 5240 <_sk_callback_hsw+0x658> DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -2900,53 +2887,53 @@ _sk_load_565_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,114 ; jne 313e <_sk_load_565_hsw+0x7c> + DB 117,114 ; jne 30fe <_sk_load_565_hsw+0x7c> DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0 DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2 - DB 196,226,125,88,5,236,30,0,0 ; vpbroadcastd 0x1eec(%rip),%ymm0 # 4fcc <_sk_callback_hsw+0x3a4> + DB 196,226,125,88,5,236,30,0,0 ; vpbroadcastd 0x1eec(%rip),%ymm0 # 4f8c <_sk_callback_hsw+0x3a4> DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,223,30,0,0 ; vbroadcastss 0x1edf(%rip),%ymm1 # 4fd0 <_sk_callback_hsw+0x3a8> + DB 196,226,125,24,13,223,30,0,0 ; vbroadcastss 0x1edf(%rip),%ymm1 # 4f90 <_sk_callback_hsw+0x3a8> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,214,30,0,0 ; vpbroadcastd 0x1ed6(%rip),%ymm1 # 4fd4 <_sk_callback_hsw+0x3ac> + DB 196,226,125,88,13,214,30,0,0 ; vpbroadcastd 0x1ed6(%rip),%ymm1 # 4f94 <_sk_callback_hsw+0x3ac> DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,201,30,0,0 ; vbroadcastss 0x1ec9(%rip),%ymm3 # 4fd8 <_sk_callback_hsw+0x3b0> + DB 196,226,125,24,29,201,30,0,0 ; vbroadcastss 0x1ec9(%rip),%ymm3 # 4f98 <_sk_callback_hsw+0x3b0> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,88,29,192,30,0,0 ; vpbroadcastd 0x1ec0(%rip),%ymm3 # 4fdc <_sk_callback_hsw+0x3b4> + DB 196,226,125,88,29,192,30,0,0 ; vpbroadcastd 0x1ec0(%rip),%ymm3 # 4f9c <_sk_callback_hsw+0x3b4> DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,179,30,0,0 ; vbroadcastss 0x1eb3(%rip),%ymm3 # 4fe0 <_sk_callback_hsw+0x3b8> + DB 196,226,125,24,29,179,30,0,0 ; vbroadcastss 0x1eb3(%rip),%ymm3 # 4fa0 <_sk_callback_hsw+0x3b8> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,168,30,0,0 ; vbroadcastss 0x1ea8(%rip),%ymm3 # 4fe4 <_sk_callback_hsw+0x3bc> + DB 196,226,125,24,29,168,30,0,0 ; vbroadcastss 0x1ea8(%rip),%ymm3 # 4fa4 <_sk_callback_hsw+0x3bc> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,7 ; and $0x7,%r9b DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,128 ; ja 30d2 <_sk_load_565_hsw+0x10> + DB 119,128 ; ja 3092 <_sk_load_565_hsw+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 31c0 <_sk_load_565_hsw+0xfe> + DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 3180 <_sk_load_565_hsw+0xfe> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 233,94,255,255,255 ; jmpq 30d2 <_sk_load_565_hsw+0x10> + DB 233,94,255,255,255 ; jmpq 3092 <_sk_load_565_hsw+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,65,255,255,255 ; jmpq 30d2 <_sk_load_565_hsw+0x10> + DB 233,65,255,255,255 ; jmpq 3092 <_sk_load_565_hsw+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,20,255,255,255 ; jmpq 30d2 <_sk_load_565_hsw+0x10> + DB 233,20,255,255,255 ; jmpq 3092 <_sk_load_565_hsw+0x10> DB 102,144 ; xchg %ax,%ax DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi) DB 255 ; (bad) @@ -3006,34 +2993,34 @@ _sk_gather_565_hsw LABEL PROC DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2 - DB 196,226,125,88,5,91,29,0,0 ; vpbroadcastd 0x1d5b(%rip),%ymm0 # 4fe8 <_sk_callback_hsw+0x3c0> + DB 196,226,125,88,5,91,29,0,0 ; vpbroadcastd 0x1d5b(%rip),%ymm0 # 4fa8 <_sk_callback_hsw+0x3c0> DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,78,29,0,0 ; vbroadcastss 0x1d4e(%rip),%ymm1 # 4fec <_sk_callback_hsw+0x3c4> + DB 196,226,125,24,13,78,29,0,0 ; vbroadcastss 0x1d4e(%rip),%ymm1 # 4fac <_sk_callback_hsw+0x3c4> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,69,29,0,0 ; vpbroadcastd 0x1d45(%rip),%ymm1 # 4ff0 <_sk_callback_hsw+0x3c8> + DB 196,226,125,88,13,69,29,0,0 ; vpbroadcastd 0x1d45(%rip),%ymm1 # 4fb0 <_sk_callback_hsw+0x3c8> DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,56,29,0,0 ; vbroadcastss 0x1d38(%rip),%ymm3 # 4ff4 <_sk_callback_hsw+0x3cc> + DB 196,226,125,24,29,56,29,0,0 ; vbroadcastss 0x1d38(%rip),%ymm3 # 4fb4 <_sk_callback_hsw+0x3cc> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,88,29,47,29,0,0 ; vpbroadcastd 0x1d2f(%rip),%ymm3 # 4ff8 <_sk_callback_hsw+0x3d0> + DB 196,226,125,88,29,47,29,0,0 ; vpbroadcastd 0x1d2f(%rip),%ymm3 # 4fb8 <_sk_callback_hsw+0x3d0> DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,34,29,0,0 ; vbroadcastss 0x1d22(%rip),%ymm3 # 4ffc <_sk_callback_hsw+0x3d4> + DB 196,226,125,24,29,34,29,0,0 ; vbroadcastss 0x1d22(%rip),%ymm3 # 4fbc <_sk_callback_hsw+0x3d4> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,23,29,0,0 ; vbroadcastss 0x1d17(%rip),%ymm3 # 5000 <_sk_callback_hsw+0x3d8> + DB 196,226,125,24,29,23,29,0,0 ; vbroadcastss 0x1d17(%rip),%ymm3 # 4fc0 <_sk_callback_hsw+0x3d8> DB 255,224 ; jmpq *%rax PUBLIC _sk_store_565_hsw _sk_store_565_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,11,29,0,0 ; vbroadcastss 0x1d0b(%rip),%ymm8 # 5004 <_sk_callback_hsw+0x3dc> + DB 196,98,125,24,5,11,29,0,0 ; vbroadcastss 0x1d0b(%rip),%ymm8 # 4fc4 <_sk_callback_hsw+0x3dc> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9 - DB 196,98,125,24,21,246,28,0,0 ; vbroadcastss 0x1cf6(%rip),%ymm10 # 5008 <_sk_callback_hsw+0x3e0> + DB 196,98,125,24,21,246,28,0,0 ; vbroadcastss 0x1cf6(%rip),%ymm10 # 4fc8 <_sk_callback_hsw+0x3e0> DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10 DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10 DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10 @@ -3044,7 +3031,7 @@ _sk_store_565_hsw LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 3350 <_sk_store_565_hsw+0x65> + DB 117,10 ; jne 3310 <_sk_store_565_hsw+0x65> DB 196,65,122,127,4,83 ; vmovdqu %xmm8,(%r11,%rdx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -3052,22 +3039,22 @@ _sk_store_565_hsw LABEL PROC DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,236 ; ja 334c <_sk_store_565_hsw+0x61> + DB 119,236 ; ja 330c <_sk_store_565_hsw+0x61> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # 33b0 <_sk_store_565_hsw+0xc5> + DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # 3370 <_sk_store_565_hsw+0xc5> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2) - DB 235,207 ; jmp 334c <_sk_store_565_hsw+0x61> + DB 235,207 ; jmp 330c <_sk_store_565_hsw+0x61> DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2) DB 196,65,121,126,4,83 ; vmovd %xmm8,(%r11,%rdx,2) - DB 235,191 ; jmp 334c <_sk_store_565_hsw+0x61> + DB 235,191 ; jmp 330c <_sk_store_565_hsw+0x61> DB 196,67,121,21,68,83,12,6 ; vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2) DB 196,67,121,21,68,83,10,5 ; vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2) DB 196,67,121,21,68,83,8,4 ; vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2) DB 196,65,121,214,4,83 ; vmovq %xmm8,(%r11,%rdx,2) - DB 235,159 ; jmp 334c <_sk_store_565_hsw+0x61> + DB 235,159 ; jmp 330c <_sk_store_565_hsw+0x61> DB 15,31,0 ; nopl (%rax) DB 196 ; (bad) DB 255 ; (bad) @@ -3098,28 +3085,28 @@ _sk_load_4444_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,138,0,0,0 ; jne 3464 <_sk_load_4444_hsw+0x98> + DB 15,133,138,0,0,0 ; jne 3424 <_sk_load_4444_hsw+0x98> DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0 DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3 - DB 196,226,125,88,5,30,28,0,0 ; vpbroadcastd 0x1c1e(%rip),%ymm0 # 500c <_sk_callback_hsw+0x3e4> + DB 196,226,125,88,5,30,28,0,0 ; vpbroadcastd 0x1c1e(%rip),%ymm0 # 4fcc <_sk_callback_hsw+0x3e4> DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,17,28,0,0 ; vbroadcastss 0x1c11(%rip),%ymm1 # 5010 <_sk_callback_hsw+0x3e8> + DB 196,226,125,24,13,17,28,0,0 ; vbroadcastss 0x1c11(%rip),%ymm1 # 4fd0 <_sk_callback_hsw+0x3e8> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,8,28,0,0 ; vpbroadcastd 0x1c08(%rip),%ymm1 # 5014 <_sk_callback_hsw+0x3ec> + DB 196,226,125,88,13,8,28,0,0 ; vpbroadcastd 0x1c08(%rip),%ymm1 # 4fd4 <_sk_callback_hsw+0x3ec> DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,251,27,0,0 ; vbroadcastss 0x1bfb(%rip),%ymm2 # 5018 <_sk_callback_hsw+0x3f0> + DB 196,226,125,24,21,251,27,0,0 ; vbroadcastss 0x1bfb(%rip),%ymm2 # 4fd8 <_sk_callback_hsw+0x3f0> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,88,21,242,27,0,0 ; vpbroadcastd 0x1bf2(%rip),%ymm2 # 501c <_sk_callback_hsw+0x3f4> + DB 196,226,125,88,21,242,27,0,0 ; vpbroadcastd 0x1bf2(%rip),%ymm2 # 4fdc <_sk_callback_hsw+0x3f4> DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,229,27,0,0 ; vbroadcastss 0x1be5(%rip),%ymm8 # 5020 <_sk_callback_hsw+0x3f8> + DB 196,98,125,24,5,229,27,0,0 ; vbroadcastss 0x1be5(%rip),%ymm8 # 4fe0 <_sk_callback_hsw+0x3f8> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,88,5,219,27,0,0 ; vpbroadcastd 0x1bdb(%rip),%ymm8 # 5024 <_sk_callback_hsw+0x3fc> + DB 196,98,125,88,5,219,27,0,0 ; vpbroadcastd 0x1bdb(%rip),%ymm8 # 4fe4 <_sk_callback_hsw+0x3fc> DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,205,27,0,0 ; vbroadcastss 0x1bcd(%rip),%ymm8 # 5028 <_sk_callback_hsw+0x400> + DB 196,98,125,24,5,205,27,0,0 ; vbroadcastss 0x1bcd(%rip),%ymm8 # 4fe8 <_sk_callback_hsw+0x400> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -3128,27 +3115,27 @@ _sk_load_4444_hsw LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,100,255,255,255 ; ja 33e0 <_sk_load_4444_hsw+0x14> + DB 15,135,100,255,255,255 ; ja 33a0 <_sk_load_4444_hsw+0x14> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,97,0,0,0 ; lea 0x61(%rip),%r10 # 34e8 <_sk_load_4444_hsw+0x11c> + DB 76,141,21,97,0,0,0 ; lea 0x61(%rip),%r10 # 34a8 <_sk_load_4444_hsw+0x11c> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 233,66,255,255,255 ; jmpq 33e0 <_sk_load_4444_hsw+0x14> + DB 233,66,255,255,255 ; jmpq 33a0 <_sk_load_4444_hsw+0x14> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,37,255,255,255 ; jmpq 33e0 <_sk_load_4444_hsw+0x14> + DB 233,37,255,255,255 ; jmpq 33a0 <_sk_load_4444_hsw+0x14> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,248,254,255,255 ; jmpq 33e0 <_sk_load_4444_hsw+0x14> + DB 233,248,254,255,255 ; jmpq 33a0 <_sk_load_4444_hsw+0x14> DB 168,255 ; test $0xff,%al DB 255 ; (bad) DB 255,194 ; inc %edx @@ -3207,25 +3194,25 @@ _sk_gather_4444_hsw LABEL PROC DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0 DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3 - DB 196,226,125,88,5,119,26,0,0 ; vpbroadcastd 0x1a77(%rip),%ymm0 # 502c <_sk_callback_hsw+0x404> + DB 196,226,125,88,5,119,26,0,0 ; vpbroadcastd 0x1a77(%rip),%ymm0 # 4fec <_sk_callback_hsw+0x404> DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,106,26,0,0 ; vbroadcastss 0x1a6a(%rip),%ymm1 # 5030 <_sk_callback_hsw+0x408> + DB 196,226,125,24,13,106,26,0,0 ; vbroadcastss 0x1a6a(%rip),%ymm1 # 4ff0 <_sk_callback_hsw+0x408> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,88,13,97,26,0,0 ; vpbroadcastd 0x1a61(%rip),%ymm1 # 5034 <_sk_callback_hsw+0x40c> + DB 196,226,125,88,13,97,26,0,0 ; vpbroadcastd 0x1a61(%rip),%ymm1 # 4ff4 <_sk_callback_hsw+0x40c> DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,84,26,0,0 ; vbroadcastss 0x1a54(%rip),%ymm2 # 5038 <_sk_callback_hsw+0x410> + DB 196,226,125,24,21,84,26,0,0 ; vbroadcastss 0x1a54(%rip),%ymm2 # 4ff8 <_sk_callback_hsw+0x410> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,88,21,75,26,0,0 ; vpbroadcastd 0x1a4b(%rip),%ymm2 # 503c <_sk_callback_hsw+0x414> + DB 196,226,125,88,21,75,26,0,0 ; vpbroadcastd 0x1a4b(%rip),%ymm2 # 4ffc <_sk_callback_hsw+0x414> DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,62,26,0,0 ; vbroadcastss 0x1a3e(%rip),%ymm8 # 5040 <_sk_callback_hsw+0x418> + DB 196,98,125,24,5,62,26,0,0 ; vbroadcastss 0x1a3e(%rip),%ymm8 # 5000 <_sk_callback_hsw+0x418> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,88,5,52,26,0,0 ; vpbroadcastd 0x1a34(%rip),%ymm8 # 5044 <_sk_callback_hsw+0x41c> + DB 196,98,125,88,5,52,26,0,0 ; vpbroadcastd 0x1a34(%rip),%ymm8 # 5004 <_sk_callback_hsw+0x41c> DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,38,26,0,0 ; vbroadcastss 0x1a26(%rip),%ymm8 # 5048 <_sk_callback_hsw+0x420> + DB 196,98,125,24,5,38,26,0,0 ; vbroadcastss 0x1a26(%rip),%ymm8 # 5008 <_sk_callback_hsw+0x420> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -3234,7 +3221,7 @@ PUBLIC _sk_store_4444_hsw _sk_store_4444_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,19,26,0,0 ; vbroadcastss 0x1a13(%rip),%ymm8 # 504c <_sk_callback_hsw+0x424> + DB 196,98,125,24,5,19,26,0,0 ; vbroadcastss 0x1a13(%rip),%ymm8 # 500c <_sk_callback_hsw+0x424> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9 @@ -3252,7 +3239,7 @@ _sk_store_4444_hsw LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 369c <_sk_store_4444_hsw+0x71> + DB 117,10 ; jne 365c <_sk_store_4444_hsw+0x71> DB 196,65,122,127,4,83 ; vmovdqu %xmm8,(%r11,%rdx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -3260,22 +3247,22 @@ _sk_store_4444_hsw LABEL PROC DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,236 ; ja 3698 <_sk_store_4444_hsw+0x6d> + DB 119,236 ; ja 3658 <_sk_store_4444_hsw+0x6d> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # 36fc <_sk_store_4444_hsw+0xd1> + DB 76,141,21,69,0,0,0 ; lea 0x45(%rip),%r10 # 36bc <_sk_store_4444_hsw+0xd1> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2) - DB 235,207 ; jmp 3698 <_sk_store_4444_hsw+0x6d> + DB 235,207 ; jmp 3658 <_sk_store_4444_hsw+0x6d> DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2) DB 196,65,121,126,4,83 ; vmovd %xmm8,(%r11,%rdx,2) - DB 235,191 ; jmp 3698 <_sk_store_4444_hsw+0x6d> + DB 235,191 ; jmp 3658 <_sk_store_4444_hsw+0x6d> DB 196,67,121,21,68,83,12,6 ; vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2) DB 196,67,121,21,68,83,10,5 ; vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2) DB 196,67,121,21,68,83,8,4 ; vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2) DB 196,65,121,214,4,83 ; vmovq %xmm8,(%r11,%rdx,2) - DB 235,159 ; jmp 3698 <_sk_store_4444_hsw+0x6d> + DB 235,159 ; jmp 3658 <_sk_store_4444_hsw+0x6d> DB 15,31,0 ; nopl (%rax) DB 196 ; (bad) DB 255 ; (bad) @@ -3308,16 +3295,16 @@ _sk_load_8888_hsw LABEL PROC DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,88 ; jne 3785 <_sk_load_8888_hsw+0x6d> + DB 117,88 ; jne 3745 <_sk_load_8888_hsw+0x6d> DB 196,193,124,16,26 ; vmovups (%r10),%ymm3 - DB 197,228,84,5,102,27,0,0 ; vandps 0x1b66(%rip),%ymm3,%ymm0 # 52a0 <_sk_callback_hsw+0x678> + DB 197,228,84,5,102,27,0,0 ; vandps 0x1b66(%rip),%ymm3,%ymm0 # 5260 <_sk_callback_hsw+0x678> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,9,25,0,0 ; vbroadcastss 0x1909(%rip),%ymm8 # 5050 <_sk_callback_hsw+0x428> + DB 196,98,125,24,5,9,25,0,0 ; vbroadcastss 0x1909(%rip),%ymm8 # 5010 <_sk_callback_hsw+0x428> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,226,101,0,13,107,27,0,0 ; vpshufb 0x1b6b(%rip),%ymm3,%ymm1 # 52c0 <_sk_callback_hsw+0x698> + DB 196,226,101,0,13,107,27,0,0 ; vpshufb 0x1b6b(%rip),%ymm3,%ymm1 # 5280 <_sk_callback_hsw+0x698> DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,226,101,0,21,121,27,0,0 ; vpshufb 0x1b79(%rip),%ymm3,%ymm2 # 52e0 <_sk_callback_hsw+0x6b8> + DB 196,226,101,0,21,121,27,0,0 ; vpshufb 0x1b79(%rip),%ymm3,%ymm2 # 52a0 <_sk_callback_hsw+0x6b8> DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -3334,7 +3321,7 @@ _sk_load_8888_hsw LABEL PROC DB 196,225,249,110,192 ; vmovq %rax,%xmm0 DB 196,226,125,33,192 ; vpmovsxbd %xmm0,%ymm0 DB 196,194,125,44,26 ; vmaskmovps (%r10),%ymm0,%ymm3 - DB 235,135 ; jmp 3732 <_sk_load_8888_hsw+0x1a> + DB 235,135 ; jmp 36f2 <_sk_load_8888_hsw+0x1a> PUBLIC _sk_gather_8888_hsw _sk_gather_8888_hsw LABEL PROC @@ -3347,14 +3334,14 @@ _sk_gather_8888_hsw LABEL PROC DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0 DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3 - DB 197,229,219,5,39,27,0,0 ; vpand 0x1b27(%rip),%ymm3,%ymm0 # 5300 <_sk_callback_hsw+0x6d8> + DB 197,229,219,5,39,27,0,0 ; vpand 0x1b27(%rip),%ymm3,%ymm0 # 52c0 <_sk_callback_hsw+0x6d8> DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,110,24,0,0 ; vbroadcastss 0x186e(%rip),%ymm8 # 5054 <_sk_callback_hsw+0x42c> + DB 196,98,125,24,5,110,24,0,0 ; vbroadcastss 0x186e(%rip),%ymm8 # 5014 <_sk_callback_hsw+0x42c> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,226,101,0,13,44,27,0,0 ; vpshufb 0x1b2c(%rip),%ymm3,%ymm1 # 5320 <_sk_callback_hsw+0x6f8> + DB 196,226,101,0,13,44,27,0,0 ; vpshufb 0x1b2c(%rip),%ymm3,%ymm1 # 52e0 <_sk_callback_hsw+0x6f8> DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,226,101,0,21,58,27,0,0 ; vpshufb 0x1b3a(%rip),%ymm3,%ymm2 # 5340 <_sk_callback_hsw+0x718> + DB 196,226,101,0,21,58,27,0,0 ; vpshufb 0x1b3a(%rip),%ymm3,%ymm2 # 5300 <_sk_callback_hsw+0x718> DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3 @@ -3369,7 +3356,7 @@ _sk_store_8888_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 - DB 196,98,125,24,5,30,24,0,0 ; vbroadcastss 0x181e(%rip),%ymm8 # 5058 <_sk_callback_hsw+0x430> + DB 196,98,125,24,5,30,24,0,0 ; vbroadcastss 0x181e(%rip),%ymm8 # 5018 <_sk_callback_hsw+0x430> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -3385,7 +3372,7 @@ _sk_store_8888_hsw LABEL PROC DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8 DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,12 ; jne 3894 <_sk_store_8888_hsw+0x73> + DB 117,12 ; jne 3854 <_sk_store_8888_hsw+0x73> DB 196,65,124,17,2 ; vmovups %ymm8,(%r10) DB 72,173 ; lods %ds:(%rsi),%rax DB 76,137,201 ; mov %r9,%rcx @@ -3398,14 +3385,14 @@ _sk_store_8888_hsw LABEL PROC DB 196,97,249,110,200 ; vmovq %rax,%xmm9 DB 196,66,125,33,201 ; vpmovsxbd %xmm9,%ymm9 DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10) - DB 235,211 ; jmp 388d <_sk_store_8888_hsw+0x6c> + DB 235,211 ; jmp 384d <_sk_store_8888_hsw+0x6c> PUBLIC _sk_load_f16_hsw _sk_load_f16_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax DB 77,133,192 ; test %r8,%r8 - DB 117,97 ; jne 3925 <_sk_load_f16_hsw+0x6b> + DB 117,97 ; jne 38e5 <_sk_load_f16_hsw+0x6b> DB 197,121,16,4,208 ; vmovupd (%rax,%rdx,8),%xmm8 DB 197,249,16,84,208,16 ; vmovupd 0x10(%rax,%rdx,8),%xmm2 DB 197,249,16,92,208,32 ; vmovupd 0x20(%rax,%rdx,8),%xmm3 @@ -3431,29 +3418,29 @@ _sk_load_f16_hsw LABEL PROC DB 197,123,16,4,208 ; vmovsd (%rax,%rdx,8),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,79 ; je 3984 <_sk_load_f16_hsw+0xca> + DB 116,79 ; je 3944 <_sk_load_f16_hsw+0xca> DB 197,57,22,68,208,8 ; vmovhpd 0x8(%rax,%rdx,8),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,67 ; jb 3984 <_sk_load_f16_hsw+0xca> + DB 114,67 ; jb 3944 <_sk_load_f16_hsw+0xca> DB 197,251,16,84,208,16 ; vmovsd 0x10(%rax,%rdx,8),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,68 ; je 3991 <_sk_load_f16_hsw+0xd7> + DB 116,68 ; je 3951 <_sk_load_f16_hsw+0xd7> DB 197,233,22,84,208,24 ; vmovhpd 0x18(%rax,%rdx,8),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,56 ; jb 3991 <_sk_load_f16_hsw+0xd7> + DB 114,56 ; jb 3951 <_sk_load_f16_hsw+0xd7> DB 197,251,16,92,208,32 ; vmovsd 0x20(%rax,%rdx,8),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,114,255,255,255 ; je 38db <_sk_load_f16_hsw+0x21> + DB 15,132,114,255,255,255 ; je 389b <_sk_load_f16_hsw+0x21> DB 197,225,22,92,208,40 ; vmovhpd 0x28(%rax,%rdx,8),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,98,255,255,255 ; jb 38db <_sk_load_f16_hsw+0x21> + DB 15,130,98,255,255,255 ; jb 389b <_sk_load_f16_hsw+0x21> DB 197,122,126,76,208,48 ; vmovq 0x30(%rax,%rdx,8),%xmm9 - DB 233,87,255,255,255 ; jmpq 38db <_sk_load_f16_hsw+0x21> + DB 233,87,255,255,255 ; jmpq 389b <_sk_load_f16_hsw+0x21> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,74,255,255,255 ; jmpq 38db <_sk_load_f16_hsw+0x21> + DB 233,74,255,255,255 ; jmpq 389b <_sk_load_f16_hsw+0x21> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,65,255,255,255 ; jmpq 38db <_sk_load_f16_hsw+0x21> + DB 233,65,255,255,255 ; jmpq 389b <_sk_load_f16_hsw+0x21> PUBLIC _sk_gather_f16_hsw _sk_gather_f16_hsw LABEL PROC @@ -3507,7 +3494,7 @@ _sk_store_f16_hsw LABEL PROC DB 196,65,57,98,205 ; vpunpckldq %xmm13,%xmm8,%xmm9 DB 196,65,57,106,197 ; vpunpckhdq %xmm13,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,27 ; jne 3a89 <_sk_store_f16_hsw+0x65> + DB 117,27 ; jne 3a49 <_sk_store_f16_hsw+0x65> DB 197,120,17,28,208 ; vmovups %xmm11,(%rax,%rdx,8) DB 197,120,17,84,208,16 ; vmovups %xmm10,0x10(%rax,%rdx,8) DB 197,120,17,76,208,32 ; vmovups %xmm9,0x20(%rax,%rdx,8) @@ -3516,22 +3503,22 @@ _sk_store_f16_hsw LABEL PROC DB 255,224 ; jmpq *%rax DB 197,121,214,28,208 ; vmovq %xmm11,(%rax,%rdx,8) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,241 ; je 3a85 <_sk_store_f16_hsw+0x61> + DB 116,241 ; je 3a45 <_sk_store_f16_hsw+0x61> DB 197,121,23,92,208,8 ; vmovhpd %xmm11,0x8(%rax,%rdx,8) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,229 ; jb 3a85 <_sk_store_f16_hsw+0x61> + DB 114,229 ; jb 3a45 <_sk_store_f16_hsw+0x61> DB 197,121,214,84,208,16 ; vmovq %xmm10,0x10(%rax,%rdx,8) - DB 116,221 ; je 3a85 <_sk_store_f16_hsw+0x61> + DB 116,221 ; je 3a45 <_sk_store_f16_hsw+0x61> DB 197,121,23,84,208,24 ; vmovhpd %xmm10,0x18(%rax,%rdx,8) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,209 ; jb 3a85 <_sk_store_f16_hsw+0x61> + DB 114,209 ; jb 3a45 <_sk_store_f16_hsw+0x61> DB 197,121,214,76,208,32 ; vmovq %xmm9,0x20(%rax,%rdx,8) - DB 116,201 ; je 3a85 <_sk_store_f16_hsw+0x61> + DB 116,201 ; je 3a45 <_sk_store_f16_hsw+0x61> DB 197,121,23,76,208,40 ; vmovhpd %xmm9,0x28(%rax,%rdx,8) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,189 ; jb 3a85 <_sk_store_f16_hsw+0x61> + DB 114,189 ; jb 3a45 <_sk_store_f16_hsw+0x61> DB 197,121,214,68,208,48 ; vmovq %xmm8,0x30(%rax,%rdx,8) - DB 235,181 ; jmp 3a85 <_sk_store_f16_hsw+0x61> + DB 235,181 ; jmp 3a45 <_sk_store_f16_hsw+0x61> PUBLIC _sk_load_u16_be_hsw _sk_load_u16_be_hsw LABEL PROC @@ -3539,7 +3526,7 @@ _sk_load_u16_be_hsw LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,204,0,0,0 ; jne 3bb2 <_sk_load_u16_be_hsw+0xe2> + DB 15,133,204,0,0,0 ; jne 3b72 <_sk_load_u16_be_hsw+0xe2> DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8 DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2 DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3 @@ -3558,7 +3545,7 @@ _sk_load_u16_be_hsw LABEL PROC DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0 DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,21,21,21,0,0 ; vbroadcastss 0x1515(%rip),%ymm10 # 505c <_sk_callback_hsw+0x434> + DB 196,98,125,24,21,21,21,0,0 ; vbroadcastss 0x1515(%rip),%ymm10 # 501c <_sk_callback_hsw+0x434> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -3586,29 +3573,29 @@ _sk_load_u16_be_hsw LABEL PROC DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je 3c18 <_sk_load_u16_be_hsw+0x148> + DB 116,85 ; je 3bd8 <_sk_load_u16_be_hsw+0x148> DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb 3c18 <_sk_load_u16_be_hsw+0x148> + DB 114,72 ; jb 3bd8 <_sk_load_u16_be_hsw+0x148> DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je 3c25 <_sk_load_u16_be_hsw+0x155> + DB 116,72 ; je 3be5 <_sk_load_u16_be_hsw+0x155> DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb 3c25 <_sk_load_u16_be_hsw+0x155> + DB 114,59 ; jb 3be5 <_sk_load_u16_be_hsw+0x155> DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,6,255,255,255 ; je 3b01 <_sk_load_u16_be_hsw+0x31> + DB 15,132,6,255,255,255 ; je 3ac1 <_sk_load_u16_be_hsw+0x31> DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,245,254,255,255 ; jb 3b01 <_sk_load_u16_be_hsw+0x31> + DB 15,130,245,254,255,255 ; jb 3ac1 <_sk_load_u16_be_hsw+0x31> DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9 - DB 233,233,254,255,255 ; jmpq 3b01 <_sk_load_u16_be_hsw+0x31> + DB 233,233,254,255,255 ; jmpq 3ac1 <_sk_load_u16_be_hsw+0x31> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,220,254,255,255 ; jmpq 3b01 <_sk_load_u16_be_hsw+0x31> + DB 233,220,254,255,255 ; jmpq 3ac1 <_sk_load_u16_be_hsw+0x31> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,211,254,255,255 ; jmpq 3b01 <_sk_load_u16_be_hsw+0x31> + DB 233,211,254,255,255 ; jmpq 3ac1 <_sk_load_u16_be_hsw+0x31> PUBLIC _sk_load_rgb_u16_be_hsw _sk_load_rgb_u16_be_hsw LABEL PROC @@ -3616,7 +3603,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,82 ; lea (%rdx,%rdx,2),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,204,0,0,0 ; jne 3d0c <_sk_load_rgb_u16_be_hsw+0xde> + DB 15,133,204,0,0,0 ; jne 3ccc <_sk_load_rgb_u16_be_hsw+0xde> DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0 DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2 DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1 @@ -3640,7 +3627,7 @@ _sk_load_rgb_u16_be_hsw LABEL PROC DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0 DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,21,166,19,0,0 ; vbroadcastss 0x13a6(%rip),%ymm10 # 5060 <_sk_callback_hsw+0x438> + DB 196,98,125,24,21,166,19,0,0 ; vbroadcastss 0x13a6(%rip),%ymm10 # 5020 <_sk_callback_hsw+0x438> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -3657,48 +3644,48 @@ _sk_load_rgb_u16_be_hsw LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,90,19,0,0 ; vbroadcastss 0x135a(%rip),%ymm3 # 5064 <_sk_callback_hsw+0x43c> + DB 196,226,125,24,29,90,19,0,0 ; vbroadcastss 0x135a(%rip),%ymm3 # 5024 <_sk_callback_hsw+0x43c> DB 255,224 ; jmpq *%rax DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0 DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,5 ; jne 3d25 <_sk_load_rgb_u16_be_hsw+0xf7> - DB 233,79,255,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46> + DB 117,5 ; jne 3ce5 <_sk_load_rgb_u16_be_hsw+0xf7> + DB 233,79,255,255,255 ; jmpq 3c34 <_sk_load_rgb_u16_be_hsw+0x46> DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1 DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,26 ; jb 3d54 <_sk_load_rgb_u16_be_hsw+0x126> + DB 114,26 ; jb 3d14 <_sk_load_rgb_u16_be_hsw+0x126> DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1 DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 117,10 ; jne 3d59 <_sk_load_rgb_u16_be_hsw+0x12b> - DB 233,32,255,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46> - DB 233,27,255,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46> + DB 117,10 ; jne 3d19 <_sk_load_rgb_u16_be_hsw+0x12b> + DB 233,32,255,255,255 ; jmpq 3c34 <_sk_load_rgb_u16_be_hsw+0x46> + DB 233,27,255,255,255 ; jmpq 3c34 <_sk_load_rgb_u16_be_hsw+0x46> DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1 DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,26 ; jb 3d88 <_sk_load_rgb_u16_be_hsw+0x15a> + DB 114,26 ; jb 3d48 <_sk_load_rgb_u16_be_hsw+0x15a> DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1 DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 117,10 ; jne 3d8d <_sk_load_rgb_u16_be_hsw+0x15f> - DB 233,236,254,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46> - DB 233,231,254,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46> + DB 117,10 ; jne 3d4d <_sk_load_rgb_u16_be_hsw+0x15f> + DB 233,236,254,255,255 ; jmpq 3c34 <_sk_load_rgb_u16_be_hsw+0x46> + DB 233,231,254,255,255 ; jmpq 3c34 <_sk_load_rgb_u16_be_hsw+0x46> DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3 DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,20 ; jb 3db6 <_sk_load_rgb_u16_be_hsw+0x188> + DB 114,20 ; jb 3d76 <_sk_load_rgb_u16_be_hsw+0x188> DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3 DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3 - DB 233,190,254,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46> - DB 233,185,254,255,255 ; jmpq 3c74 <_sk_load_rgb_u16_be_hsw+0x46> + DB 233,190,254,255,255 ; jmpq 3c34 <_sk_load_rgb_u16_be_hsw+0x46> + DB 233,185,254,255,255 ; jmpq 3c34 <_sk_load_rgb_u16_be_hsw+0x46> PUBLIC _sk_store_u16_be_hsw _sk_store_u16_be_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax - DB 196,98,125,24,5,151,18,0,0 ; vbroadcastss 0x1297(%rip),%ymm8 # 5068 <_sk_callback_hsw+0x440> + DB 196,98,125,24,5,151,18,0,0 ; vbroadcastss 0x1297(%rip),%ymm8 # 5028 <_sk_callback_hsw+0x440> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10 @@ -3736,7 +3723,7 @@ _sk_store_u16_be_hsw LABEL PROC DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9 DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,31 ; jne 3eb5 <_sk_store_u16_be_hsw+0xfa> + DB 117,31 ; jne 3e75 <_sk_store_u16_be_hsw+0xfa> DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2) DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2) DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2) @@ -3745,31 +3732,31 @@ _sk_store_u16_be_hsw LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 3eb1 <_sk_store_u16_be_hsw+0xf6> + DB 116,240 ; je 3e71 <_sk_store_u16_be_hsw+0xf6> DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 3eb1 <_sk_store_u16_be_hsw+0xf6> + DB 114,227 ; jb 3e71 <_sk_store_u16_be_hsw+0xf6> DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2) - DB 116,218 ; je 3eb1 <_sk_store_u16_be_hsw+0xf6> + DB 116,218 ; je 3e71 <_sk_store_u16_be_hsw+0xf6> DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,205 ; jb 3eb1 <_sk_store_u16_be_hsw+0xf6> + DB 114,205 ; jb 3e71 <_sk_store_u16_be_hsw+0xf6> DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2) - DB 116,196 ; je 3eb1 <_sk_store_u16_be_hsw+0xf6> + DB 116,196 ; je 3e71 <_sk_store_u16_be_hsw+0xf6> DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,183 ; jb 3eb1 <_sk_store_u16_be_hsw+0xf6> + DB 114,183 ; jb 3e71 <_sk_store_u16_be_hsw+0xf6> DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2) - DB 235,174 ; jmp 3eb1 <_sk_store_u16_be_hsw+0xf6> + DB 235,174 ; jmp 3e71 <_sk_store_u16_be_hsw+0xf6> PUBLIC _sk_load_f32_hsw _sk_load_f32_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,131,248,7 ; cmp $0x7,%r8 - DB 119,110 ; ja 3f79 <_sk_load_f32_hsw+0x76> + DB 119,110 ; ja 3f39 <_sk_load_f32_hsw+0x76> DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 - DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # 3fa4 <_sk_load_f32_hsw+0xa1> + DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # 3f64 <_sk_load_f32_hsw+0xa1> DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax @@ -3828,7 +3815,7 @@ _sk_store_f32_hsw LABEL PROC DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8 DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11 DB 77,133,192 ; test %r8,%r8 - DB 117,55 ; jne 4031 <_sk_store_f32_hsw+0x6d> + DB 117,55 ; jne 3ff1 <_sk_store_f32_hsw+0x6d> DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -3841,22 +3828,22 @@ _sk_store_f32_hsw LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 402d <_sk_store_f32_hsw+0x69> + DB 116,240 ; je 3fed <_sk_store_f32_hsw+0x69> DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 402d <_sk_store_f32_hsw+0x69> + DB 114,227 ; jb 3fed <_sk_store_f32_hsw+0x69> DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4) - DB 116,218 ; je 402d <_sk_store_f32_hsw+0x69> + DB 116,218 ; je 3fed <_sk_store_f32_hsw+0x69> DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,205 ; jb 402d <_sk_store_f32_hsw+0x69> + DB 114,205 ; jb 3fed <_sk_store_f32_hsw+0x69> DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4) - DB 116,195 ; je 402d <_sk_store_f32_hsw+0x69> + DB 116,195 ; je 3fed <_sk_store_f32_hsw+0x69> DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,181 ; jb 402d <_sk_store_f32_hsw+0x69> + DB 114,181 ; jb 3fed <_sk_store_f32_hsw+0x69> DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4) - DB 235,171 ; jmp 402d <_sk_store_f32_hsw+0x69> + DB 235,171 ; jmp 3fed <_sk_store_f32_hsw+0x69> PUBLIC _sk_clamp_x_hsw _sk_clamp_x_hsw LABEL PROC @@ -3919,7 +3906,7 @@ _sk_mirror_x_hsw LABEL PROC DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11 DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0 DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8 - DB 197,178,89,5,37,15,0,0 ; vmulss 0xf25(%rip),%xmm9,%xmm0 # 506c <_sk_callback_hsw+0x444> + DB 197,178,89,5,37,15,0,0 ; vmulss 0xf25(%rip),%xmm9,%xmm0 # 502c <_sk_callback_hsw+0x444> DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0 DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0 DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0 @@ -3943,7 +3930,7 @@ _sk_mirror_y_hsw LABEL PROC DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11 DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1 DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8 - DB 197,178,89,13,201,14,0,0 ; vmulss 0xec9(%rip),%xmm9,%xmm1 # 5070 <_sk_callback_hsw+0x448> + DB 197,178,89,13,201,14,0,0 ; vmulss 0xec9(%rip),%xmm9,%xmm1 # 5030 <_sk_callback_hsw+0x448> DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1 DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1 DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1 @@ -3962,7 +3949,7 @@ PUBLIC _sk_clamp_x_1_hsw _sk_clamp_x_1_hsw LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,130,14,0,0 ; vbroadcastss 0xe82(%rip),%ymm8 # 5074 <_sk_callback_hsw+0x44c> + DB 196,98,125,24,5,130,14,0,0 ; vbroadcastss 0xe82(%rip),%ymm8 # 5034 <_sk_callback_hsw+0x44c> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -3976,9 +3963,9 @@ _sk_repeat_x_1_hsw LABEL PROC PUBLIC _sk_mirror_x_1_hsw _sk_mirror_x_1_hsw LABEL PROC - DB 196,98,125,24,5,101,14,0,0 ; vbroadcastss 0xe65(%rip),%ymm8 # 5078 <_sk_callback_hsw+0x450> + DB 196,98,125,24,5,101,14,0,0 ; vbroadcastss 0xe65(%rip),%ymm8 # 5038 <_sk_callback_hsw+0x450> DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,13,91,14,0,0 ; vbroadcastss 0xe5b(%rip),%ymm9 # 507c <_sk_callback_hsw+0x454> + DB 196,98,125,24,13,91,14,0,0 ; vbroadcastss 0xe5b(%rip),%ymm9 # 503c <_sk_callback_hsw+0x454> DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9 DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9 DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9 @@ -3992,11 +3979,11 @@ _sk_mirror_x_1_hsw LABEL PROC PUBLIC _sk_luminance_to_alpha_hsw _sk_luminance_to_alpha_hsw LABEL PROC - DB 196,226,125,24,29,43,14,0,0 ; vbroadcastss 0xe2b(%rip),%ymm3 # 5080 <_sk_callback_hsw+0x458> - DB 196,98,125,24,5,38,14,0,0 ; vbroadcastss 0xe26(%rip),%ymm8 # 5084 <_sk_callback_hsw+0x45c> + DB 196,226,125,24,29,43,14,0,0 ; vbroadcastss 0xe2b(%rip),%ymm3 # 5040 <_sk_callback_hsw+0x458> + DB 196,98,125,24,5,38,14,0,0 ; vbroadcastss 0xe26(%rip),%ymm8 # 5044 <_sk_callback_hsw+0x45c> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1 - DB 196,226,125,24,29,23,14,0,0 ; vbroadcastss 0xe17(%rip),%ymm3 # 5088 <_sk_callback_hsw+0x460> + DB 196,226,125,24,29,23,14,0,0 ; vbroadcastss 0xe17(%rip),%ymm3 # 5048 <_sk_callback_hsw+0x460> DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -4158,9 +4145,9 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC DB 76,139,72,8 ; mov 0x8(%rax),%r9 DB 77,137,211 ; mov %r10,%r11 DB 73,255,203 ; dec %r11 - DB 120,7 ; js 452a <_sk_evenly_spaced_gradient_hsw+0x19> + DB 120,7 ; js 44ea <_sk_evenly_spaced_gradient_hsw+0x19> DB 196,193,242,42,203 ; vcvtsi2ss %r11,%xmm1,%xmm1 - DB 235,22 ; jmp 4540 <_sk_evenly_spaced_gradient_hsw+0x2f> + DB 235,22 ; jmp 4500 <_sk_evenly_spaced_gradient_hsw+0x2f> DB 76,137,219 ; mov %r11,%rbx DB 72,209,235 ; shr %rbx DB 65,131,227,1 ; and $0x1,%r11d @@ -4171,7 +4158,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC DB 197,244,89,200 ; vmulps %ymm0,%ymm1,%ymm1 DB 197,126,91,217 ; vcvttps2dq %ymm1,%ymm11 DB 73,131,250,8 ; cmp $0x8,%r10 - DB 119,70 ; ja 4599 <_sk_evenly_spaced_gradient_hsw+0x88> + DB 119,70 ; ja 4559 <_sk_evenly_spaced_gradient_hsw+0x88> DB 196,66,37,22,1 ; vpermps (%r9),%ymm11,%ymm8 DB 72,139,88,40 ; mov 0x28(%rax),%rbx DB 196,98,37,22,11 ; vpermps (%rbx),%ymm11,%ymm9 @@ -4187,7 +4174,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC DB 196,226,37,22,27 ; vpermps (%rbx),%ymm11,%ymm3 DB 72,139,64,64 ; mov 0x40(%rax),%rax DB 196,98,37,22,40 ; vpermps (%rax),%ymm11,%ymm13 - DB 235,110 ; jmp 4607 <_sk_evenly_spaced_gradient_hsw+0xf6> + DB 235,110 ; jmp 45c7 <_sk_evenly_spaced_gradient_hsw+0xf6> DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14 DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,2,117,146,4,153 ; vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8 @@ -4222,14 +4209,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC PUBLIC _sk_gauss_a_to_rgba_hsw _sk_gauss_a_to_rgba_hsw LABEL PROC - DB 196,226,125,24,5,95,10,0,0 ; vbroadcastss 0xa5f(%rip),%ymm0 # 508c <_sk_callback_hsw+0x464> - DB 196,226,125,24,13,90,10,0,0 ; vbroadcastss 0xa5a(%rip),%ymm1 # 5090 <_sk_callback_hsw+0x468> + DB 196,226,125,24,5,95,10,0,0 ; vbroadcastss 0xa5f(%rip),%ymm0 # 504c <_sk_callback_hsw+0x464> + DB 196,226,125,24,13,90,10,0,0 ; vbroadcastss 0xa5a(%rip),%ymm1 # 5050 <_sk_callback_hsw+0x468> DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1 - DB 196,226,125,24,5,80,10,0,0 ; vbroadcastss 0xa50(%rip),%ymm0 # 5094 <_sk_callback_hsw+0x46c> + DB 196,226,125,24,5,80,10,0,0 ; vbroadcastss 0xa50(%rip),%ymm0 # 5054 <_sk_callback_hsw+0x46c> DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0 - DB 196,226,125,24,13,70,10,0,0 ; vbroadcastss 0xa46(%rip),%ymm1 # 5098 <_sk_callback_hsw+0x470> + DB 196,226,125,24,13,70,10,0,0 ; vbroadcastss 0xa46(%rip),%ymm1 # 5058 <_sk_callback_hsw+0x470> DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1 - DB 196,226,125,24,5,60,10,0,0 ; vbroadcastss 0xa3c(%rip),%ymm0 # 509c <_sk_callback_hsw+0x474> + DB 196,226,125,24,5,60,10,0,0 ; vbroadcastss 0xa3c(%rip),%ymm0 # 505c <_sk_callback_hsw+0x474> DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 @@ -4242,11 +4229,11 @@ _sk_gradient_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 73,131,249,1 ; cmp $0x1,%r9 - DB 15,134,180,0,0,0 ; jbe 4738 <_sk_gradient_hsw+0xc3> + DB 15,134,180,0,0,0 ; jbe 46f8 <_sk_gradient_hsw+0xc3> DB 76,139,80,72 ; mov 0x48(%rax),%r10 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 65,187,1,0,0,0 ; mov $0x1,%r11d - DB 196,226,125,24,21,5,10,0,0 ; vbroadcastss 0xa05(%rip),%ymm2 # 50a0 <_sk_callback_hsw+0x478> + DB 196,226,125,24,21,5,10,0,0 ; vbroadcastss 0xa05(%rip),%ymm2 # 5060 <_sk_callback_hsw+0x478> DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9 DB 196,130,125,24,28,154 ; vbroadcastss (%r10,%r11,4),%ymm3 DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3 @@ -4254,10 +4241,10 @@ _sk_gradient_hsw LABEL PROC DB 196,65,101,254,201 ; vpaddd %ymm9,%ymm3,%ymm9 DB 73,255,195 ; inc %r11 DB 77,57,217 ; cmp %r11,%r9 - DB 117,226 ; jne 46a0 <_sk_gradient_hsw+0x2b> + DB 117,226 ; jne 4660 <_sk_gradient_hsw+0x2b> DB 76,139,80,8 ; mov 0x8(%rax),%r10 DB 73,131,249,8 ; cmp $0x8,%r9 - DB 118,121 ; jbe 4741 <_sk_gradient_hsw+0xcc> + DB 118,121 ; jbe 4701 <_sk_gradient_hsw+0xcc> DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14 DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1 DB 196,2,117,146,4,138 ; vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8 @@ -4281,7 +4268,7 @@ _sk_gradient_hsw LABEL PROC DB 196,130,21,146,28,137 ; vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3 DB 72,139,64,64 ; mov 0x40(%rax),%rax DB 196,34,13,146,44,136 ; vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13 - DB 235,77 ; jmp 4785 <_sk_gradient_hsw+0x110> + DB 235,77 ; jmp 4745 <_sk_gradient_hsw+0x110> DB 76,139,80,8 ; mov 0x8(%rax),%r10 DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9 DB 196,66,53,22,2 ; vpermps (%r10),%ymm9,%ymm8 @@ -4337,24 +4324,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12 DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11 DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12 - DB 196,98,125,24,45,132,8,0,0 ; vbroadcastss 0x884(%rip),%ymm13 # 50a4 <_sk_callback_hsw+0x47c> - DB 196,98,125,24,53,127,8,0,0 ; vbroadcastss 0x87f(%rip),%ymm14 # 50a8 <_sk_callback_hsw+0x480> + DB 196,98,125,24,45,132,8,0,0 ; vbroadcastss 0x884(%rip),%ymm13 # 5064 <_sk_callback_hsw+0x47c> + DB 196,98,125,24,53,127,8,0,0 ; vbroadcastss 0x87f(%rip),%ymm14 # 5068 <_sk_callback_hsw+0x480> DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14 - DB 196,98,125,24,45,117,8,0,0 ; vbroadcastss 0x875(%rip),%ymm13 # 50ac <_sk_callback_hsw+0x484> + DB 196,98,125,24,45,117,8,0,0 ; vbroadcastss 0x875(%rip),%ymm13 # 506c <_sk_callback_hsw+0x484> DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13 - DB 196,98,125,24,53,107,8,0,0 ; vbroadcastss 0x86b(%rip),%ymm14 # 50b0 <_sk_callback_hsw+0x488> + DB 196,98,125,24,53,107,8,0,0 ; vbroadcastss 0x86b(%rip),%ymm14 # 5070 <_sk_callback_hsw+0x488> DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14 DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11 DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,21,86,8,0,0 ; vbroadcastss 0x856(%rip),%ymm10 # 50b4 <_sk_callback_hsw+0x48c> + DB 196,98,125,24,21,86,8,0,0 ; vbroadcastss 0x856(%rip),%ymm10 # 5074 <_sk_callback_hsw+0x48c> DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10 DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9 DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,21,64,8,0,0 ; vbroadcastss 0x840(%rip),%ymm10 # 50b8 <_sk_callback_hsw+0x490> + DB 196,98,125,24,21,64,8,0,0 ; vbroadcastss 0x840(%rip),%ymm10 # 5078 <_sk_callback_hsw+0x490> DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9 - DB 196,98,125,24,21,42,8,0,0 ; vbroadcastss 0x82a(%rip),%ymm10 # 50bc <_sk_callback_hsw+0x494> + DB 196,98,125,24,21,42,8,0,0 ; vbroadcastss 0x82a(%rip),%ymm10 # 507c <_sk_callback_hsw+0x494> DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10 DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0 DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9 @@ -4373,7 +4360,7 @@ _sk_xy_to_radius_hsw LABEL PROC PUBLIC _sk_save_xy_hsw _sk_save_xy_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,247,7,0,0 ; vbroadcastss 0x7f7(%rip),%ymm8 # 50c0 <_sk_callback_hsw+0x498> + DB 196,98,125,24,5,247,7,0,0 ; vbroadcastss 0x7f7(%rip),%ymm8 # 5080 <_sk_callback_hsw+0x498> DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9 DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10 DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9 @@ -4403,9 +4390,9 @@ _sk_accumulate_hsw LABEL PROC PUBLIC _sk_bilinear_nx_hsw _sk_bilinear_nx_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,139,7,0,0 ; vbroadcastss 0x78b(%rip),%ymm0 # 50c4 <_sk_callback_hsw+0x49c> + DB 196,226,125,24,5,139,7,0,0 ; vbroadcastss 0x78b(%rip),%ymm0 # 5084 <_sk_callback_hsw+0x49c> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,130,7,0,0 ; vbroadcastss 0x782(%rip),%ymm8 # 50c8 <_sk_callback_hsw+0x4a0> + DB 196,98,125,24,5,130,7,0,0 ; vbroadcastss 0x782(%rip),%ymm8 # 5088 <_sk_callback_hsw+0x4a0> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -4414,7 +4401,7 @@ _sk_bilinear_nx_hsw LABEL PROC PUBLIC _sk_bilinear_px_hsw _sk_bilinear_px_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,106,7,0,0 ; vbroadcastss 0x76a(%rip),%ymm0 # 50cc <_sk_callback_hsw+0x4a4> + DB 196,226,125,24,5,106,7,0,0 ; vbroadcastss 0x76a(%rip),%ymm0 # 508c <_sk_callback_hsw+0x4a4> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -4424,9 +4411,9 @@ _sk_bilinear_px_hsw LABEL PROC PUBLIC _sk_bilinear_ny_hsw _sk_bilinear_ny_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,78,7,0,0 ; vbroadcastss 0x74e(%rip),%ymm1 # 50d0 <_sk_callback_hsw+0x4a8> + DB 196,226,125,24,13,78,7,0,0 ; vbroadcastss 0x74e(%rip),%ymm1 # 5090 <_sk_callback_hsw+0x4a8> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,68,7,0,0 ; vbroadcastss 0x744(%rip),%ymm8 # 50d4 <_sk_callback_hsw+0x4ac> + DB 196,98,125,24,5,68,7,0,0 ; vbroadcastss 0x744(%rip),%ymm8 # 5094 <_sk_callback_hsw+0x4ac> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -4435,7 +4422,7 @@ _sk_bilinear_ny_hsw LABEL PROC PUBLIC _sk_bilinear_py_hsw _sk_bilinear_py_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,44,7,0,0 ; vbroadcastss 0x72c(%rip),%ymm1 # 50d8 <_sk_callback_hsw+0x4b0> + DB 196,226,125,24,13,44,7,0,0 ; vbroadcastss 0x72c(%rip),%ymm1 # 5098 <_sk_callback_hsw+0x4b0> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -4445,13 +4432,13 @@ _sk_bilinear_py_hsw LABEL PROC PUBLIC _sk_bicubic_n3x_hsw _sk_bicubic_n3x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,15,7,0,0 ; vbroadcastss 0x70f(%rip),%ymm0 # 50dc <_sk_callback_hsw+0x4b4> + DB 196,226,125,24,5,15,7,0,0 ; vbroadcastss 0x70f(%rip),%ymm0 # 509c <_sk_callback_hsw+0x4b4> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,6,7,0,0 ; vbroadcastss 0x706(%rip),%ymm8 # 50e0 <_sk_callback_hsw+0x4b8> + DB 196,98,125,24,5,6,7,0,0 ; vbroadcastss 0x706(%rip),%ymm8 # 50a0 <_sk_callback_hsw+0x4b8> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,247,6,0,0 ; vbroadcastss 0x6f7(%rip),%ymm10 # 50e4 <_sk_callback_hsw+0x4bc> - DB 196,98,125,24,29,242,6,0,0 ; vbroadcastss 0x6f2(%rip),%ymm11 # 50e8 <_sk_callback_hsw+0x4c0> + DB 196,98,125,24,21,247,6,0,0 ; vbroadcastss 0x6f7(%rip),%ymm10 # 50a4 <_sk_callback_hsw+0x4bc> + DB 196,98,125,24,29,242,6,0,0 ; vbroadcastss 0x6f2(%rip),%ymm11 # 50a8 <_sk_callback_hsw+0x4c0> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -4461,16 +4448,16 @@ _sk_bicubic_n3x_hsw LABEL PROC PUBLIC _sk_bicubic_n1x_hsw _sk_bicubic_n1x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,213,6,0,0 ; vbroadcastss 0x6d5(%rip),%ymm0 # 50ec <_sk_callback_hsw+0x4c4> + DB 196,226,125,24,5,213,6,0,0 ; vbroadcastss 0x6d5(%rip),%ymm0 # 50ac <_sk_callback_hsw+0x4c4> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,204,6,0,0 ; vbroadcastss 0x6cc(%rip),%ymm8 # 50f0 <_sk_callback_hsw+0x4c8> + DB 196,98,125,24,5,204,6,0,0 ; vbroadcastss 0x6cc(%rip),%ymm8 # 50b0 <_sk_callback_hsw+0x4c8> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm9 # 50f4 <_sk_callback_hsw+0x4cc> - DB 196,98,125,24,21,189,6,0,0 ; vbroadcastss 0x6bd(%rip),%ymm10 # 50f8 <_sk_callback_hsw+0x4d0> + DB 196,98,125,24,13,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm9 # 50b4 <_sk_callback_hsw+0x4cc> + DB 196,98,125,24,21,189,6,0,0 ; vbroadcastss 0x6bd(%rip),%ymm10 # 50b8 <_sk_callback_hsw+0x4d0> DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,13,179,6,0,0 ; vbroadcastss 0x6b3(%rip),%ymm9 # 50fc <_sk_callback_hsw+0x4d4> + DB 196,98,125,24,13,179,6,0,0 ; vbroadcastss 0x6b3(%rip),%ymm9 # 50bc <_sk_callback_hsw+0x4d4> DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9 - DB 196,98,125,24,21,169,6,0,0 ; vbroadcastss 0x6a9(%rip),%ymm10 # 5100 <_sk_callback_hsw+0x4d8> + DB 196,98,125,24,21,169,6,0,0 ; vbroadcastss 0x6a9(%rip),%ymm10 # 50c0 <_sk_callback_hsw+0x4d8> DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10 DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -4479,14 +4466,14 @@ _sk_bicubic_n1x_hsw LABEL PROC PUBLIC _sk_bicubic_p1x_hsw _sk_bicubic_p1x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,145,6,0,0 ; vbroadcastss 0x691(%rip),%ymm8 # 5104 <_sk_callback_hsw+0x4dc> + DB 196,98,125,24,5,145,6,0,0 ; vbroadcastss 0x691(%rip),%ymm8 # 50c4 <_sk_callback_hsw+0x4dc> DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0 DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9 - DB 196,98,125,24,21,131,6,0,0 ; vbroadcastss 0x683(%rip),%ymm10 # 5108 <_sk_callback_hsw+0x4e0> - DB 196,98,125,24,29,126,6,0,0 ; vbroadcastss 0x67e(%rip),%ymm11 # 510c <_sk_callback_hsw+0x4e4> + DB 196,98,125,24,21,131,6,0,0 ; vbroadcastss 0x683(%rip),%ymm10 # 50c8 <_sk_callback_hsw+0x4e0> + DB 196,98,125,24,29,126,6,0,0 ; vbroadcastss 0x67e(%rip),%ymm11 # 50cc <_sk_callback_hsw+0x4e4> DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11 DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11 - DB 196,98,125,24,5,111,6,0,0 ; vbroadcastss 0x66f(%rip),%ymm8 # 5110 <_sk_callback_hsw+0x4e8> + DB 196,98,125,24,5,111,6,0,0 ; vbroadcastss 0x66f(%rip),%ymm8 # 50d0 <_sk_callback_hsw+0x4e8> DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -4495,12 +4482,12 @@ _sk_bicubic_p1x_hsw LABEL PROC PUBLIC _sk_bicubic_p3x_hsw _sk_bicubic_p3x_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,87,6,0,0 ; vbroadcastss 0x657(%rip),%ymm0 # 5114 <_sk_callback_hsw+0x4ec> + DB 196,226,125,24,5,87,6,0,0 ; vbroadcastss 0x657(%rip),%ymm0 # 50d4 <_sk_callback_hsw+0x4ec> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,68,6,0,0 ; vbroadcastss 0x644(%rip),%ymm10 # 5118 <_sk_callback_hsw+0x4f0> - DB 196,98,125,24,29,63,6,0,0 ; vbroadcastss 0x63f(%rip),%ymm11 # 511c <_sk_callback_hsw+0x4f4> + DB 196,98,125,24,21,68,6,0,0 ; vbroadcastss 0x644(%rip),%ymm10 # 50d8 <_sk_callback_hsw+0x4f0> + DB 196,98,125,24,29,63,6,0,0 ; vbroadcastss 0x63f(%rip),%ymm11 # 50dc <_sk_callback_hsw+0x4f4> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -4510,13 +4497,13 @@ _sk_bicubic_p3x_hsw LABEL PROC PUBLIC _sk_bicubic_n3y_hsw _sk_bicubic_n3y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,34,6,0,0 ; vbroadcastss 0x622(%rip),%ymm1 # 5120 <_sk_callback_hsw+0x4f8> + DB 196,226,125,24,13,34,6,0,0 ; vbroadcastss 0x622(%rip),%ymm1 # 50e0 <_sk_callback_hsw+0x4f8> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,24,6,0,0 ; vbroadcastss 0x618(%rip),%ymm8 # 5124 <_sk_callback_hsw+0x4fc> + DB 196,98,125,24,5,24,6,0,0 ; vbroadcastss 0x618(%rip),%ymm8 # 50e4 <_sk_callback_hsw+0x4fc> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,9,6,0,0 ; vbroadcastss 0x609(%rip),%ymm10 # 5128 <_sk_callback_hsw+0x500> - DB 196,98,125,24,29,4,6,0,0 ; vbroadcastss 0x604(%rip),%ymm11 # 512c <_sk_callback_hsw+0x504> + DB 196,98,125,24,21,9,6,0,0 ; vbroadcastss 0x609(%rip),%ymm10 # 50e8 <_sk_callback_hsw+0x500> + DB 196,98,125,24,29,4,6,0,0 ; vbroadcastss 0x604(%rip),%ymm11 # 50ec <_sk_callback_hsw+0x504> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -4526,16 +4513,16 @@ _sk_bicubic_n3y_hsw LABEL PROC PUBLIC _sk_bicubic_n1y_hsw _sk_bicubic_n1y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,231,5,0,0 ; vbroadcastss 0x5e7(%rip),%ymm1 # 5130 <_sk_callback_hsw+0x508> + DB 196,226,125,24,13,231,5,0,0 ; vbroadcastss 0x5e7(%rip),%ymm1 # 50f0 <_sk_callback_hsw+0x508> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,221,5,0,0 ; vbroadcastss 0x5dd(%rip),%ymm8 # 5134 <_sk_callback_hsw+0x50c> + DB 196,98,125,24,5,221,5,0,0 ; vbroadcastss 0x5dd(%rip),%ymm8 # 50f4 <_sk_callback_hsw+0x50c> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,211,5,0,0 ; vbroadcastss 0x5d3(%rip),%ymm9 # 5138 <_sk_callback_hsw+0x510> - DB 196,98,125,24,21,206,5,0,0 ; vbroadcastss 0x5ce(%rip),%ymm10 # 513c <_sk_callback_hsw+0x514> + DB 196,98,125,24,13,211,5,0,0 ; vbroadcastss 0x5d3(%rip),%ymm9 # 50f8 <_sk_callback_hsw+0x510> + DB 196,98,125,24,21,206,5,0,0 ; vbroadcastss 0x5ce(%rip),%ymm10 # 50fc <_sk_callback_hsw+0x514> DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,13,196,5,0,0 ; vbroadcastss 0x5c4(%rip),%ymm9 # 5140 <_sk_callback_hsw+0x518> + DB 196,98,125,24,13,196,5,0,0 ; vbroadcastss 0x5c4(%rip),%ymm9 # 5100 <_sk_callback_hsw+0x518> DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9 - DB 196,98,125,24,21,186,5,0,0 ; vbroadcastss 0x5ba(%rip),%ymm10 # 5144 <_sk_callback_hsw+0x51c> + DB 196,98,125,24,21,186,5,0,0 ; vbroadcastss 0x5ba(%rip),%ymm10 # 5104 <_sk_callback_hsw+0x51c> DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10 DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -4544,14 +4531,14 @@ _sk_bicubic_n1y_hsw LABEL PROC PUBLIC _sk_bicubic_p1y_hsw _sk_bicubic_p1y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,162,5,0,0 ; vbroadcastss 0x5a2(%rip),%ymm8 # 5148 <_sk_callback_hsw+0x520> + DB 196,98,125,24,5,162,5,0,0 ; vbroadcastss 0x5a2(%rip),%ymm8 # 5108 <_sk_callback_hsw+0x520> DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1 DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9 - DB 196,98,125,24,21,147,5,0,0 ; vbroadcastss 0x593(%rip),%ymm10 # 514c <_sk_callback_hsw+0x524> - DB 196,98,125,24,29,142,5,0,0 ; vbroadcastss 0x58e(%rip),%ymm11 # 5150 <_sk_callback_hsw+0x528> + DB 196,98,125,24,21,147,5,0,0 ; vbroadcastss 0x593(%rip),%ymm10 # 510c <_sk_callback_hsw+0x524> + DB 196,98,125,24,29,142,5,0,0 ; vbroadcastss 0x58e(%rip),%ymm11 # 5110 <_sk_callback_hsw+0x528> DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11 DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11 - DB 196,98,125,24,5,127,5,0,0 ; vbroadcastss 0x57f(%rip),%ymm8 # 5154 <_sk_callback_hsw+0x52c> + DB 196,98,125,24,5,127,5,0,0 ; vbroadcastss 0x57f(%rip),%ymm8 # 5114 <_sk_callback_hsw+0x52c> DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -4560,12 +4547,12 @@ _sk_bicubic_p1y_hsw LABEL PROC PUBLIC _sk_bicubic_p3y_hsw _sk_bicubic_p3y_hsw LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,103,5,0,0 ; vbroadcastss 0x567(%rip),%ymm1 # 5158 <_sk_callback_hsw+0x530> + DB 196,226,125,24,13,103,5,0,0 ; vbroadcastss 0x567(%rip),%ymm1 # 5118 <_sk_callback_hsw+0x530> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,83,5,0,0 ; vbroadcastss 0x553(%rip),%ymm10 # 515c <_sk_callback_hsw+0x534> - DB 196,98,125,24,29,78,5,0,0 ; vbroadcastss 0x54e(%rip),%ymm11 # 5160 <_sk_callback_hsw+0x538> + DB 196,98,125,24,21,83,5,0,0 ; vbroadcastss 0x553(%rip),%ymm10 # 511c <_sk_callback_hsw+0x534> + DB 196,98,125,24,29,78,5,0,0 ; vbroadcastss 0x54e(%rip),%ymm11 # 5120 <_sk_callback_hsw+0x538> DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11 DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -4687,25 +4674,25 @@ ALIGN 4 DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 4e05 <.literal4+0xb1> + DB 71,225,61 ; rex.RXB loope 4dc5 <.literal4+0xb1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 4e15 <.literal4+0xc1> + DB 71,225,61 ; rex.RXB loope 4dd5 <.literal4+0xc1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 4e25 <.literal4+0xd1> + DB 71,225,61 ; rex.RXB loope 4de5 <.literal4+0xd1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 4e35 <.literal4+0xe1> + DB 71,225,61 ; rex.RXB loope 4df5 <.literal4+0xe1> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax) @@ -4755,7 +4742,7 @@ ALIGN 4 DB 190,129,128,128,59 ; mov $0x3b808081,%esi DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 4e8d <.literal4+0x139> + DB 224,7 ; loopne 4e4d <.literal4+0x139> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -4771,10 +4758,10 @@ ALIGN 4 DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax) DB 0,52,255 ; add %dh,(%rdi,%rdi,8) DB 255 ; (bad) - DB 127,0 ; jg 4eb4 <.literal4+0x160> + DB 127,0 ; jg 4e74 <.literal4+0x160> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 4f2d <.literal4+0x1d9> + DB 119,115 ; ja 4eed <.literal4+0x1d9> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -4788,10 +4775,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 4ee8 <.literal4+0x194> + DB 127,0 ; jg 4ea8 <.literal4+0x194> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 4f61 <.literal4+0x20d> + DB 119,115 ; ja 4f21 <.literal4+0x20d> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -4805,10 +4792,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 4f1c <.literal4+0x1c8> + DB 127,0 ; jg 4edc <.literal4+0x1c8> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 4f95 <.literal4+0x241> + DB 119,115 ; ja 4f55 <.literal4+0x241> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -4822,10 +4809,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 4f50 <.literal4+0x1fc> + DB 127,0 ; jg 4f10 <.literal4+0x1fc> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 4fc9 <.literal4+0x275> + DB 119,115 ; ja 4f89 <.literal4+0x275> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -4838,7 +4825,7 @@ ALIGN 4 DB 0,75,0 ; add %cl,0x0(%rbx) DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax) DB 66,0,0 ; rex.X add %al,(%rax) - DB 127,67 ; jg 4fc7 <.literal4+0x273> + DB 127,67 ; jg 4f87 <.literal4+0x273> DB 0,0 ; add %al,(%rax) DB 0,195 ; add %al,%bl DB 0,0 ; add %al,(%rax) @@ -4850,10 +4837,10 @@ ALIGN 4 DB 190,80,128,3,62 ; mov $0x3e038050,%esi DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 4fe7 <.literal4+0x293> + DB 118,63 ; jbe 4fa7 <.literal4+0x293> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax) - DB 127,67 ; jg 4ffb <.literal4+0x2a7> + DB 127,67 ; jg 4fbb <.literal4+0x2a7> DB 129,128,128,59,0,0,128,63,129,128 ; addl $0x80813f80,0x3b80(%rax) DB 128,59,0 ; cmpb $0x0,(%rbx) DB 0,128,63,129,128,128 ; add %al,-0x7f7f7ec1(%rax) @@ -4862,7 +4849,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 4fdd <.literal4+0x289> + DB 224,7 ; loopne 4f9d <.literal4+0x289> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -4874,7 +4861,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 4ff9 <.literal4+0x2a5> + DB 224,7 ; loopne 4fb9 <.literal4+0x2a5> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -4885,7 +4872,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 504e <.literal4+0x2fa> + DB 124,66 ; jl 500e <.literal4+0x2fa> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax) @@ -4903,9 +4890,9 @@ ALIGN 4 DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax) DB 0,0 ; add %al,(%rax) DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax) - DB 112,65 ; jo 5091 <.literal4+0x33d> + DB 112,65 ; jo 5051 <.literal4+0x33d> DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax) - DB 127,67 ; jg 509f <.literal4+0x34b> + DB 127,67 ; jg 505f <.literal4+0x34b> DB 128,0,128 ; addb $0x80,(%rax) DB 55 ; (bad) DB 128,0,128 ; addb $0x80,(%rax) @@ -4913,7 +4900,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 255 ; (bad) - DB 127,71 ; jg 50b3 <.literal4+0x35f> + DB 127,71 ; jg 5073 <.literal4+0x35f> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -5025,16 +5012,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0051a8 <_sk_callback_hsw+0xa000580> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005168 <_sk_callback_hsw+0xa000580> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120051b0 <_sk_callback_hsw+0x12000588> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005170 <_sk_callback_hsw+0x12000588> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0051b8 <_sk_callback_hsw+0x1a000590> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005178 <_sk_callback_hsw+0x1a000590> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30051c0 <_sk_callback_hsw+0x3000598> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005180 <_sk_callback_hsw+0x3000598> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5077,16 +5064,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005208 <_sk_callback_hsw+0xa0005e0> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0051c8 <_sk_callback_hsw+0xa0005e0> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005210 <_sk_callback_hsw+0x120005e8> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120051d0 <_sk_callback_hsw+0x120005e8> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005218 <_sk_callback_hsw+0x1a0005f0> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0051d8 <_sk_callback_hsw+0x1a0005f0> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005220 <_sk_callback_hsw+0x30005f8> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30051e0 <_sk_callback_hsw+0x30005f8> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5129,16 +5116,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005268 <_sk_callback_hsw+0xa000640> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005228 <_sk_callback_hsw+0xa000640> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005270 <_sk_callback_hsw+0x12000648> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005230 <_sk_callback_hsw+0x12000648> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005278 <_sk_callback_hsw+0x1a000650> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005238 <_sk_callback_hsw+0x1a000650> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005280 <_sk_callback_hsw+0x3000658> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005240 <_sk_callback_hsw+0x3000658> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5181,16 +5168,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0052c8 <_sk_callback_hsw+0xa0006a0> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005288 <_sk_callback_hsw+0xa0006a0> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120052d0 <_sk_callback_hsw+0x120006a8> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005290 <_sk_callback_hsw+0x120006a8> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0052d8 <_sk_callback_hsw+0x1a0006b0> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005298 <_sk_callback_hsw+0x1a0006b0> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30052e0 <_sk_callback_hsw+0x30006b8> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 30052a0 <_sk_callback_hsw+0x30006b8> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5233,16 +5220,16 @@ ALIGN 32 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005328 <_sk_callback_hsw+0xa000700> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0052e8 <_sk_callback_hsw+0xa000700> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 12005330 <_sk_callback_hsw+0x12000708> + DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 120052f0 <_sk_callback_hsw+0x12000708> DB 255 ; (bad) DB 255 ; (bad) - DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a005338 <_sk_callback_hsw+0x1a000710> + DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a0052f8 <_sk_callback_hsw+0x1a000710> DB 255 ; (bad) DB 255 ; (bad) - DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005340 <_sk_callback_hsw+0x3000718> + DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 3005300 <_sk_callback_hsw+0x3000718> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -5358,50 +5345,34 @@ _sk_start_pipeline_avx LABEL PROC DB 197,248,41,189,48,255,255,255 ; vmovaps %xmm7,-0xd0(%rbp) DB 197,248,41,181,32,255,255,255 ; vmovaps %xmm6,-0xe0(%rbp) DB 72,137,211 ; mov %rdx,%rbx - DB 73,137,207 ; mov %rcx,%r15 + DB 73,137,204 ; mov %rcx,%r12 DB 76,139,117,48 ; mov 0x30(%rbp),%r14 DB 76,137,206 ; mov %r9,%rsi DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,197 ; mov %rax,%r13 - DB 73,137,244 ; mov %rsi,%r12 - DB 73,141,79,8 ; lea 0x8(%r15),%rcx + DB 73,137,247 ; mov %rsi,%r15 + DB 73,141,76,36,8 ; lea 0x8(%r12),%rcx DB 76,57,193 ; cmp %r8,%rcx - DB 118,5 ; jbe 7d <_sk_start_pipeline_avx+0x7d> - DB 76,137,250 ; mov %r15,%rdx - DB 235,83 ; jmp d0 <_sk_start_pipeline_avx+0xd0> + DB 118,5 ; jbe 7e <_sk_start_pipeline_avx+0x7e> + DB 76,137,226 ; mov %r12,%rdx + DB 235,49 ; jmp af <_sk_start_pipeline_avx+0xaf> DB 76,137,133,24,255,255,255 ; mov %r8,-0xe8(%rbp) - DB 65,184,0,0,0,0 ; mov $0x0,%r8d - DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 - DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 - DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2 - DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 - DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 - DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 - DB 197,204,87,246 ; vxorps %ymm6,%ymm6,%ymm6 - DB 197,196,87,255 ; vxorps %ymm7,%ymm7,%ymm7 + DB 69,49,192 ; xor %r8d,%r8d DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi - DB 76,137,250 ; mov %r15,%rdx + DB 76,137,254 ; mov %r15,%rsi + DB 76,137,226 ; mov %r12,%rdx DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 76,139,133,24,255,255,255 ; mov -0xe8(%rbp),%r8 - DB 73,141,87,8 ; lea 0x8(%r15),%rdx - DB 73,131,199,16 ; add $0x10,%r15 - DB 77,57,199 ; cmp %r8,%r15 - DB 73,137,215 ; mov %rdx,%r15 - DB 118,180 ; jbe 84 <_sk_start_pipeline_avx+0x84> + DB 73,141,84,36,8 ; lea 0x8(%r12),%rdx + DB 73,131,196,16 ; add $0x10,%r12 + DB 77,57,196 ; cmp %r8,%r12 + DB 73,137,212 ; mov %rdx,%r12 + DB 118,214 ; jbe 85 <_sk_start_pipeline_avx+0x85> DB 73,41,208 ; sub %rdx,%r8 - DB 116,44 ; je 101 <_sk_start_pipeline_avx+0x101> - DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 - DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 - DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2 - DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 - DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 - DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 - DB 197,204,87,246 ; vxorps %ymm6,%ymm6,%ymm6 - DB 197,196,87,255 ; vxorps %ymm7,%ymm7,%ymm7 + DB 116,12 ; je c0 <_sk_start_pipeline_avx+0xc0> DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi + DB 76,137,254 ; mov %r15,%rsi DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6 @@ -5436,7 +5407,7 @@ _sk_seed_shader_avx LABEL PROC DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,55,104,0,0 ; vbroadcastss 0x6837(%rip),%ymm1 # 69b0 <_sk_callback_avx+0x12a> + DB 196,226,125,24,13,56,104,0,0 ; vbroadcastss 0x6838(%rip),%ymm1 # 6970 <_sk_callback_avx+0x12a> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0 DB 197,249,110,209 ; vmovd %ecx,%xmm2 @@ -5445,7 +5416,7 @@ _sk_seed_shader_avx LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,21,17,104,0,0 ; vbroadcastss 0x6811(%rip),%ymm2 # 69b4 <_sk_callback_avx+0x12e> + DB 196,226,125,24,21,18,104,0,0 ; vbroadcastss 0x6812(%rip),%ymm2 # 6974 <_sk_callback_avx+0x12e> DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 @@ -5467,7 +5438,7 @@ _sk_dither_avx LABEL PROC DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9 DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9 DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10 - DB 196,98,125,24,29,186,103,0,0 ; vbroadcastss 0x67ba(%rip),%ymm11 # 69b8 <_sk_callback_avx+0x132> + DB 196,98,125,24,29,187,103,0,0 ; vbroadcastss 0x67bb(%rip),%ymm11 # 6978 <_sk_callback_avx+0x132> DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9 DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12 DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9 @@ -5478,8 +5449,8 @@ _sk_dither_avx LABEL PROC DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11 DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11 DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11 - DB 196,98,125,24,37,123,103,0,0 ; vbroadcastss 0x677b(%rip),%ymm12 # 69bc <_sk_callback_avx+0x136> - DB 196,98,125,24,45,118,103,0,0 ; vbroadcastss 0x6776(%rip),%ymm13 # 69c0 <_sk_callback_avx+0x13a> + DB 196,98,125,24,37,124,103,0,0 ; vbroadcastss 0x677c(%rip),%ymm12 # 697c <_sk_callback_avx+0x136> + DB 196,98,125,24,45,119,103,0,0 ; vbroadcastss 0x6777(%rip),%ymm13 # 6980 <_sk_callback_avx+0x13a> DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14 DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15 DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14 @@ -5506,9 +5477,9 @@ _sk_dither_avx LABEL PROC DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8 DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,225,102,0,0 ; vbroadcastss 0x66e1(%rip),%ymm9 # 69c4 <_sk_callback_avx+0x13e> + DB 196,98,125,24,13,226,102,0,0 ; vbroadcastss 0x66e2(%rip),%ymm9 # 6984 <_sk_callback_avx+0x13e> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 - DB 196,98,125,24,13,215,102,0,0 ; vbroadcastss 0x66d7(%rip),%ymm9 # 69c8 <_sk_callback_avx+0x142> + DB 196,98,125,24,13,216,102,0,0 ; vbroadcastss 0x66d8(%rip),%ymm9 # 6988 <_sk_callback_avx+0x142> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 @@ -5567,7 +5538,7 @@ _sk_clear_avx LABEL PROC PUBLIC _sk_srcatop_avx _sk_srcatop_avx LABEL PROC DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0 - DB 196,98,125,24,5,47,102,0,0 ; vbroadcastss 0x662f(%rip),%ymm8 # 69cc <_sk_callback_avx+0x146> + DB 196,98,125,24,5,48,102,0,0 ; vbroadcastss 0x6630(%rip),%ymm8 # 698c <_sk_callback_avx+0x146> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9 DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0 @@ -5586,7 +5557,7 @@ _sk_srcatop_avx LABEL PROC PUBLIC _sk_dstatop_avx _sk_dstatop_avx LABEL PROC DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8 - DB 196,98,125,24,13,241,101,0,0 ; vbroadcastss 0x65f1(%rip),%ymm9 # 69d0 <_sk_callback_avx+0x14a> + DB 196,98,125,24,13,242,101,0,0 ; vbroadcastss 0x65f2(%rip),%ymm9 # 6990 <_sk_callback_avx+0x14a> DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9 DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0 @@ -5622,7 +5593,7 @@ _sk_dstin_avx LABEL PROC PUBLIC _sk_srcout_avx _sk_srcout_avx LABEL PROC - DB 196,98,125,24,5,144,101,0,0 ; vbroadcastss 0x6590(%rip),%ymm8 # 69d4 <_sk_callback_avx+0x14e> + DB 196,98,125,24,5,145,101,0,0 ; vbroadcastss 0x6591(%rip),%ymm8 # 6994 <_sk_callback_avx+0x14e> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -5633,7 +5604,7 @@ _sk_srcout_avx LABEL PROC PUBLIC _sk_dstout_avx _sk_dstout_avx LABEL PROC - DB 196,226,125,24,5,115,101,0,0 ; vbroadcastss 0x6573(%rip),%ymm0 # 69d8 <_sk_callback_avx+0x152> + DB 196,226,125,24,5,116,101,0,0 ; vbroadcastss 0x6574(%rip),%ymm0 # 6998 <_sk_callback_avx+0x152> DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3 DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0 DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1 @@ -5644,7 +5615,7 @@ _sk_dstout_avx LABEL PROC PUBLIC _sk_srcover_avx _sk_srcover_avx LABEL PROC - DB 196,98,125,24,5,86,101,0,0 ; vbroadcastss 0x6556(%rip),%ymm8 # 69dc <_sk_callback_avx+0x156> + DB 196,98,125,24,5,87,101,0,0 ; vbroadcastss 0x6557(%rip),%ymm8 # 699c <_sk_callback_avx+0x156> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9 DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0 @@ -5659,7 +5630,7 @@ _sk_srcover_avx LABEL PROC PUBLIC _sk_dstover_avx _sk_dstover_avx LABEL PROC - DB 196,98,125,24,5,41,101,0,0 ; vbroadcastss 0x6529(%rip),%ymm8 # 69e0 <_sk_callback_avx+0x15a> + DB 196,98,125,24,5,42,101,0,0 ; vbroadcastss 0x652a(%rip),%ymm8 # 69a0 <_sk_callback_avx+0x15a> DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0 @@ -5683,7 +5654,7 @@ _sk_modulate_avx LABEL PROC PUBLIC _sk_multiply_avx _sk_multiply_avx LABEL PROC - DB 196,98,125,24,5,232,100,0,0 ; vbroadcastss 0x64e8(%rip),%ymm8 # 69e4 <_sk_callback_avx+0x15e> + DB 196,98,125,24,5,233,100,0,0 ; vbroadcastss 0x64e9(%rip),%ymm8 # 69a4 <_sk_callback_avx+0x15e> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -5737,7 +5708,7 @@ _sk_screen_avx LABEL PROC PUBLIC _sk_xor__avx _sk_xor__avx LABEL PROC - DB 196,98,125,24,5,55,100,0,0 ; vbroadcastss 0x6437(%rip),%ymm8 # 69e8 <_sk_callback_avx+0x162> + DB 196,98,125,24,5,56,100,0,0 ; vbroadcastss 0x6438(%rip),%ymm8 # 69a8 <_sk_callback_avx+0x162> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -5772,7 +5743,7 @@ _sk_darken_avx LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,183,99,0,0 ; vbroadcastss 0x63b7(%rip),%ymm8 # 69ec <_sk_callback_avx+0x166> + DB 196,98,125,24,5,184,99,0,0 ; vbroadcastss 0x63b8(%rip),%ymm8 # 69ac <_sk_callback_avx+0x166> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -5796,7 +5767,7 @@ _sk_lighten_avx LABEL PROC DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9 DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,99,99,0,0 ; vbroadcastss 0x6363(%rip),%ymm8 # 69f0 <_sk_callback_avx+0x16a> + DB 196,98,125,24,5,100,99,0,0 ; vbroadcastss 0x6364(%rip),%ymm8 # 69b0 <_sk_callback_avx+0x16a> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -5823,7 +5794,7 @@ _sk_difference_avx LABEL PROC DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,3,99,0,0 ; vbroadcastss 0x6303(%rip),%ymm8 # 69f4 <_sk_callback_avx+0x16e> + DB 196,98,125,24,5,4,99,0,0 ; vbroadcastss 0x6304(%rip),%ymm8 # 69b4 <_sk_callback_avx+0x16e> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -5844,7 +5815,7 @@ _sk_exclusion_avx LABEL PROC DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2 DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2 DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2 - DB 196,98,125,24,5,190,98,0,0 ; vbroadcastss 0x62be(%rip),%ymm8 # 69f8 <_sk_callback_avx+0x172> + DB 196,98,125,24,5,191,98,0,0 ; vbroadcastss 0x62bf(%rip),%ymm8 # 69b8 <_sk_callback_avx+0x172> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8 DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3 @@ -5853,7 +5824,7 @@ _sk_exclusion_avx LABEL PROC PUBLIC _sk_colorburn_avx _sk_colorburn_avx LABEL PROC - DB 196,98,125,24,5,169,98,0,0 ; vbroadcastss 0x62a9(%rip),%ymm8 # 69fc <_sk_callback_avx+0x176> + DB 196,98,125,24,5,170,98,0,0 ; vbroadcastss 0x62aa(%rip),%ymm8 # 69bc <_sk_callback_avx+0x176> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11 DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10 @@ -5913,7 +5884,7 @@ _sk_colorburn_avx LABEL PROC PUBLIC _sk_colordodge_avx _sk_colordodge_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 - DB 196,98,125,24,13,165,97,0,0 ; vbroadcastss 0x61a5(%rip),%ymm9 # 6a00 <_sk_callback_avx+0x17a> + DB 196,98,125,24,13,166,97,0,0 ; vbroadcastss 0x61a6(%rip),%ymm9 # 69c0 <_sk_callback_avx+0x17a> DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10 DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11 DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9 @@ -5968,7 +5939,7 @@ _sk_colordodge_avx LABEL PROC PUBLIC _sk_hardlight_avx _sk_hardlight_avx LABEL PROC - DB 196,98,125,24,5,183,96,0,0 ; vbroadcastss 0x60b7(%rip),%ymm8 # 6a04 <_sk_callback_avx+0x17e> + DB 196,98,125,24,5,184,96,0,0 ; vbroadcastss 0x60b8(%rip),%ymm8 # 69c4 <_sk_callback_avx+0x17e> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -6021,7 +5992,7 @@ _sk_hardlight_avx LABEL PROC PUBLIC _sk_overlay_avx _sk_overlay_avx LABEL PROC - DB 196,98,125,24,5,224,95,0,0 ; vbroadcastss 0x5fe0(%rip),%ymm8 # 6a08 <_sk_callback_avx+0x182> + DB 196,98,125,24,5,225,95,0,0 ; vbroadcastss 0x5fe1(%rip),%ymm8 # 69c8 <_sk_callback_avx+0x182> DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10 DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -6086,10 +6057,10 @@ _sk_softlight_avx LABEL PROC DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8 DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11 DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8 - DB 196,98,125,24,29,211,94,0,0 ; vbroadcastss 0x5ed3(%rip),%ymm11 # 6a10 <_sk_callback_avx+0x18a> + DB 196,98,125,24,29,212,94,0,0 ; vbroadcastss 0x5ed4(%rip),%ymm11 # 69d0 <_sk_callback_avx+0x18a> DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13 DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8 - DB 196,98,125,24,45,196,94,0,0 ; vbroadcastss 0x5ec4(%rip),%ymm13 # 6a14 <_sk_callback_avx+0x18e> + DB 196,98,125,24,45,197,94,0,0 ; vbroadcastss 0x5ec5(%rip),%ymm13 # 69d4 <_sk_callback_avx+0x18e> DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14 DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8 DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14 @@ -6100,7 +6071,7 @@ _sk_softlight_avx LABEL PROC DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15 DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14 DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15 - DB 196,98,125,24,5,130,94,0,0 ; vbroadcastss 0x5e82(%rip),%ymm8 # 6a0c <_sk_callback_avx+0x186> + DB 196,98,125,24,5,131,94,0,0 ; vbroadcastss 0x5e83(%rip),%ymm8 # 69cc <_sk_callback_avx+0x186> DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12 DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0 DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12 @@ -6227,12 +6198,12 @@ _sk_hue_avx LABEL PROC DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11 DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11 DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - DB 196,98,125,24,53,76,92,0,0 ; vbroadcastss 0x5c4c(%rip),%ymm14 # 6a18 <_sk_callback_avx+0x192> + DB 196,98,125,24,53,77,92,0,0 ; vbroadcastss 0x5c4d(%rip),%ymm14 # 69d8 <_sk_callback_avx+0x192> DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11 - DB 196,98,125,24,61,66,92,0,0 ; vbroadcastss 0x5c42(%rip),%ymm15 # 6a1c <_sk_callback_avx+0x196> + DB 196,98,125,24,61,67,92,0,0 ; vbroadcastss 0x5c43(%rip),%ymm15 # 69dc <_sk_callback_avx+0x196> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 - DB 196,226,125,24,5,51,92,0,0 ; vbroadcastss 0x5c33(%rip),%ymm0 # 6a20 <_sk_callback_avx+0x19a> + DB 196,226,125,24,5,52,92,0,0 ; vbroadcastss 0x5c34(%rip),%ymm0 # 69e0 <_sk_callback_avx+0x19a> DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13 @@ -6293,7 +6264,7 @@ _sk_hue_avx LABEL PROC DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10 DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,12,91,0,0 ; vbroadcastss 0x5b0c(%rip),%ymm8 # 6a24 <_sk_callback_avx+0x19e> + DB 196,98,125,24,5,13,91,0,0 ; vbroadcastss 0x5b0d(%rip),%ymm8 # 69e4 <_sk_callback_avx+0x19e> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -6350,12 +6321,12 @@ _sk_saturation_avx LABEL PROC DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11 DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11 DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12 - DB 196,98,125,24,53,20,90,0,0 ; vbroadcastss 0x5a14(%rip),%ymm14 # 6a28 <_sk_callback_avx+0x1a2> + DB 196,98,125,24,53,21,90,0,0 ; vbroadcastss 0x5a15(%rip),%ymm14 # 69e8 <_sk_callback_avx+0x1a2> DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11 - DB 196,98,125,24,61,10,90,0,0 ; vbroadcastss 0x5a0a(%rip),%ymm15 # 6a2c <_sk_callback_avx+0x1a6> + DB 196,98,125,24,61,11,90,0,0 ; vbroadcastss 0x5a0b(%rip),%ymm15 # 69ec <_sk_callback_avx+0x1a6> DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 - DB 196,226,125,24,5,251,89,0,0 ; vbroadcastss 0x59fb(%rip),%ymm0 # 6a30 <_sk_callback_avx+0x1aa> + DB 196,226,125,24,5,252,89,0,0 ; vbroadcastss 0x59fc(%rip),%ymm0 # 69f0 <_sk_callback_avx+0x1aa> DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13 DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11 DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13 @@ -6416,7 +6387,7 @@ _sk_saturation_avx LABEL PROC DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10 DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,212,88,0,0 ; vbroadcastss 0x58d4(%rip),%ymm8 # 6a34 <_sk_callback_avx+0x1ae> + DB 196,98,125,24,5,213,88,0,0 ; vbroadcastss 0x58d5(%rip),%ymm8 # 69f4 <_sk_callback_avx+0x1ae> DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9 DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1 DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 @@ -6445,12 +6416,12 @@ _sk_color_avx LABEL PROC DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp) DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8 DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9 - DB 196,98,125,24,45,100,88,0,0 ; vbroadcastss 0x5864(%rip),%ymm13 # 6a38 <_sk_callback_avx+0x1b2> + DB 196,98,125,24,45,101,88,0,0 ; vbroadcastss 0x5865(%rip),%ymm13 # 69f8 <_sk_callback_avx+0x1b2> DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10 - DB 196,98,125,24,53,90,88,0,0 ; vbroadcastss 0x585a(%rip),%ymm14 # 6a3c <_sk_callback_avx+0x1b6> + DB 196,98,125,24,53,91,88,0,0 ; vbroadcastss 0x585b(%rip),%ymm14 # 69fc <_sk_callback_avx+0x1b6> DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11 DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 - DB 196,98,125,24,61,75,88,0,0 ; vbroadcastss 0x584b(%rip),%ymm15 # 6a40 <_sk_callback_avx+0x1ba> + DB 196,98,125,24,61,76,88,0,0 ; vbroadcastss 0x584c(%rip),%ymm15 # 6a00 <_sk_callback_avx+0x1ba> DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11 DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0 DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11 @@ -6513,7 +6484,7 @@ _sk_color_avx LABEL PROC DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9 DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0 DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8 - DB 196,226,125,24,5,18,87,0,0 ; vbroadcastss 0x5712(%rip),%ymm0 # 6a44 <_sk_callback_avx+0x1be> + DB 196,226,125,24,5,19,87,0,0 ; vbroadcastss 0x5713(%rip),%ymm0 # 6a04 <_sk_callback_avx+0x1be> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -6543,12 +6514,12 @@ _sk_luminosity_avx LABEL PROC DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8 DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9 - DB 196,98,125,24,45,158,86,0,0 ; vbroadcastss 0x569e(%rip),%ymm13 # 6a48 <_sk_callback_avx+0x1c2> + DB 196,98,125,24,45,159,86,0,0 ; vbroadcastss 0x569f(%rip),%ymm13 # 6a08 <_sk_callback_avx+0x1c2> DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10 - DB 196,98,125,24,53,148,86,0,0 ; vbroadcastss 0x5694(%rip),%ymm14 # 6a4c <_sk_callback_avx+0x1c6> + DB 196,98,125,24,53,149,86,0,0 ; vbroadcastss 0x5695(%rip),%ymm14 # 6a0c <_sk_callback_avx+0x1c6> DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11 DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 - DB 196,98,125,24,61,133,86,0,0 ; vbroadcastss 0x5685(%rip),%ymm15 # 6a50 <_sk_callback_avx+0x1ca> + DB 196,98,125,24,61,134,86,0,0 ; vbroadcastss 0x5686(%rip),%ymm15 # 6a10 <_sk_callback_avx+0x1ca> DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11 DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0 DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11 @@ -6611,7 +6582,7 @@ _sk_luminosity_avx LABEL PROC DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9 DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0 DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8 - DB 196,226,125,24,5,76,85,0,0 ; vbroadcastss 0x554c(%rip),%ymm0 # 6a54 <_sk_callback_avx+0x1ce> + DB 196,226,125,24,5,77,85,0,0 ; vbroadcastss 0x554d(%rip),%ymm0 # 6a14 <_sk_callback_avx+0x1ce> DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11 @@ -6640,9 +6611,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,47,1,0,0 ; jne 16a2 <_sk_srcover_rgba_8888_avx+0x14c> + DB 15,133,47,1,0,0 ; jne 1661 <_sk_srcover_rgba_8888_avx+0x14c> DB 196,193,124,16,58 ; vmovups (%r10),%ymm7 - DB 197,124,40,13,128,89,0,0 ; vmovaps 0x5980(%rip),%ymm9 # 6f00 <_sk_callback_avx+0x67a> + DB 197,124,40,13,129,89,0,0 ; vmovaps 0x5981(%rip),%ymm9 # 6ec0 <_sk_callback_avx+0x67a> DB 196,193,68,84,225 ; vandps %ymm9,%ymm7,%ymm4 DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4 DB 197,209,114,215,8 ; vpsrld $0x8,%xmm7,%xmm5 @@ -6660,9 +6631,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7 DB 196,227,53,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm7 DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7 - DB 196,98,125,24,5,119,84,0,0 ; vbroadcastss 0x5477(%rip),%ymm8 # 6a58 <_sk_callback_avx+0x1d2> + DB 196,98,125,24,5,120,84,0,0 ; vbroadcastss 0x5478(%rip),%ymm8 # 6a18 <_sk_callback_avx+0x1d2> DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8 - DB 196,98,125,24,13,110,84,0,0 ; vbroadcastss 0x546e(%rip),%ymm9 # 6a5c <_sk_callback_avx+0x1d6> + DB 196,98,125,24,13,111,84,0,0 ; vbroadcastss 0x546f(%rip),%ymm9 # 6a1c <_sk_callback_avx+0x1d6> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10 DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0 @@ -6695,7 +6666,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 196,65,53,86,202 ; vorpd %ymm10,%ymm9,%ymm9 DB 196,65,61,86,193 ; vorpd %ymm9,%ymm8,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,91 ; jne 16ed <_sk_srcover_rgba_8888_avx+0x197> + DB 117,91 ; jne 16ac <_sk_srcover_rgba_8888_avx+0x197> DB 196,65,124,17,2 ; vmovups %ymm8,(%r10) DB 72,173 ; lods %ds:(%rsi),%rax DB 76,137,201 ; mov %r9,%rcx @@ -6708,13 +6679,13 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,225,249,110,224 ; vmovq %rax,%xmm4 DB 196,226,121,48,228 ; vpmovzxbw %xmm4,%xmm4 - DB 196,226,89,0,45,38,87,0,0 ; vpshufb 0x5726(%rip),%xmm4,%xmm5 # 6df0 <_sk_callback_avx+0x56a> + DB 196,226,89,0,45,39,87,0,0 ; vpshufb 0x5727(%rip),%xmm4,%xmm5 # 6db0 <_sk_callback_avx+0x56a> DB 196,226,121,33,237 ; vpmovsxbd %xmm5,%xmm5 - DB 196,226,89,0,37,40,87,0,0 ; vpshufb 0x5728(%rip),%xmm4,%xmm4 # 6e00 <_sk_callback_avx+0x57a> + DB 196,226,89,0,37,41,87,0,0 ; vpshufb 0x5729(%rip),%xmm4,%xmm4 # 6dc0 <_sk_callback_avx+0x57a> DB 196,226,121,33,228 ; vpmovsxbd %xmm4,%xmm4 DB 196,227,85,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm4 DB 196,194,93,44,58 ; vmaskmovps (%r10),%ymm4,%ymm7 - DB 233,139,254,255,255 ; jmpq 1578 <_sk_srcover_rgba_8888_avx+0x22> + DB 233,139,254,255,255 ; jmpq 1537 <_sk_srcover_rgba_8888_avx+0x22> DB 185,8,0,0,0 ; mov $0x8,%ecx DB 68,41,193 ; sub %r8d,%ecx DB 192,225,3 ; shl $0x3,%cl @@ -6722,13 +6693,13 @@ _sk_srcover_rgba_8888_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,97,249,110,200 ; vmovq %rax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 - DB 196,98,49,0,21,219,86,0,0 ; vpshufb 0x56db(%rip),%xmm9,%xmm10 # 6df0 <_sk_callback_avx+0x56a> + DB 196,98,49,0,21,220,86,0,0 ; vpshufb 0x56dc(%rip),%xmm9,%xmm10 # 6db0 <_sk_callback_avx+0x56a> DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10 - DB 196,98,49,0,13,221,86,0,0 ; vpshufb 0x56dd(%rip),%xmm9,%xmm9 # 6e00 <_sk_callback_avx+0x57a> + DB 196,98,49,0,13,222,86,0,0 ; vpshufb 0x56de(%rip),%xmm9,%xmm9 # 6dc0 <_sk_callback_avx+0x57a> DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9 DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10) - DB 233,95,255,255,255 ; jmpq 1697 <_sk_srcover_rgba_8888_avx+0x141> + DB 233,95,255,255,255 ; jmpq 1656 <_sk_srcover_rgba_8888_avx+0x141> PUBLIC _sk_clamp_0_avx _sk_clamp_0_avx LABEL PROC @@ -6742,7 +6713,7 @@ _sk_clamp_0_avx LABEL PROC PUBLIC _sk_clamp_1_avx _sk_clamp_1_avx LABEL PROC - DB 196,98,125,24,5,2,83,0,0 ; vbroadcastss 0x5302(%rip),%ymm8 # 6a60 <_sk_callback_avx+0x1da> + DB 196,98,125,24,5,3,83,0,0 ; vbroadcastss 0x5303(%rip),%ymm8 # 6a20 <_sk_callback_avx+0x1da> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 @@ -6752,7 +6723,7 @@ _sk_clamp_1_avx LABEL PROC PUBLIC _sk_clamp_a_avx _sk_clamp_a_avx LABEL PROC - DB 196,98,125,24,5,229,82,0,0 ; vbroadcastss 0x52e5(%rip),%ymm8 # 6a64 <_sk_callback_avx+0x1de> + DB 196,98,125,24,5,230,82,0,0 ; vbroadcastss 0x52e6(%rip),%ymm8 # 6a24 <_sk_callback_avx+0x1de> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0 DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1 @@ -6824,7 +6795,7 @@ PUBLIC _sk_unpremul_avx _sk_unpremul_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9 - DB 196,98,125,24,21,45,82,0,0 ; vbroadcastss 0x522d(%rip),%ymm10 # 6a68 <_sk_callback_avx+0x1e2> + DB 196,98,125,24,21,46,82,0,0 ; vbroadcastss 0x522e(%rip),%ymm10 # 6a28 <_sk_callback_avx+0x1e2> DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10 DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 @@ -6835,17 +6806,17 @@ _sk_unpremul_avx LABEL PROC PUBLIC _sk_from_srgb_avx _sk_from_srgb_avx LABEL PROC - DB 196,98,125,24,5,14,82,0,0 ; vbroadcastss 0x520e(%rip),%ymm8 # 6a6c <_sk_callback_avx+0x1e6> + DB 196,98,125,24,5,15,82,0,0 ; vbroadcastss 0x520f(%rip),%ymm8 # 6a2c <_sk_callback_avx+0x1e6> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10 - DB 196,98,125,24,29,0,82,0,0 ; vbroadcastss 0x5200(%rip),%ymm11 # 6a70 <_sk_callback_avx+0x1ea> + DB 196,98,125,24,29,1,82,0,0 ; vbroadcastss 0x5201(%rip),%ymm11 # 6a30 <_sk_callback_avx+0x1ea> DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12 - DB 196,98,125,24,45,246,81,0,0 ; vbroadcastss 0x51f6(%rip),%ymm13 # 6a74 <_sk_callback_avx+0x1ee> + DB 196,98,125,24,45,247,81,0,0 ; vbroadcastss 0x51f7(%rip),%ymm13 # 6a34 <_sk_callback_avx+0x1ee> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,37,231,81,0,0 ; vbroadcastss 0x51e7(%rip),%ymm12 # 6a78 <_sk_callback_avx+0x1f2> + DB 196,98,125,24,37,232,81,0,0 ; vbroadcastss 0x51e8(%rip),%ymm12 # 6a38 <_sk_callback_avx+0x1f2> DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10 - DB 196,98,125,24,53,221,81,0,0 ; vbroadcastss 0x51dd(%rip),%ymm14 # 6a7c <_sk_callback_avx+0x1f6> + DB 196,98,125,24,53,222,81,0,0 ; vbroadcastss 0x51de(%rip),%ymm14 # 6a3c <_sk_callback_avx+0x1f6> DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0 DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0 DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9 @@ -6870,20 +6841,20 @@ _sk_from_srgb_avx LABEL PROC PUBLIC _sk_to_srgb_avx _sk_to_srgb_avx LABEL PROC DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9 - DB 196,98,125,24,5,114,81,0,0 ; vbroadcastss 0x5172(%rip),%ymm8 # 6a80 <_sk_callback_avx+0x1fa> + DB 196,98,125,24,5,115,81,0,0 ; vbroadcastss 0x5173(%rip),%ymm8 # 6a40 <_sk_callback_avx+0x1fa> DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10 - DB 196,98,125,24,29,104,81,0,0 ; vbroadcastss 0x5168(%rip),%ymm11 # 6a84 <_sk_callback_avx+0x1fe> + DB 196,98,125,24,29,105,81,0,0 ; vbroadcastss 0x5169(%rip),%ymm11 # 6a44 <_sk_callback_avx+0x1fe> DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12 - DB 196,98,125,24,45,94,81,0,0 ; vbroadcastss 0x515e(%rip),%ymm13 # 6a88 <_sk_callback_avx+0x202> + DB 196,98,125,24,45,95,81,0,0 ; vbroadcastss 0x515f(%rip),%ymm13 # 6a48 <_sk_callback_avx+0x202> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12 - DB 196,98,125,24,53,79,81,0,0 ; vbroadcastss 0x514f(%rip),%ymm14 # 6a8c <_sk_callback_avx+0x206> + DB 196,98,125,24,53,80,81,0,0 ; vbroadcastss 0x5150(%rip),%ymm14 # 6a4c <_sk_callback_avx+0x206> DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12 - DB 196,98,125,24,61,69,81,0,0 ; vbroadcastss 0x5145(%rip),%ymm15 # 6a90 <_sk_callback_avx+0x20a> + DB 196,98,125,24,61,70,81,0,0 ; vbroadcastss 0x5146(%rip),%ymm15 # 6a50 <_sk_callback_avx+0x20a> DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9 DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9 DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9 - DB 196,98,125,24,37,49,81,0,0 ; vbroadcastss 0x5131(%rip),%ymm12 # 6a94 <_sk_callback_avx+0x20e> + DB 196,98,125,24,37,50,81,0,0 ; vbroadcastss 0x5132(%rip),%ymm12 # 6a54 <_sk_callback_avx+0x20e> DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9 @@ -6918,7 +6889,7 @@ _sk_rgb_to_hsl_avx LABEL PROC DB 197,124,93,201 ; vminps %ymm1,%ymm0,%ymm9 DB 197,52,93,202 ; vminps %ymm2,%ymm9,%ymm9 DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10 - DB 196,98,125,24,29,151,80,0,0 ; vbroadcastss 0x5097(%rip),%ymm11 # 6a98 <_sk_callback_avx+0x212> + DB 196,98,125,24,29,152,80,0,0 ; vbroadcastss 0x5098(%rip),%ymm11 # 6a58 <_sk_callback_avx+0x212> DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11 DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12 DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12 @@ -6928,19 +6899,19 @@ _sk_rgb_to_hsl_avx LABEL PROC DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2 DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1 DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,112,80,0,0 ; vbroadcastss 0x5070(%rip),%ymm11 # 6aa4 <_sk_callback_avx+0x21e> + DB 196,98,125,24,29,113,80,0,0 ; vbroadcastss 0x5071(%rip),%ymm11 # 6a64 <_sk_callback_avx+0x21e> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,94,80,0,0 ; vbroadcastss 0x505e(%rip),%ymm11 # 6aa0 <_sk_callback_avx+0x21a> + DB 196,98,125,24,29,95,80,0,0 ; vbroadcastss 0x505f(%rip),%ymm11 # 6a60 <_sk_callback_avx+0x21a> DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,70,80,0,0 ; vbroadcastss 0x5046(%rip),%ymm2 # 6a9c <_sk_callback_avx+0x216> + DB 196,226,125,24,21,71,80,0,0 ; vbroadcastss 0x5047(%rip),%ymm2 # 6a5c <_sk_callback_avx+0x216> DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14 DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2 DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0 DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2 DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0 DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1 - DB 196,98,125,24,37,45,80,0,0 ; vbroadcastss 0x502d(%rip),%ymm12 # 6aac <_sk_callback_avx+0x226> + DB 196,98,125,24,37,46,80,0,0 ; vbroadcastss 0x502e(%rip),%ymm12 # 6a6c <_sk_callback_avx+0x226> DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2 DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12 DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11 @@ -6950,7 +6921,7 @@ _sk_rgb_to_hsl_avx LABEL PROC DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1 DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0 DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1 - DB 196,98,125,24,5,240,79,0,0 ; vbroadcastss 0x4ff0(%rip),%ymm8 # 6aa8 <_sk_callback_avx+0x222> + DB 196,98,125,24,5,241,79,0,0 ; vbroadcastss 0x4ff1(%rip),%ymm8 # 6a68 <_sk_callback_avx+0x222> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -6965,7 +6936,7 @@ _sk_hsl_to_rgb_avx LABEL PROC DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp) DB 197,252,40,225 ; vmovaps %ymm1,%ymm4 DB 197,252,40,216 ; vmovaps %ymm0,%ymm3 - DB 196,98,125,24,5,183,79,0,0 ; vbroadcastss 0x4fb7(%rip),%ymm8 # 6ab0 <_sk_callback_avx+0x22a> + DB 196,98,125,24,5,184,79,0,0 ; vbroadcastss 0x4fb8(%rip),%ymm8 # 6a70 <_sk_callback_avx+0x22a> DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9 DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10 DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11 @@ -6973,23 +6944,23 @@ _sk_hsl_to_rgb_avx LABEL PROC DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10 DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9 DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,29,145,79,0,0 ; vbroadcastss 0x4f91(%rip),%ymm11 # 6ab4 <_sk_callback_avx+0x22e> + DB 196,98,125,24,29,146,79,0,0 ; vbroadcastss 0x4f92(%rip),%ymm11 # 6a74 <_sk_callback_avx+0x22e> DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11 DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12 DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15 DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11 - DB 196,98,125,24,37,123,79,0,0 ; vbroadcastss 0x4f7b(%rip),%ymm12 # 6abc <_sk_callback_avx+0x236> + DB 196,98,125,24,37,124,79,0,0 ; vbroadcastss 0x4f7c(%rip),%ymm12 # 6a7c <_sk_callback_avx+0x236> DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0 - DB 196,98,125,24,45,113,79,0,0 ; vbroadcastss 0x4f71(%rip),%ymm13 # 6ac0 <_sk_callback_avx+0x23a> + DB 196,98,125,24,45,114,79,0,0 ; vbroadcastss 0x4f72(%rip),%ymm13 # 6a80 <_sk_callback_avx+0x23a> DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14 DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14 DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14 - DB 196,226,125,24,13,82,79,0,0 ; vbroadcastss 0x4f52(%rip),%ymm1 # 6ab8 <_sk_callback_avx+0x232> + DB 196,226,125,24,13,83,79,0,0 ; vbroadcastss 0x4f53(%rip),%ymm1 # 6a78 <_sk_callback_avx+0x232> DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7 DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7 DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14 DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7 - DB 196,98,125,24,53,61,79,0,0 ; vbroadcastss 0x4f3d(%rip),%ymm14 # 6ac4 <_sk_callback_avx+0x23e> + DB 196,98,125,24,53,62,79,0,0 ; vbroadcastss 0x4f3e(%rip),%ymm14 # 6a84 <_sk_callback_avx+0x23e> DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15 DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0 DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0 @@ -7008,7 +6979,7 @@ _sk_hsl_to_rgb_avx LABEL PROC DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6 DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6 DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5 - DB 196,226,125,24,5,223,78,0,0 ; vbroadcastss 0x4edf(%rip),%ymm0 # 6ac8 <_sk_callback_avx+0x242> + DB 196,226,125,24,5,224,78,0,0 ; vbroadcastss 0x4ee0(%rip),%ymm0 # 6a88 <_sk_callback_avx+0x242> DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0 DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3 DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0 @@ -7054,15 +7025,15 @@ _sk_scale_u8_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,74 ; jne 1ce6 <_sk_scale_u8_avx+0x54> + DB 117,74 ; jne 1ca5 <_sk_scale_u8_avx+0x54> DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8 - DB 197,57,219,5,102,81,0,0 ; vpand 0x5166(%rip),%xmm8,%xmm8 # 6e10 <_sk_callback_avx+0x58a> + DB 197,57,219,5,103,81,0,0 ; vpand 0x5167(%rip),%xmm8,%xmm8 # 6dd0 <_sk_callback_avx+0x58a> DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,255,77,0,0 ; vbroadcastss 0x4dff(%rip),%ymm9 # 6acc <_sk_callback_avx+0x246> + DB 196,98,125,24,13,0,78,0,0 ; vbroadcastss 0x4e00(%rip),%ymm9 # 6a8c <_sk_callback_avx+0x246> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1 @@ -7075,15 +7046,15 @@ _sk_scale_u8_avx LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,167 ; ja 1ca2 <_sk_scale_u8_avx+0x10> + DB 119,167 ; ja 1c61 <_sk_scale_u8_avx+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,122,0,0,0 ; lea 0x7a(%rip),%r10 # 1d80 <_sk_scale_u8_avx+0xee> + DB 76,141,21,123,0,0,0 ; lea 0x7b(%rip),%r10 # 1d40 <_sk_scale_u8_avx+0xef> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 235,136 ; jmp 1ca2 <_sk_scale_u8_avx+0x10> + DB 235,136 ; jmp 1c61 <_sk_scale_u8_avx+0x10> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -7091,7 +7062,7 @@ _sk_scale_u8_avx LABEL PROC DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8 - DB 233,95,255,255,255 ; jmpq 1ca2 <_sk_scale_u8_avx+0x10> + DB 233,95,255,255,255 ; jmpq 1c61 <_sk_scale_u8_avx+0x10> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -7102,22 +7073,21 @@ _sk_scale_u8_avx LABEL PROC DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - DB 233,35,255,255,255 ; jmpq 1ca2 <_sk_scale_u8_avx+0x10> - DB 144 ; nop - DB 143 ; (bad) + DB 233,35,255,255,255 ; jmpq 1c61 <_sk_scale_u8_avx+0x10> + DB 102,144 ; xchg %ax,%ax + DB 142,255 ; mov %edi,%? DB 255 ; (bad) - DB 255 ; (bad) - DB 255,170,255,255,255,154 ; ljmp *-0x65000001(%rdx) + DB 255,169,255,255,255,153 ; ljmp *-0x66000001(%rcx) DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf001d90 <_sk_callback_avx+0xffffffffdeffb50a> + DB 232,255,255,255,221 ; callq ffffffffde001d50 <_sk_callback_avx+0xffffffffddffb50a> DB 255 ; (bad) DB 255 ; (bad) - DB 255,211 ; callq *%rbx + DB 255,210 ; callq *%rdx DB 255 ; (bad) DB 255 ; (bad) - DB 255,195 ; inc %ebx + DB 255,194 ; inc %edx DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -7146,15 +7116,15 @@ _sk_lerp_u8_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,110 ; jne 1e53 <_sk_lerp_u8_avx+0x78> + DB 117,110 ; jne 1e13 <_sk_lerp_u8_avx+0x78> DB 196,66,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm8 - DB 197,57,219,5,45,80,0,0 ; vpand 0x502d(%rip),%xmm8,%xmm8 # 6e20 <_sk_callback_avx+0x59a> + DB 197,57,219,5,45,80,0,0 ; vpand 0x502d(%rip),%xmm8,%xmm8 # 6de0 <_sk_callback_avx+0x59a> DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,13,186,76,0,0 ; vbroadcastss 0x4cba(%rip),%ymm9 # 6ad0 <_sk_callback_avx+0x24a> + DB 196,98,125,24,13,186,76,0,0 ; vbroadcastss 0x4cba(%rip),%ymm9 # 6a90 <_sk_callback_avx+0x24a> DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 @@ -7175,15 +7145,15 @@ _sk_lerp_u8_avx LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,131 ; ja 1deb <_sk_lerp_u8_avx+0x10> + DB 119,131 ; ja 1dab <_sk_lerp_u8_avx+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,125,0,0,0 ; lea 0x7d(%rip),%r10 # 1ef0 <_sk_lerp_u8_avx+0x115> + DB 76,141,21,125,0,0,0 ; lea 0x7d(%rip),%r10 # 1eb0 <_sk_lerp_u8_avx+0x115> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 233,97,255,255,255 ; jmpq 1deb <_sk_lerp_u8_avx+0x10> + DB 233,97,255,255,255 ; jmpq 1dab <_sk_lerp_u8_avx+0x10> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8 @@ -7191,7 +7161,7 @@ _sk_lerp_u8_avx LABEL PROC DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8 - DB 233,56,255,255,255 ; jmpq 1deb <_sk_lerp_u8_avx+0x10> + DB 233,56,255,255,255 ; jmpq 1dab <_sk_lerp_u8_avx+0x10> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8 @@ -7202,7 +7172,7 @@ _sk_lerp_u8_avx LABEL PROC DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - DB 233,252,254,255,255 ; jmpq 1deb <_sk_lerp_u8_avx+0x10> + DB 233,252,254,255,255 ; jmpq 1dab <_sk_lerp_u8_avx+0x10> DB 144 ; nop DB 140,255 ; mov %?,%edi DB 255 ; (bad) @@ -7210,7 +7180,7 @@ _sk_lerp_u8_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf001f00 <_sk_callback_avx+0xffffffffdeffb67a> + DB 233,255,255,255,222 ; jmpq ffffffffdf001ec0 <_sk_callback_avx+0xffffffffdeffb67a> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -7226,26 +7196,26 @@ _sk_lerp_565_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,208,0,0,0 ; jne 1fea <_sk_lerp_565_avx+0xde> + DB 15,133,208,0,0,0 ; jne 1faa <_sk_lerp_565_avx+0xde> DB 196,65,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9 DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8 DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8 - DB 196,98,125,24,13,150,75,0,0 ; vbroadcastss 0x4b96(%rip),%ymm9 # 6ad4 <_sk_callback_avx+0x24e> + DB 196,98,125,24,13,150,75,0,0 ; vbroadcastss 0x4b96(%rip),%ymm9 # 6a94 <_sk_callback_avx+0x24e> DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9 DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9 - DB 196,98,125,24,21,135,75,0,0 ; vbroadcastss 0x4b87(%rip),%ymm10 # 6ad8 <_sk_callback_avx+0x252> + DB 196,98,125,24,21,135,75,0,0 ; vbroadcastss 0x4b87(%rip),%ymm10 # 6a98 <_sk_callback_avx+0x252> DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,21,125,75,0,0 ; vbroadcastss 0x4b7d(%rip),%ymm10 # 6adc <_sk_callback_avx+0x256> + DB 196,98,125,24,21,125,75,0,0 ; vbroadcastss 0x4b7d(%rip),%ymm10 # 6a9c <_sk_callback_avx+0x256> DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10 DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10 - DB 196,98,125,24,29,110,75,0,0 ; vbroadcastss 0x4b6e(%rip),%ymm11 # 6ae0 <_sk_callback_avx+0x25a> + DB 196,98,125,24,29,110,75,0,0 ; vbroadcastss 0x4b6e(%rip),%ymm11 # 6aa0 <_sk_callback_avx+0x25a> DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10 - DB 196,98,125,24,29,100,75,0,0 ; vbroadcastss 0x4b64(%rip),%ymm11 # 6ae4 <_sk_callback_avx+0x25e> + DB 196,98,125,24,29,100,75,0,0 ; vbroadcastss 0x4b64(%rip),%ymm11 # 6aa4 <_sk_callback_avx+0x25e> DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8 DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8 - DB 196,98,125,24,29,85,75,0,0 ; vbroadcastss 0x4b55(%rip),%ymm11 # 6ae8 <_sk_callback_avx+0x262> + DB 196,98,125,24,29,85,75,0,0 ; vbroadcastss 0x4b55(%rip),%ymm11 # 6aa8 <_sk_callback_avx+0x262> DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8 DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0 DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 @@ -7272,27 +7242,27 @@ _sk_lerp_565_avx LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,29,255,255,255 ; ja 1f20 <_sk_lerp_565_avx+0x14> + DB 15,135,29,255,255,255 ; ja 1ee0 <_sk_lerp_565_avx+0x14> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,102,0,0,0 ; lea 0x66(%rip),%r10 # 2074 <_sk_lerp_565_avx+0x168> + DB 76,141,21,102,0,0,0 ; lea 0x66(%rip),%r10 # 2034 <_sk_lerp_565_avx+0x168> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 233,251,254,255,255 ; jmpq 1f20 <_sk_lerp_565_avx+0x14> + DB 233,251,254,255,255 ; jmpq 1ee0 <_sk_lerp_565_avx+0x14> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,65,57,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm8,%xmm8 DB 196,65,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm9 DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8 - DB 233,221,254,255,255 ; jmpq 1f20 <_sk_lerp_565_avx+0x14> + DB 233,221,254,255,255 ; jmpq 1ee0 <_sk_lerp_565_avx+0x14> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,65,57,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm8,%xmm8 DB 196,65,57,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm8,%xmm8 DB 196,65,57,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm8,%xmm8 DB 196,65,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm9 DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8 - DB 233,175,254,255,255 ; jmpq 1f20 <_sk_lerp_565_avx+0x14> + DB 233,175,254,255,255 ; jmpq 1ee0 <_sk_lerp_565_avx+0x14> DB 15,31,0 ; nopl (%rax) DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff DB 255 ; (bad) @@ -7322,9 +7292,9 @@ _sk_load_tables_avx LABEL PROC DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,251,1,0,0 ; jne 22ae <_sk_load_tables_avx+0x21e> + DB 15,133,251,1,0,0 ; jne 226e <_sk_load_tables_avx+0x21e> DB 196,65,124,16,18 ; vmovups (%r10),%ymm10 - DB 197,124,40,13,96,78,0,0 ; vmovaps 0x4e60(%rip),%ymm9 # 6f20 <_sk_callback_avx+0x69a> + DB 197,124,40,13,96,78,0,0 ; vmovaps 0x4e60(%rip),%ymm9 # 6ee0 <_sk_callback_avx+0x69a> DB 196,193,44,84,201 ; vandps %ymm9,%ymm10,%ymm1 DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0 DB 196,193,249,126,195 ; vmovq %xmm0,%r11 @@ -7416,7 +7386,7 @@ _sk_load_tables_avx LABEL PROC DB 196,193,65,114,208,24 ; vpsrld $0x18,%xmm8,%xmm7 DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,226,125,24,61,83,72,0,0 ; vbroadcastss 0x4853(%rip),%ymm7 # 6aec <_sk_callback_avx+0x266> + DB 196,226,125,24,61,83,72,0,0 ; vbroadcastss 0x4853(%rip),%ymm7 # 6aac <_sk_callback_avx+0x266> DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 76,137,201 ; mov %r9,%rcx @@ -7431,13 +7401,13 @@ _sk_load_tables_avx LABEL PROC DB 73,211,235 ; shr %cl,%r11 DB 196,193,249,110,195 ; vmovq %r11,%xmm0 DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0 - DB 196,226,121,0,13,90,75,0,0 ; vpshufb 0x4b5a(%rip),%xmm0,%xmm1 # 6e30 <_sk_callback_avx+0x5aa> + DB 196,226,121,0,13,90,75,0,0 ; vpshufb 0x4b5a(%rip),%xmm0,%xmm1 # 6df0 <_sk_callback_avx+0x5aa> DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1 - DB 196,226,121,0,5,92,75,0,0 ; vpshufb 0x4b5c(%rip),%xmm0,%xmm0 # 6e40 <_sk_callback_avx+0x5ba> + DB 196,226,121,0,5,92,75,0,0 ; vpshufb 0x4b5c(%rip),%xmm0,%xmm0 # 6e00 <_sk_callback_avx+0x5ba> DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 196,66,125,44,18 ; vmaskmovps (%r10),%ymm0,%ymm10 - DB 233,191,253,255,255 ; jmpq 20b8 <_sk_load_tables_avx+0x28> + DB 233,191,253,255,255 ; jmpq 2078 <_sk_load_tables_avx+0x28> PUBLIC _sk_load_tables_u16_be_avx _sk_load_tables_u16_be_avx LABEL PROC @@ -7447,7 +7417,7 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 77,133,192 ; test %r8,%r8 DB 197,252,17,60,36 ; vmovups %ymm7,(%rsp) - DB 15,133,87,2,0,0 ; jne 256f <_sk_load_tables_u16_be_avx+0x276> + DB 15,133,87,2,0,0 ; jne 252f <_sk_load_tables_u16_be_avx+0x276> DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8 DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2 DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3 @@ -7462,7 +7432,7 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11 DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1 DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12 - DB 197,121,111,21,235,74,0,0 ; vmovdqa 0x4aeb(%rip),%xmm10 # 6e50 <_sk_callback_avx+0x5ca> + DB 197,121,111,21,235,74,0,0 ; vmovdqa 0x4aeb(%rip),%xmm10 # 6e10 <_sk_callback_avx+0x5ca> DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2 @@ -7560,7 +7530,7 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3 DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,226,125,24,61,146,69,0,0 ; vbroadcastss 0x4592(%rip),%ymm7 # 6af0 <_sk_callback_avx+0x26a> + DB 196,226,125,24,61,146,69,0,0 ; vbroadcastss 0x4592(%rip),%ymm7 # 6ab0 <_sk_callback_avx+0x26a> DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7 @@ -7569,29 +7539,29 @@ _sk_load_tables_u16_be_avx LABEL PROC DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je 25d5 <_sk_load_tables_u16_be_avx+0x2dc> + DB 116,85 ; je 2595 <_sk_load_tables_u16_be_avx+0x2dc> DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb 25d5 <_sk_load_tables_u16_be_avx+0x2dc> + DB 114,72 ; jb 2595 <_sk_load_tables_u16_be_avx+0x2dc> DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je 25e2 <_sk_load_tables_u16_be_avx+0x2e9> + DB 116,72 ; je 25a2 <_sk_load_tables_u16_be_avx+0x2e9> DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb 25e2 <_sk_load_tables_u16_be_avx+0x2e9> + DB 114,59 ; jb 25a2 <_sk_load_tables_u16_be_avx+0x2e9> DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,123,253,255,255 ; je 2333 <_sk_load_tables_u16_be_avx+0x3a> + DB 15,132,123,253,255,255 ; je 22f3 <_sk_load_tables_u16_be_avx+0x3a> DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,106,253,255,255 ; jb 2333 <_sk_load_tables_u16_be_avx+0x3a> + DB 15,130,106,253,255,255 ; jb 22f3 <_sk_load_tables_u16_be_avx+0x3a> DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9 - DB 233,94,253,255,255 ; jmpq 2333 <_sk_load_tables_u16_be_avx+0x3a> + DB 233,94,253,255,255 ; jmpq 22f3 <_sk_load_tables_u16_be_avx+0x3a> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,81,253,255,255 ; jmpq 2333 <_sk_load_tables_u16_be_avx+0x3a> + DB 233,81,253,255,255 ; jmpq 22f3 <_sk_load_tables_u16_be_avx+0x3a> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,72,253,255,255 ; jmpq 2333 <_sk_load_tables_u16_be_avx+0x3a> + DB 233,72,253,255,255 ; jmpq 22f3 <_sk_load_tables_u16_be_avx+0x3a> PUBLIC _sk_load_tables_rgb_u16_be_avx _sk_load_tables_rgb_u16_be_avx LABEL PROC @@ -7602,7 +7572,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 77,133,192 ; test %r8,%r8 DB 197,252,17,124,36,32 ; vmovups %ymm7,0x20(%rsp) DB 197,252,17,52,36 ; vmovups %ymm6,(%rsp) - DB 15,133,74,2,0,0 ; jne 2856 <_sk_load_tables_rgb_u16_be_avx+0x26b> + DB 15,133,74,2,0,0 ; jne 2816 <_sk_load_tables_rgb_u16_be_avx+0x26b> DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0 DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2 DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1 @@ -7623,7 +7593,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3 DB 197,57,109,218 ; vpunpckhqdq %xmm2,%xmm8,%xmm11 DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8 - DB 197,121,111,13,234,71,0,0 ; vmovdqa 0x47ea(%rip),%xmm9 # 6e60 <_sk_callback_avx+0x5da> + DB 197,121,111,13,234,71,0,0 ; vmovdqa 0x47ea(%rip),%xmm9 # 6e20 <_sk_callback_avx+0x5da> DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0 DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10 DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1 @@ -7713,7 +7683,7 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2 DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,175,66,0,0 ; vbroadcastss 0x42af(%rip),%ymm3 # 6af4 <_sk_callback_avx+0x26e> + DB 196,226,125,24,29,175,66,0,0 ; vbroadcastss 0x42af(%rip),%ymm3 # 6ab4 <_sk_callback_avx+0x26e> DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6 DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7 DB 72,131,196,88 ; add $0x58,%rsp @@ -7721,41 +7691,41 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0 DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,5 ; jne 286f <_sk_load_tables_rgb_u16_be_avx+0x284> - DB 233,209,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 117,5 ; jne 282f <_sk_load_tables_rgb_u16_be_avx+0x284> + DB 233,209,253,255,255 ; jmpq 2600 <_sk_load_tables_rgb_u16_be_avx+0x55> DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1 DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,26 ; jb 289e <_sk_load_tables_rgb_u16_be_avx+0x2b3> + DB 114,26 ; jb 285e <_sk_load_tables_rgb_u16_be_avx+0x2b3> DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1 DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 117,10 ; jne 28a3 <_sk_load_tables_rgb_u16_be_avx+0x2b8> - DB 233,162,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55> - DB 233,157,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 117,10 ; jne 2863 <_sk_load_tables_rgb_u16_be_avx+0x2b8> + DB 233,162,253,255,255 ; jmpq 2600 <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 233,157,253,255,255 ; jmpq 2600 <_sk_load_tables_rgb_u16_be_avx+0x55> DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1 DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,26 ; jb 28d2 <_sk_load_tables_rgb_u16_be_avx+0x2e7> + DB 114,26 ; jb 2892 <_sk_load_tables_rgb_u16_be_avx+0x2e7> DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1 DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 117,10 ; jne 28d7 <_sk_load_tables_rgb_u16_be_avx+0x2ec> - DB 233,110,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55> - DB 233,105,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 117,10 ; jne 2897 <_sk_load_tables_rgb_u16_be_avx+0x2ec> + DB 233,110,253,255,255 ; jmpq 2600 <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 233,105,253,255,255 ; jmpq 2600 <_sk_load_tables_rgb_u16_be_avx+0x55> DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3 DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,20 ; jb 2900 <_sk_load_tables_rgb_u16_be_avx+0x315> + DB 114,20 ; jb 28c0 <_sk_load_tables_rgb_u16_be_avx+0x315> DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3 DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3 - DB 233,64,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55> - DB 233,59,253,255,255 ; jmpq 2640 <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 233,64,253,255,255 ; jmpq 2600 <_sk_load_tables_rgb_u16_be_avx+0x55> + DB 233,59,253,255,255 ; jmpq 2600 <_sk_load_tables_rgb_u16_be_avx+0x55> PUBLIC _sk_byte_tables_avx _sk_byte_tables_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,232,65,0,0 ; vbroadcastss 0x41e8(%rip),%ymm8 # 6af8 <_sk_callback_avx+0x272> + DB 196,98,125,24,5,232,65,0,0 ; vbroadcastss 0x41e8(%rip),%ymm8 # 6ab8 <_sk_callback_avx+0x272> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9 DB 196,65,249,126,201 ; vmovq %xmm9,%r9 @@ -7874,7 +7844,7 @@ _sk_byte_tables_avx LABEL PROC DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1 DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2 DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 - DB 196,98,125,24,13,146,63,0,0 ; vbroadcastss 0x3f92(%rip),%ymm9 # 6afc <_sk_callback_avx+0x276> + DB 196,98,125,24,13,146,63,0,0 ; vbroadcastss 0x3f92(%rip),%ymm9 # 6abc <_sk_callback_avx+0x276> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1 @@ -7988,7 +7958,7 @@ _sk_byte_tables_rgb_avx LABEL PROC DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,13,115,61,0,0 ; vbroadcastss 0x3d73(%rip),%ymm9 # 6b00 <_sk_callback_avx+0x27a> + DB 196,98,125,24,13,115,61,0,0 ; vbroadcastss 0x3d73(%rip),%ymm9 # 6ac0 <_sk_callback_avx+0x27a> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1 DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2 @@ -8183,36 +8153,36 @@ _sk_parametric_r_avx LABEL PROC DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11 - DB 196,98,125,24,37,32,58,0,0 ; vbroadcastss 0x3a20(%rip),%ymm12 # 6b04 <_sk_callback_avx+0x27e> + DB 196,98,125,24,37,32,58,0,0 ; vbroadcastss 0x3a20(%rip),%ymm12 # 6ac4 <_sk_callback_avx+0x27e> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,22,58,0,0 ; vbroadcastss 0x3a16(%rip),%ymm12 # 6b08 <_sk_callback_avx+0x282> + DB 196,98,125,24,37,22,58,0,0 ; vbroadcastss 0x3a16(%rip),%ymm12 # 6ac8 <_sk_callback_avx+0x282> DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,37,12,58,0,0 ; vbroadcastss 0x3a0c(%rip),%ymm12 # 6b0c <_sk_callback_avx+0x286> + DB 196,98,125,24,37,12,58,0,0 ; vbroadcastss 0x3a0c(%rip),%ymm12 # 6acc <_sk_callback_avx+0x286> DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,37,2,58,0,0 ; vbroadcastss 0x3a02(%rip),%ymm12 # 6b10 <_sk_callback_avx+0x28a> + DB 196,98,125,24,37,2,58,0,0 ; vbroadcastss 0x3a02(%rip),%ymm12 # 6ad0 <_sk_callback_avx+0x28a> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,248,57,0,0 ; vbroadcastss 0x39f8(%rip),%ymm12 # 6b14 <_sk_callback_avx+0x28e> + DB 196,98,125,24,37,248,57,0,0 ; vbroadcastss 0x39f8(%rip),%ymm12 # 6ad4 <_sk_callback_avx+0x28e> DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,233,57,0,0 ; vbroadcastss 0x39e9(%rip),%ymm12 # 6b18 <_sk_callback_avx+0x292> + DB 196,98,125,24,37,233,57,0,0 ; vbroadcastss 0x39e9(%rip),%ymm12 # 6ad8 <_sk_callback_avx+0x292> DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0 - DB 196,98,125,24,37,223,57,0,0 ; vbroadcastss 0x39df(%rip),%ymm12 # 6b1c <_sk_callback_avx+0x296> + DB 196,98,125,24,37,223,57,0,0 ; vbroadcastss 0x39df(%rip),%ymm12 # 6adc <_sk_callback_avx+0x296> DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0 DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0 DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0 DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10 DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10 - DB 196,98,125,24,29,195,57,0,0 ; vbroadcastss 0x39c3(%rip),%ymm11 # 6b20 <_sk_callback_avx+0x29a> + DB 196,98,125,24,29,195,57,0,0 ; vbroadcastss 0x39c3(%rip),%ymm11 # 6ae0 <_sk_callback_avx+0x29a> DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0 - DB 196,98,125,24,29,185,57,0,0 ; vbroadcastss 0x39b9(%rip),%ymm11 # 6b24 <_sk_callback_avx+0x29e> + DB 196,98,125,24,29,185,57,0,0 ; vbroadcastss 0x39b9(%rip),%ymm11 # 6ae4 <_sk_callback_avx+0x29e> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0 - DB 196,98,125,24,29,170,57,0,0 ; vbroadcastss 0x39aa(%rip),%ymm11 # 6b28 <_sk_callback_avx+0x2a2> + DB 196,98,125,24,29,170,57,0,0 ; vbroadcastss 0x39aa(%rip),%ymm11 # 6ae8 <_sk_callback_avx+0x2a2> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,160,57,0,0 ; vbroadcastss 0x39a0(%rip),%ymm11 # 6b2c <_sk_callback_avx+0x2a6> + DB 196,98,125,24,29,160,57,0,0 ; vbroadcastss 0x39a0(%rip),%ymm11 # 6aec <_sk_callback_avx+0x2a6> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0 - DB 196,98,125,24,21,145,57,0,0 ; vbroadcastss 0x3991(%rip),%ymm10 # 6b30 <_sk_callback_avx+0x2aa> + DB 196,98,125,24,21,145,57,0,0 ; vbroadcastss 0x3991(%rip),%ymm10 # 6af0 <_sk_callback_avx+0x2aa> DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0 DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -8220,7 +8190,7 @@ _sk_parametric_r_avx LABEL PROC DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,104,57,0,0 ; vbroadcastss 0x3968(%rip),%ymm8 # 6b34 <_sk_callback_avx+0x2ae> + DB 196,98,125,24,5,104,57,0,0 ; vbroadcastss 0x3968(%rip),%ymm8 # 6af4 <_sk_callback_avx+0x2ae> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -8240,36 +8210,36 @@ _sk_parametric_g_avx LABEL PROC DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11 - DB 196,98,125,24,37,25,57,0,0 ; vbroadcastss 0x3919(%rip),%ymm12 # 6b38 <_sk_callback_avx+0x2b2> + DB 196,98,125,24,37,25,57,0,0 ; vbroadcastss 0x3919(%rip),%ymm12 # 6af8 <_sk_callback_avx+0x2b2> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,15,57,0,0 ; vbroadcastss 0x390f(%rip),%ymm12 # 6b3c <_sk_callback_avx+0x2b6> + DB 196,98,125,24,37,15,57,0,0 ; vbroadcastss 0x390f(%rip),%ymm12 # 6afc <_sk_callback_avx+0x2b6> DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1 - DB 196,98,125,24,37,5,57,0,0 ; vbroadcastss 0x3905(%rip),%ymm12 # 6b40 <_sk_callback_avx+0x2ba> + DB 196,98,125,24,37,5,57,0,0 ; vbroadcastss 0x3905(%rip),%ymm12 # 6b00 <_sk_callback_avx+0x2ba> DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1 - DB 196,98,125,24,37,251,56,0,0 ; vbroadcastss 0x38fb(%rip),%ymm12 # 6b44 <_sk_callback_avx+0x2be> + DB 196,98,125,24,37,251,56,0,0 ; vbroadcastss 0x38fb(%rip),%ymm12 # 6b04 <_sk_callback_avx+0x2be> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,241,56,0,0 ; vbroadcastss 0x38f1(%rip),%ymm12 # 6b48 <_sk_callback_avx+0x2c2> + DB 196,98,125,24,37,241,56,0,0 ; vbroadcastss 0x38f1(%rip),%ymm12 # 6b08 <_sk_callback_avx+0x2c2> DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,226,56,0,0 ; vbroadcastss 0x38e2(%rip),%ymm12 # 6b4c <_sk_callback_avx+0x2c6> + DB 196,98,125,24,37,226,56,0,0 ; vbroadcastss 0x38e2(%rip),%ymm12 # 6b0c <_sk_callback_avx+0x2c6> DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1 - DB 196,98,125,24,37,216,56,0,0 ; vbroadcastss 0x38d8(%rip),%ymm12 # 6b50 <_sk_callback_avx+0x2ca> + DB 196,98,125,24,37,216,56,0,0 ; vbroadcastss 0x38d8(%rip),%ymm12 # 6b10 <_sk_callback_avx+0x2ca> DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1 DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1 DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1 DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10 DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10 - DB 196,98,125,24,29,188,56,0,0 ; vbroadcastss 0x38bc(%rip),%ymm11 # 6b54 <_sk_callback_avx+0x2ce> + DB 196,98,125,24,29,188,56,0,0 ; vbroadcastss 0x38bc(%rip),%ymm11 # 6b14 <_sk_callback_avx+0x2ce> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,178,56,0,0 ; vbroadcastss 0x38b2(%rip),%ymm11 # 6b58 <_sk_callback_avx+0x2d2> + DB 196,98,125,24,29,178,56,0,0 ; vbroadcastss 0x38b2(%rip),%ymm11 # 6b18 <_sk_callback_avx+0x2d2> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,29,163,56,0,0 ; vbroadcastss 0x38a3(%rip),%ymm11 # 6b5c <_sk_callback_avx+0x2d6> + DB 196,98,125,24,29,163,56,0,0 ; vbroadcastss 0x38a3(%rip),%ymm11 # 6b1c <_sk_callback_avx+0x2d6> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,153,56,0,0 ; vbroadcastss 0x3899(%rip),%ymm11 # 6b60 <_sk_callback_avx+0x2da> + DB 196,98,125,24,29,153,56,0,0 ; vbroadcastss 0x3899(%rip),%ymm11 # 6b20 <_sk_callback_avx+0x2da> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1 - DB 196,98,125,24,21,138,56,0,0 ; vbroadcastss 0x388a(%rip),%ymm10 # 6b64 <_sk_callback_avx+0x2de> + DB 196,98,125,24,21,138,56,0,0 ; vbroadcastss 0x388a(%rip),%ymm10 # 6b24 <_sk_callback_avx+0x2de> DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1 DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -8277,7 +8247,7 @@ _sk_parametric_g_avx LABEL PROC DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,5,97,56,0,0 ; vbroadcastss 0x3861(%rip),%ymm8 # 6b68 <_sk_callback_avx+0x2e2> + DB 196,98,125,24,5,97,56,0,0 ; vbroadcastss 0x3861(%rip),%ymm8 # 6b28 <_sk_callback_avx+0x2e2> DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -8297,36 +8267,36 @@ _sk_parametric_b_avx LABEL PROC DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11 - DB 196,98,125,24,37,18,56,0,0 ; vbroadcastss 0x3812(%rip),%ymm12 # 6b6c <_sk_callback_avx+0x2e6> + DB 196,98,125,24,37,18,56,0,0 ; vbroadcastss 0x3812(%rip),%ymm12 # 6b2c <_sk_callback_avx+0x2e6> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,8,56,0,0 ; vbroadcastss 0x3808(%rip),%ymm12 # 6b70 <_sk_callback_avx+0x2ea> + DB 196,98,125,24,37,8,56,0,0 ; vbroadcastss 0x3808(%rip),%ymm12 # 6b30 <_sk_callback_avx+0x2ea> DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2 - DB 196,98,125,24,37,254,55,0,0 ; vbroadcastss 0x37fe(%rip),%ymm12 # 6b74 <_sk_callback_avx+0x2ee> + DB 196,98,125,24,37,254,55,0,0 ; vbroadcastss 0x37fe(%rip),%ymm12 # 6b34 <_sk_callback_avx+0x2ee> DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2 - DB 196,98,125,24,37,244,55,0,0 ; vbroadcastss 0x37f4(%rip),%ymm12 # 6b78 <_sk_callback_avx+0x2f2> + DB 196,98,125,24,37,244,55,0,0 ; vbroadcastss 0x37f4(%rip),%ymm12 # 6b38 <_sk_callback_avx+0x2f2> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,234,55,0,0 ; vbroadcastss 0x37ea(%rip),%ymm12 # 6b7c <_sk_callback_avx+0x2f6> + DB 196,98,125,24,37,234,55,0,0 ; vbroadcastss 0x37ea(%rip),%ymm12 # 6b3c <_sk_callback_avx+0x2f6> DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,219,55,0,0 ; vbroadcastss 0x37db(%rip),%ymm12 # 6b80 <_sk_callback_avx+0x2fa> + DB 196,98,125,24,37,219,55,0,0 ; vbroadcastss 0x37db(%rip),%ymm12 # 6b40 <_sk_callback_avx+0x2fa> DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2 - DB 196,98,125,24,37,209,55,0,0 ; vbroadcastss 0x37d1(%rip),%ymm12 # 6b84 <_sk_callback_avx+0x2fe> + DB 196,98,125,24,37,209,55,0,0 ; vbroadcastss 0x37d1(%rip),%ymm12 # 6b44 <_sk_callback_avx+0x2fe> DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2 DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2 DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2 DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10 DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10 - DB 196,98,125,24,29,181,55,0,0 ; vbroadcastss 0x37b5(%rip),%ymm11 # 6b88 <_sk_callback_avx+0x302> + DB 196,98,125,24,29,181,55,0,0 ; vbroadcastss 0x37b5(%rip),%ymm11 # 6b48 <_sk_callback_avx+0x302> DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 - DB 196,98,125,24,29,171,55,0,0 ; vbroadcastss 0x37ab(%rip),%ymm11 # 6b8c <_sk_callback_avx+0x306> + DB 196,98,125,24,29,171,55,0,0 ; vbroadcastss 0x37ab(%rip),%ymm11 # 6b4c <_sk_callback_avx+0x306> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2 - DB 196,98,125,24,29,156,55,0,0 ; vbroadcastss 0x379c(%rip),%ymm11 # 6b90 <_sk_callback_avx+0x30a> + DB 196,98,125,24,29,156,55,0,0 ; vbroadcastss 0x379c(%rip),%ymm11 # 6b50 <_sk_callback_avx+0x30a> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,146,55,0,0 ; vbroadcastss 0x3792(%rip),%ymm11 # 6b94 <_sk_callback_avx+0x30e> + DB 196,98,125,24,29,146,55,0,0 ; vbroadcastss 0x3792(%rip),%ymm11 # 6b54 <_sk_callback_avx+0x30e> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2 - DB 196,98,125,24,21,131,55,0,0 ; vbroadcastss 0x3783(%rip),%ymm10 # 6b98 <_sk_callback_avx+0x312> + DB 196,98,125,24,21,131,55,0,0 ; vbroadcastss 0x3783(%rip),%ymm10 # 6b58 <_sk_callback_avx+0x312> DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2 DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -8334,7 +8304,7 @@ _sk_parametric_b_avx LABEL PROC DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,90,55,0,0 ; vbroadcastss 0x375a(%rip),%ymm8 # 6b9c <_sk_callback_avx+0x316> + DB 196,98,125,24,5,90,55,0,0 ; vbroadcastss 0x375a(%rip),%ymm8 # 6b5c <_sk_callback_avx+0x316> DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -8354,36 +8324,36 @@ _sk_parametric_a_avx LABEL PROC DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3 DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10 DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11 - DB 196,98,125,24,37,11,55,0,0 ; vbroadcastss 0x370b(%rip),%ymm12 # 6ba0 <_sk_callback_avx+0x31a> + DB 196,98,125,24,37,11,55,0,0 ; vbroadcastss 0x370b(%rip),%ymm12 # 6b60 <_sk_callback_avx+0x31a> DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,1,55,0,0 ; vbroadcastss 0x3701(%rip),%ymm12 # 6ba4 <_sk_callback_avx+0x31e> + DB 196,98,125,24,37,1,55,0,0 ; vbroadcastss 0x3701(%rip),%ymm12 # 6b64 <_sk_callback_avx+0x31e> DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3 - DB 196,98,125,24,37,247,54,0,0 ; vbroadcastss 0x36f7(%rip),%ymm12 # 6ba8 <_sk_callback_avx+0x322> + DB 196,98,125,24,37,247,54,0,0 ; vbroadcastss 0x36f7(%rip),%ymm12 # 6b68 <_sk_callback_avx+0x322> DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3 - DB 196,98,125,24,37,237,54,0,0 ; vbroadcastss 0x36ed(%rip),%ymm12 # 6bac <_sk_callback_avx+0x326> + DB 196,98,125,24,37,237,54,0,0 ; vbroadcastss 0x36ed(%rip),%ymm12 # 6b6c <_sk_callback_avx+0x326> DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,227,54,0,0 ; vbroadcastss 0x36e3(%rip),%ymm12 # 6bb0 <_sk_callback_avx+0x32a> + DB 196,98,125,24,37,227,54,0,0 ; vbroadcastss 0x36e3(%rip),%ymm12 # 6b70 <_sk_callback_avx+0x32a> DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12 DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11 - DB 196,98,125,24,37,212,54,0,0 ; vbroadcastss 0x36d4(%rip),%ymm12 # 6bb4 <_sk_callback_avx+0x32e> + DB 196,98,125,24,37,212,54,0,0 ; vbroadcastss 0x36d4(%rip),%ymm12 # 6b74 <_sk_callback_avx+0x32e> DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3 - DB 196,98,125,24,37,202,54,0,0 ; vbroadcastss 0x36ca(%rip),%ymm12 # 6bb8 <_sk_callback_avx+0x332> + DB 196,98,125,24,37,202,54,0,0 ; vbroadcastss 0x36ca(%rip),%ymm12 # 6b78 <_sk_callback_avx+0x332> DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3 DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3 DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3 DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10 DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10 - DB 196,98,125,24,29,174,54,0,0 ; vbroadcastss 0x36ae(%rip),%ymm11 # 6bbc <_sk_callback_avx+0x336> + DB 196,98,125,24,29,174,54,0,0 ; vbroadcastss 0x36ae(%rip),%ymm11 # 6b7c <_sk_callback_avx+0x336> DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3 - DB 196,98,125,24,29,164,54,0,0 ; vbroadcastss 0x36a4(%rip),%ymm11 # 6bc0 <_sk_callback_avx+0x33a> + DB 196,98,125,24,29,164,54,0,0 ; vbroadcastss 0x36a4(%rip),%ymm11 # 6b80 <_sk_callback_avx+0x33a> DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11 DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3 - DB 196,98,125,24,29,149,54,0,0 ; vbroadcastss 0x3695(%rip),%ymm11 # 6bc4 <_sk_callback_avx+0x33e> + DB 196,98,125,24,29,149,54,0,0 ; vbroadcastss 0x3695(%rip),%ymm11 # 6b84 <_sk_callback_avx+0x33e> DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10 - DB 196,98,125,24,29,139,54,0,0 ; vbroadcastss 0x368b(%rip),%ymm11 # 6bc8 <_sk_callback_avx+0x342> + DB 196,98,125,24,29,139,54,0,0 ; vbroadcastss 0x368b(%rip),%ymm11 # 6b88 <_sk_callback_avx+0x342> DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10 DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3 - DB 196,98,125,24,21,124,54,0,0 ; vbroadcastss 0x367c(%rip),%ymm10 # 6bcc <_sk_callback_avx+0x346> + DB 196,98,125,24,21,124,54,0,0 ; vbroadcastss 0x367c(%rip),%ymm10 # 6b8c <_sk_callback_avx+0x346> DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3 DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3 DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10 @@ -8391,38 +8361,38 @@ _sk_parametric_a_avx LABEL PROC DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3 DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3 - DB 196,98,125,24,5,83,54,0,0 ; vbroadcastss 0x3653(%rip),%ymm8 # 6bd0 <_sk_callback_avx+0x34a> + DB 196,98,125,24,5,83,54,0,0 ; vbroadcastss 0x3653(%rip),%ymm8 # 6b90 <_sk_callback_avx+0x34a> DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax PUBLIC _sk_lab_to_xyz_avx _sk_lab_to_xyz_avx LABEL PROC - DB 196,98,125,24,5,69,54,0,0 ; vbroadcastss 0x3645(%rip),%ymm8 # 6bd4 <_sk_callback_avx+0x34e> + DB 196,98,125,24,5,69,54,0,0 ; vbroadcastss 0x3645(%rip),%ymm8 # 6b94 <_sk_callback_avx+0x34e> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,59,54,0,0 ; vbroadcastss 0x363b(%rip),%ymm8 # 6bd8 <_sk_callback_avx+0x352> + DB 196,98,125,24,5,59,54,0,0 ; vbroadcastss 0x363b(%rip),%ymm8 # 6b98 <_sk_callback_avx+0x352> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 - DB 196,98,125,24,13,49,54,0,0 ; vbroadcastss 0x3631(%rip),%ymm9 # 6bdc <_sk_callback_avx+0x356> + DB 196,98,125,24,13,49,54,0,0 ; vbroadcastss 0x3631(%rip),%ymm9 # 6b9c <_sk_callback_avx+0x356> DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1 DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2 - DB 196,98,125,24,5,29,54,0,0 ; vbroadcastss 0x361d(%rip),%ymm8 # 6be0 <_sk_callback_avx+0x35a> + DB 196,98,125,24,5,29,54,0,0 ; vbroadcastss 0x361d(%rip),%ymm8 # 6ba0 <_sk_callback_avx+0x35a> DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,19,54,0,0 ; vbroadcastss 0x3613(%rip),%ymm8 # 6be4 <_sk_callback_avx+0x35e> + DB 196,98,125,24,5,19,54,0,0 ; vbroadcastss 0x3613(%rip),%ymm8 # 6ba4 <_sk_callback_avx+0x35e> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,5,9,54,0,0 ; vbroadcastss 0x3609(%rip),%ymm8 # 6be8 <_sk_callback_avx+0x362> + DB 196,98,125,24,5,9,54,0,0 ; vbroadcastss 0x3609(%rip),%ymm8 # 6ba8 <_sk_callback_avx+0x362> DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1 DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1 - DB 196,98,125,24,5,251,53,0,0 ; vbroadcastss 0x35fb(%rip),%ymm8 # 6bec <_sk_callback_avx+0x366> + DB 196,98,125,24,5,251,53,0,0 ; vbroadcastss 0x35fb(%rip),%ymm8 # 6bac <_sk_callback_avx+0x366> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2 DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8 DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8 - DB 196,98,125,24,13,228,53,0,0 ; vbroadcastss 0x35e4(%rip),%ymm9 # 6bf0 <_sk_callback_avx+0x36a> + DB 196,98,125,24,13,228,53,0,0 ; vbroadcastss 0x35e4(%rip),%ymm9 # 6bb0 <_sk_callback_avx+0x36a> DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10 - DB 196,98,125,24,29,217,53,0,0 ; vbroadcastss 0x35d9(%rip),%ymm11 # 6bf4 <_sk_callback_avx+0x36e> + DB 196,98,125,24,29,217,53,0,0 ; vbroadcastss 0x35d9(%rip),%ymm11 # 6bb4 <_sk_callback_avx+0x36e> DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1 - DB 196,98,125,24,37,207,53,0,0 ; vbroadcastss 0x35cf(%rip),%ymm12 # 6bf8 <_sk_callback_avx+0x372> + DB 196,98,125,24,37,207,53,0,0 ; vbroadcastss 0x35cf(%rip),%ymm12 # 6bb8 <_sk_callback_avx+0x372> DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1 DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8 DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1 @@ -8437,9 +8407,9 @@ _sk_lab_to_xyz_avx LABEL PROC DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2 DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2 DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2 - DB 196,226,125,24,5,133,53,0,0 ; vbroadcastss 0x3585(%rip),%ymm0 # 6bfc <_sk_callback_avx+0x376> + DB 196,226,125,24,5,133,53,0,0 ; vbroadcastss 0x3585(%rip),%ymm0 # 6bbc <_sk_callback_avx+0x376> DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,124,53,0,0 ; vbroadcastss 0x357c(%rip),%ymm8 # 6c00 <_sk_callback_avx+0x37a> + DB 196,98,125,24,5,124,53,0,0 ; vbroadcastss 0x357c(%rip),%ymm8 # 6bc0 <_sk_callback_avx+0x37a> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -8449,15 +8419,15 @@ _sk_load_a8_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,66 ; jne 36d9 <_sk_load_a8_avx+0x4c> + DB 117,66 ; jne 3699 <_sk_load_a8_avx+0x4c> DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0 - DB 197,249,219,5,203,55,0,0 ; vpand 0x37cb(%rip),%xmm0,%xmm0 # 6e70 <_sk_callback_avx+0x5ea> + DB 197,249,219,5,203,55,0,0 ; vpand 0x37cb(%rip),%xmm0,%xmm0 # 6e30 <_sk_callback_avx+0x5ea> DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,63,53,0,0 ; vbroadcastss 0x353f(%rip),%ymm1 # 6c04 <_sk_callback_avx+0x37e> + DB 196,226,125,24,13,63,53,0,0 ; vbroadcastss 0x353f(%rip),%ymm1 # 6bc4 <_sk_callback_avx+0x37e> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -8469,15 +8439,15 @@ _sk_load_a8_avx LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,176 ; ja 369d <_sk_load_a8_avx+0x10> + DB 119,176 ; ja 365d <_sk_load_a8_avx+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 3770 <_sk_load_a8_avx+0xe3> + DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 3730 <_sk_load_a8_avx+0xe3> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,145 ; jmp 369d <_sk_load_a8_avx+0x10> + DB 235,145 ; jmp 365d <_sk_load_a8_avx+0x10> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -8485,7 +8455,7 @@ _sk_load_a8_avx LABEL PROC DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0 - DB 233,105,255,255,255 ; jmpq 369d <_sk_load_a8_avx+0x10> + DB 233,105,255,255,255 ; jmpq 365d <_sk_load_a8_avx+0x10> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -8496,7 +8466,7 @@ _sk_load_a8_avx LABEL PROC DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - DB 233,46,255,255,255 ; jmpq 369d <_sk_load_a8_avx+0x10> + DB 233,46,255,255,255 ; jmpq 365d <_sk_load_a8_avx+0x10> DB 144 ; nop DB 145 ; xchg %eax,%ecx DB 255 ; (bad) @@ -8505,7 +8475,7 @@ _sk_load_a8_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf003780 <_sk_callback_avx+0xffffffffdeffcefa> + DB 233,255,255,255,222 ; jmpq ffffffffdf003740 <_sk_callback_avx+0xffffffffdeffcefa> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -8558,7 +8528,7 @@ _sk_gather_a8_avx LABEL PROC DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,176,51,0,0 ; vbroadcastss 0x33b0(%rip),%ymm1 # 6c08 <_sk_callback_avx+0x382> + DB 196,226,125,24,13,176,51,0,0 ; vbroadcastss 0x33b0(%rip),%ymm1 # 6bc8 <_sk_callback_avx+0x382> DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 @@ -8570,14 +8540,14 @@ PUBLIC _sk_store_a8_avx _sk_store_a8_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,146,51,0,0 ; vbroadcastss 0x3392(%rip),%ymm8 # 6c0c <_sk_callback_avx+0x386> + DB 196,98,125,24,5,146,51,0,0 ; vbroadcastss 0x3392(%rip),%ymm8 # 6bcc <_sk_callback_avx+0x386> DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8 DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8 DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 38a3 <_sk_store_a8_avx+0x37> + DB 117,10 ; jne 3863 <_sk_store_a8_avx+0x37> DB 196,65,123,17,4,19 ; vmovsd %xmm8,(%r11,%rdx,1) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -8585,25 +8555,25 @@ _sk_store_a8_avx LABEL PROC DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,236 ; ja 389f <_sk_store_a8_avx+0x33> + DB 119,236 ; ja 385f <_sk_store_a8_avx+0x33> DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8 DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,85,0,0,0 ; lea 0x55(%rip),%r10 # 3918 <_sk_store_a8_avx+0xac> + DB 76,141,21,85,0,0,0 ; lea 0x55(%rip),%r10 # 38d8 <_sk_store_a8_avx+0xac> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,20,4,19,0 ; vpextrb $0x0,%xmm8,(%r11,%rdx,1) - DB 235,202 ; jmp 389f <_sk_store_a8_avx+0x33> + DB 235,202 ; jmp 385f <_sk_store_a8_avx+0x33> DB 196,67,121,20,68,19,2,4 ; vpextrb $0x4,%xmm8,0x2(%r11,%rdx,1) - DB 196,98,57,0,5,154,53,0,0 ; vpshufb 0x359a(%rip),%xmm8,%xmm8 # 6e80 <_sk_callback_avx+0x5fa> + DB 196,98,57,0,5,154,53,0,0 ; vpshufb 0x359a(%rip),%xmm8,%xmm8 # 6e40 <_sk_callback_avx+0x5fa> DB 196,67,121,21,4,19,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,1) - DB 235,176 ; jmp 389f <_sk_store_a8_avx+0x33> + DB 235,176 ; jmp 385f <_sk_store_a8_avx+0x33> DB 196,67,121,20,68,19,6,12 ; vpextrb $0xc,%xmm8,0x6(%r11,%rdx,1) DB 196,67,121,20,68,19,5,10 ; vpextrb $0xa,%xmm8,0x5(%r11,%rdx,1) DB 196,67,121,20,68,19,4,8 ; vpextrb $0x8,%xmm8,0x4(%r11,%rdx,1) - DB 196,98,57,0,5,128,53,0,0 ; vpshufb 0x3580(%rip),%xmm8,%xmm8 # 6e90 <_sk_callback_avx+0x60a> + DB 196,98,57,0,5,128,53,0,0 ; vpshufb 0x3580(%rip),%xmm8,%xmm8 # 6e50 <_sk_callback_avx+0x60a> DB 196,65,121,126,4,19 ; vmovd %xmm8,(%r11,%rdx,1) - DB 235,135 ; jmp 389f <_sk_store_a8_avx+0x33> + DB 235,135 ; jmp 385f <_sk_store_a8_avx+0x33> DB 180,255 ; mov $0xff,%ah DB 255 ; (bad) DB 255,197 ; inc %ebp @@ -8629,18 +8599,18 @@ _sk_load_g8_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,71 ; jne 3985 <_sk_load_g8_avx+0x51> + DB 117,71 ; jne 3945 <_sk_load_g8_avx+0x51> DB 196,194,121,48,4,19 ; vpmovzxbw (%r11,%rdx,1),%xmm0 - DB 197,249,219,5,84,53,0,0 ; vpand 0x3554(%rip),%xmm0,%xmm0 # 6ea0 <_sk_callback_avx+0x61a> + DB 197,249,219,5,84,53,0,0 ; vpand 0x3554(%rip),%xmm0,%xmm0 # 6e60 <_sk_callback_avx+0x61a> DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,164,50,0,0 ; vbroadcastss 0x32a4(%rip),%ymm1 # 6c10 <_sk_callback_avx+0x38a> + DB 196,226,125,24,13,164,50,0,0 ; vbroadcastss 0x32a4(%rip),%ymm1 # 6bd0 <_sk_callback_avx+0x38a> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,153,50,0,0 ; vbroadcastss 0x3299(%rip),%ymm3 # 6c14 <_sk_callback_avx+0x38e> + DB 196,226,125,24,29,153,50,0,0 ; vbroadcastss 0x3299(%rip),%ymm3 # 6bd4 <_sk_callback_avx+0x38e> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -8649,15 +8619,15 @@ _sk_load_g8_avx LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,171 ; ja 3944 <_sk_load_g8_avx+0x10> + DB 119,171 ; ja 3904 <_sk_load_g8_avx+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 3a1c <_sk_load_g8_avx+0xe8> + DB 76,141,21,120,0,0,0 ; lea 0x78(%rip),%r10 # 39dc <_sk_load_g8_avx+0xe8> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,140 ; jmp 3944 <_sk_load_g8_avx+0x10> + DB 235,140 ; jmp 3904 <_sk_load_g8_avx+0x10> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0 @@ -8665,7 +8635,7 @@ _sk_load_g8_avx LABEL PROC DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0 - DB 233,100,255,255,255 ; jmpq 3944 <_sk_load_g8_avx+0x10> + DB 233,100,255,255,255 ; jmpq 3904 <_sk_load_g8_avx+0x10> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0 @@ -8676,7 +8646,7 @@ _sk_load_g8_avx LABEL PROC DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1 DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1 DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - DB 233,41,255,255,255 ; jmpq 3944 <_sk_load_g8_avx+0x10> + DB 233,41,255,255,255 ; jmpq 3904 <_sk_load_g8_avx+0x10> DB 144 ; nop DB 145 ; xchg %eax,%ecx DB 255 ; (bad) @@ -8685,7 +8655,7 @@ _sk_load_g8_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 233,255,255,255,222 ; jmpq ffffffffdf003a2c <_sk_callback_avx+0xffffffffdeffd1a6> + DB 233,255,255,255,222 ; jmpq ffffffffdf0039ec <_sk_callback_avx+0xffffffffdeffd1a6> DB 255 ; (bad) DB 255 ; (bad) DB 255,211 ; callq *%rbx @@ -8738,10 +8708,10 @@ _sk_gather_g8_avx LABEL PROC DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,20,49,0,0 ; vbroadcastss 0x3114(%rip),%ymm1 # 6c18 <_sk_callback_avx+0x392> + DB 196,226,125,24,13,20,49,0,0 ; vbroadcastss 0x3114(%rip),%ymm1 # 6bd8 <_sk_callback_avx+0x392> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,9,49,0,0 ; vbroadcastss 0x3109(%rip),%ymm3 # 6c1c <_sk_callback_avx+0x396> + DB 196,226,125,24,29,9,49,0,0 ; vbroadcastss 0x3109(%rip),%ymm3 # 6bdc <_sk_callback_avx+0x396> DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 DB 197,252,40,208 ; vmovaps %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -8751,9 +8721,9 @@ _sk_gather_i8_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,193 ; mov %rax,%r9 DB 77,133,201 ; test %r9,%r9 - DB 116,5 ; je 3b2c <_sk_gather_i8_avx+0xf> + DB 116,5 ; je 3aec <_sk_gather_i8_avx+0xf> DB 76,137,200 ; mov %r9,%rax - DB 235,2 ; jmp 3b2e <_sk_gather_i8_avx+0x11> + DB 235,2 ; jmp 3aee <_sk_gather_i8_avx+0x11> DB 72,173 ; lods %ds:(%rsi),%rax DB 83 ; push %rbx DB 76,139,16 ; mov (%rax),%r10 @@ -8811,10 +8781,10 @@ _sk_gather_i8_avx LABEL PROC DB 72,193,235,30 ; shr $0x1e,%rbx DB 196,195,121,34,28,27,3 ; vpinsrd $0x3,(%r11,%rbx,1),%xmm0,%xmm3 DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - DB 197,124,40,21,244,50,0,0 ; vmovaps 0x32f4(%rip),%ymm10 # 6f40 <_sk_callback_avx+0x6ba> + DB 197,124,40,21,244,50,0,0 ; vmovaps 0x32f4(%rip),%ymm10 # 6f00 <_sk_callback_avx+0x6ba> DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,13,194,47,0,0 ; vbroadcastss 0x2fc2(%rip),%ymm9 # 6c20 <_sk_callback_avx+0x39a> + DB 196,98,125,24,13,194,47,0,0 ; vbroadcastss 0x2fc2(%rip),%ymm9 # 6be0 <_sk_callback_avx+0x39a> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1 DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2 @@ -8842,56 +8812,56 @@ _sk_load_565_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,128,0,0,0 ; jne 3d4e <_sk_load_565_avx+0x8e> + DB 15,133,128,0,0,0 ; jne 3d0e <_sk_load_565_avx+0x8e> DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0 DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - DB 196,226,125,24,5,52,47,0,0 ; vbroadcastss 0x2f34(%rip),%ymm0 # 6c24 <_sk_callback_avx+0x39e> + DB 196,226,125,24,5,52,47,0,0 ; vbroadcastss 0x2f34(%rip),%ymm0 # 6be4 <_sk_callback_avx+0x39e> DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,39,47,0,0 ; vbroadcastss 0x2f27(%rip),%ymm1 # 6c28 <_sk_callback_avx+0x3a2> + DB 196,226,125,24,13,39,47,0,0 ; vbroadcastss 0x2f27(%rip),%ymm1 # 6be8 <_sk_callback_avx+0x3a2> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,30,47,0,0 ; vbroadcastss 0x2f1e(%rip),%ymm1 # 6c2c <_sk_callback_avx+0x3a6> + DB 196,226,125,24,13,30,47,0,0 ; vbroadcastss 0x2f1e(%rip),%ymm1 # 6bec <_sk_callback_avx+0x3a6> DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,17,47,0,0 ; vbroadcastss 0x2f11(%rip),%ymm3 # 6c30 <_sk_callback_avx+0x3aa> + DB 196,226,125,24,29,17,47,0,0 ; vbroadcastss 0x2f11(%rip),%ymm3 # 6bf0 <_sk_callback_avx+0x3aa> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,24,29,8,47,0,0 ; vbroadcastss 0x2f08(%rip),%ymm3 # 6c34 <_sk_callback_avx+0x3ae> + DB 196,226,125,24,29,8,47,0,0 ; vbroadcastss 0x2f08(%rip),%ymm3 # 6bf4 <_sk_callback_avx+0x3ae> DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,251,46,0,0 ; vbroadcastss 0x2efb(%rip),%ymm3 # 6c38 <_sk_callback_avx+0x3b2> + DB 196,226,125,24,29,251,46,0,0 ; vbroadcastss 0x2efb(%rip),%ymm3 # 6bf8 <_sk_callback_avx+0x3b2> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,240,46,0,0 ; vbroadcastss 0x2ef0(%rip),%ymm3 # 6c3c <_sk_callback_avx+0x3b6> + DB 196,226,125,24,29,240,46,0,0 ; vbroadcastss 0x2ef0(%rip),%ymm3 # 6bfc <_sk_callback_avx+0x3b6> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,7 ; and $0x7,%r9b DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,110,255,255,255 ; ja 3cd4 <_sk_load_565_avx+0x14> + DB 15,135,110,255,255,255 ; ja 3c94 <_sk_load_565_avx+0x14> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 3dd4 <_sk_load_565_avx+0x114> + DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 3d94 <_sk_load_565_avx+0x114> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 233,76,255,255,255 ; jmpq 3cd4 <_sk_load_565_avx+0x14> + DB 233,76,255,255,255 ; jmpq 3c94 <_sk_load_565_avx+0x14> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm1 DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0 - DB 233,47,255,255,255 ; jmpq 3cd4 <_sk_load_565_avx+0x14> + DB 233,47,255,255,255 ; jmpq 3c94 <_sk_load_565_avx+0x14> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm1 DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - DB 233,2,255,255,255 ; jmpq 3cd4 <_sk_load_565_avx+0x14> + DB 233,2,255,255,255 ; jmpq 3c94 <_sk_load_565_avx+0x14> DB 102,144 ; xchg %ax,%ax DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi) DB 255 ; (bad) @@ -8958,37 +8928,37 @@ _sk_gather_565_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2 - DB 196,226,125,24,5,126,45,0,0 ; vbroadcastss 0x2d7e(%rip),%ymm0 # 6c40 <_sk_callback_avx+0x3ba> + DB 196,226,125,24,5,126,45,0,0 ; vbroadcastss 0x2d7e(%rip),%ymm0 # 6c00 <_sk_callback_avx+0x3ba> DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,113,45,0,0 ; vbroadcastss 0x2d71(%rip),%ymm1 # 6c44 <_sk_callback_avx+0x3be> + DB 196,226,125,24,13,113,45,0,0 ; vbroadcastss 0x2d71(%rip),%ymm1 # 6c04 <_sk_callback_avx+0x3be> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,104,45,0,0 ; vbroadcastss 0x2d68(%rip),%ymm1 # 6c48 <_sk_callback_avx+0x3c2> + DB 196,226,125,24,13,104,45,0,0 ; vbroadcastss 0x2d68(%rip),%ymm1 # 6c08 <_sk_callback_avx+0x3c2> DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,29,91,45,0,0 ; vbroadcastss 0x2d5b(%rip),%ymm3 # 6c4c <_sk_callback_avx+0x3c6> + DB 196,226,125,24,29,91,45,0,0 ; vbroadcastss 0x2d5b(%rip),%ymm3 # 6c0c <_sk_callback_avx+0x3c6> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 - DB 196,226,125,24,29,82,45,0,0 ; vbroadcastss 0x2d52(%rip),%ymm3 # 6c50 <_sk_callback_avx+0x3ca> + DB 196,226,125,24,29,82,45,0,0 ; vbroadcastss 0x2d52(%rip),%ymm3 # 6c10 <_sk_callback_avx+0x3ca> DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,226,125,24,29,69,45,0,0 ; vbroadcastss 0x2d45(%rip),%ymm3 # 6c54 <_sk_callback_avx+0x3ce> + DB 196,226,125,24,29,69,45,0,0 ; vbroadcastss 0x2d45(%rip),%ymm3 # 6c14 <_sk_callback_avx+0x3ce> DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,58,45,0,0 ; vbroadcastss 0x2d3a(%rip),%ymm3 # 6c58 <_sk_callback_avx+0x3d2> + DB 196,226,125,24,29,58,45,0,0 ; vbroadcastss 0x2d3a(%rip),%ymm3 # 6c18 <_sk_callback_avx+0x3d2> DB 255,224 ; jmpq *%rax PUBLIC _sk_store_565_avx _sk_store_565_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,46,45,0,0 ; vbroadcastss 0x2d2e(%rip),%ymm8 # 6c5c <_sk_callback_avx+0x3d6> + DB 196,98,125,24,5,46,45,0,0 ; vbroadcastss 0x2d2e(%rip),%ymm8 # 6c1c <_sk_callback_avx+0x3d6> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10 DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9 DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9 DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 - DB 196,98,125,24,21,7,45,0,0 ; vbroadcastss 0x2d07(%rip),%ymm10 # 6c60 <_sk_callback_avx+0x3da> + DB 196,98,125,24,21,7,45,0,0 ; vbroadcastss 0x2d07(%rip),%ymm10 # 6c20 <_sk_callback_avx+0x3da> DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10 DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10 DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11 @@ -9002,7 +8972,7 @@ _sk_store_565_avx LABEL PROC DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 3fa9 <_sk_store_565_avx+0x89> + DB 117,10 ; jne 3f69 <_sk_store_565_avx+0x89> DB 196,65,122,127,4,83 ; vmovdqu %xmm8,(%r11,%rdx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9010,22 +8980,22 @@ _sk_store_565_avx LABEL PROC DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,236 ; ja 3fa5 <_sk_store_565_avx+0x85> + DB 119,236 ; ja 3f65 <_sk_store_565_avx+0x85> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,68,0,0,0 ; lea 0x44(%rip),%r10 # 4008 <_sk_store_565_avx+0xe8> + DB 76,141,21,68,0,0,0 ; lea 0x44(%rip),%r10 # 3fc8 <_sk_store_565_avx+0xe8> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2) - DB 235,207 ; jmp 3fa5 <_sk_store_565_avx+0x85> + DB 235,207 ; jmp 3f65 <_sk_store_565_avx+0x85> DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2) DB 196,65,121,126,4,83 ; vmovd %xmm8,(%r11,%rdx,2) - DB 235,191 ; jmp 3fa5 <_sk_store_565_avx+0x85> + DB 235,191 ; jmp 3f65 <_sk_store_565_avx+0x85> DB 196,67,121,21,68,83,12,6 ; vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2) DB 196,67,121,21,68,83,10,5 ; vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2) DB 196,67,121,21,68,83,8,4 ; vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2) DB 196,65,121,214,4,83 ; vmovq %xmm8,(%r11,%rdx,2) - DB 235,159 ; jmp 3fa5 <_sk_store_565_avx+0x85> + DB 235,159 ; jmp 3f65 <_sk_store_565_avx+0x85> DB 102,144 ; xchg %ax,%ax DB 197,255,255 ; (bad) DB 255,214 ; callq *%rsi @@ -9054,31 +9024,31 @@ _sk_load_4444_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,152,0,0,0 ; jne 40ca <_sk_load_4444_avx+0xa6> + DB 15,133,152,0,0,0 ; jne 408a <_sk_load_4444_avx+0xa6> DB 196,193,122,111,4,83 ; vmovdqu (%r11,%rdx,2),%xmm0 DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1 DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - DB 196,226,125,24,5,16,44,0,0 ; vbroadcastss 0x2c10(%rip),%ymm0 # 6c64 <_sk_callback_avx+0x3de> + DB 196,226,125,24,5,16,44,0,0 ; vbroadcastss 0x2c10(%rip),%ymm0 # 6c24 <_sk_callback_avx+0x3de> DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,3,44,0,0 ; vbroadcastss 0x2c03(%rip),%ymm1 # 6c68 <_sk_callback_avx+0x3e2> + DB 196,226,125,24,13,3,44,0,0 ; vbroadcastss 0x2c03(%rip),%ymm1 # 6c28 <_sk_callback_avx+0x3e2> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,250,43,0,0 ; vbroadcastss 0x2bfa(%rip),%ymm1 # 6c6c <_sk_callback_avx+0x3e6> + DB 196,226,125,24,13,250,43,0,0 ; vbroadcastss 0x2bfa(%rip),%ymm1 # 6c2c <_sk_callback_avx+0x3e6> DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,237,43,0,0 ; vbroadcastss 0x2bed(%rip),%ymm2 # 6c70 <_sk_callback_avx+0x3ea> + DB 196,226,125,24,21,237,43,0,0 ; vbroadcastss 0x2bed(%rip),%ymm2 # 6c30 <_sk_callback_avx+0x3ea> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,228,43,0,0 ; vbroadcastss 0x2be4(%rip),%ymm2 # 6c74 <_sk_callback_avx+0x3ee> + DB 196,226,125,24,21,228,43,0,0 ; vbroadcastss 0x2be4(%rip),%ymm2 # 6c34 <_sk_callback_avx+0x3ee> DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,215,43,0,0 ; vbroadcastss 0x2bd7(%rip),%ymm8 # 6c78 <_sk_callback_avx+0x3f2> + DB 196,98,125,24,5,215,43,0,0 ; vbroadcastss 0x2bd7(%rip),%ymm8 # 6c38 <_sk_callback_avx+0x3f2> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,205,43,0,0 ; vbroadcastss 0x2bcd(%rip),%ymm8 # 6c7c <_sk_callback_avx+0x3f6> + DB 196,98,125,24,5,205,43,0,0 ; vbroadcastss 0x2bcd(%rip),%ymm8 # 6c3c <_sk_callback_avx+0x3f6> DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,191,43,0,0 ; vbroadcastss 0x2bbf(%rip),%ymm8 # 6c80 <_sk_callback_avx+0x3fa> + DB 196,98,125,24,5,191,43,0,0 ; vbroadcastss 0x2bbf(%rip),%ymm8 # 6c40 <_sk_callback_avx+0x3fa> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9087,27 +9057,27 @@ _sk_load_4444_avx LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,86,255,255,255 ; ja 4038 <_sk_load_4444_avx+0x14> + DB 15,135,86,255,255,255 ; ja 3ff8 <_sk_load_4444_avx+0x14> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 4150 <_sk_load_4444_avx+0x12c> + DB 76,141,21,99,0,0,0 ; lea 0x63(%rip),%r10 # 4110 <_sk_load_4444_avx+0x12c> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,183,4,83 ; movzwl (%r11,%rdx,2),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 233,52,255,255,255 ; jmpq 4038 <_sk_load_4444_avx+0x14> + DB 233,52,255,255,255 ; jmpq 3ff8 <_sk_load_4444_avx+0x14> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,83,4,2 ; vpinsrw $0x2,0x4(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,110,12,83 ; vmovd (%r11,%rdx,2),%xmm1 DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0 - DB 233,23,255,255,255 ; jmpq 4038 <_sk_load_4444_avx+0x14> + DB 233,23,255,255,255 ; jmpq 3ff8 <_sk_load_4444_avx+0x14> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,193,121,196,68,83,12,6 ; vpinsrw $0x6,0xc(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,196,68,83,10,5 ; vpinsrw $0x5,0xa(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,121,196,68,83,8,4 ; vpinsrw $0x4,0x8(%r11,%rdx,2),%xmm0,%xmm0 DB 196,193,122,126,12,83 ; vmovq (%r11,%rdx,2),%xmm1 DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0 - DB 233,234,254,255,255 ; jmpq 4038 <_sk_load_4444_avx+0x14> + DB 233,234,254,255,255 ; jmpq 3ff8 <_sk_load_4444_avx+0x14> DB 102,144 ; xchg %ax,%ax DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi) DB 255 ; (bad) @@ -9174,25 +9144,25 @@ _sk_gather_4444_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3 - DB 196,226,125,24,5,70,42,0,0 ; vbroadcastss 0x2a46(%rip),%ymm0 # 6c84 <_sk_callback_avx+0x3fe> + DB 196,226,125,24,5,70,42,0,0 ; vbroadcastss 0x2a46(%rip),%ymm0 # 6c44 <_sk_callback_avx+0x3fe> DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,226,125,24,13,57,42,0,0 ; vbroadcastss 0x2a39(%rip),%ymm1 # 6c88 <_sk_callback_avx+0x402> + DB 196,226,125,24,13,57,42,0,0 ; vbroadcastss 0x2a39(%rip),%ymm1 # 6c48 <_sk_callback_avx+0x402> DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,48,42,0,0 ; vbroadcastss 0x2a30(%rip),%ymm1 # 6c8c <_sk_callback_avx+0x406> + DB 196,226,125,24,13,48,42,0,0 ; vbroadcastss 0x2a30(%rip),%ymm1 # 6c4c <_sk_callback_avx+0x406> DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1 DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1 - DB 196,226,125,24,21,35,42,0,0 ; vbroadcastss 0x2a23(%rip),%ymm2 # 6c90 <_sk_callback_avx+0x40a> + DB 196,226,125,24,21,35,42,0,0 ; vbroadcastss 0x2a23(%rip),%ymm2 # 6c50 <_sk_callback_avx+0x40a> DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1 - DB 196,226,125,24,21,26,42,0,0 ; vbroadcastss 0x2a1a(%rip),%ymm2 # 6c94 <_sk_callback_avx+0x40e> + DB 196,226,125,24,21,26,42,0,0 ; vbroadcastss 0x2a1a(%rip),%ymm2 # 6c54 <_sk_callback_avx+0x40e> DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2 DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 - DB 196,98,125,24,5,13,42,0,0 ; vbroadcastss 0x2a0d(%rip),%ymm8 # 6c98 <_sk_callback_avx+0x412> + DB 196,98,125,24,5,13,42,0,0 ; vbroadcastss 0x2a0d(%rip),%ymm8 # 6c58 <_sk_callback_avx+0x412> DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2 - DB 196,98,125,24,5,3,42,0,0 ; vbroadcastss 0x2a03(%rip),%ymm8 # 6c9c <_sk_callback_avx+0x416> + DB 196,98,125,24,5,3,42,0,0 ; vbroadcastss 0x2a03(%rip),%ymm8 # 6c5c <_sk_callback_avx+0x416> DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3 DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3 - DB 196,98,125,24,5,245,41,0,0 ; vbroadcastss 0x29f5(%rip),%ymm8 # 6ca0 <_sk_callback_avx+0x41a> + DB 196,98,125,24,5,245,41,0,0 ; vbroadcastss 0x29f5(%rip),%ymm8 # 6c60 <_sk_callback_avx+0x41a> DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9201,7 +9171,7 @@ PUBLIC _sk_store_4444_avx _sk_store_4444_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 - DB 196,98,125,24,5,226,41,0,0 ; vbroadcastss 0x29e2(%rip),%ymm8 # 6ca4 <_sk_callback_avx+0x41e> + DB 196,98,125,24,5,226,41,0,0 ; vbroadcastss 0x29e2(%rip),%ymm8 # 6c64 <_sk_callback_avx+0x41e> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10 @@ -9228,7 +9198,7 @@ _sk_store_4444_avx LABEL PROC DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9 DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 435b <_sk_store_4444_avx+0xa7> + DB 117,10 ; jne 431b <_sk_store_4444_avx+0xa7> DB 196,65,122,127,4,83 ; vmovdqu %xmm8,(%r11,%rdx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -9236,22 +9206,22 @@ _sk_store_4444_avx LABEL PROC DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,236 ; ja 4357 <_sk_store_4444_avx+0xa3> + DB 119,236 ; ja 4317 <_sk_store_4444_avx+0xa3> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,66,0,0,0 ; lea 0x42(%rip),%r10 # 43b8 <_sk_store_4444_avx+0x104> + DB 76,141,21,66,0,0,0 ; lea 0x42(%rip),%r10 # 4378 <_sk_store_4444_avx+0x104> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,21,4,83,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,2) - DB 235,207 ; jmp 4357 <_sk_store_4444_avx+0xa3> + DB 235,207 ; jmp 4317 <_sk_store_4444_avx+0xa3> DB 196,67,121,21,68,83,4,2 ; vpextrw $0x2,%xmm8,0x4(%r11,%rdx,2) DB 196,65,121,126,4,83 ; vmovd %xmm8,(%r11,%rdx,2) - DB 235,191 ; jmp 4357 <_sk_store_4444_avx+0xa3> + DB 235,191 ; jmp 4317 <_sk_store_4444_avx+0xa3> DB 196,67,121,21,68,83,12,6 ; vpextrw $0x6,%xmm8,0xc(%r11,%rdx,2) DB 196,67,121,21,68,83,10,5 ; vpextrw $0x5,%xmm8,0xa(%r11,%rdx,2) DB 196,67,121,21,68,83,8,4 ; vpextrw $0x4,%xmm8,0x8(%r11,%rdx,2) DB 196,65,121,214,4,83 ; vmovq %xmm8,(%r11,%rdx,2) - DB 235,159 ; jmp 4357 <_sk_store_4444_avx+0xa3> + DB 235,159 ; jmp 4317 <_sk_store_4444_avx+0xa3> DB 199 ; (bad) DB 255 ; (bad) DB 255 ; (bad) @@ -9269,7 +9239,7 @@ _sk_store_4444_avx LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 232,255,255,255,224 ; callq ffffffffe10043d0 <_sk_callback_avx+0xffffffffe0ffdb4a> + DB 232,255,255,255,224 ; callq ffffffffe1004390 <_sk_callback_avx+0xffffffffe0ffdb4a> DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -9282,12 +9252,12 @@ _sk_load_8888_avx LABEL PROC DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,139,0,0,0 ; jne 4479 <_sk_load_8888_avx+0xa5> + DB 15,133,139,0,0,0 ; jne 4439 <_sk_load_8888_avx+0xa5> DB 196,193,124,16,26 ; vmovups (%r10),%ymm3 - DB 197,124,40,21,101,43,0,0 ; vmovaps 0x2b65(%rip),%ymm10 # 6f60 <_sk_callback_avx+0x6da> + DB 197,124,40,21,101,43,0,0 ; vmovaps 0x2b65(%rip),%ymm10 # 6f20 <_sk_callback_avx+0x6da> DB 196,193,100,84,194 ; vandps %ymm10,%ymm3,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,5,155,40,0,0 ; vbroadcastss 0x289b(%rip),%ymm8 # 6ca8 <_sk_callback_avx+0x422> + DB 196,98,125,24,5,155,40,0,0 ; vbroadcastss 0x289b(%rip),%ymm8 # 6c68 <_sk_callback_avx+0x422> DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0 DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1 DB 196,195,125,25,217,1 ; vextractf128 $0x1,%ymm3,%xmm9 @@ -9318,13 +9288,13 @@ _sk_load_8888_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,225,249,110,192 ; vmovq %rax,%xmm0 DB 196,226,121,48,192 ; vpmovzxbw %xmm0,%xmm0 - DB 196,226,121,0,13,15,42,0,0 ; vpshufb 0x2a0f(%rip),%xmm0,%xmm1 # 6eb0 <_sk_callback_avx+0x62a> + DB 196,226,121,0,13,15,42,0,0 ; vpshufb 0x2a0f(%rip),%xmm0,%xmm1 # 6e70 <_sk_callback_avx+0x62a> DB 196,226,121,33,201 ; vpmovsxbd %xmm1,%xmm1 - DB 196,226,121,0,5,17,42,0,0 ; vpshufb 0x2a11(%rip),%xmm0,%xmm0 # 6ec0 <_sk_callback_avx+0x63a> + DB 196,226,121,0,5,17,42,0,0 ; vpshufb 0x2a11(%rip),%xmm0,%xmm0 # 6e80 <_sk_callback_avx+0x63a> DB 196,226,121,33,192 ; vpmovsxbd %xmm0,%xmm0 DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0 DB 196,194,125,44,26 ; vmaskmovps (%r10),%ymm0,%ymm3 - DB 233,47,255,255,255 ; jmpq 43f3 <_sk_load_8888_avx+0x1f> + DB 233,47,255,255,255 ; jmpq 43b3 <_sk_load_8888_avx+0x1f> PUBLIC _sk_gather_8888_avx _sk_gather_8888_avx LABEL PROC @@ -9361,10 +9331,10 @@ _sk_gather_8888_avx LABEL PROC DB 73,193,234,32 ; shr $0x20,%r10 DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3 DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0 - DB 197,124,40,21,17,42,0,0 ; vmovaps 0x2a11(%rip),%ymm10 # 6f80 <_sk_callback_avx+0x6fa> + DB 197,124,40,21,17,42,0,0 ; vmovaps 0x2a11(%rip),%ymm10 # 6f40 <_sk_callback_avx+0x6fa> DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,13,43,39,0,0 ; vbroadcastss 0x272b(%rip),%ymm9 # 6cac <_sk_callback_avx+0x426> + DB 196,98,125,24,13,43,39,0,0 ; vbroadcastss 0x272b(%rip),%ymm9 # 6c6c <_sk_callback_avx+0x426> DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0 DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1 DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2 @@ -9393,7 +9363,7 @@ _sk_store_8888_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 76,3,16 ; add (%rax),%r10 - DB 196,98,125,24,5,180,38,0,0 ; vbroadcastss 0x26b4(%rip),%ymm8 # 6cb0 <_sk_callback_avx+0x42a> + DB 196,98,125,24,5,180,38,0,0 ; vbroadcastss 0x26b4(%rip),%ymm8 # 6c70 <_sk_callback_avx+0x42a> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10 @@ -9418,7 +9388,7 @@ _sk_store_8888_avx LABEL PROC DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8 DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,14 ; jne 468e <_sk_store_8888_avx+0xac> + DB 117,14 ; jne 464e <_sk_store_8888_avx+0xac> DB 196,65,124,17,2 ; vmovups %ymm8,(%r10) DB 72,173 ; lods %ds:(%rsi),%rax DB 76,137,201 ; mov %r9,%rcx @@ -9431,13 +9401,13 @@ _sk_store_8888_avx LABEL PROC DB 72,211,232 ; shr %cl,%rax DB 196,97,249,110,200 ; vmovq %rax,%xmm9 DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9 - DB 196,98,49,0,21,26,40,0,0 ; vpshufb 0x281a(%rip),%xmm9,%xmm10 # 6ed0 <_sk_callback_avx+0x64a> + DB 196,98,49,0,21,26,40,0,0 ; vpshufb 0x281a(%rip),%xmm9,%xmm10 # 6e90 <_sk_callback_avx+0x64a> DB 196,66,121,33,210 ; vpmovsxbd %xmm10,%xmm10 - DB 196,98,49,0,13,28,40,0,0 ; vpshufb 0x281c(%rip),%xmm9,%xmm9 # 6ee0 <_sk_callback_avx+0x65a> + DB 196,98,49,0,13,28,40,0,0 ; vpshufb 0x281c(%rip),%xmm9,%xmm9 # 6ea0 <_sk_callback_avx+0x65a> DB 196,66,121,33,201 ; vpmovsxbd %xmm9,%xmm9 DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9 DB 196,66,53,46,2 ; vmaskmovps %ymm8,%ymm9,(%r10) - DB 235,175 ; jmp 4685 <_sk_store_8888_avx+0xa3> + DB 235,175 ; jmp 4645 <_sk_store_8888_avx+0xa3> PUBLIC _sk_load_f16_avx _sk_load_f16_avx LABEL PROC @@ -9449,7 +9419,7 @@ _sk_load_f16_avx LABEL PROC DB 197,252,17,116,36,64 ; vmovups %ymm6,0x40(%rsp) DB 197,252,17,108,36,32 ; vmovups %ymm5,0x20(%rsp) DB 197,254,127,36,36 ; vmovdqu %ymm4,(%rsp) - DB 15,133,143,2,0,0 ; jne 4991 <_sk_load_f16_avx+0x2bb> + DB 15,133,143,2,0,0 ; jne 4951 <_sk_load_f16_avx+0x2bb> DB 197,121,16,4,208 ; vmovupd (%rax,%rdx,8),%xmm8 DB 197,249,16,84,208,16 ; vmovupd 0x10(%rax,%rdx,8),%xmm2 DB 197,249,16,76,208,32 ; vmovupd 0x20(%rax,%rdx,8),%xmm1 @@ -9467,13 +9437,13 @@ _sk_load_f16_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - DB 196,98,125,24,37,89,37,0,0 ; vbroadcastss 0x2559(%rip),%ymm12 # 6cb4 <_sk_callback_avx+0x42e> + DB 196,98,125,24,37,89,37,0,0 ; vbroadcastss 0x2559(%rip),%ymm12 # 6c74 <_sk_callback_avx+0x42e> DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1 DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0 DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14 - DB 196,98,121,24,29,69,37,0,0 ; vbroadcastss 0x2545(%rip),%xmm11 # 6cb8 <_sk_callback_avx+0x432> + DB 196,98,121,24,29,69,37,0,0 ; vbroadcastss 0x2545(%rip),%xmm11 # 6c78 <_sk_callback_avx+0x432> DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3 - DB 196,98,121,24,45,59,37,0,0 ; vbroadcastss 0x253b(%rip),%xmm13 # 6cbc <_sk_callback_avx+0x436> + DB 196,98,121,24,45,59,37,0,0 ; vbroadcastss 0x253b(%rip),%xmm13 # 6c7c <_sk_callback_avx+0x436> DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3 DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10 DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -9487,7 +9457,7 @@ _sk_load_f16_avx LABEL PROC DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0 DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1 - DB 196,226,121,24,29,241,36,0,0 ; vbroadcastss 0x24f1(%rip),%xmm3 # 6cc0 <_sk_callback_avx+0x43a> + DB 196,226,121,24,29,241,36,0,0 ; vbroadcastss 0x24f1(%rip),%xmm3 # 6c80 <_sk_callback_avx+0x43a> DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1 DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -9580,29 +9550,29 @@ _sk_load_f16_avx LABEL PROC DB 197,123,16,4,208 ; vmovsd (%rax,%rdx,8),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,79 ; je 49f0 <_sk_load_f16_avx+0x31a> + DB 116,79 ; je 49b0 <_sk_load_f16_avx+0x31a> DB 197,57,22,68,208,8 ; vmovhpd 0x8(%rax,%rdx,8),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,67 ; jb 49f0 <_sk_load_f16_avx+0x31a> + DB 114,67 ; jb 49b0 <_sk_load_f16_avx+0x31a> DB 197,251,16,84,208,16 ; vmovsd 0x10(%rax,%rdx,8),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,68 ; je 49fd <_sk_load_f16_avx+0x327> + DB 116,68 ; je 49bd <_sk_load_f16_avx+0x327> DB 197,233,22,84,208,24 ; vmovhpd 0x18(%rax,%rdx,8),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,56 ; jb 49fd <_sk_load_f16_avx+0x327> + DB 114,56 ; jb 49bd <_sk_load_f16_avx+0x327> DB 197,251,16,76,208,32 ; vmovsd 0x20(%rax,%rdx,8),%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,68,253,255,255 ; je 4719 <_sk_load_f16_avx+0x43> + DB 15,132,68,253,255,255 ; je 46d9 <_sk_load_f16_avx+0x43> DB 197,241,22,76,208,40 ; vmovhpd 0x28(%rax,%rdx,8),%xmm1,%xmm1 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,52,253,255,255 ; jb 4719 <_sk_load_f16_avx+0x43> + DB 15,130,52,253,255,255 ; jb 46d9 <_sk_load_f16_avx+0x43> DB 197,122,126,76,208,48 ; vmovq 0x30(%rax,%rdx,8),%xmm9 - DB 233,41,253,255,255 ; jmpq 4719 <_sk_load_f16_avx+0x43> + DB 233,41,253,255,255 ; jmpq 46d9 <_sk_load_f16_avx+0x43> DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,28,253,255,255 ; jmpq 4719 <_sk_load_f16_avx+0x43> + DB 233,28,253,255,255 ; jmpq 46d9 <_sk_load_f16_avx+0x43> DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1 - DB 233,19,253,255,255 ; jmpq 4719 <_sk_load_f16_avx+0x43> + DB 233,19,253,255,255 ; jmpq 46d9 <_sk_load_f16_avx+0x43> PUBLIC _sk_gather_f16_avx _sk_gather_f16_avx LABEL PROC @@ -9661,13 +9631,13 @@ _sk_gather_f16_avx LABEL PROC DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1 DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 - DB 196,98,125,24,37,178,33,0,0 ; vbroadcastss 0x21b2(%rip),%ymm12 # 6cc4 <_sk_callback_avx+0x43e> + DB 196,98,125,24,37,178,33,0,0 ; vbroadcastss 0x21b2(%rip),%ymm12 # 6c84 <_sk_callback_avx+0x43e> DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1 DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0 DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14 - DB 196,98,121,24,29,158,33,0,0 ; vbroadcastss 0x219e(%rip),%xmm11 # 6cc8 <_sk_callback_avx+0x442> + DB 196,98,121,24,29,158,33,0,0 ; vbroadcastss 0x219e(%rip),%xmm11 # 6c88 <_sk_callback_avx+0x442> DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3 - DB 196,98,121,24,45,148,33,0,0 ; vbroadcastss 0x2194(%rip),%xmm13 # 6ccc <_sk_callback_avx+0x446> + DB 196,98,121,24,45,148,33,0,0 ; vbroadcastss 0x2194(%rip),%xmm13 # 6c8c <_sk_callback_avx+0x446> DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3 DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10 DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10 @@ -9681,7 +9651,7 @@ _sk_gather_f16_avx LABEL PROC DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0 DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0 DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1 - DB 196,226,121,24,29,74,33,0,0 ; vbroadcastss 0x214a(%rip),%xmm3 # 6cd0 <_sk_callback_avx+0x44a> + DB 196,226,121,24,29,74,33,0,0 ; vbroadcastss 0x214a(%rip),%xmm3 # 6c90 <_sk_callback_avx+0x44a> DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1 DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 @@ -9779,12 +9749,12 @@ _sk_store_f16_avx LABEL PROC DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp) DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp) DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp) - DB 196,98,125,24,13,94,31,0,0 ; vbroadcastss 0x1f5e(%rip),%ymm9 # 6cd4 <_sk_callback_avx+0x44e> + DB 196,98,125,24,13,94,31,0,0 ; vbroadcastss 0x1f5e(%rip),%ymm9 # 6c94 <_sk_callback_avx+0x44e> DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10 DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp) DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11 DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12 - DB 196,98,121,24,5,68,31,0,0 ; vbroadcastss 0x1f44(%rip),%xmm8 # 6cd8 <_sk_callback_avx+0x452> + DB 196,98,121,24,5,68,31,0,0 ; vbroadcastss 0x1f44(%rip),%xmm8 # 6c98 <_sk_callback_avx+0x452> DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13 DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14 DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13 @@ -9794,7 +9764,7 @@ _sk_store_f16_avx LABEL PROC DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14 DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11 DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12 - DB 196,98,125,24,21,11,31,0,0 ; vbroadcastss 0x1f0b(%rip),%ymm10 # 6cdc <_sk_callback_avx+0x456> + DB 196,98,125,24,21,11,31,0,0 ; vbroadcastss 0x1f0b(%rip),%ymm10 # 6c9c <_sk_callback_avx+0x456> DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14 DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15 DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12 @@ -9876,7 +9846,7 @@ _sk_store_f16_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax DB 77,133,192 ; test %r8,%r8 - DB 117,75 ; jne 4fb8 <_sk_store_f16_avx+0x270> + DB 117,75 ; jne 4f78 <_sk_store_f16_avx+0x270> DB 197,120,17,28,208 ; vmovups %xmm11,(%rax,%rdx,8) DB 197,120,17,84,208,16 ; vmovups %xmm10,0x10(%rax,%rdx,8) DB 197,120,17,76,208,32 ; vmovups %xmm9,0x20(%rax,%rdx,8) @@ -9892,22 +9862,22 @@ _sk_store_f16_avx LABEL PROC DB 255,224 ; jmpq *%rax DB 197,121,214,28,208 ; vmovq %xmm11,(%rax,%rdx,8) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,193 ; je 4f84 <_sk_store_f16_avx+0x23c> + DB 116,193 ; je 4f44 <_sk_store_f16_avx+0x23c> DB 197,121,23,92,208,8 ; vmovhpd %xmm11,0x8(%rax,%rdx,8) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,181 ; jb 4f84 <_sk_store_f16_avx+0x23c> + DB 114,181 ; jb 4f44 <_sk_store_f16_avx+0x23c> DB 197,121,214,84,208,16 ; vmovq %xmm10,0x10(%rax,%rdx,8) - DB 116,173 ; je 4f84 <_sk_store_f16_avx+0x23c> + DB 116,173 ; je 4f44 <_sk_store_f16_avx+0x23c> DB 197,121,23,84,208,24 ; vmovhpd %xmm10,0x18(%rax,%rdx,8) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,161 ; jb 4f84 <_sk_store_f16_avx+0x23c> + DB 114,161 ; jb 4f44 <_sk_store_f16_avx+0x23c> DB 197,121,214,76,208,32 ; vmovq %xmm9,0x20(%rax,%rdx,8) - DB 116,153 ; je 4f84 <_sk_store_f16_avx+0x23c> + DB 116,153 ; je 4f44 <_sk_store_f16_avx+0x23c> DB 197,121,23,76,208,40 ; vmovhpd %xmm9,0x28(%rax,%rdx,8) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,141 ; jb 4f84 <_sk_store_f16_avx+0x23c> + DB 114,141 ; jb 4f44 <_sk_store_f16_avx+0x23c> DB 197,121,214,68,208,48 ; vmovq %xmm8,0x30(%rax,%rdx,8) - DB 235,133 ; jmp 4f84 <_sk_store_f16_avx+0x23c> + DB 235,133 ; jmp 4f44 <_sk_store_f16_avx+0x23c> PUBLIC _sk_load_u16_be_avx _sk_load_u16_be_avx LABEL PROC @@ -9915,7 +9885,7 @@ _sk_load_u16_be_avx LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,253,0,0,0 ; jne 5112 <_sk_load_u16_be_avx+0x113> + DB 15,133,253,0,0,0 ; jne 50d2 <_sk_load_u16_be_avx+0x113> DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8 DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2 DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3 @@ -9937,7 +9907,7 @@ _sk_load_u16_be_avx LABEL PROC DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,29,90,28,0,0 ; vbroadcastss 0x1c5a(%rip),%ymm11 # 6ce0 <_sk_callback_avx+0x45a> + DB 196,98,125,24,29,90,28,0,0 ; vbroadcastss 0x1c5a(%rip),%ymm11 # 6ca0 <_sk_callback_avx+0x45a> DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0 DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -9971,29 +9941,29 @@ _sk_load_u16_be_avx LABEL PROC DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8 DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,85 ; je 5178 <_sk_load_u16_be_avx+0x179> + DB 116,85 ; je 5138 <_sk_load_u16_be_avx+0x179> DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,72 ; jb 5178 <_sk_load_u16_be_avx+0x179> + DB 114,72 ; jb 5138 <_sk_load_u16_be_avx+0x179> DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 116,72 ; je 5185 <_sk_load_u16_be_avx+0x186> + DB 116,72 ; je 5145 <_sk_load_u16_be_avx+0x186> DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,59 ; jb 5185 <_sk_load_u16_be_avx+0x186> + DB 114,59 ; jb 5145 <_sk_load_u16_be_avx+0x186> DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 15,132,213,254,255,255 ; je 5030 <_sk_load_u16_be_avx+0x31> + DB 15,132,213,254,255,255 ; je 4ff0 <_sk_load_u16_be_avx+0x31> DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 15,130,196,254,255,255 ; jb 5030 <_sk_load_u16_be_avx+0x31> + DB 15,130,196,254,255,255 ; jb 4ff0 <_sk_load_u16_be_avx+0x31> DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9 - DB 233,184,254,255,255 ; jmpq 5030 <_sk_load_u16_be_avx+0x31> + DB 233,184,254,255,255 ; jmpq 4ff0 <_sk_load_u16_be_avx+0x31> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2 - DB 233,171,254,255,255 ; jmpq 5030 <_sk_load_u16_be_avx+0x31> + DB 233,171,254,255,255 ; jmpq 4ff0 <_sk_load_u16_be_avx+0x31> DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3 - DB 233,162,254,255,255 ; jmpq 5030 <_sk_load_u16_be_avx+0x31> + DB 233,162,254,255,255 ; jmpq 4ff0 <_sk_load_u16_be_avx+0x31> PUBLIC _sk_load_rgb_u16_be_avx _sk_load_rgb_u16_be_avx LABEL PROC @@ -10001,7 +9971,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,82 ; lea (%rdx,%rdx,2),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,243,0,0,0 ; jne 5293 <_sk_load_rgb_u16_be_avx+0x105> + DB 15,133,243,0,0,0 ; jne 5253 <_sk_load_rgb_u16_be_avx+0x105> DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0 DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2 DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1 @@ -10028,7 +9998,7 @@ _sk_load_rgb_u16_be_avx LABEL PROC DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0 DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0 DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0 - DB 196,98,125,24,29,186,26,0,0 ; vbroadcastss 0x1aba(%rip),%ymm11 # 6ce4 <_sk_callback_avx+0x45e> + DB 196,98,125,24,29,186,26,0,0 ; vbroadcastss 0x1aba(%rip),%ymm11 # 6ca4 <_sk_callback_avx+0x45e> DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0 DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1 DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2 @@ -10049,48 +10019,48 @@ _sk_load_rgb_u16_be_avx LABEL PROC DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2 DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,29,87,26,0,0 ; vbroadcastss 0x1a57(%rip),%ymm3 # 6ce8 <_sk_callback_avx+0x462> + DB 196,226,125,24,29,87,26,0,0 ; vbroadcastss 0x1a57(%rip),%ymm3 # 6ca8 <_sk_callback_avx+0x462> DB 255,224 ; jmpq *%rax DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0 DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,5 ; jne 52ac <_sk_load_rgb_u16_be_avx+0x11e> - DB 233,40,255,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46> + DB 117,5 ; jne 526c <_sk_load_rgb_u16_be_avx+0x11e> + DB 233,40,255,255,255 ; jmpq 5194 <_sk_load_rgb_u16_be_avx+0x46> DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1 DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,26 ; jb 52db <_sk_load_rgb_u16_be_avx+0x14d> + DB 114,26 ; jb 529b <_sk_load_rgb_u16_be_avx+0x14d> DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1 DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 117,10 ; jne 52e0 <_sk_load_rgb_u16_be_avx+0x152> - DB 233,249,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46> - DB 233,244,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46> + DB 117,10 ; jne 52a0 <_sk_load_rgb_u16_be_avx+0x152> + DB 233,249,254,255,255 ; jmpq 5194 <_sk_load_rgb_u16_be_avx+0x46> + DB 233,244,254,255,255 ; jmpq 5194 <_sk_load_rgb_u16_be_avx+0x46> DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1 DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,26 ; jb 530f <_sk_load_rgb_u16_be_avx+0x181> + DB 114,26 ; jb 52cf <_sk_load_rgb_u16_be_avx+0x181> DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1 DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1 DB 73,131,248,5 ; cmp $0x5,%r8 - DB 117,10 ; jne 5314 <_sk_load_rgb_u16_be_avx+0x186> - DB 233,197,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46> - DB 233,192,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46> + DB 117,10 ; jne 52d4 <_sk_load_rgb_u16_be_avx+0x186> + DB 233,197,254,255,255 ; jmpq 5194 <_sk_load_rgb_u16_be_avx+0x46> + DB 233,192,254,255,255 ; jmpq 5194 <_sk_load_rgb_u16_be_avx+0x46> DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3 DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11 DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,20 ; jb 533d <_sk_load_rgb_u16_be_avx+0x1af> + DB 114,20 ; jb 52fd <_sk_load_rgb_u16_be_avx+0x1af> DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3 DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3 - DB 233,151,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46> - DB 233,146,254,255,255 ; jmpq 51d4 <_sk_load_rgb_u16_be_avx+0x46> + DB 233,151,254,255,255 ; jmpq 5194 <_sk_load_rgb_u16_be_avx+0x46> + DB 233,146,254,255,255 ; jmpq 5194 <_sk_load_rgb_u16_be_avx+0x46> PUBLIC _sk_store_u16_be_avx _sk_store_u16_be_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax - DB 196,98,125,24,5,148,25,0,0 ; vbroadcastss 0x1994(%rip),%ymm8 # 6cec <_sk_callback_avx+0x466> + DB 196,98,125,24,5,148,25,0,0 ; vbroadcastss 0x1994(%rip),%ymm8 # 6cac <_sk_callback_avx+0x466> DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9 DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9 DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10 @@ -10128,7 +10098,7 @@ _sk_store_u16_be_avx LABEL PROC DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9 DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,31 ; jne 543c <_sk_store_u16_be_avx+0xfa> + DB 117,31 ; jne 53fc <_sk_store_u16_be_avx+0xfa> DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2) DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2) DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2) @@ -10137,31 +10107,31 @@ _sk_store_u16_be_avx LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 5438 <_sk_store_u16_be_avx+0xf6> + DB 116,240 ; je 53f8 <_sk_store_u16_be_avx+0xf6> DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 5438 <_sk_store_u16_be_avx+0xf6> + DB 114,227 ; jb 53f8 <_sk_store_u16_be_avx+0xf6> DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2) - DB 116,218 ; je 5438 <_sk_store_u16_be_avx+0xf6> + DB 116,218 ; je 53f8 <_sk_store_u16_be_avx+0xf6> DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,205 ; jb 5438 <_sk_store_u16_be_avx+0xf6> + DB 114,205 ; jb 53f8 <_sk_store_u16_be_avx+0xf6> DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2) - DB 116,196 ; je 5438 <_sk_store_u16_be_avx+0xf6> + DB 116,196 ; je 53f8 <_sk_store_u16_be_avx+0xf6> DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,183 ; jb 5438 <_sk_store_u16_be_avx+0xf6> + DB 114,183 ; jb 53f8 <_sk_store_u16_be_avx+0xf6> DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2) - DB 235,174 ; jmp 5438 <_sk_store_u16_be_avx+0xf6> + DB 235,174 ; jmp 53f8 <_sk_store_u16_be_avx+0xf6> PUBLIC _sk_load_f32_avx _sk_load_f32_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,131,248,7 ; cmp $0x7,%r8 - DB 119,110 ; ja 5500 <_sk_load_f32_avx+0x76> + DB 119,110 ; ja 54c0 <_sk_load_f32_avx+0x76> DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 - DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 5528 <_sk_load_f32_avx+0x9e> + DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 54e8 <_sk_load_f32_avx+0x9e> DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax DB 76,1,216 ; add %r11,%rax DB 255,224 ; jmpq *%rax @@ -10218,7 +10188,7 @@ _sk_store_f32_avx LABEL PROC DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8 DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11 DB 77,133,192 ; test %r8,%r8 - DB 117,55 ; jne 55b5 <_sk_store_f32_avx+0x6d> + DB 117,55 ; jne 5575 <_sk_store_f32_avx+0x6d> DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12 DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13 DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9 @@ -10231,22 +10201,22 @@ _sk_store_f32_avx LABEL PROC DB 255,224 ; jmpq *%rax DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 55b1 <_sk_store_f32_avx+0x69> + DB 116,240 ; je 5571 <_sk_store_f32_avx+0x69> DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 55b1 <_sk_store_f32_avx+0x69> + DB 114,227 ; jb 5571 <_sk_store_f32_avx+0x69> DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4) - DB 116,218 ; je 55b1 <_sk_store_f32_avx+0x69> + DB 116,218 ; je 5571 <_sk_store_f32_avx+0x69> DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4) DB 73,131,248,5 ; cmp $0x5,%r8 - DB 114,205 ; jb 55b1 <_sk_store_f32_avx+0x69> + DB 114,205 ; jb 5571 <_sk_store_f32_avx+0x69> DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4) - DB 116,195 ; je 55b1 <_sk_store_f32_avx+0x69> + DB 116,195 ; je 5571 <_sk_store_f32_avx+0x69> DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4) DB 73,131,248,7 ; cmp $0x7,%r8 - DB 114,181 ; jb 55b1 <_sk_store_f32_avx+0x69> + DB 114,181 ; jb 5571 <_sk_store_f32_avx+0x69> DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4) - DB 235,171 ; jmp 55b1 <_sk_store_f32_avx+0x69> + DB 235,171 ; jmp 5571 <_sk_store_f32_avx+0x69> PUBLIC _sk_clamp_x_avx _sk_clamp_x_avx LABEL PROC @@ -10325,7 +10295,7 @@ _sk_mirror_x_avx LABEL PROC DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0 DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8 - DB 197,178,89,5,199,21,0,0 ; vmulss 0x15c7(%rip),%xmm9,%xmm0 # 6cf0 <_sk_callback_avx+0x46a> + DB 197,178,89,5,199,21,0,0 ; vmulss 0x15c7(%rip),%xmm9,%xmm0 # 6cb0 <_sk_callback_avx+0x46a> DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0 DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0 DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0 @@ -10356,7 +10326,7 @@ _sk_mirror_y_avx LABEL PROC DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1 DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1 DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8 - DB 197,178,89,13,66,21,0,0 ; vmulss 0x1542(%rip),%xmm9,%xmm1 # 6cf4 <_sk_callback_avx+0x46e> + DB 197,178,89,13,66,21,0,0 ; vmulss 0x1542(%rip),%xmm9,%xmm1 # 6cb4 <_sk_callback_avx+0x46e> DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1 DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1 DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1 @@ -10380,7 +10350,7 @@ PUBLIC _sk_clamp_x_1_avx _sk_clamp_x_1_avx LABEL PROC DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8 DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0 - DB 196,98,125,24,5,224,20,0,0 ; vbroadcastss 0x14e0(%rip),%ymm8 # 6cf8 <_sk_callback_avx+0x472> + DB 196,98,125,24,5,224,20,0,0 ; vbroadcastss 0x14e0(%rip),%ymm8 # 6cb8 <_sk_callback_avx+0x472> DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -10394,9 +10364,9 @@ _sk_repeat_x_1_avx LABEL PROC PUBLIC _sk_mirror_x_1_avx _sk_mirror_x_1_avx LABEL PROC - DB 196,98,125,24,5,195,20,0,0 ; vbroadcastss 0x14c3(%rip),%ymm8 # 6cfc <_sk_callback_avx+0x476> + DB 196,98,125,24,5,195,20,0,0 ; vbroadcastss 0x14c3(%rip),%ymm8 # 6cbc <_sk_callback_avx+0x476> DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,13,185,20,0,0 ; vbroadcastss 0x14b9(%rip),%ymm9 # 6d00 <_sk_callback_avx+0x47a> + DB 196,98,125,24,13,185,20,0,0 ; vbroadcastss 0x14b9(%rip),%ymm9 # 6cc0 <_sk_callback_avx+0x47a> DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9 DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9 DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9 @@ -10410,12 +10380,12 @@ _sk_mirror_x_1_avx LABEL PROC PUBLIC _sk_luminance_to_alpha_avx _sk_luminance_to_alpha_avx LABEL PROC - DB 196,226,125,24,29,137,20,0,0 ; vbroadcastss 0x1489(%rip),%ymm3 # 6d04 <_sk_callback_avx+0x47e> + DB 196,226,125,24,29,137,20,0,0 ; vbroadcastss 0x1489(%rip),%ymm3 # 6cc4 <_sk_callback_avx+0x47e> DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,29,128,20,0,0 ; vbroadcastss 0x1480(%rip),%ymm3 # 6d08 <_sk_callback_avx+0x482> + DB 196,226,125,24,29,128,20,0,0 ; vbroadcastss 0x1480(%rip),%ymm3 # 6cc8 <_sk_callback_avx+0x482> DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1 DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 - DB 196,226,125,24,13,115,20,0,0 ; vbroadcastss 0x1473(%rip),%ymm1 # 6d0c <_sk_callback_avx+0x486> + DB 196,226,125,24,13,115,20,0,0 ; vbroadcastss 0x1473(%rip),%ymm1 # 6ccc <_sk_callback_avx+0x486> DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1 DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax @@ -10624,9 +10594,9 @@ _sk_evenly_spaced_gradient_avx LABEL PROC DB 72,139,24 ; mov (%rax),%rbx DB 72,139,104,8 ; mov 0x8(%rax),%rbp DB 72,255,203 ; dec %rbx - DB 120,7 ; js 5bf8 <_sk_evenly_spaced_gradient_avx+0x28> + DB 120,7 ; js 5bb8 <_sk_evenly_spaced_gradient_avx+0x28> DB 196,225,242,42,203 ; vcvtsi2ss %rbx,%xmm1,%xmm1 - DB 235,21 ; jmp 5c0d <_sk_evenly_spaced_gradient_avx+0x3d> + DB 235,21 ; jmp 5bcd <_sk_evenly_spaced_gradient_avx+0x3d> DB 73,137,217 ; mov %rbx,%r9 DB 73,209,233 ; shr %r9 DB 131,227,1 ; and $0x1,%ebx @@ -10783,18 +10753,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC PUBLIC _sk_gauss_a_to_rgba_avx _sk_gauss_a_to_rgba_avx LABEL PROC - DB 196,226,125,24,5,156,13,0,0 ; vbroadcastss 0xd9c(%rip),%ymm0 # 6d10 <_sk_callback_avx+0x48a> + DB 196,226,125,24,5,156,13,0,0 ; vbroadcastss 0xd9c(%rip),%ymm0 # 6cd0 <_sk_callback_avx+0x48a> DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0 - DB 196,226,125,24,13,147,13,0,0 ; vbroadcastss 0xd93(%rip),%ymm1 # 6d14 <_sk_callback_avx+0x48e> + DB 196,226,125,24,13,147,13,0,0 ; vbroadcastss 0xd93(%rip),%ymm1 # 6cd4 <_sk_callback_avx+0x48e> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,13,134,13,0,0 ; vbroadcastss 0xd86(%rip),%ymm1 # 6d18 <_sk_callback_avx+0x492> + DB 196,226,125,24,13,134,13,0,0 ; vbroadcastss 0xd86(%rip),%ymm1 # 6cd8 <_sk_callback_avx+0x492> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,13,121,13,0,0 ; vbroadcastss 0xd79(%rip),%ymm1 # 6d1c <_sk_callback_avx+0x496> + DB 196,226,125,24,13,121,13,0,0 ; vbroadcastss 0xd79(%rip),%ymm1 # 6cdc <_sk_callback_avx+0x496> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0 - DB 196,226,125,24,13,108,13,0,0 ; vbroadcastss 0xd6c(%rip),%ymm1 # 6d20 <_sk_callback_avx+0x49a> + DB 196,226,125,24,13,108,13,0,0 ; vbroadcastss 0xd6c(%rip),%ymm1 # 6ce0 <_sk_callback_avx+0x49a> DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,252,40,200 ; vmovaps %ymm0,%ymm1 @@ -10816,12 +10786,12 @@ _sk_gradient_avx LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 73,131,249,2 ; cmp $0x2,%r9 - DB 114,80 ; jb 603a <_sk_gradient_avx+0x72> + DB 114,80 ; jb 5ffa <_sk_gradient_avx+0x72> DB 72,139,88,72 ; mov 0x48(%rax),%rbx DB 73,255,201 ; dec %r9 DB 72,131,195,4 ; add $0x4,%rbx DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9 - DB 196,98,125,24,21,33,13,0,0 ; vbroadcastss 0xd21(%rip),%ymm10 # 6d24 <_sk_callback_avx+0x49e> + DB 196,98,125,24,21,33,13,0,0 ; vbroadcastss 0xd21(%rip),%ymm10 # 6ce4 <_sk_callback_avx+0x49e> DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8 DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8 @@ -10833,7 +10803,7 @@ _sk_gradient_avx LABEL PROC DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1 DB 72,131,195,4 ; add $0x4,%rbx DB 73,255,201 ; dec %r9 - DB 117,205 ; jne 6007 <_sk_gradient_avx+0x3f> + DB 117,205 ; jne 5fc7 <_sk_gradient_avx+0x3f> DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9 DB 69,137,202 ; mov %r9d,%r10d DB 73,193,233,32 ; shr $0x20,%r9 @@ -11013,27 +10983,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12 DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11 DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12 - DB 196,98,125,24,45,20,9,0,0 ; vbroadcastss 0x914(%rip),%ymm13 # 6d28 <_sk_callback_avx+0x4a2> + DB 196,98,125,24,45,20,9,0,0 ; vbroadcastss 0x914(%rip),%ymm13 # 6ce8 <_sk_callback_avx+0x4a2> DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13 - DB 196,98,125,24,53,10,9,0,0 ; vbroadcastss 0x90a(%rip),%ymm14 # 6d2c <_sk_callback_avx+0x4a6> + DB 196,98,125,24,53,10,9,0,0 ; vbroadcastss 0x90a(%rip),%ymm14 # 6cec <_sk_callback_avx+0x4a6> DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13 DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13 - DB 196,98,125,24,53,251,8,0,0 ; vbroadcastss 0x8fb(%rip),%ymm14 # 6d30 <_sk_callback_avx+0x4aa> + DB 196,98,125,24,53,251,8,0,0 ; vbroadcastss 0x8fb(%rip),%ymm14 # 6cf0 <_sk_callback_avx+0x4aa> DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13 DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12 - DB 196,98,125,24,45,236,8,0,0 ; vbroadcastss 0x8ec(%rip),%ymm13 # 6d34 <_sk_callback_avx+0x4ae> + DB 196,98,125,24,45,236,8,0,0 ; vbroadcastss 0x8ec(%rip),%ymm13 # 6cf4 <_sk_callback_avx+0x4ae> DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12 DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11 DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9 - DB 196,98,125,24,21,215,8,0,0 ; vbroadcastss 0x8d7(%rip),%ymm10 # 6d38 <_sk_callback_avx+0x4b2> + DB 196,98,125,24,21,215,8,0,0 ; vbroadcastss 0x8d7(%rip),%ymm10 # 6cf8 <_sk_callback_avx+0x4b2> DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10 DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9 DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0 - DB 196,98,125,24,21,193,8,0,0 ; vbroadcastss 0x8c1(%rip),%ymm10 # 6d3c <_sk_callback_avx+0x4b6> + DB 196,98,125,24,21,193,8,0,0 ; vbroadcastss 0x8c1(%rip),%ymm10 # 6cfc <_sk_callback_avx+0x4b6> DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10 DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0 DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9 - DB 196,98,125,24,21,171,8,0,0 ; vbroadcastss 0x8ab(%rip),%ymm10 # 6d40 <_sk_callback_avx+0x4ba> + DB 196,98,125,24,21,171,8,0,0 ; vbroadcastss 0x8ab(%rip),%ymm10 # 6d00 <_sk_callback_avx+0x4ba> DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10 DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0 DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9 @@ -11053,7 +11023,7 @@ _sk_xy_to_radius_avx LABEL PROC PUBLIC _sk_save_xy_avx _sk_save_xy_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,117,8,0,0 ; vbroadcastss 0x875(%rip),%ymm8 # 6d44 <_sk_callback_avx+0x4be> + DB 196,98,125,24,5,117,8,0,0 ; vbroadcastss 0x875(%rip),%ymm8 # 6d04 <_sk_callback_avx+0x4be> DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9 DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10 DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9 @@ -11086,9 +11056,9 @@ _sk_accumulate_avx LABEL PROC PUBLIC _sk_bilinear_nx_avx _sk_bilinear_nx_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,1,8,0,0 ; vbroadcastss 0x801(%rip),%ymm0 # 6d48 <_sk_callback_avx+0x4c2> + DB 196,226,125,24,5,1,8,0,0 ; vbroadcastss 0x801(%rip),%ymm0 # 6d08 <_sk_callback_avx+0x4c2> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,248,7,0,0 ; vbroadcastss 0x7f8(%rip),%ymm8 # 6d4c <_sk_callback_avx+0x4c6> + DB 196,98,125,24,5,248,7,0,0 ; vbroadcastss 0x7f8(%rip),%ymm8 # 6d0c <_sk_callback_avx+0x4c6> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -11097,7 +11067,7 @@ _sk_bilinear_nx_avx LABEL PROC PUBLIC _sk_bilinear_px_avx _sk_bilinear_px_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,224,7,0,0 ; vbroadcastss 0x7e0(%rip),%ymm0 # 6d50 <_sk_callback_avx+0x4ca> + DB 196,226,125,24,5,224,7,0,0 ; vbroadcastss 0x7e0(%rip),%ymm0 # 6d10 <_sk_callback_avx+0x4ca> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -11107,9 +11077,9 @@ _sk_bilinear_px_avx LABEL PROC PUBLIC _sk_bilinear_ny_avx _sk_bilinear_ny_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,196,7,0,0 ; vbroadcastss 0x7c4(%rip),%ymm1 # 6d54 <_sk_callback_avx+0x4ce> + DB 196,226,125,24,13,196,7,0,0 ; vbroadcastss 0x7c4(%rip),%ymm1 # 6d14 <_sk_callback_avx+0x4ce> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,186,7,0,0 ; vbroadcastss 0x7ba(%rip),%ymm8 # 6d58 <_sk_callback_avx+0x4d2> + DB 196,98,125,24,5,186,7,0,0 ; vbroadcastss 0x7ba(%rip),%ymm8 # 6d18 <_sk_callback_avx+0x4d2> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -11118,7 +11088,7 @@ _sk_bilinear_ny_avx LABEL PROC PUBLIC _sk_bilinear_py_avx _sk_bilinear_py_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,162,7,0,0 ; vbroadcastss 0x7a2(%rip),%ymm1 # 6d5c <_sk_callback_avx+0x4d6> + DB 196,226,125,24,13,162,7,0,0 ; vbroadcastss 0x7a2(%rip),%ymm1 # 6d1c <_sk_callback_avx+0x4d6> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -11128,14 +11098,14 @@ _sk_bilinear_py_avx LABEL PROC PUBLIC _sk_bicubic_n3x_avx _sk_bicubic_n3x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,133,7,0,0 ; vbroadcastss 0x785(%rip),%ymm0 # 6d60 <_sk_callback_avx+0x4da> + DB 196,226,125,24,5,133,7,0,0 ; vbroadcastss 0x785(%rip),%ymm0 # 6d20 <_sk_callback_avx+0x4da> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,124,7,0,0 ; vbroadcastss 0x77c(%rip),%ymm8 # 6d64 <_sk_callback_avx+0x4de> + DB 196,98,125,24,5,124,7,0,0 ; vbroadcastss 0x77c(%rip),%ymm8 # 6d24 <_sk_callback_avx+0x4de> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,109,7,0,0 ; vbroadcastss 0x76d(%rip),%ymm10 # 6d68 <_sk_callback_avx+0x4e2> + DB 196,98,125,24,21,109,7,0,0 ; vbroadcastss 0x76d(%rip),%ymm10 # 6d28 <_sk_callback_avx+0x4e2> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,99,7,0,0 ; vbroadcastss 0x763(%rip),%ymm10 # 6d6c <_sk_callback_avx+0x4e6> + DB 196,98,125,24,21,99,7,0,0 ; vbroadcastss 0x763(%rip),%ymm10 # 6d2c <_sk_callback_avx+0x4e6> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -11145,19 +11115,19 @@ _sk_bicubic_n3x_avx LABEL PROC PUBLIC _sk_bicubic_n1x_avx _sk_bicubic_n1x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,70,7,0,0 ; vbroadcastss 0x746(%rip),%ymm0 # 6d70 <_sk_callback_avx+0x4ea> + DB 196,226,125,24,5,70,7,0,0 ; vbroadcastss 0x746(%rip),%ymm0 # 6d30 <_sk_callback_avx+0x4ea> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 - DB 196,98,125,24,5,61,7,0,0 ; vbroadcastss 0x73d(%rip),%ymm8 # 6d74 <_sk_callback_avx+0x4ee> + DB 196,98,125,24,5,61,7,0,0 ; vbroadcastss 0x73d(%rip),%ymm8 # 6d34 <_sk_callback_avx+0x4ee> DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,51,7,0,0 ; vbroadcastss 0x733(%rip),%ymm9 # 6d78 <_sk_callback_avx+0x4f2> + DB 196,98,125,24,13,51,7,0,0 ; vbroadcastss 0x733(%rip),%ymm9 # 6d38 <_sk_callback_avx+0x4f2> DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,41,7,0,0 ; vbroadcastss 0x729(%rip),%ymm10 # 6d7c <_sk_callback_avx+0x4f6> + DB 196,98,125,24,21,41,7,0,0 ; vbroadcastss 0x729(%rip),%ymm10 # 6d3c <_sk_callback_avx+0x4f6> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,26,7,0,0 ; vbroadcastss 0x71a(%rip),%ymm10 # 6d80 <_sk_callback_avx+0x4fa> + DB 196,98,125,24,21,26,7,0,0 ; vbroadcastss 0x71a(%rip),%ymm10 # 6d40 <_sk_callback_avx+0x4fa> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 - DB 196,98,125,24,13,11,7,0,0 ; vbroadcastss 0x70b(%rip),%ymm9 # 6d84 <_sk_callback_avx+0x4fe> + DB 196,98,125,24,13,11,7,0,0 ; vbroadcastss 0x70b(%rip),%ymm9 # 6d44 <_sk_callback_avx+0x4fe> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -11166,17 +11136,17 @@ _sk_bicubic_n1x_avx LABEL PROC PUBLIC _sk_bicubic_p1x_avx _sk_bicubic_p1x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,243,6,0,0 ; vbroadcastss 0x6f3(%rip),%ymm8 # 6d88 <_sk_callback_avx+0x502> + DB 196,98,125,24,5,243,6,0,0 ; vbroadcastss 0x6f3(%rip),%ymm8 # 6d48 <_sk_callback_avx+0x502> DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0 DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9 - DB 196,98,125,24,21,229,6,0,0 ; vbroadcastss 0x6e5(%rip),%ymm10 # 6d8c <_sk_callback_avx+0x506> + DB 196,98,125,24,21,229,6,0,0 ; vbroadcastss 0x6e5(%rip),%ymm10 # 6d4c <_sk_callback_avx+0x506> DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 - DB 196,98,125,24,29,219,6,0,0 ; vbroadcastss 0x6db(%rip),%ymm11 # 6d90 <_sk_callback_avx+0x50a> + DB 196,98,125,24,29,219,6,0,0 ; vbroadcastss 0x6db(%rip),%ymm11 # 6d50 <_sk_callback_avx+0x50a> DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 - DB 196,98,125,24,13,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm9 # 6d94 <_sk_callback_avx+0x50e> + DB 196,98,125,24,13,194,6,0,0 ; vbroadcastss 0x6c2(%rip),%ymm9 # 6d54 <_sk_callback_avx+0x50e> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -11185,13 +11155,13 @@ _sk_bicubic_p1x_avx LABEL PROC PUBLIC _sk_bicubic_p3x_avx _sk_bicubic_p3x_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,5,170,6,0,0 ; vbroadcastss 0x6aa(%rip),%ymm0 # 6d98 <_sk_callback_avx+0x512> + DB 196,226,125,24,5,170,6,0,0 ; vbroadcastss 0x6aa(%rip),%ymm0 # 6d58 <_sk_callback_avx+0x512> DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0 DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,151,6,0,0 ; vbroadcastss 0x697(%rip),%ymm10 # 6d9c <_sk_callback_avx+0x516> + DB 196,98,125,24,21,151,6,0,0 ; vbroadcastss 0x697(%rip),%ymm10 # 6d5c <_sk_callback_avx+0x516> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,141,6,0,0 ; vbroadcastss 0x68d(%rip),%ymm10 # 6da0 <_sk_callback_avx+0x51a> + DB 196,98,125,24,21,141,6,0,0 ; vbroadcastss 0x68d(%rip),%ymm10 # 6d60 <_sk_callback_avx+0x51a> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax) @@ -11201,14 +11171,14 @@ _sk_bicubic_p3x_avx LABEL PROC PUBLIC _sk_bicubic_n3y_avx _sk_bicubic_n3y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,112,6,0,0 ; vbroadcastss 0x670(%rip),%ymm1 # 6da4 <_sk_callback_avx+0x51e> + DB 196,226,125,24,13,112,6,0,0 ; vbroadcastss 0x670(%rip),%ymm1 # 6d64 <_sk_callback_avx+0x51e> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,102,6,0,0 ; vbroadcastss 0x666(%rip),%ymm8 # 6da8 <_sk_callback_avx+0x522> + DB 196,98,125,24,5,102,6,0,0 ; vbroadcastss 0x666(%rip),%ymm8 # 6d68 <_sk_callback_avx+0x522> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,87,6,0,0 ; vbroadcastss 0x657(%rip),%ymm10 # 6dac <_sk_callback_avx+0x526> + DB 196,98,125,24,21,87,6,0,0 ; vbroadcastss 0x657(%rip),%ymm10 # 6d6c <_sk_callback_avx+0x526> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,77,6,0,0 ; vbroadcastss 0x64d(%rip),%ymm10 # 6db0 <_sk_callback_avx+0x52a> + DB 196,98,125,24,21,77,6,0,0 ; vbroadcastss 0x64d(%rip),%ymm10 # 6d70 <_sk_callback_avx+0x52a> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -11218,19 +11188,19 @@ _sk_bicubic_n3y_avx LABEL PROC PUBLIC _sk_bicubic_n1y_avx _sk_bicubic_n1y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,48,6,0,0 ; vbroadcastss 0x630(%rip),%ymm1 # 6db4 <_sk_callback_avx+0x52e> + DB 196,226,125,24,13,48,6,0,0 ; vbroadcastss 0x630(%rip),%ymm1 # 6d74 <_sk_callback_avx+0x52e> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 - DB 196,98,125,24,5,38,6,0,0 ; vbroadcastss 0x626(%rip),%ymm8 # 6db8 <_sk_callback_avx+0x532> + DB 196,98,125,24,5,38,6,0,0 ; vbroadcastss 0x626(%rip),%ymm8 # 6d78 <_sk_callback_avx+0x532> DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8 - DB 196,98,125,24,13,28,6,0,0 ; vbroadcastss 0x61c(%rip),%ymm9 # 6dbc <_sk_callback_avx+0x536> + DB 196,98,125,24,13,28,6,0,0 ; vbroadcastss 0x61c(%rip),%ymm9 # 6d7c <_sk_callback_avx+0x536> DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,18,6,0,0 ; vbroadcastss 0x612(%rip),%ymm10 # 6dc0 <_sk_callback_avx+0x53a> + DB 196,98,125,24,21,18,6,0,0 ; vbroadcastss 0x612(%rip),%ymm10 # 6d80 <_sk_callback_avx+0x53a> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9 - DB 196,98,125,24,21,3,6,0,0 ; vbroadcastss 0x603(%rip),%ymm10 # 6dc4 <_sk_callback_avx+0x53e> + DB 196,98,125,24,21,3,6,0,0 ; vbroadcastss 0x603(%rip),%ymm10 # 6d84 <_sk_callback_avx+0x53e> DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9 DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8 - DB 196,98,125,24,13,244,5,0,0 ; vbroadcastss 0x5f4(%rip),%ymm9 # 6dc8 <_sk_callback_avx+0x542> + DB 196,98,125,24,13,244,5,0,0 ; vbroadcastss 0x5f4(%rip),%ymm9 # 6d88 <_sk_callback_avx+0x542> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -11239,17 +11209,17 @@ _sk_bicubic_n1y_avx LABEL PROC PUBLIC _sk_bicubic_p1y_avx _sk_bicubic_p1y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,98,125,24,5,220,5,0,0 ; vbroadcastss 0x5dc(%rip),%ymm8 # 6dcc <_sk_callback_avx+0x546> + DB 196,98,125,24,5,220,5,0,0 ; vbroadcastss 0x5dc(%rip),%ymm8 # 6d8c <_sk_callback_avx+0x546> DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1 DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9 - DB 196,98,125,24,21,205,5,0,0 ; vbroadcastss 0x5cd(%rip),%ymm10 # 6dd0 <_sk_callback_avx+0x54a> + DB 196,98,125,24,21,205,5,0,0 ; vbroadcastss 0x5cd(%rip),%ymm10 # 6d90 <_sk_callback_avx+0x54a> DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 - DB 196,98,125,24,29,195,5,0,0 ; vbroadcastss 0x5c3(%rip),%ymm11 # 6dd4 <_sk_callback_avx+0x54e> + DB 196,98,125,24,29,195,5,0,0 ; vbroadcastss 0x5c3(%rip),%ymm11 # 6d94 <_sk_callback_avx+0x54e> DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10 DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10 DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 - DB 196,98,125,24,13,170,5,0,0 ; vbroadcastss 0x5aa(%rip),%ymm9 # 6dd8 <_sk_callback_avx+0x552> + DB 196,98,125,24,13,170,5,0,0 ; vbroadcastss 0x5aa(%rip),%ymm9 # 6d98 <_sk_callback_avx+0x552> DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -11258,13 +11228,13 @@ _sk_bicubic_p1y_avx LABEL PROC PUBLIC _sk_bicubic_p3y_avx _sk_bicubic_p3y_avx LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,24,13,146,5,0,0 ; vbroadcastss 0x592(%rip),%ymm1 # 6ddc <_sk_callback_avx+0x556> + DB 196,226,125,24,13,146,5,0,0 ; vbroadcastss 0x592(%rip),%ymm1 # 6d9c <_sk_callback_avx+0x556> DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1 DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8 DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9 - DB 196,98,125,24,21,126,5,0,0 ; vbroadcastss 0x57e(%rip),%ymm10 # 6de0 <_sk_callback_avx+0x55a> + DB 196,98,125,24,21,126,5,0,0 ; vbroadcastss 0x57e(%rip),%ymm10 # 6da0 <_sk_callback_avx+0x55a> DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8 - DB 196,98,125,24,21,116,5,0,0 ; vbroadcastss 0x574(%rip),%ymm10 # 6de4 <_sk_callback_avx+0x55e> + DB 196,98,125,24,21,116,5,0,0 ; vbroadcastss 0x574(%rip),%ymm10 # 6da4 <_sk_callback_avx+0x55e> DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8 DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8 DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax) @@ -11386,25 +11356,25 @@ ALIGN 4 DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 6a61 <.literal4+0xb1> + DB 71,225,61 ; rex.RXB loope 6a21 <.literal4+0xb1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 6a71 <.literal4+0xc1> + DB 71,225,61 ; rex.RXB loope 6a31 <.literal4+0xc1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 6a81 <.literal4+0xd1> + DB 71,225,61 ; rex.RXB loope 6a41 <.literal4+0xd1> DB 0,0 ; add %al,(%rax) DB 128,63,154 ; cmpb $0x9a,(%rdi) DB 153 ; cltd DB 153 ; cltd DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax - DB 71,225,61 ; rex.RXB loope 6a91 <.literal4+0xe1> + DB 71,225,61 ; rex.RXB loope 6a51 <.literal4+0xe1> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax) @@ -11456,7 +11426,7 @@ ALIGN 4 DB 190,129,128,128,59 ; mov $0x3b808081,%esi DB 129,128,128,59,0,248,0,0,8,33 ; addl $0x21080000,-0x7ffc480(%rax) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6ae5 <.literal4+0x135> + DB 224,7 ; loopne 6aa5 <.literal4+0x135> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -11472,10 +11442,10 @@ ALIGN 4 DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax) DB 0,52,255 ; add %dh,(%rdi,%rdi,8) DB 255 ; (bad) - DB 127,0 ; jg 6b0c <.literal4+0x15c> + DB 127,0 ; jg 6acc <.literal4+0x15c> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 6b85 <.literal4+0x1d5> + DB 119,115 ; ja 6b45 <.literal4+0x1d5> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -11489,10 +11459,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6b40 <.literal4+0x190> + DB 127,0 ; jg 6b00 <.literal4+0x190> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 6bb9 <.literal4+0x209> + DB 119,115 ; ja 6b79 <.literal4+0x209> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -11506,10 +11476,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6b74 <.literal4+0x1c4> + DB 127,0 ; jg 6b34 <.literal4+0x1c4> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 6bed <.literal4+0x23d> + DB 119,115 ; ja 6bad <.literal4+0x23d> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -11523,10 +11493,10 @@ ALIGN 4 DB 0,128,63,0,0,0 ; add %al,0x3f(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 6ba8 <.literal4+0x1f8> + DB 127,0 ; jg 6b68 <.literal4+0x1f8> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 6c21 <.literal4+0x271> + DB 119,115 ; ja 6be1 <.literal4+0x271> DB 248 ; clc DB 194,117,191 ; retq $0xbf75 DB 191,63,249,68,180 ; mov $0xb444f93f,%edi @@ -11539,7 +11509,7 @@ ALIGN 4 DB 0,75,0 ; add %cl,0x0(%rbx) DB 0,128,63,0,0,200 ; add %al,-0x37ffffc1(%rax) DB 66,0,0 ; rex.X add %al,(%rax) - DB 127,67 ; jg 6c1f <.literal4+0x26f> + DB 127,67 ; jg 6bdf <.literal4+0x26f> DB 0,0 ; add %al,(%rax) DB 0,195 ; add %al,%bl DB 0,0 ; add %al,(%rax) @@ -11551,10 +11521,10 @@ ALIGN 4 DB 190,80,128,3,62 ; mov $0x3e038050,%esi DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 6c3f <.literal4+0x28f> + DB 118,63 ; jbe 6bff <.literal4+0x28f> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax) - DB 127,67 ; jg 6c53 <.literal4+0x2a3> + DB 127,67 ; jg 6c13 <.literal4+0x2a3> DB 129,128,128,59,0,0,128,63,129,128 ; addl $0x80813f80,0x3b80(%rax) DB 128,59,0 ; cmpb $0x0,(%rbx) DB 0,128,63,129,128,128 ; add %al,-0x7f7f7ec1(%rax) @@ -11563,7 +11533,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6c35 <.literal4+0x285> + DB 224,7 ; loopne 6bf5 <.literal4+0x285> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -11575,7 +11545,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6c51 <.literal4+0x2a1> + DB 224,7 ; loopne 6c11 <.literal4+0x2a1> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -11586,7 +11556,7 @@ ALIGN 4 DB 0,0 ; add %al,(%rax) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 6ca6 <.literal4+0x2f6> + DB 124,66 ; jl 6c66 <.literal4+0x2f6> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax) @@ -11604,9 +11574,9 @@ ALIGN 4 DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax) DB 0,0 ; add %al,(%rax) DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax) - DB 112,65 ; jo 6ce9 <.literal4+0x339> + DB 112,65 ; jo 6ca9 <.literal4+0x339> DB 129,128,128,59,129,128,128,59,0,0 ; addl $0x3b80,-0x7f7ec480(%rax) - DB 127,67 ; jg 6cf7 <.literal4+0x347> + DB 127,67 ; jg 6cb7 <.literal4+0x347> DB 0,128,0,0,0,0 ; add %al,0x0(%rax) DB 0,128,0,4,0,128 ; add %al,-0x7ffffc00(%rax) DB 0,0 ; add %al,(%rax) @@ -11622,7 +11592,7 @@ ALIGN 4 DB 0,128,55,0,0,128 ; add %al,-0x7fffffc9(%rax) DB 63 ; (bad) DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 6d37 <.literal4+0x387> + DB 127,71 ; jg 6cf7 <.literal4+0x387> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -11958,50 +11928,34 @@ _sk_start_pipeline_sse41 LABEL PROC DB 15,41,189,48,255,255,255 ; movaps %xmm7,-0xd0(%rbp) DB 15,41,181,32,255,255,255 ; movaps %xmm6,-0xe0(%rbp) DB 72,137,211 ; mov %rdx,%rbx - DB 73,137,207 ; mov %rcx,%r15 + DB 73,137,204 ; mov %rcx,%r12 DB 76,139,117,48 ; mov 0x30(%rbp),%r14 DB 76,137,206 ; mov %r9,%rsi DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,197 ; mov %rax,%r13 - DB 73,137,244 ; mov %rsi,%r12 - DB 73,141,79,4 ; lea 0x4(%r15),%rcx + DB 73,137,247 ; mov %rsi,%r15 + DB 73,141,76,36,4 ; lea 0x4(%r12),%rcx DB 76,57,193 ; cmp %r8,%rcx - DB 118,5 ; jbe 7b <_sk_start_pipeline_sse41+0x7b> - DB 76,137,250 ; mov %r15,%rdx - DB 235,75 ; jmp c6 <_sk_start_pipeline_sse41+0xc6> + DB 118,5 ; jbe 7c <_sk_start_pipeline_sse41+0x7c> + DB 76,137,226 ; mov %r12,%rdx + DB 235,49 ; jmp ad <_sk_start_pipeline_sse41+0xad> DB 76,137,133,24,255,255,255 ; mov %r8,-0xe8(%rbp) - DB 65,184,0,0,0,0 ; mov $0x0,%r8d - DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 15,87,201 ; xorps %xmm1,%xmm1 - DB 15,87,210 ; xorps %xmm2,%xmm2 - DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 15,87,228 ; xorps %xmm4,%xmm4 - DB 15,87,237 ; xorps %xmm5,%xmm5 - DB 15,87,246 ; xorps %xmm6,%xmm6 - DB 15,87,255 ; xorps %xmm7,%xmm7 + DB 69,49,192 ; xor %r8d,%r8d DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi - DB 76,137,250 ; mov %r15,%rdx + DB 76,137,254 ; mov %r15,%rsi + DB 76,137,226 ; mov %r12,%rdx DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 76,139,133,24,255,255,255 ; mov -0xe8(%rbp),%r8 - DB 73,141,87,4 ; lea 0x4(%r15),%rdx - DB 73,131,199,8 ; add $0x8,%r15 - DB 77,57,199 ; cmp %r8,%r15 - DB 73,137,215 ; mov %rdx,%r15 - DB 118,188 ; jbe 82 <_sk_start_pipeline_sse41+0x82> + DB 73,141,84,36,4 ; lea 0x4(%r12),%rdx + DB 73,131,196,8 ; add $0x8,%r12 + DB 77,57,196 ; cmp %r8,%r12 + DB 73,137,212 ; mov %rdx,%r12 + DB 118,214 ; jbe 83 <_sk_start_pipeline_sse41+0x83> DB 73,41,208 ; sub %rdx,%r8 - DB 116,36 ; je ef <_sk_start_pipeline_sse41+0xef> - DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 15,87,201 ; xorps %xmm1,%xmm1 - DB 15,87,210 ; xorps %xmm2,%xmm2 - DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 15,87,228 ; xorps %xmm4,%xmm4 - DB 15,87,237 ; xorps %xmm5,%xmm5 - DB 15,87,246 ; xorps %xmm6,%xmm6 - DB 15,87,255 ; xorps %xmm7,%xmm7 + DB 116,12 ; je be <_sk_start_pipeline_sse41+0xbe> DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi + DB 76,137,254 ; mov %r15,%rsi DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6 @@ -12034,7 +11988,7 @@ _sk_seed_shader_sse41 LABEL PROC DB 102,15,110,194 ; movd %edx,%xmm0 DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0 DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 - DB 15,40,21,247,80,0,0 ; movaps 0x50f7(%rip),%xmm2 # 5250 <_sk_callback_sse41+0xd0> + DB 15,40,21,248,80,0,0 ; movaps 0x50f8(%rip),%xmm2 # 5220 <_sk_callback_sse41+0xd1> DB 15,88,202 ; addps %xmm2,%xmm1 DB 15,16,7 ; movups (%rdi),%xmm0 DB 15,88,193 ; addps %xmm1,%xmm0 @@ -12043,7 +11997,7 @@ _sk_seed_shader_sse41 LABEL PROC DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,88,202 ; addps %xmm2,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,21,230,80,0,0 ; movaps 0x50e6(%rip),%xmm2 # 5260 <_sk_callback_sse41+0xe0> + DB 15,40,21,231,80,0,0 ; movaps 0x50e7(%rip),%xmm2 # 5230 <_sk_callback_sse41+0xe1> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,87,237 ; xorps %xmm5,%xmm5 @@ -12061,14 +12015,14 @@ _sk_dither_sse41 LABEL PROC DB 102,68,15,110,193 ; movd %ecx,%xmm8 DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8 DB 102,69,15,239,193 ; pxor %xmm9,%xmm8 - DB 102,68,15,111,21,180,80,0,0 ; movdqa 0x50b4(%rip),%xmm10 # 5270 <_sk_callback_sse41+0xf0> + DB 102,68,15,111,21,181,80,0,0 ; movdqa 0x50b5(%rip),%xmm10 # 5240 <_sk_callback_sse41+0xf1> DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11 DB 102,69,15,219,218 ; pand %xmm10,%xmm11 DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11 DB 102,69,15,219,209 ; pand %xmm9,%xmm10 DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10 - DB 102,68,15,111,37,160,80,0,0 ; movdqa 0x50a0(%rip),%xmm12 # 5280 <_sk_callback_sse41+0x100> - DB 102,68,15,111,45,167,80,0,0 ; movdqa 0x50a7(%rip),%xmm13 # 5290 <_sk_callback_sse41+0x110> + DB 102,68,15,111,37,161,80,0,0 ; movdqa 0x50a1(%rip),%xmm12 # 5250 <_sk_callback_sse41+0x101> + DB 102,68,15,111,45,168,80,0,0 ; movdqa 0x50a8(%rip),%xmm13 # 5260 <_sk_callback_sse41+0x111> DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14 DB 102,69,15,219,245 ; pand %xmm13,%xmm14 DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14 @@ -12084,8 +12038,8 @@ _sk_dither_sse41 LABEL PROC DB 102,69,15,235,245 ; por %xmm13,%xmm14 DB 102,69,15,235,240 ; por %xmm8,%xmm14 DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8 - DB 68,15,89,5,98,80,0,0 ; mulps 0x5062(%rip),%xmm8 # 52a0 <_sk_callback_sse41+0x120> - DB 68,15,88,5,106,80,0,0 ; addps 0x506a(%rip),%xmm8 # 52b0 <_sk_callback_sse41+0x130> + DB 68,15,89,5,99,80,0,0 ; mulps 0x5063(%rip),%xmm8 # 5270 <_sk_callback_sse41+0x121> + DB 68,15,88,5,107,80,0,0 ; addps 0x506b(%rip),%xmm8 # 5280 <_sk_callback_sse41+0x131> DB 243,68,15,16,16 ; movss (%rax),%xmm10 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -12152,7 +12106,7 @@ _sk_clear_sse41 LABEL PROC PUBLIC _sk_srcatop_sse41 _sk_srcatop_sse41 LABEL PROC DB 15,89,199 ; mulps %xmm7,%xmm0 - DB 68,15,40,5,196,79,0,0 ; movaps 0x4fc4(%rip),%xmm8 # 52c0 <_sk_callback_sse41+0x140> + DB 68,15,40,5,197,79,0,0 ; movaps 0x4fc5(%rip),%xmm8 # 5290 <_sk_callback_sse41+0x141> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -12175,7 +12129,7 @@ PUBLIC _sk_dstatop_sse41 _sk_dstatop_sse41 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 DB 68,15,89,196 ; mulps %xmm4,%xmm8 - DB 68,15,40,13,135,79,0,0 ; movaps 0x4f87(%rip),%xmm9 # 52d0 <_sk_callback_sse41+0x150> + DB 68,15,40,13,136,79,0,0 ; movaps 0x4f88(%rip),%xmm9 # 52a0 <_sk_callback_sse41+0x151> DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,88,192 ; addps %xmm8,%xmm0 @@ -12216,7 +12170,7 @@ _sk_dstin_sse41 LABEL PROC PUBLIC _sk_srcout_sse41 _sk_srcout_sse41 LABEL PROC - DB 68,15,40,5,43,79,0,0 ; movaps 0x4f2b(%rip),%xmm8 # 52e0 <_sk_callback_sse41+0x160> + DB 68,15,40,5,44,79,0,0 ; movaps 0x4f2c(%rip),%xmm8 # 52b0 <_sk_callback_sse41+0x161> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 @@ -12227,7 +12181,7 @@ _sk_srcout_sse41 LABEL PROC PUBLIC _sk_dstout_sse41 _sk_dstout_sse41 LABEL PROC - DB 68,15,40,5,27,79,0,0 ; movaps 0x4f1b(%rip),%xmm8 # 52f0 <_sk_callback_sse41+0x170> + DB 68,15,40,5,28,79,0,0 ; movaps 0x4f1c(%rip),%xmm8 # 52c0 <_sk_callback_sse41+0x171> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 15,89,196 ; mulps %xmm4,%xmm0 @@ -12242,7 +12196,7 @@ _sk_dstout_sse41 LABEL PROC PUBLIC _sk_srcover_sse41 _sk_srcover_sse41 LABEL PROC - DB 68,15,40,5,254,78,0,0 ; movaps 0x4efe(%rip),%xmm8 # 5300 <_sk_callback_sse41+0x180> + DB 68,15,40,5,255,78,0,0 ; movaps 0x4eff(%rip),%xmm8 # 52d0 <_sk_callback_sse41+0x181> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -12260,7 +12214,7 @@ _sk_srcover_sse41 LABEL PROC PUBLIC _sk_dstover_sse41 _sk_dstover_sse41 LABEL PROC - DB 68,15,40,5,210,78,0,0 ; movaps 0x4ed2(%rip),%xmm8 # 5310 <_sk_callback_sse41+0x190> + DB 68,15,40,5,211,78,0,0 ; movaps 0x4ed3(%rip),%xmm8 # 52e0 <_sk_callback_sse41+0x191> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -12284,7 +12238,7 @@ _sk_modulate_sse41 LABEL PROC PUBLIC _sk_multiply_sse41 _sk_multiply_sse41 LABEL PROC - DB 68,15,40,5,166,78,0,0 ; movaps 0x4ea6(%rip),%xmm8 # 5320 <_sk_callback_sse41+0x1a0> + DB 68,15,40,5,167,78,0,0 ; movaps 0x4ea7(%rip),%xmm8 # 52f0 <_sk_callback_sse41+0x1a1> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 69,15,40,209 ; movaps %xmm9,%xmm10 @@ -12353,7 +12307,7 @@ _sk_screen_sse41 LABEL PROC PUBLIC _sk_xor__sse41 _sk_xor__sse41 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 - DB 15,40,29,219,77,0,0 ; movaps 0x4ddb(%rip),%xmm3 # 5330 <_sk_callback_sse41+0x1b0> + DB 15,40,29,220,77,0,0 ; movaps 0x4ddc(%rip),%xmm3 # 5300 <_sk_callback_sse41+0x1b1> DB 68,15,40,203 ; movaps %xmm3,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 @@ -12399,7 +12353,7 @@ _sk_darken_sse41 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,95,209 ; maxps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,70,77,0,0 ; movaps 0x4d46(%rip),%xmm2 # 5340 <_sk_callback_sse41+0x1c0> + DB 15,40,21,71,77,0,0 ; movaps 0x4d47(%rip),%xmm2 # 5310 <_sk_callback_sse41+0x1c1> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -12431,7 +12385,7 @@ _sk_lighten_sse41 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,235,76,0,0 ; movaps 0x4ceb(%rip),%xmm2 # 5350 <_sk_callback_sse41+0x1d0> + DB 15,40,21,236,76,0,0 ; movaps 0x4cec(%rip),%xmm2 # 5320 <_sk_callback_sse41+0x1d1> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -12466,7 +12420,7 @@ _sk_difference_sse41 LABEL PROC DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,133,76,0,0 ; movaps 0x4c85(%rip),%xmm2 # 5360 <_sk_callback_sse41+0x1e0> + DB 15,40,21,134,76,0,0 ; movaps 0x4c86(%rip),%xmm2 # 5330 <_sk_callback_sse41+0x1e1> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -12492,7 +12446,7 @@ _sk_exclusion_sse41 LABEL PROC DB 15,89,214 ; mulps %xmm6,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,69,76,0,0 ; movaps 0x4c45(%rip),%xmm2 # 5370 <_sk_callback_sse41+0x1f0> + DB 15,40,21,70,76,0,0 ; movaps 0x4c46(%rip),%xmm2 # 5340 <_sk_callback_sse41+0x1f1> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -12503,7 +12457,7 @@ _sk_exclusion_sse41 LABEL PROC PUBLIC _sk_colorburn_sse41 _sk_colorburn_sse41 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,21,56,76,0,0 ; movaps 0x4c38(%rip),%xmm10 # 5380 <_sk_callback_sse41+0x200> + DB 68,15,40,21,57,76,0,0 ; movaps 0x4c39(%rip),%xmm10 # 5350 <_sk_callback_sse41+0x201> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 69,15,40,203 ; movaps %xmm11,%xmm9 @@ -12583,7 +12537,7 @@ _sk_colorburn_sse41 LABEL PROC PUBLIC _sk_colordodge_sse41 _sk_colordodge_sse41 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,21,22,75,0,0 ; movaps 0x4b16(%rip),%xmm10 # 5390 <_sk_callback_sse41+0x210> + DB 68,15,40,21,23,75,0,0 ; movaps 0x4b17(%rip),%xmm10 # 5360 <_sk_callback_sse41+0x211> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 69,15,40,227 ; movaps %xmm11,%xmm12 @@ -12664,7 +12618,7 @@ _sk_hardlight_sse41 LABEL PROC DB 15,40,244 ; movaps %xmm4,%xmm6 DB 15,40,227 ; movaps %xmm3,%xmm4 DB 68,15,40,200 ; movaps %xmm0,%xmm9 - DB 68,15,40,21,236,73,0,0 ; movaps 0x49ec(%rip),%xmm10 # 53a0 <_sk_callback_sse41+0x220> + DB 68,15,40,21,237,73,0,0 ; movaps 0x49ed(%rip),%xmm10 # 5370 <_sk_callback_sse41+0x221> DB 65,15,40,234 ; movaps %xmm10,%xmm5 DB 15,92,239 ; subps %xmm7,%xmm5 DB 15,40,197 ; movaps %xmm5,%xmm0 @@ -12746,7 +12700,7 @@ PUBLIC _sk_overlay_sse41 _sk_overlay_sse41 LABEL PROC DB 68,15,40,201 ; movaps %xmm1,%xmm9 DB 68,15,40,240 ; movaps %xmm0,%xmm14 - DB 68,15,40,21,206,72,0,0 ; movaps 0x48ce(%rip),%xmm10 # 53b0 <_sk_callback_sse41+0x230> + DB 68,15,40,21,207,72,0,0 ; movaps 0x48cf(%rip),%xmm10 # 5380 <_sk_callback_sse41+0x231> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 65,15,40,195 ; movaps %xmm11,%xmm0 @@ -12830,7 +12784,7 @@ _sk_softlight_sse41 LABEL PROC DB 15,40,198 ; movaps %xmm6,%xmm0 DB 15,94,199 ; divps %xmm7,%xmm0 DB 65,15,84,193 ; andps %xmm9,%xmm0 - DB 15,40,13,161,71,0,0 ; movaps 0x47a1(%rip),%xmm1 # 53c0 <_sk_callback_sse41+0x240> + DB 15,40,13,162,71,0,0 ; movaps 0x47a2(%rip),%xmm1 # 5390 <_sk_callback_sse41+0x241> DB 68,15,40,209 ; movaps %xmm1,%xmm10 DB 68,15,92,208 ; subps %xmm0,%xmm10 DB 68,15,40,240 ; movaps %xmm0,%xmm14 @@ -12843,10 +12797,10 @@ _sk_softlight_sse41 LABEL PROC DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,89,210 ; mulps %xmm2,%xmm2 DB 15,88,208 ; addps %xmm0,%xmm2 - DB 68,15,40,45,127,71,0,0 ; movaps 0x477f(%rip),%xmm13 # 53d0 <_sk_callback_sse41+0x250> + DB 68,15,40,45,128,71,0,0 ; movaps 0x4780(%rip),%xmm13 # 53a0 <_sk_callback_sse41+0x251> DB 69,15,88,245 ; addps %xmm13,%xmm14 DB 68,15,89,242 ; mulps %xmm2,%xmm14 - DB 68,15,40,37,127,71,0,0 ; movaps 0x477f(%rip),%xmm12 # 53e0 <_sk_callback_sse41+0x260> + DB 68,15,40,37,128,71,0,0 ; movaps 0x4780(%rip),%xmm12 # 53b0 <_sk_callback_sse41+0x261> DB 69,15,89,252 ; mulps %xmm12,%xmm15 DB 69,15,88,254 ; addps %xmm14,%xmm15 DB 15,40,198 ; movaps %xmm6,%xmm0 @@ -13032,12 +12986,12 @@ _sk_hue_sse41 LABEL PROC DB 68,15,84,208 ; andps %xmm0,%xmm10 DB 15,84,200 ; andps %xmm0,%xmm1 DB 68,15,84,232 ; andps %xmm0,%xmm13 - DB 15,40,5,229,68,0,0 ; movaps 0x44e5(%rip),%xmm0 # 53f0 <_sk_callback_sse41+0x270> + DB 15,40,5,230,68,0,0 ; movaps 0x44e6(%rip),%xmm0 # 53c0 <_sk_callback_sse41+0x271> DB 68,15,89,224 ; mulps %xmm0,%xmm12 - DB 15,40,21,234,68,0,0 ; movaps 0x44ea(%rip),%xmm2 # 5400 <_sk_callback_sse41+0x280> + DB 15,40,21,235,68,0,0 ; movaps 0x44eb(%rip),%xmm2 # 53d0 <_sk_callback_sse41+0x281> DB 15,89,250 ; mulps %xmm2,%xmm7 DB 65,15,88,252 ; addps %xmm12,%xmm7 - DB 68,15,40,53,235,68,0,0 ; movaps 0x44eb(%rip),%xmm14 # 5410 <_sk_callback_sse41+0x290> + DB 68,15,40,53,236,68,0,0 ; movaps 0x44ec(%rip),%xmm14 # 53e0 <_sk_callback_sse41+0x291> DB 68,15,40,252 ; movaps %xmm4,%xmm15 DB 69,15,89,254 ; mulps %xmm14,%xmm15 DB 68,15,88,255 ; addps %xmm7,%xmm15 @@ -13120,7 +13074,7 @@ _sk_hue_sse41 LABEL PROC DB 65,15,88,214 ; addps %xmm14,%xmm2 DB 15,40,196 ; movaps %xmm4,%xmm0 DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1 - DB 68,15,40,13,176,67,0,0 ; movaps 0x43b0(%rip),%xmm9 # 5420 <_sk_callback_sse41+0x2a0> + DB 68,15,40,13,177,67,0,0 ; movaps 0x43b1(%rip),%xmm9 # 53f0 <_sk_callback_sse41+0x2a1> DB 65,15,40,225 ; movaps %xmm9,%xmm4 DB 15,92,229 ; subps %xmm5,%xmm4 DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0 @@ -13214,14 +13168,14 @@ _sk_saturation_sse41 LABEL PROC DB 68,15,84,215 ; andps %xmm7,%xmm10 DB 68,15,84,223 ; andps %xmm7,%xmm11 DB 68,15,84,199 ; andps %xmm7,%xmm8 - DB 15,40,21,99,66,0,0 ; movaps 0x4263(%rip),%xmm2 # 5430 <_sk_callback_sse41+0x2b0> + DB 15,40,21,100,66,0,0 ; movaps 0x4264(%rip),%xmm2 # 5400 <_sk_callback_sse41+0x2b1> DB 15,40,221 ; movaps %xmm5,%xmm3 DB 15,89,218 ; mulps %xmm2,%xmm3 - DB 15,40,13,102,66,0,0 ; movaps 0x4266(%rip),%xmm1 # 5440 <_sk_callback_sse41+0x2c0> + DB 15,40,13,103,66,0,0 ; movaps 0x4267(%rip),%xmm1 # 5410 <_sk_callback_sse41+0x2c1> DB 15,40,254 ; movaps %xmm6,%xmm7 DB 15,89,249 ; mulps %xmm1,%xmm7 DB 15,88,251 ; addps %xmm3,%xmm7 - DB 68,15,40,45,101,66,0,0 ; movaps 0x4265(%rip),%xmm13 # 5450 <_sk_callback_sse41+0x2d0> + DB 68,15,40,45,102,66,0,0 ; movaps 0x4266(%rip),%xmm13 # 5420 <_sk_callback_sse41+0x2d1> DB 69,15,89,245 ; mulps %xmm13,%xmm14 DB 68,15,88,247 ; addps %xmm7,%xmm14 DB 65,15,40,218 ; movaps %xmm10,%xmm3 @@ -13302,7 +13256,7 @@ _sk_saturation_sse41 LABEL PROC DB 65,15,88,253 ; addps %xmm13,%xmm7 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11 - DB 68,15,40,13,43,65,0,0 ; movaps 0x412b(%rip),%xmm9 # 5460 <_sk_callback_sse41+0x2e0> + DB 68,15,40,13,44,65,0,0 ; movaps 0x412c(%rip),%xmm9 # 5430 <_sk_callback_sse41+0x2e1> DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 68,15,92,204 ; subps %xmm4,%xmm9 DB 15,40,60,36 ; movaps (%rsp),%xmm7 @@ -13357,14 +13311,14 @@ _sk_color_sse41 LABEL PROC DB 15,40,231 ; movaps %xmm7,%xmm4 DB 68,15,89,244 ; mulps %xmm4,%xmm14 DB 15,89,204 ; mulps %xmm4,%xmm1 - DB 68,15,40,13,112,64,0,0 ; movaps 0x4070(%rip),%xmm9 # 5470 <_sk_callback_sse41+0x2f0> + DB 68,15,40,13,113,64,0,0 ; movaps 0x4071(%rip),%xmm9 # 5440 <_sk_callback_sse41+0x2f1> DB 65,15,40,250 ; movaps %xmm10,%xmm7 DB 65,15,89,249 ; mulps %xmm9,%xmm7 - DB 68,15,40,21,112,64,0,0 ; movaps 0x4070(%rip),%xmm10 # 5480 <_sk_callback_sse41+0x300> + DB 68,15,40,21,113,64,0,0 ; movaps 0x4071(%rip),%xmm10 # 5450 <_sk_callback_sse41+0x301> DB 65,15,40,219 ; movaps %xmm11,%xmm3 DB 65,15,89,218 ; mulps %xmm10,%xmm3 DB 15,88,223 ; addps %xmm7,%xmm3 - DB 68,15,40,29,109,64,0,0 ; movaps 0x406d(%rip),%xmm11 # 5490 <_sk_callback_sse41+0x310> + DB 68,15,40,29,110,64,0,0 ; movaps 0x406e(%rip),%xmm11 # 5460 <_sk_callback_sse41+0x311> DB 69,15,40,236 ; movaps %xmm12,%xmm13 DB 69,15,89,235 ; mulps %xmm11,%xmm13 DB 68,15,88,235 ; addps %xmm3,%xmm13 @@ -13449,7 +13403,7 @@ _sk_color_sse41 LABEL PROC DB 65,15,88,251 ; addps %xmm11,%xmm7 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1 - DB 68,15,40,13,41,63,0,0 ; movaps 0x3f29(%rip),%xmm9 # 54a0 <_sk_callback_sse41+0x320> + DB 68,15,40,13,42,63,0,0 ; movaps 0x3f2a(%rip),%xmm9 # 5470 <_sk_callback_sse41+0x321> DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,92,196 ; subps %xmm4,%xmm0 DB 68,15,89,192 ; mulps %xmm0,%xmm8 @@ -13501,13 +13455,13 @@ _sk_luminosity_sse41 LABEL PROC DB 69,15,89,216 ; mulps %xmm8,%xmm11 DB 68,15,40,203 ; movaps %xmm3,%xmm9 DB 68,15,89,205 ; mulps %xmm5,%xmm9 - DB 68,15,40,5,123,62,0,0 ; movaps 0x3e7b(%rip),%xmm8 # 54b0 <_sk_callback_sse41+0x330> + DB 68,15,40,5,124,62,0,0 ; movaps 0x3e7c(%rip),%xmm8 # 5480 <_sk_callback_sse41+0x331> DB 65,15,89,192 ; mulps %xmm8,%xmm0 - DB 68,15,40,21,127,62,0,0 ; movaps 0x3e7f(%rip),%xmm10 # 54c0 <_sk_callback_sse41+0x340> + DB 68,15,40,21,128,62,0,0 ; movaps 0x3e80(%rip),%xmm10 # 5490 <_sk_callback_sse41+0x341> DB 15,40,233 ; movaps %xmm1,%xmm5 DB 65,15,89,234 ; mulps %xmm10,%xmm5 DB 15,88,232 ; addps %xmm0,%xmm5 - DB 68,15,40,37,125,62,0,0 ; movaps 0x3e7d(%rip),%xmm12 # 54d0 <_sk_callback_sse41+0x350> + DB 68,15,40,37,126,62,0,0 ; movaps 0x3e7e(%rip),%xmm12 # 54a0 <_sk_callback_sse41+0x351> DB 68,15,40,242 ; movaps %xmm2,%xmm14 DB 69,15,89,244 ; mulps %xmm12,%xmm14 DB 68,15,88,245 ; addps %xmm5,%xmm14 @@ -13592,7 +13546,7 @@ _sk_luminosity_sse41 LABEL PROC DB 65,15,88,244 ; addps %xmm12,%xmm6 DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9 - DB 15,40,5,51,61,0,0 ; movaps 0x3d33(%rip),%xmm0 # 54e0 <_sk_callback_sse41+0x360> + DB 15,40,5,52,61,0,0 ; movaps 0x3d34(%rip),%xmm0 # 54b0 <_sk_callback_sse41+0x361> DB 15,40,208 ; movaps %xmm0,%xmm2 DB 15,92,215 ; subps %xmm7,%xmm2 DB 15,89,226 ; mulps %xmm2,%xmm4 @@ -13631,23 +13585,23 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,217,0,0,0 ; jne 1904 <_sk_srcover_rgba_8888_sse41+0xe7> + DB 15,133,217,0,0,0 ; jne 18d3 <_sk_srcover_rgba_8888_sse41+0xe7> DB 243,15,111,60,144 ; movdqu (%rax,%rdx,4),%xmm7 DB 77,133,192 ; test %r8,%r8 - DB 102,15,111,37,181,60,0,0 ; movdqa 0x3cb5(%rip),%xmm4 # 54f0 <_sk_callback_sse41+0x370> + DB 102,15,111,37,182,60,0,0 ; movdqa 0x3cb6(%rip),%xmm4 # 54c0 <_sk_callback_sse41+0x371> DB 102,15,219,231 ; pand %xmm7,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 DB 102,15,111,239 ; movdqa %xmm7,%xmm5 - DB 102,15,56,0,45,177,60,0,0 ; pshufb 0x3cb1(%rip),%xmm5 # 5500 <_sk_callback_sse41+0x380> + DB 102,15,56,0,45,178,60,0,0 ; pshufb 0x3cb2(%rip),%xmm5 # 54d0 <_sk_callback_sse41+0x381> DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5 DB 102,15,111,247 ; movdqa %xmm7,%xmm6 - DB 102,15,56,0,53,177,60,0,0 ; pshufb 0x3cb1(%rip),%xmm6 # 5510 <_sk_callback_sse41+0x390> + DB 102,15,56,0,53,178,60,0,0 ; pshufb 0x3cb2(%rip),%xmm6 # 54e0 <_sk_callback_sse41+0x391> DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6 DB 102,15,114,215,24 ; psrld $0x18,%xmm7 DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7 - DB 68,15,40,5,174,60,0,0 ; movaps 0x3cae(%rip),%xmm8 # 5520 <_sk_callback_sse41+0x3a0> + DB 68,15,40,5,175,60,0,0 ; movaps 0x3caf(%rip),%xmm8 # 54f0 <_sk_callback_sse41+0x3a1> DB 68,15,92,195 ; subps %xmm3,%xmm8 - DB 68,15,40,37,178,60,0,0 ; movaps 0x3cb2(%rip),%xmm12 # 5530 <_sk_callback_sse41+0x3b0> + DB 68,15,40,37,179,60,0,0 ; movaps 0x3cb3(%rip),%xmm12 # 5500 <_sk_callback_sse41+0x3b1> DB 65,15,89,196 ; mulps %xmm12,%xmm0 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -13673,7 +13627,7 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC DB 102,15,114,240,24 ; pslld $0x18,%xmm0 DB 102,15,235,194 ; por %xmm2,%xmm0 DB 102,15,235,193 ; por %xmm1,%xmm0 - DB 117,85 ; jne 1940 <_sk_srcover_rgba_8888_sse41+0x123> + DB 117,85 ; jne 190f <_sk_srcover_rgba_8888_sse41+0x123> DB 243,15,127,4,144 ; movdqu %xmm0,(%rax,%rdx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,193 ; movaps %xmm9,%xmm0 @@ -13684,32 +13638,32 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,87 ; je 1968 <_sk_srcover_rgba_8888_sse41+0x14b> + DB 116,87 ; je 1937 <_sk_srcover_rgba_8888_sse41+0x14b> DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,21 ; je 1930 <_sk_srcover_rgba_8888_sse41+0x113> + DB 116,21 ; je 18ff <_sk_srcover_rgba_8888_sse41+0x113> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 15,133,11,255,255,255 ; jne 1830 <_sk_srcover_rgba_8888_sse41+0x13> + DB 15,133,11,255,255,255 ; jne 17ff <_sk_srcover_rgba_8888_sse41+0x13> DB 102,15,110,100,144,8 ; movd 0x8(%rax,%rdx,4),%xmm4 DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7 DB 243,15,126,36,144 ; movq (%rax,%rdx,4),%xmm4 DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7 - DB 233,240,254,255,255 ; jmpq 1830 <_sk_srcover_rgba_8888_sse41+0x13> + DB 233,240,254,255,255 ; jmpq 17ff <_sk_srcover_rgba_8888_sse41+0x13> DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,37 ; je 1972 <_sk_srcover_rgba_8888_sse41+0x155> + DB 116,37 ; je 1941 <_sk_srcover_rgba_8888_sse41+0x155> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,14 ; je 1961 <_sk_srcover_rgba_8888_sse41+0x144> + DB 116,14 ; je 1930 <_sk_srcover_rgba_8888_sse41+0x144> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,151 ; jne 18f0 <_sk_srcover_rgba_8888_sse41+0xd3> + DB 117,151 ; jne 18bf <_sk_srcover_rgba_8888_sse41+0xd3> DB 102,15,58,22,68,144,8,2 ; pextrd $0x2,%xmm0,0x8(%rax,%rdx,4) DB 102,15,214,4,144 ; movq %xmm0,(%rax,%rdx,4) - DB 235,136 ; jmp 18f0 <_sk_srcover_rgba_8888_sse41+0xd3> + DB 235,136 ; jmp 18bf <_sk_srcover_rgba_8888_sse41+0xd3> DB 102,15,110,60,144 ; movd (%rax,%rdx,4),%xmm7 - DB 233,190,254,255,255 ; jmpq 1830 <_sk_srcover_rgba_8888_sse41+0x13> + DB 233,190,254,255,255 ; jmpq 17ff <_sk_srcover_rgba_8888_sse41+0x13> DB 102,15,126,4,144 ; movd %xmm0,(%rax,%rdx,4) - DB 233,116,255,255,255 ; jmpq 18f0 <_sk_srcover_rgba_8888_sse41+0xd3> + DB 233,116,255,255,255 ; jmpq 18bf <_sk_srcover_rgba_8888_sse41+0xd3> PUBLIC _sk_clamp_0_sse41 _sk_clamp_0_sse41 LABEL PROC @@ -13723,7 +13677,7 @@ _sk_clamp_0_sse41 LABEL PROC PUBLIC _sk_clamp_1_sse41 _sk_clamp_1_sse41 LABEL PROC - DB 68,15,40,5,164,59,0,0 ; movaps 0x3ba4(%rip),%xmm8 # 5540 <_sk_callback_sse41+0x3c0> + DB 68,15,40,5,165,59,0,0 ; movaps 0x3ba5(%rip),%xmm8 # 5510 <_sk_callback_sse41+0x3c1> DB 65,15,93,192 ; minps %xmm8,%xmm0 DB 65,15,93,200 ; minps %xmm8,%xmm1 DB 65,15,93,208 ; minps %xmm8,%xmm2 @@ -13733,7 +13687,7 @@ _sk_clamp_1_sse41 LABEL PROC PUBLIC _sk_clamp_a_sse41 _sk_clamp_a_sse41 LABEL PROC - DB 15,93,29,153,59,0,0 ; minps 0x3b99(%rip),%xmm3 # 5550 <_sk_callback_sse41+0x3d0> + DB 15,93,29,154,59,0,0 ; minps 0x3b9a(%rip),%xmm3 # 5520 <_sk_callback_sse41+0x3d1> DB 15,93,195 ; minps %xmm3,%xmm0 DB 15,93,203 ; minps %xmm3,%xmm1 DB 15,93,211 ; minps %xmm3,%xmm2 @@ -13806,7 +13760,7 @@ _sk_premul_sse41 LABEL PROC PUBLIC _sk_unpremul_sse41 _sk_unpremul_sse41 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 - DB 68,15,40,13,4,59,0,0 ; movaps 0x3b04(%rip),%xmm9 # 5560 <_sk_callback_sse41+0x3e0> + DB 68,15,40,13,5,59,0,0 ; movaps 0x3b05(%rip),%xmm9 # 5530 <_sk_callback_sse41+0x3e1> DB 68,15,94,203 ; divps %xmm3,%xmm9 DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8 DB 69,15,84,193 ; andps %xmm9,%xmm8 @@ -13818,20 +13772,20 @@ _sk_unpremul_sse41 LABEL PROC PUBLIC _sk_from_srgb_sse41 _sk_from_srgb_sse41 LABEL PROC - DB 68,15,40,29,239,58,0,0 ; movaps 0x3aef(%rip),%xmm11 # 5570 <_sk_callback_sse41+0x3f0> + DB 68,15,40,29,240,58,0,0 ; movaps 0x3af0(%rip),%xmm11 # 5540 <_sk_callback_sse41+0x3f1> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 DB 68,15,40,208 ; movaps %xmm0,%xmm10 DB 69,15,89,210 ; mulps %xmm10,%xmm10 - DB 68,15,40,37,231,58,0,0 ; movaps 0x3ae7(%rip),%xmm12 # 5580 <_sk_callback_sse41+0x400> + DB 68,15,40,37,232,58,0,0 ; movaps 0x3ae8(%rip),%xmm12 # 5550 <_sk_callback_sse41+0x401> DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 69,15,89,196 ; mulps %xmm12,%xmm8 - DB 68,15,40,45,231,58,0,0 ; movaps 0x3ae7(%rip),%xmm13 # 5590 <_sk_callback_sse41+0x410> + DB 68,15,40,45,232,58,0,0 ; movaps 0x3ae8(%rip),%xmm13 # 5560 <_sk_callback_sse41+0x411> DB 69,15,88,197 ; addps %xmm13,%xmm8 DB 69,15,89,194 ; mulps %xmm10,%xmm8 - DB 68,15,40,53,231,58,0,0 ; movaps 0x3ae7(%rip),%xmm14 # 55a0 <_sk_callback_sse41+0x420> + DB 68,15,40,53,232,58,0,0 ; movaps 0x3ae8(%rip),%xmm14 # 5570 <_sk_callback_sse41+0x421> DB 69,15,88,198 ; addps %xmm14,%xmm8 - DB 68,15,40,61,235,58,0,0 ; movaps 0x3aeb(%rip),%xmm15 # 55b0 <_sk_callback_sse41+0x430> + DB 68,15,40,61,236,58,0,0 ; movaps 0x3aec(%rip),%xmm15 # 5580 <_sk_callback_sse41+0x431> DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0 DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 DB 68,15,40,209 ; movaps %xmm1,%xmm10 @@ -13873,22 +13827,22 @@ _sk_to_srgb_sse41 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 DB 15,40,209 ; movaps %xmm1,%xmm2 DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8 - DB 68,15,40,29,96,58,0,0 ; movaps 0x3a60(%rip),%xmm11 # 55c0 <_sk_callback_sse41+0x440> + DB 68,15,40,29,97,58,0,0 ; movaps 0x3a61(%rip),%xmm11 # 5590 <_sk_callback_sse41+0x441> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 - DB 68,15,40,37,96,58,0,0 ; movaps 0x3a60(%rip),%xmm12 # 55d0 <_sk_callback_sse41+0x450> + DB 68,15,40,37,97,58,0,0 ; movaps 0x3a61(%rip),%xmm12 # 55a0 <_sk_callback_sse41+0x451> DB 69,15,40,248 ; movaps %xmm8,%xmm15 DB 69,15,89,252 ; mulps %xmm12,%xmm15 - DB 68,15,40,21,96,58,0,0 ; movaps 0x3a60(%rip),%xmm10 # 55e0 <_sk_callback_sse41+0x460> + DB 68,15,40,21,97,58,0,0 ; movaps 0x3a61(%rip),%xmm10 # 55b0 <_sk_callback_sse41+0x461> DB 69,15,88,250 ; addps %xmm10,%xmm15 DB 69,15,89,248 ; mulps %xmm8,%xmm15 - DB 68,15,40,45,96,58,0,0 ; movaps 0x3a60(%rip),%xmm13 # 55f0 <_sk_callback_sse41+0x470> + DB 68,15,40,45,97,58,0,0 ; movaps 0x3a61(%rip),%xmm13 # 55c0 <_sk_callback_sse41+0x471> DB 69,15,88,253 ; addps %xmm13,%xmm15 - DB 68,15,40,53,100,58,0,0 ; movaps 0x3a64(%rip),%xmm14 # 5600 <_sk_callback_sse41+0x480> + DB 68,15,40,53,101,58,0,0 ; movaps 0x3a65(%rip),%xmm14 # 55d0 <_sk_callback_sse41+0x481> DB 69,15,88,198 ; addps %xmm14,%xmm8 DB 69,15,83,192 ; rcpps %xmm8,%xmm8 DB 69,15,89,199 ; mulps %xmm15,%xmm8 - DB 68,15,40,61,96,58,0,0 ; movaps 0x3a60(%rip),%xmm15 # 5610 <_sk_callback_sse41+0x490> + DB 68,15,40,61,97,58,0,0 ; movaps 0x3a61(%rip),%xmm15 # 55e0 <_sk_callback_sse41+0x491> DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0 DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9 @@ -13940,7 +13894,7 @@ _sk_rgb_to_hsl_sse41 LABEL PROC DB 68,15,93,226 ; minps %xmm2,%xmm12 DB 65,15,40,203 ; movaps %xmm11,%xmm1 DB 65,15,92,204 ; subps %xmm12,%xmm1 - DB 68,15,40,53,170,57,0,0 ; movaps 0x39aa(%rip),%xmm14 # 5620 <_sk_callback_sse41+0x4a0> + DB 68,15,40,53,171,57,0,0 ; movaps 0x39ab(%rip),%xmm14 # 55f0 <_sk_callback_sse41+0x4a1> DB 68,15,94,241 ; divps %xmm1,%xmm14 DB 69,15,40,211 ; movaps %xmm11,%xmm10 DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10 @@ -13949,27 +13903,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC DB 65,15,89,198 ; mulps %xmm14,%xmm0 DB 69,15,40,249 ; movaps %xmm9,%xmm15 DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15 - DB 68,15,84,61,145,57,0,0 ; andps 0x3991(%rip),%xmm15 # 5630 <_sk_callback_sse41+0x4b0> + DB 68,15,84,61,146,57,0,0 ; andps 0x3992(%rip),%xmm15 # 5600 <_sk_callback_sse41+0x4b1> DB 68,15,88,248 ; addps %xmm0,%xmm15 DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0 DB 65,15,92,208 ; subps %xmm8,%xmm2 DB 65,15,89,214 ; mulps %xmm14,%xmm2 - DB 68,15,40,45,132,57,0,0 ; movaps 0x3984(%rip),%xmm13 # 5640 <_sk_callback_sse41+0x4c0> + DB 68,15,40,45,133,57,0,0 ; movaps 0x3985(%rip),%xmm13 # 5610 <_sk_callback_sse41+0x4c1> DB 65,15,88,213 ; addps %xmm13,%xmm2 DB 69,15,92,193 ; subps %xmm9,%xmm8 DB 69,15,89,198 ; mulps %xmm14,%xmm8 - DB 68,15,88,5,128,57,0,0 ; addps 0x3980(%rip),%xmm8 # 5650 <_sk_callback_sse41+0x4d0> + DB 68,15,88,5,129,57,0,0 ; addps 0x3981(%rip),%xmm8 # 5620 <_sk_callback_sse41+0x4d1> DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8 - DB 68,15,89,5,120,57,0,0 ; mulps 0x3978(%rip),%xmm8 # 5660 <_sk_callback_sse41+0x4e0> + DB 68,15,89,5,121,57,0,0 ; mulps 0x3979(%rip),%xmm8 # 5630 <_sk_callback_sse41+0x4e1> DB 69,15,40,203 ; movaps %xmm11,%xmm9 DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9 DB 69,15,84,193 ; andps %xmm9,%xmm8 DB 69,15,92,235 ; subps %xmm11,%xmm13 DB 69,15,88,220 ; addps %xmm12,%xmm11 - DB 15,40,5,108,57,0,0 ; movaps 0x396c(%rip),%xmm0 # 5670 <_sk_callback_sse41+0x4f0> + DB 15,40,5,109,57,0,0 ; movaps 0x396d(%rip),%xmm0 # 5640 <_sk_callback_sse41+0x4f1> DB 65,15,40,211 ; movaps %xmm11,%xmm2 DB 15,89,208 ; mulps %xmm0,%xmm2 DB 15,194,194,1 ; cmpltps %xmm2,%xmm0 @@ -13990,7 +13944,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp) DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp) DB 68,15,40,208 ; movaps %xmm0,%xmm10 - DB 68,15,40,13,46,57,0,0 ; movaps 0x392e(%rip),%xmm9 # 5680 <_sk_callback_sse41+0x500> + DB 68,15,40,13,47,57,0,0 ; movaps 0x392f(%rip),%xmm9 # 5650 <_sk_callback_sse41+0x501> DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 15,194,194,2 ; cmpleps %xmm2,%xmm0 DB 15,40,217 ; movaps %xmm1,%xmm3 @@ -14003,19 +13957,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 15,41,20,36 ; movaps %xmm2,(%rsp) DB 69,15,88,192 ; addps %xmm8,%xmm8 DB 68,15,92,197 ; subps %xmm5,%xmm8 - DB 68,15,40,53,10,57,0,0 ; movaps 0x390a(%rip),%xmm14 # 5690 <_sk_callback_sse41+0x510> + DB 68,15,40,53,11,57,0,0 ; movaps 0x390b(%rip),%xmm14 # 5660 <_sk_callback_sse41+0x511> DB 69,15,88,242 ; addps %xmm10,%xmm14 DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0 DB 68,15,92,240 ; subps %xmm0,%xmm14 - DB 68,15,40,29,3,57,0,0 ; movaps 0x3903(%rip),%xmm11 # 56a0 <_sk_callback_sse41+0x520> + DB 68,15,40,29,4,57,0,0 ; movaps 0x3904(%rip),%xmm11 # 5670 <_sk_callback_sse41+0x521> DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0 DB 15,40,245 ; movaps %xmm5,%xmm6 DB 65,15,92,240 ; subps %xmm8,%xmm6 - DB 15,40,61,252,56,0,0 ; movaps 0x38fc(%rip),%xmm7 # 56b0 <_sk_callback_sse41+0x530> + DB 15,40,61,253,56,0,0 ; movaps 0x38fd(%rip),%xmm7 # 5680 <_sk_callback_sse41+0x531> DB 69,15,40,238 ; movaps %xmm14,%xmm13 DB 68,15,89,239 ; mulps %xmm7,%xmm13 - DB 15,40,29,253,56,0,0 ; movaps 0x38fd(%rip),%xmm3 # 56c0 <_sk_callback_sse41+0x540> + DB 15,40,29,254,56,0,0 ; movaps 0x38fe(%rip),%xmm3 # 5690 <_sk_callback_sse41+0x541> DB 68,15,40,227 ; movaps %xmm3,%xmm12 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 68,15,89,230 ; mulps %xmm6,%xmm12 @@ -14025,7 +13979,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0 DB 68,15,40,253 ; movaps %xmm5,%xmm15 DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15 - DB 68,15,40,37,220,56,0,0 ; movaps 0x38dc(%rip),%xmm12 # 56d0 <_sk_callback_sse41+0x550> + DB 68,15,40,37,221,56,0,0 ; movaps 0x38dd(%rip),%xmm12 # 56a0 <_sk_callback_sse41+0x551> DB 65,15,40,196 ; movaps %xmm12,%xmm0 DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0 DB 68,15,89,238 ; mulps %xmm6,%xmm13 @@ -14059,7 +14013,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC DB 65,15,40,198 ; movaps %xmm14,%xmm0 DB 15,40,20,36 ; movaps (%rsp),%xmm2 DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1 - DB 68,15,88,21,85,56,0,0 ; addps 0x3855(%rip),%xmm10 # 56e0 <_sk_callback_sse41+0x560> + DB 68,15,88,21,86,56,0,0 ; addps 0x3856(%rip),%xmm10 # 56b0 <_sk_callback_sse41+0x561> DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0 DB 68,15,92,208 ; subps %xmm0,%xmm10 DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11 @@ -14107,11 +14061,11 @@ _sk_scale_u8_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,52 ; jne 1f68 <_sk_scale_u8_sse41+0x3e> + DB 117,52 ; jne 1f37 <_sk_scale_u8_sse41+0x3e> DB 102,69,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm8 - DB 102,68,15,219,5,172,55,0,0 ; pand 0x37ac(%rip),%xmm8 # 56f0 <_sk_callback_sse41+0x570> + DB 102,68,15,219,5,173,55,0,0 ; pand 0x37ad(%rip),%xmm8 # 56c0 <_sk_callback_sse41+0x571> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,176,55,0,0 ; mulps 0x37b0(%rip),%xmm8 # 5700 <_sk_callback_sse41+0x580> + DB 68,15,89,5,177,55,0,0 ; mulps 0x37b1(%rip),%xmm8 # 56d0 <_sk_callback_sse41+0x581> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 65,15,89,208 ; mulps %xmm8,%xmm2 @@ -14122,12 +14076,12 @@ _sk_scale_u8_sse41 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,59 ; je 1fb0 <_sk_scale_u8_sse41+0x86> + DB 116,59 ; je 1f7f <_sk_scale_u8_sse41+0x86> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,23 ; je 1f97 <_sk_scale_u8_sse41+0x6d> + DB 116,23 ; je 1f66 <_sk_scale_u8_sse41+0x6d> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,181 ; jne 1f3b <_sk_scale_u8_sse41+0x11> + DB 117,181 ; jne 1f0a <_sk_scale_u8_sse41+0x11> DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8 @@ -14135,10 +14089,10 @@ _sk_scale_u8_sse41 LABEL PROC DB 102,68,15,110,200 ; movd %eax,%xmm9 DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9 DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8 - DB 235,139 ; jmp 1f3b <_sk_scale_u8_sse41+0x11> + DB 235,139 ; jmp 1f0a <_sk_scale_u8_sse41+0x11> DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 233,124,255,255,255 ; jmpq 1f3b <_sk_scale_u8_sse41+0x11> + DB 233,124,255,255,255 ; jmpq 1f0a <_sk_scale_u8_sse41+0x11> PUBLIC _sk_lerp_1_float_sse41 _sk_lerp_1_float_sse41 LABEL PROC @@ -14165,11 +14119,11 @@ _sk_lerp_u8_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,72 ; jne 2049 <_sk_lerp_u8_sse41+0x52> + DB 117,72 ; jne 2018 <_sk_lerp_u8_sse41+0x52> DB 102,69,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm8 - DB 102,68,15,219,5,255,54,0,0 ; pand 0x36ff(%rip),%xmm8 # 5710 <_sk_callback_sse41+0x590> + DB 102,68,15,219,5,0,55,0,0 ; pand 0x3700(%rip),%xmm8 # 56e0 <_sk_callback_sse41+0x591> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,3,55,0,0 ; mulps 0x3703(%rip),%xmm8 # 5720 <_sk_callback_sse41+0x5a0> + DB 68,15,89,5,4,55,0,0 ; mulps 0x3704(%rip),%xmm8 # 56f0 <_sk_callback_sse41+0x5a1> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -14187,12 +14141,12 @@ _sk_lerp_u8_sse41 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,62 ; je 2094 <_sk_lerp_u8_sse41+0x9d> + DB 116,62 ; je 2063 <_sk_lerp_u8_sse41+0x9d> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,23 ; je 2078 <_sk_lerp_u8_sse41+0x81> + DB 116,23 ; je 2047 <_sk_lerp_u8_sse41+0x81> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,161 ; jne 2008 <_sk_lerp_u8_sse41+0x11> + DB 117,161 ; jne 1fd7 <_sk_lerp_u8_sse41+0x11> DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8 @@ -14200,29 +14154,29 @@ _sk_lerp_u8_sse41 LABEL PROC DB 102,68,15,110,200 ; movd %eax,%xmm9 DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9 DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8 - DB 233,116,255,255,255 ; jmpq 2008 <_sk_lerp_u8_sse41+0x11> + DB 233,116,255,255,255 ; jmpq 1fd7 <_sk_lerp_u8_sse41+0x11> DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 233,101,255,255,255 ; jmpq 2008 <_sk_lerp_u8_sse41+0x11> + DB 233,101,255,255,255 ; jmpq 1fd7 <_sk_lerp_u8_sse41+0x11> PUBLIC _sk_lerp_565_sse41 _sk_lerp_565_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,152,0,0,0 ; jne 2149 <_sk_lerp_565_sse41+0xa6> + DB 15,133,152,0,0,0 ; jne 2118 <_sk_lerp_565_sse41+0xa6> DB 102,69,15,56,51,20,82 ; pmovzxwd (%r10,%rdx,2),%xmm10 - DB 102,68,15,111,5,111,54,0,0 ; movdqa 0x366f(%rip),%xmm8 # 5730 <_sk_callback_sse41+0x5b0> + DB 102,68,15,111,5,112,54,0,0 ; movdqa 0x3670(%rip),%xmm8 # 5700 <_sk_callback_sse41+0x5b1> DB 102,69,15,219,194 ; pand %xmm10,%xmm8 DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,110,54,0,0 ; mulps 0x366e(%rip),%xmm8 # 5740 <_sk_callback_sse41+0x5c0> - DB 102,68,15,111,13,117,54,0,0 ; movdqa 0x3675(%rip),%xmm9 # 5750 <_sk_callback_sse41+0x5d0> + DB 68,15,89,5,111,54,0,0 ; mulps 0x366f(%rip),%xmm8 # 5710 <_sk_callback_sse41+0x5c1> + DB 102,68,15,111,13,118,54,0,0 ; movdqa 0x3676(%rip),%xmm9 # 5720 <_sk_callback_sse41+0x5d1> DB 102,69,15,219,202 ; pand %xmm10,%xmm9 DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9 - DB 68,15,89,13,116,54,0,0 ; mulps 0x3674(%rip),%xmm9 # 5760 <_sk_callback_sse41+0x5e0> - DB 102,68,15,219,21,123,54,0,0 ; pand 0x367b(%rip),%xmm10 # 5770 <_sk_callback_sse41+0x5f0> + DB 68,15,89,13,117,54,0,0 ; mulps 0x3675(%rip),%xmm9 # 5730 <_sk_callback_sse41+0x5e1> + DB 102,68,15,219,21,124,54,0,0 ; pand 0x367c(%rip),%xmm10 # 5740 <_sk_callback_sse41+0x5f1> DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 - DB 68,15,89,21,127,54,0,0 ; mulps 0x367f(%rip),%xmm10 # 5780 <_sk_callback_sse41+0x600> + DB 68,15,89,21,128,54,0,0 ; mulps 0x3680(%rip),%xmm10 # 5750 <_sk_callback_sse41+0x601> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -14247,34 +14201,34 @@ _sk_lerp_565_sse41 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,62 ; je 2194 <_sk_lerp_565_sse41+0xf1> + DB 116,62 ; je 2163 <_sk_lerp_565_sse41+0xf1> DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,27 ; je 217c <_sk_lerp_565_sse41+0xd9> + DB 116,27 ; je 214b <_sk_lerp_565_sse41+0xd9> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 15,133,77,255,255,255 ; jne 20b8 <_sk_lerp_565_sse41+0x15> + DB 15,133,77,255,255,255 ; jne 2087 <_sk_lerp_565_sse41+0x15> DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10 DB 102,69,15,110,4,82 ; movd (%r10,%rdx,2),%xmm8 DB 102,69,15,56,51,192 ; pmovzxwd %xmm8,%xmm8 DB 102,69,15,58,14,208,15 ; pblendw $0xf,%xmm8,%xmm10 - DB 233,36,255,255,255 ; jmpq 20b8 <_sk_lerp_565_sse41+0x15> + DB 233,36,255,255,255 ; jmpq 2087 <_sk_lerp_565_sse41+0x15> DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax DB 102,68,15,110,208 ; movd %eax,%xmm10 - DB 233,21,255,255,255 ; jmpq 20b8 <_sk_lerp_565_sse41+0x15> + DB 233,21,255,255,255 ; jmpq 2087 <_sk_lerp_565_sse41+0x15> PUBLIC _sk_load_tables_sse41 _sk_load_tables_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 77,133,192 ; test %r8,%r8 - DB 15,133,24,1,0,0 ; jne 22c9 <_sk_load_tables_sse41+0x126> + DB 15,133,24,1,0,0 ; jne 2298 <_sk_load_tables_sse41+0x126> DB 243,69,15,111,4,145 ; movdqu (%r9,%rdx,4),%xmm8 DB 65,87 ; push %r15 DB 65,86 ; push %r14 DB 83 ; push %rbx - DB 102,15,111,5,204,53,0,0 ; movdqa 0x35cc(%rip),%xmm0 # 5790 <_sk_callback_sse41+0x610> + DB 102,15,111,5,205,53,0,0 ; movdqa 0x35cd(%rip),%xmm0 # 5760 <_sk_callback_sse41+0x611> DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9 DB 102,73,15,126,194 ; movq %xmm0,%r10 @@ -14289,7 +14243,7 @@ _sk_load_tables_sse41 LABEL PROC DB 102,66,15,58,33,4,179,32 ; insertps $0x20,(%rbx,%r14,4),%xmm0 DB 102,66,15,58,33,4,11,48 ; insertps $0x30,(%rbx,%r9,1),%xmm0 DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1 - DB 102,15,56,0,13,135,53,0,0 ; pshufb 0x3587(%rip),%xmm1 # 57a0 <_sk_callback_sse41+0x620> + DB 102,15,56,0,13,136,53,0,0 ; pshufb 0x3588(%rip),%xmm1 # 5770 <_sk_callback_sse41+0x621> DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 102,72,15,126,203 ; movq %xmm1,%rbx DB 68,15,182,211 ; movzbl %bl,%r10d @@ -14304,7 +14258,7 @@ _sk_load_tables_sse41 LABEL PROC DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1 DB 76,139,72,24 ; mov 0x18(%rax),%r9 DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2 - DB 102,15,56,0,21,67,53,0,0 ; pshufb 0x3543(%rip),%xmm2 # 57b0 <_sk_callback_sse41+0x630> + DB 102,15,56,0,21,68,53,0,0 ; pshufb 0x3544(%rip),%xmm2 # 5780 <_sk_callback_sse41+0x631> DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx DB 102,72,15,126,208 ; movq %xmm2,%rax DB 68,15,182,208 ; movzbl %al,%r10d @@ -14319,7 +14273,7 @@ _sk_load_tables_sse41 LABEL PROC DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2 DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8 DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3 - DB 15,89,29,0,53,0,0 ; mulps 0x3500(%rip),%xmm3 # 57c0 <_sk_callback_sse41+0x640> + DB 15,89,29,1,53,0,0 ; mulps 0x3501(%rip),%xmm3 # 5790 <_sk_callback_sse41+0x641> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -14328,19 +14282,19 @@ _sk_load_tables_sse41 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,52 ; je 230a <_sk_load_tables_sse41+0x167> + DB 116,52 ; je 22d9 <_sk_load_tables_sse41+0x167> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,23 ; je 22f8 <_sk_load_tables_sse41+0x155> + DB 116,23 ; je 22c7 <_sk_load_tables_sse41+0x155> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 15,133,204,254,255,255 ; jne 21b7 <_sk_load_tables_sse41+0x14> + DB 15,133,204,254,255,255 ; jne 2186 <_sk_load_tables_sse41+0x14> DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0 DB 102,68,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm8 DB 243,65,15,126,4,145 ; movq (%r9,%rdx,4),%xmm0 DB 102,68,15,58,14,192,15 ; pblendw $0xf,%xmm0,%xmm8 - DB 233,173,254,255,255 ; jmpq 21b7 <_sk_load_tables_sse41+0x14> + DB 233,173,254,255,255 ; jmpq 2186 <_sk_load_tables_sse41+0x14> DB 102,69,15,110,4,145 ; movd (%r9,%rdx,4),%xmm8 - DB 233,162,254,255,255 ; jmpq 21b7 <_sk_load_tables_sse41+0x14> + DB 233,162,254,255,255 ; jmpq 2186 <_sk_load_tables_sse41+0x14> PUBLIC _sk_load_tables_u16_be_sse41 _sk_load_tables_u16_be_sse41 LABEL PROC @@ -14348,7 +14302,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,99,1,0,0 ; jne 248e <_sk_load_tables_u16_be_sse41+0x179> + DB 15,133,99,1,0,0 ; jne 245d <_sk_load_tables_u16_be_sse41+0x179> DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0 DB 243,67,15,111,76,81,16 ; movdqu 0x10(%r9,%r10,2),%xmm1 DB 65,87 ; push %r15 @@ -14360,7 +14314,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9 - DB 102,68,15,111,5,110,52,0,0 ; movdqa 0x346e(%rip),%xmm8 # 57d0 <_sk_callback_sse41+0x650> + DB 102,68,15,111,5,111,52,0,0 ; movdqa 0x346f(%rip),%xmm8 # 57a0 <_sk_callback_sse41+0x651> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 @@ -14378,7 +14332,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0 DB 243,66,15,16,20,11 ; movss (%rbx,%r9,1),%xmm2 DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0 - DB 102,15,56,0,13,29,52,0,0 ; pshufb 0x341d(%rip),%xmm1 # 57e0 <_sk_callback_sse41+0x660> + DB 102,15,56,0,13,30,52,0,0 ; pshufb 0x341e(%rip),%xmm1 # 57b0 <_sk_callback_sse41+0x661> DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1 DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 102,72,15,126,203 ; movq %xmm1,%rbx @@ -14414,7 +14368,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 102,65,15,235,216 ; por %xmm8,%xmm3 DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,107,51,0,0 ; mulps 0x336b(%rip),%xmm3 # 57f0 <_sk_callback_sse41+0x670> + DB 15,89,29,108,51,0,0 ; mulps 0x336c(%rip),%xmm3 # 57c0 <_sk_callback_sse41+0x671> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -14422,16 +14376,16 @@ _sk_load_tables_u16_be_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 24a7 <_sk_load_tables_u16_be_sse41+0x192> + DB 117,13 ; jne 2476 <_sk_load_tables_u16_be_sse41+0x192> DB 243,15,126,192 ; movq %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,145,254,255,255 ; jmpq 2338 <_sk_load_tables_u16_be_sse41+0x23> + DB 233,145,254,255,255 ; jmpq 2307 <_sk_load_tables_u16_be_sse41+0x23> DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,124,254,255,255 ; jb 2338 <_sk_load_tables_u16_be_sse41+0x23> + DB 15,130,124,254,255,255 ; jb 2307 <_sk_load_tables_u16_be_sse41+0x23> DB 243,67,15,126,76,81,16 ; movq 0x10(%r9,%r10,2),%xmm1 - DB 233,112,254,255,255 ; jmpq 2338 <_sk_load_tables_u16_be_sse41+0x23> + DB 233,112,254,255,255 ; jmpq 2307 <_sk_load_tables_u16_be_sse41+0x23> PUBLIC _sk_load_tables_rgb_u16_be_sse41 _sk_load_tables_rgb_u16_be_sse41 LABEL PROC @@ -14439,7 +14393,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,83,1,0,0 ; jne 262d <_sk_load_tables_rgb_u16_be_sse41+0x165> + DB 15,133,83,1,0,0 ; jne 25fc <_sk_load_tables_rgb_u16_be_sse41+0x165> DB 243,67,15,111,20,81 ; movdqu (%r9,%r10,2),%xmm2 DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1 DB 102,15,115,217,4 ; psrldq $0x4,%xmm1 @@ -14454,7 +14408,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 DB 102,15,111,202 ; movdqa %xmm2,%xmm1 DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1 - DB 102,68,15,111,5,224,50,0,0 ; movdqa 0x32e0(%rip),%xmm8 # 5800 <_sk_callback_sse41+0x680> + DB 102,68,15,111,5,225,50,0,0 ; movdqa 0x32e1(%rip),%xmm8 # 57d0 <_sk_callback_sse41+0x681> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 @@ -14472,7 +14426,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0 DB 243,66,15,16,28,11 ; movss (%rbx,%r9,1),%xmm3 DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0 - DB 102,15,56,0,13,143,50,0,0 ; pshufb 0x328f(%rip),%xmm1 # 5810 <_sk_callback_sse41+0x690> + DB 102,15,56,0,13,144,50,0,0 ; pshufb 0x3290(%rip),%xmm1 # 57e0 <_sk_callback_sse41+0x691> DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1 DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 102,72,15,126,203 ; movq %xmm1,%rbx @@ -14503,7 +14457,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 243,65,15,16,28,25 ; movss (%r9,%rbx,1),%xmm3 DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,250,49,0,0 ; movaps 0x31fa(%rip),%xmm3 # 5820 <_sk_callback_sse41+0x6a0> + DB 15,40,29,251,49,0,0 ; movaps 0x31fb(%rip),%xmm3 # 57f0 <_sk_callback_sse41+0x6a1> DB 91 ; pop %rbx DB 65,94 ; pop %r14 DB 65,95 ; pop %r15 @@ -14512,21 +14466,21 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC DB 102,67,15,196,84,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm2 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,14 ; jne 2653 <_sk_load_tables_rgb_u16_be_sse41+0x18b> + DB 117,14 ; jne 2622 <_sk_load_tables_rgb_u16_be_sse41+0x18b> DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 - DB 233,173,254,255,255 ; jmpq 2500 <_sk_load_tables_rgb_u16_be_sse41+0x38> + DB 233,173,254,255,255 ; jmpq 24cf <_sk_load_tables_rgb_u16_be_sse41+0x38> DB 102,71,15,110,76,81,6 ; movd 0x6(%r9,%r10,2),%xmm9 DB 102,71,15,196,76,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm9 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,24 ; jb 2684 <_sk_load_tables_rgb_u16_be_sse41+0x1bc> + DB 114,24 ; jb 2653 <_sk_load_tables_rgb_u16_be_sse41+0x1bc> DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1 DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,124,254,255,255 ; jmpq 2500 <_sk_load_tables_rgb_u16_be_sse41+0x38> + DB 233,124,254,255,255 ; jmpq 24cf <_sk_load_tables_rgb_u16_be_sse41+0x38> DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,115,254,255,255 ; jmpq 2500 <_sk_load_tables_rgb_u16_be_sse41+0x38> + DB 233,115,254,255,255 ; jmpq 24cf <_sk_load_tables_rgb_u16_be_sse41+0x38> PUBLIC _sk_byte_tables_sse41 _sk_byte_tables_sse41 LABEL PROC @@ -14535,7 +14489,7 @@ _sk_byte_tables_sse41 LABEL PROC DB 65,84 ; push %r12 DB 83 ; push %rbx DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,146,49,0,0 ; movaps 0x3192(%rip),%xmm8 # 5830 <_sk_callback_sse41+0x6b0> + DB 68,15,40,5,147,49,0,0 ; movaps 0x3193(%rip),%xmm8 # 5800 <_sk_callback_sse41+0x6b1> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9 @@ -14554,7 +14508,7 @@ _sk_byte_tables_sse41 LABEL PROC DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,13,67,49,0,0 ; movaps 0x3143(%rip),%xmm9 # 5840 <_sk_callback_sse41+0x6c0> + DB 68,15,40,13,68,49,0,0 ; movaps 0x3144(%rip),%xmm9 # 5810 <_sk_callback_sse41+0x6c1> DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -14648,7 +14602,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,13,187,47,0,0 ; movaps 0x2fbb(%rip),%xmm9 # 5850 <_sk_callback_sse41+0x6d0> + DB 68,15,40,13,188,47,0,0 ; movaps 0x2fbc(%rip),%xmm9 # 5820 <_sk_callback_sse41+0x6d1> DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -14825,31 +14779,31 @@ _sk_parametric_r_sse41 LABEL PROC DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8 - DB 68,15,89,5,3,45,0,0 ; mulps 0x2d03(%rip),%xmm8 # 5860 <_sk_callback_sse41+0x6e0> - DB 68,15,84,21,11,45,0,0 ; andps 0x2d0b(%rip),%xmm10 # 5870 <_sk_callback_sse41+0x6f0> - DB 68,15,86,21,19,45,0,0 ; orps 0x2d13(%rip),%xmm10 # 5880 <_sk_callback_sse41+0x700> - DB 68,15,88,5,27,45,0,0 ; addps 0x2d1b(%rip),%xmm8 # 5890 <_sk_callback_sse41+0x710> - DB 68,15,40,37,35,45,0,0 ; movaps 0x2d23(%rip),%xmm12 # 58a0 <_sk_callback_sse41+0x720> + DB 68,15,89,5,4,45,0,0 ; mulps 0x2d04(%rip),%xmm8 # 5830 <_sk_callback_sse41+0x6e1> + DB 68,15,84,21,12,45,0,0 ; andps 0x2d0c(%rip),%xmm10 # 5840 <_sk_callback_sse41+0x6f1> + DB 68,15,86,21,20,45,0,0 ; orps 0x2d14(%rip),%xmm10 # 5850 <_sk_callback_sse41+0x701> + DB 68,15,88,5,28,45,0,0 ; addps 0x2d1c(%rip),%xmm8 # 5860 <_sk_callback_sse41+0x711> + DB 68,15,40,37,36,45,0,0 ; movaps 0x2d24(%rip),%xmm12 # 5870 <_sk_callback_sse41+0x721> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,196 ; subps %xmm12,%xmm8 - DB 68,15,88,21,35,45,0,0 ; addps 0x2d23(%rip),%xmm10 # 58b0 <_sk_callback_sse41+0x730> - DB 68,15,40,37,43,45,0,0 ; movaps 0x2d2b(%rip),%xmm12 # 58c0 <_sk_callback_sse41+0x740> + DB 68,15,88,21,36,45,0,0 ; addps 0x2d24(%rip),%xmm10 # 5880 <_sk_callback_sse41+0x731> + DB 68,15,40,37,44,45,0,0 ; movaps 0x2d2c(%rip),%xmm12 # 5890 <_sk_callback_sse41+0x741> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,196 ; subps %xmm12,%xmm8 DB 69,15,89,195 ; mulps %xmm11,%xmm8 DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10 DB 69,15,40,216 ; movaps %xmm8,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,5,24,45,0,0 ; addps 0x2d18(%rip),%xmm8 # 58d0 <_sk_callback_sse41+0x750> - DB 68,15,40,21,32,45,0,0 ; movaps 0x2d20(%rip),%xmm10 # 58e0 <_sk_callback_sse41+0x760> + DB 68,15,88,5,25,45,0,0 ; addps 0x2d19(%rip),%xmm8 # 58a0 <_sk_callback_sse41+0x751> + DB 68,15,40,21,33,45,0,0 ; movaps 0x2d21(%rip),%xmm10 # 58b0 <_sk_callback_sse41+0x761> DB 69,15,89,211 ; mulps %xmm11,%xmm10 DB 69,15,92,194 ; subps %xmm10,%xmm8 - DB 68,15,40,21,32,45,0,0 ; movaps 0x2d20(%rip),%xmm10 # 58f0 <_sk_callback_sse41+0x770> + DB 68,15,40,21,33,45,0,0 ; movaps 0x2d21(%rip),%xmm10 # 58c0 <_sk_callback_sse41+0x771> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 68,15,40,29,36,45,0,0 ; movaps 0x2d24(%rip),%xmm11 # 5900 <_sk_callback_sse41+0x780> + DB 68,15,40,29,37,45,0,0 ; movaps 0x2d25(%rip),%xmm11 # 58d0 <_sk_callback_sse41+0x781> DB 69,15,94,218 ; divps %xmm10,%xmm11 DB 69,15,88,216 ; addps %xmm8,%xmm11 - DB 68,15,89,29,36,45,0,0 ; mulps 0x2d24(%rip),%xmm11 # 5910 <_sk_callback_sse41+0x790> + DB 68,15,89,29,37,45,0,0 ; mulps 0x2d25(%rip),%xmm11 # 58e0 <_sk_callback_sse41+0x791> DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10 DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 @@ -14857,7 +14811,7 @@ _sk_parametric_r_sse41 LABEL PROC DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 68,15,95,192 ; maxps %xmm0,%xmm8 - DB 68,15,93,5,11,45,0,0 ; minps 0x2d0b(%rip),%xmm8 # 5920 <_sk_callback_sse41+0x7a0> + DB 68,15,93,5,12,45,0,0 ; minps 0x2d0c(%rip),%xmm8 # 58f0 <_sk_callback_sse41+0x7a1> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -14885,31 +14839,31 @@ _sk_parametric_g_sse41 LABEL PROC DB 68,15,88,217 ; addps %xmm1,%xmm11 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12 - DB 68,15,89,37,172,44,0,0 ; mulps 0x2cac(%rip),%xmm12 # 5930 <_sk_callback_sse41+0x7b0> - DB 68,15,84,29,180,44,0,0 ; andps 0x2cb4(%rip),%xmm11 # 5940 <_sk_callback_sse41+0x7c0> - DB 68,15,86,29,188,44,0,0 ; orps 0x2cbc(%rip),%xmm11 # 5950 <_sk_callback_sse41+0x7d0> - DB 68,15,88,37,196,44,0,0 ; addps 0x2cc4(%rip),%xmm12 # 5960 <_sk_callback_sse41+0x7e0> - DB 15,40,13,205,44,0,0 ; movaps 0x2ccd(%rip),%xmm1 # 5970 <_sk_callback_sse41+0x7f0> + DB 68,15,89,37,173,44,0,0 ; mulps 0x2cad(%rip),%xmm12 # 5900 <_sk_callback_sse41+0x7b1> + DB 68,15,84,29,181,44,0,0 ; andps 0x2cb5(%rip),%xmm11 # 5910 <_sk_callback_sse41+0x7c1> + DB 68,15,86,29,189,44,0,0 ; orps 0x2cbd(%rip),%xmm11 # 5920 <_sk_callback_sse41+0x7d1> + DB 68,15,88,37,197,44,0,0 ; addps 0x2cc5(%rip),%xmm12 # 5930 <_sk_callback_sse41+0x7e1> + DB 15,40,13,206,44,0,0 ; movaps 0x2cce(%rip),%xmm1 # 5940 <_sk_callback_sse41+0x7f1> DB 65,15,89,203 ; mulps %xmm11,%xmm1 DB 68,15,92,225 ; subps %xmm1,%xmm12 - DB 68,15,88,29,205,44,0,0 ; addps 0x2ccd(%rip),%xmm11 # 5980 <_sk_callback_sse41+0x800> - DB 15,40,13,214,44,0,0 ; movaps 0x2cd6(%rip),%xmm1 # 5990 <_sk_callback_sse41+0x810> + DB 68,15,88,29,206,44,0,0 ; addps 0x2cce(%rip),%xmm11 # 5950 <_sk_callback_sse41+0x801> + DB 15,40,13,215,44,0,0 ; movaps 0x2cd7(%rip),%xmm1 # 5960 <_sk_callback_sse41+0x811> DB 65,15,94,203 ; divps %xmm11,%xmm1 DB 68,15,92,225 ; subps %xmm1,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10 DB 69,15,40,220 ; movaps %xmm12,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,37,195,44,0,0 ; addps 0x2cc3(%rip),%xmm12 # 59a0 <_sk_callback_sse41+0x820> - DB 15,40,13,204,44,0,0 ; movaps 0x2ccc(%rip),%xmm1 # 59b0 <_sk_callback_sse41+0x830> + DB 68,15,88,37,196,44,0,0 ; addps 0x2cc4(%rip),%xmm12 # 5970 <_sk_callback_sse41+0x821> + DB 15,40,13,205,44,0,0 ; movaps 0x2ccd(%rip),%xmm1 # 5980 <_sk_callback_sse41+0x831> DB 65,15,89,203 ; mulps %xmm11,%xmm1 DB 68,15,92,225 ; subps %xmm1,%xmm12 - DB 68,15,40,21,204,44,0,0 ; movaps 0x2ccc(%rip),%xmm10 # 59c0 <_sk_callback_sse41+0x840> + DB 68,15,40,21,205,44,0,0 ; movaps 0x2ccd(%rip),%xmm10 # 5990 <_sk_callback_sse41+0x841> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 15,40,13,209,44,0,0 ; movaps 0x2cd1(%rip),%xmm1 # 59d0 <_sk_callback_sse41+0x850> + DB 15,40,13,210,44,0,0 ; movaps 0x2cd2(%rip),%xmm1 # 59a0 <_sk_callback_sse41+0x851> DB 65,15,94,202 ; divps %xmm10,%xmm1 DB 65,15,88,204 ; addps %xmm12,%xmm1 - DB 15,89,13,210,44,0,0 ; mulps 0x2cd2(%rip),%xmm1 # 59e0 <_sk_callback_sse41+0x860> + DB 15,89,13,211,44,0,0 ; mulps 0x2cd3(%rip),%xmm1 # 59b0 <_sk_callback_sse41+0x861> DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10 DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1 DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1 @@ -14917,7 +14871,7 @@ _sk_parametric_g_sse41 LABEL PROC DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,95,200 ; maxps %xmm0,%xmm1 - DB 15,93,13,189,44,0,0 ; minps 0x2cbd(%rip),%xmm1 # 59f0 <_sk_callback_sse41+0x870> + DB 15,93,13,190,44,0,0 ; minps 0x2cbe(%rip),%xmm1 # 59c0 <_sk_callback_sse41+0x871> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -14945,31 +14899,31 @@ _sk_parametric_b_sse41 LABEL PROC DB 68,15,88,218 ; addps %xmm2,%xmm11 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12 - DB 68,15,89,37,94,44,0,0 ; mulps 0x2c5e(%rip),%xmm12 # 5a00 <_sk_callback_sse41+0x880> - DB 68,15,84,29,102,44,0,0 ; andps 0x2c66(%rip),%xmm11 # 5a10 <_sk_callback_sse41+0x890> - DB 68,15,86,29,110,44,0,0 ; orps 0x2c6e(%rip),%xmm11 # 5a20 <_sk_callback_sse41+0x8a0> - DB 68,15,88,37,118,44,0,0 ; addps 0x2c76(%rip),%xmm12 # 5a30 <_sk_callback_sse41+0x8b0> - DB 15,40,21,127,44,0,0 ; movaps 0x2c7f(%rip),%xmm2 # 5a40 <_sk_callback_sse41+0x8c0> + DB 68,15,89,37,95,44,0,0 ; mulps 0x2c5f(%rip),%xmm12 # 59d0 <_sk_callback_sse41+0x881> + DB 68,15,84,29,103,44,0,0 ; andps 0x2c67(%rip),%xmm11 # 59e0 <_sk_callback_sse41+0x891> + DB 68,15,86,29,111,44,0,0 ; orps 0x2c6f(%rip),%xmm11 # 59f0 <_sk_callback_sse41+0x8a1> + DB 68,15,88,37,119,44,0,0 ; addps 0x2c77(%rip),%xmm12 # 5a00 <_sk_callback_sse41+0x8b1> + DB 15,40,21,128,44,0,0 ; movaps 0x2c80(%rip),%xmm2 # 5a10 <_sk_callback_sse41+0x8c1> DB 65,15,89,211 ; mulps %xmm11,%xmm2 DB 68,15,92,226 ; subps %xmm2,%xmm12 - DB 68,15,88,29,127,44,0,0 ; addps 0x2c7f(%rip),%xmm11 # 5a50 <_sk_callback_sse41+0x8d0> - DB 15,40,21,136,44,0,0 ; movaps 0x2c88(%rip),%xmm2 # 5a60 <_sk_callback_sse41+0x8e0> + DB 68,15,88,29,128,44,0,0 ; addps 0x2c80(%rip),%xmm11 # 5a20 <_sk_callback_sse41+0x8d1> + DB 15,40,21,137,44,0,0 ; movaps 0x2c89(%rip),%xmm2 # 5a30 <_sk_callback_sse41+0x8e1> DB 65,15,94,211 ; divps %xmm11,%xmm2 DB 68,15,92,226 ; subps %xmm2,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10 DB 69,15,40,220 ; movaps %xmm12,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,37,117,44,0,0 ; addps 0x2c75(%rip),%xmm12 # 5a70 <_sk_callback_sse41+0x8f0> - DB 15,40,21,126,44,0,0 ; movaps 0x2c7e(%rip),%xmm2 # 5a80 <_sk_callback_sse41+0x900> + DB 68,15,88,37,118,44,0,0 ; addps 0x2c76(%rip),%xmm12 # 5a40 <_sk_callback_sse41+0x8f1> + DB 15,40,21,127,44,0,0 ; movaps 0x2c7f(%rip),%xmm2 # 5a50 <_sk_callback_sse41+0x901> DB 65,15,89,211 ; mulps %xmm11,%xmm2 DB 68,15,92,226 ; subps %xmm2,%xmm12 - DB 68,15,40,21,126,44,0,0 ; movaps 0x2c7e(%rip),%xmm10 # 5a90 <_sk_callback_sse41+0x910> + DB 68,15,40,21,127,44,0,0 ; movaps 0x2c7f(%rip),%xmm10 # 5a60 <_sk_callback_sse41+0x911> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 15,40,21,131,44,0,0 ; movaps 0x2c83(%rip),%xmm2 # 5aa0 <_sk_callback_sse41+0x920> + DB 15,40,21,132,44,0,0 ; movaps 0x2c84(%rip),%xmm2 # 5a70 <_sk_callback_sse41+0x921> DB 65,15,94,210 ; divps %xmm10,%xmm2 DB 65,15,88,212 ; addps %xmm12,%xmm2 - DB 15,89,21,132,44,0,0 ; mulps 0x2c84(%rip),%xmm2 # 5ab0 <_sk_callback_sse41+0x930> + DB 15,89,21,133,44,0,0 ; mulps 0x2c85(%rip),%xmm2 # 5a80 <_sk_callback_sse41+0x931> DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10 DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2 DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2 @@ -14977,7 +14931,7 @@ _sk_parametric_b_sse41 LABEL PROC DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,95,208 ; maxps %xmm0,%xmm2 - DB 15,93,21,111,44,0,0 ; minps 0x2c6f(%rip),%xmm2 # 5ac0 <_sk_callback_sse41+0x940> + DB 15,93,21,112,44,0,0 ; minps 0x2c70(%rip),%xmm2 # 5a90 <_sk_callback_sse41+0x941> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -15005,31 +14959,31 @@ _sk_parametric_a_sse41 LABEL PROC DB 68,15,88,219 ; addps %xmm3,%xmm11 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12 - DB 68,15,89,37,16,44,0,0 ; mulps 0x2c10(%rip),%xmm12 # 5ad0 <_sk_callback_sse41+0x950> - DB 68,15,84,29,24,44,0,0 ; andps 0x2c18(%rip),%xmm11 # 5ae0 <_sk_callback_sse41+0x960> - DB 68,15,86,29,32,44,0,0 ; orps 0x2c20(%rip),%xmm11 # 5af0 <_sk_callback_sse41+0x970> - DB 68,15,88,37,40,44,0,0 ; addps 0x2c28(%rip),%xmm12 # 5b00 <_sk_callback_sse41+0x980> - DB 15,40,29,49,44,0,0 ; movaps 0x2c31(%rip),%xmm3 # 5b10 <_sk_callback_sse41+0x990> + DB 68,15,89,37,17,44,0,0 ; mulps 0x2c11(%rip),%xmm12 # 5aa0 <_sk_callback_sse41+0x951> + DB 68,15,84,29,25,44,0,0 ; andps 0x2c19(%rip),%xmm11 # 5ab0 <_sk_callback_sse41+0x961> + DB 68,15,86,29,33,44,0,0 ; orps 0x2c21(%rip),%xmm11 # 5ac0 <_sk_callback_sse41+0x971> + DB 68,15,88,37,41,44,0,0 ; addps 0x2c29(%rip),%xmm12 # 5ad0 <_sk_callback_sse41+0x981> + DB 15,40,29,50,44,0,0 ; movaps 0x2c32(%rip),%xmm3 # 5ae0 <_sk_callback_sse41+0x991> DB 65,15,89,219 ; mulps %xmm11,%xmm3 DB 68,15,92,227 ; subps %xmm3,%xmm12 - DB 68,15,88,29,49,44,0,0 ; addps 0x2c31(%rip),%xmm11 # 5b20 <_sk_callback_sse41+0x9a0> - DB 15,40,29,58,44,0,0 ; movaps 0x2c3a(%rip),%xmm3 # 5b30 <_sk_callback_sse41+0x9b0> + DB 68,15,88,29,50,44,0,0 ; addps 0x2c32(%rip),%xmm11 # 5af0 <_sk_callback_sse41+0x9a1> + DB 15,40,29,59,44,0,0 ; movaps 0x2c3b(%rip),%xmm3 # 5b00 <_sk_callback_sse41+0x9b1> DB 65,15,94,219 ; divps %xmm11,%xmm3 DB 68,15,92,227 ; subps %xmm3,%xmm12 DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10 DB 69,15,40,220 ; movaps %xmm12,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 68,15,88,37,39,44,0,0 ; addps 0x2c27(%rip),%xmm12 # 5b40 <_sk_callback_sse41+0x9c0> - DB 15,40,29,48,44,0,0 ; movaps 0x2c30(%rip),%xmm3 # 5b50 <_sk_callback_sse41+0x9d0> + DB 68,15,88,37,40,44,0,0 ; addps 0x2c28(%rip),%xmm12 # 5b10 <_sk_callback_sse41+0x9c1> + DB 15,40,29,49,44,0,0 ; movaps 0x2c31(%rip),%xmm3 # 5b20 <_sk_callback_sse41+0x9d1> DB 65,15,89,219 ; mulps %xmm11,%xmm3 DB 68,15,92,227 ; subps %xmm3,%xmm12 - DB 68,15,40,21,48,44,0,0 ; movaps 0x2c30(%rip),%xmm10 # 5b60 <_sk_callback_sse41+0x9e0> + DB 68,15,40,21,49,44,0,0 ; movaps 0x2c31(%rip),%xmm10 # 5b30 <_sk_callback_sse41+0x9e1> DB 69,15,92,211 ; subps %xmm11,%xmm10 - DB 15,40,29,53,44,0,0 ; movaps 0x2c35(%rip),%xmm3 # 5b70 <_sk_callback_sse41+0x9f0> + DB 15,40,29,54,44,0,0 ; movaps 0x2c36(%rip),%xmm3 # 5b40 <_sk_callback_sse41+0x9f1> DB 65,15,94,218 ; divps %xmm10,%xmm3 DB 65,15,88,220 ; addps %xmm12,%xmm3 - DB 15,89,29,54,44,0,0 ; mulps 0x2c36(%rip),%xmm3 # 5b80 <_sk_callback_sse41+0xa00> + DB 15,89,29,55,44,0,0 ; mulps 0x2c37(%rip),%xmm3 # 5b50 <_sk_callback_sse41+0xa01> DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10 DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 @@ -15037,7 +14991,7 @@ _sk_parametric_a_sse41 LABEL PROC DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3 DB 15,87,192 ; xorps %xmm0,%xmm0 DB 15,95,216 ; maxps %xmm0,%xmm3 - DB 15,93,29,33,44,0,0 ; minps 0x2c21(%rip),%xmm3 # 5b90 <_sk_callback_sse41+0xa10> + DB 15,93,29,34,44,0,0 ; minps 0x2c22(%rip),%xmm3 # 5b60 <_sk_callback_sse41+0xa11> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -15045,29 +14999,29 @@ _sk_parametric_a_sse41 LABEL PROC PUBLIC _sk_lab_to_xyz_sse41 _sk_lab_to_xyz_sse41 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,89,5,29,44,0,0 ; mulps 0x2c1d(%rip),%xmm8 # 5ba0 <_sk_callback_sse41+0xa20> - DB 68,15,40,13,37,44,0,0 ; movaps 0x2c25(%rip),%xmm9 # 5bb0 <_sk_callback_sse41+0xa30> + DB 68,15,89,5,30,44,0,0 ; mulps 0x2c1e(%rip),%xmm8 # 5b70 <_sk_callback_sse41+0xa21> + DB 68,15,40,13,38,44,0,0 ; movaps 0x2c26(%rip),%xmm9 # 5b80 <_sk_callback_sse41+0xa31> DB 65,15,89,201 ; mulps %xmm9,%xmm1 - DB 15,40,5,42,44,0,0 ; movaps 0x2c2a(%rip),%xmm0 # 5bc0 <_sk_callback_sse41+0xa40> + DB 15,40,5,43,44,0,0 ; movaps 0x2c2b(%rip),%xmm0 # 5b90 <_sk_callback_sse41+0xa41> DB 15,88,200 ; addps %xmm0,%xmm1 DB 65,15,89,209 ; mulps %xmm9,%xmm2 DB 15,88,208 ; addps %xmm0,%xmm2 - DB 68,15,88,5,40,44,0,0 ; addps 0x2c28(%rip),%xmm8 # 5bd0 <_sk_callback_sse41+0xa50> - DB 68,15,89,5,48,44,0,0 ; mulps 0x2c30(%rip),%xmm8 # 5be0 <_sk_callback_sse41+0xa60> - DB 15,89,13,57,44,0,0 ; mulps 0x2c39(%rip),%xmm1 # 5bf0 <_sk_callback_sse41+0xa70> + DB 68,15,88,5,41,44,0,0 ; addps 0x2c29(%rip),%xmm8 # 5ba0 <_sk_callback_sse41+0xa51> + DB 68,15,89,5,49,44,0,0 ; mulps 0x2c31(%rip),%xmm8 # 5bb0 <_sk_callback_sse41+0xa61> + DB 15,89,13,58,44,0,0 ; mulps 0x2c3a(%rip),%xmm1 # 5bc0 <_sk_callback_sse41+0xa71> DB 65,15,88,200 ; addps %xmm8,%xmm1 - DB 15,89,21,62,44,0,0 ; mulps 0x2c3e(%rip),%xmm2 # 5c00 <_sk_callback_sse41+0xa80> + DB 15,89,21,63,44,0,0 ; mulps 0x2c3f(%rip),%xmm2 # 5bd0 <_sk_callback_sse41+0xa81> DB 69,15,40,208 ; movaps %xmm8,%xmm10 DB 68,15,92,210 ; subps %xmm2,%xmm10 DB 68,15,40,217 ; movaps %xmm1,%xmm11 DB 69,15,89,219 ; mulps %xmm11,%xmm11 DB 68,15,89,217 ; mulps %xmm1,%xmm11 - DB 68,15,40,13,50,44,0,0 ; movaps 0x2c32(%rip),%xmm9 # 5c10 <_sk_callback_sse41+0xa90> + DB 68,15,40,13,51,44,0,0 ; movaps 0x2c33(%rip),%xmm9 # 5be0 <_sk_callback_sse41+0xa91> DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0 - DB 15,40,21,50,44,0,0 ; movaps 0x2c32(%rip),%xmm2 # 5c20 <_sk_callback_sse41+0xaa0> + DB 15,40,21,51,44,0,0 ; movaps 0x2c33(%rip),%xmm2 # 5bf0 <_sk_callback_sse41+0xaa1> DB 15,88,202 ; addps %xmm2,%xmm1 - DB 68,15,40,37,55,44,0,0 ; movaps 0x2c37(%rip),%xmm12 # 5c30 <_sk_callback_sse41+0xab0> + DB 68,15,40,37,56,44,0,0 ; movaps 0x2c38(%rip),%xmm12 # 5c00 <_sk_callback_sse41+0xab1> DB 65,15,89,204 ; mulps %xmm12,%xmm1 DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1 DB 69,15,40,216 ; movaps %xmm8,%xmm11 @@ -15086,8 +15040,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC DB 65,15,89,212 ; mulps %xmm12,%xmm2 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2 - DB 15,89,13,240,43,0,0 ; mulps 0x2bf0(%rip),%xmm1 # 5c40 <_sk_callback_sse41+0xac0> - DB 15,89,21,249,43,0,0 ; mulps 0x2bf9(%rip),%xmm2 # 5c50 <_sk_callback_sse41+0xad0> + DB 15,89,13,241,43,0,0 ; mulps 0x2bf1(%rip),%xmm1 # 5c10 <_sk_callback_sse41+0xac1> + DB 15,89,21,250,43,0,0 ; mulps 0x2bfa(%rip),%xmm2 # 5c20 <_sk_callback_sse41+0xad1> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,40,193 ; movaps %xmm1,%xmm0 DB 65,15,40,200 ; movaps %xmm8,%xmm1 @@ -15098,11 +15052,11 @@ _sk_load_a8_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,39 ; jne 3093 <_sk_load_a8_sse41+0x31> + DB 117,39 ; jne 3062 <_sk_load_a8_sse41+0x31> DB 102,65,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm0 - DB 102,15,219,5,229,43,0,0 ; pand 0x2be5(%rip),%xmm0 # 5c60 <_sk_callback_sse41+0xae0> + DB 102,15,219,5,230,43,0,0 ; pand 0x2be6(%rip),%xmm0 # 5c30 <_sk_callback_sse41+0xae1> DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,235,43,0,0 ; mulps 0x2beb(%rip),%xmm3 # 5c70 <_sk_callback_sse41+0xaf0> + DB 15,89,29,236,43,0,0 ; mulps 0x2bec(%rip),%xmm3 # 5c40 <_sk_callback_sse41+0xaf1> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 @@ -15111,12 +15065,12 @@ _sk_load_a8_sse41 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,53 ; je 30d5 <_sk_load_a8_sse41+0x73> + DB 116,53 ; je 30a4 <_sk_load_a8_sse41+0x73> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,21 ; je 30bf <_sk_load_a8_sse41+0x5d> + DB 116,21 ; je 308e <_sk_load_a8_sse41+0x5d> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,195 ; jne 3073 <_sk_load_a8_sse41+0x11> + DB 117,195 ; jne 3042 <_sk_load_a8_sse41+0x11> DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -15124,10 +15078,10 @@ _sk_load_a8_sse41 LABEL PROC DB 102,15,110,200 ; movd %eax,%xmm1 DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1 DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0 - DB 235,158 ; jmp 3073 <_sk_load_a8_sse41+0x11> + DB 235,158 ; jmp 3042 <_sk_load_a8_sse41+0x11> DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,147 ; jmp 3073 <_sk_load_a8_sse41+0x11> + DB 235,147 ; jmp 3042 <_sk_load_a8_sse41+0x11> PUBLIC _sk_gather_a8_sse41 _sk_gather_a8_sse41 LABEL PROC @@ -15154,7 +15108,7 @@ _sk_gather_a8_sse41 LABEL PROC DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,48,43,0,0 ; mulps 0x2b30(%rip),%xmm3 # 5c80 <_sk_callback_sse41+0xb00> + DB 15,89,29,49,43,0,0 ; mulps 0x2b31(%rip),%xmm3 # 5c50 <_sk_callback_sse41+0xb01> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 @@ -15167,13 +15121,13 @@ _sk_store_a8_sse41 LABEL PROC DB 72,131,236,4 ; sub $0x4,%rsp DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 - DB 68,15,40,5,31,43,0,0 ; movaps 0x2b1f(%rip),%xmm8 # 5c90 <_sk_callback_sse41+0xb10> + DB 68,15,40,5,32,43,0,0 ; movaps 0x2b20(%rip),%xmm8 # 5c60 <_sk_callback_sse41+0xb11> DB 68,15,89,195 ; mulps %xmm3,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8 DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 319b <_sk_store_a8_sse41+0x3b> + DB 117,17 ; jne 316a <_sk_store_a8_sse41+0x3b> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 65,137,4,18 ; mov %eax,(%r10,%rdx,1) DB 72,173 ; lods %ds:(%rsi),%rax @@ -15183,42 +15137,42 @@ _sk_store_a8_sse41 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,41 ; je 31d7 <_sk_store_a8_sse41+0x77> + DB 116,41 ; je 31a6 <_sk_store_a8_sse41+0x77> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,15 ; je 31c3 <_sk_store_a8_sse41+0x63> + DB 116,15 ; je 3192 <_sk_store_a8_sse41+0x63> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,217 ; jne 3193 <_sk_store_a8_sse41+0x33> + DB 117,217 ; jne 3162 <_sk_store_a8_sse41+0x33> DB 102,69,15,58,20,68,18,2,8 ; pextrb $0x8,%xmm8,0x2(%r10,%rdx,1) - DB 102,68,15,56,0,5,211,42,0,0 ; pshufb 0x2ad3(%rip),%xmm8 # 5ca0 <_sk_callback_sse41+0xb20> + DB 102,68,15,56,0,5,212,42,0,0 ; pshufb 0x2ad4(%rip),%xmm8 # 5c70 <_sk_callback_sse41+0xb21> DB 102,69,15,58,21,4,18,0 ; pextrw $0x0,%xmm8,(%r10,%rdx,1) - DB 235,188 ; jmp 3193 <_sk_store_a8_sse41+0x33> + DB 235,188 ; jmp 3162 <_sk_store_a8_sse41+0x33> DB 102,69,15,58,20,4,18,0 ; pextrb $0x0,%xmm8,(%r10,%rdx,1) - DB 235,178 ; jmp 3193 <_sk_store_a8_sse41+0x33> + DB 235,178 ; jmp 3162 <_sk_store_a8_sse41+0x33> PUBLIC _sk_load_g8_sse41 _sk_load_g8_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,42 ; jne 3215 <_sk_load_g8_sse41+0x34> + DB 117,42 ; jne 31e4 <_sk_load_g8_sse41+0x34> DB 102,65,15,56,49,4,18 ; pmovzxbd (%r10,%rdx,1),%xmm0 - DB 102,15,219,5,182,42,0,0 ; pand 0x2ab6(%rip),%xmm0 # 5cb0 <_sk_callback_sse41+0xb30> + DB 102,15,219,5,183,42,0,0 ; pand 0x2ab7(%rip),%xmm0 # 5c80 <_sk_callback_sse41+0xb31> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,188,42,0,0 ; mulps 0x2abc(%rip),%xmm0 # 5cc0 <_sk_callback_sse41+0xb40> + DB 15,89,5,189,42,0,0 ; mulps 0x2abd(%rip),%xmm0 # 5c90 <_sk_callback_sse41+0xb41> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,195,42,0,0 ; movaps 0x2ac3(%rip),%xmm3 # 5cd0 <_sk_callback_sse41+0xb50> + DB 15,40,29,196,42,0,0 ; movaps 0x2ac4(%rip),%xmm3 # 5ca0 <_sk_callback_sse41+0xb51> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,53 ; je 3257 <_sk_load_g8_sse41+0x76> + DB 116,53 ; je 3226 <_sk_load_g8_sse41+0x76> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,21 ; je 3241 <_sk_load_g8_sse41+0x60> + DB 116,21 ; je 3210 <_sk_load_g8_sse41+0x60> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,192 ; jne 31f2 <_sk_load_g8_sse41+0x11> + DB 117,192 ; jne 31c1 <_sk_load_g8_sse41+0x11> DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -15226,10 +15180,10 @@ _sk_load_g8_sse41 LABEL PROC DB 102,15,110,200 ; movd %eax,%xmm1 DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1 DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0 - DB 235,155 ; jmp 31f2 <_sk_load_g8_sse41+0x11> + DB 235,155 ; jmp 31c1 <_sk_load_g8_sse41+0x11> DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,144 ; jmp 31f2 <_sk_load_g8_sse41+0x11> + DB 235,144 ; jmp 31c1 <_sk_load_g8_sse41+0x11> PUBLIC _sk_gather_g8_sse41 _sk_gather_g8_sse41 LABEL PROC @@ -15256,9 +15210,9 @@ _sk_gather_g8_sse41 LABEL PROC DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0 DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,14,42,0,0 ; mulps 0x2a0e(%rip),%xmm0 # 5ce0 <_sk_callback_sse41+0xb60> + DB 15,89,5,15,42,0,0 ; mulps 0x2a0f(%rip),%xmm0 # 5cb0 <_sk_callback_sse41+0xb61> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,21,42,0,0 ; movaps 0x2a15(%rip),%xmm3 # 5cf0 <_sk_callback_sse41+0xb70> + DB 15,40,29,22,42,0,0 ; movaps 0x2a16(%rip),%xmm3 # 5cc0 <_sk_callback_sse41+0xb71> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 91 ; pop %rbx @@ -15269,9 +15223,9 @@ _sk_gather_i8_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,193 ; mov %rax,%r9 DB 77,133,201 ; test %r9,%r9 - DB 116,5 ; je 32f3 <_sk_gather_i8_sse41+0xf> + DB 116,5 ; je 32c2 <_sk_gather_i8_sse41+0xf> DB 76,137,200 ; mov %r9,%rax - DB 235,2 ; jmp 32f5 <_sk_gather_i8_sse41+0x11> + DB 235,2 ; jmp 32c4 <_sk_gather_i8_sse41+0x11> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,86 ; push %r14 DB 83 ; push %rbx @@ -15304,17 +15258,17 @@ _sk_gather_i8_sse41 LABEL PROC DB 102,15,58,34,28,24,1 ; pinsrd $0x1,(%rax,%rbx,1),%xmm3 DB 102,66,15,58,34,28,152,2 ; pinsrd $0x2,(%rax,%r11,4),%xmm3 DB 102,66,15,58,34,28,16,3 ; pinsrd $0x3,(%rax,%r10,1),%xmm3 - DB 102,15,111,5,104,41,0,0 ; movdqa 0x2968(%rip),%xmm0 # 5d00 <_sk_callback_sse41+0xb80> + DB 102,15,111,5,105,41,0,0 ; movdqa 0x2969(%rip),%xmm0 # 5cd0 <_sk_callback_sse41+0xb81> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,105,41,0,0 ; movaps 0x2969(%rip),%xmm8 # 5d10 <_sk_callback_sse41+0xb90> + DB 68,15,40,5,106,41,0,0 ; movaps 0x296a(%rip),%xmm8 # 5ce0 <_sk_callback_sse41+0xb91> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 - DB 102,15,56,0,13,104,41,0,0 ; pshufb 0x2968(%rip),%xmm1 # 5d20 <_sk_callback_sse41+0xba0> + DB 102,15,56,0,13,105,41,0,0 ; pshufb 0x2969(%rip),%xmm1 # 5cf0 <_sk_callback_sse41+0xba1> DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,211 ; movdqa %xmm3,%xmm2 - DB 102,15,56,0,21,100,41,0,0 ; pshufb 0x2964(%rip),%xmm2 # 5d30 <_sk_callback_sse41+0xbb0> + DB 102,15,56,0,21,101,41,0,0 ; pshufb 0x2965(%rip),%xmm2 # 5d00 <_sk_callback_sse41+0xbb1> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -15330,41 +15284,41 @@ _sk_load_565_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,80 ; jne 3440 <_sk_load_565_sse41+0x5a> + DB 117,80 ; jne 340f <_sk_load_565_sse41+0x5a> DB 102,65,15,56,51,20,82 ; pmovzxwd (%r10,%rdx,2),%xmm2 - DB 102,15,111,5,65,41,0,0 ; movdqa 0x2941(%rip),%xmm0 # 5d40 <_sk_callback_sse41+0xbc0> + DB 102,15,111,5,66,41,0,0 ; movdqa 0x2942(%rip),%xmm0 # 5d10 <_sk_callback_sse41+0xbc1> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,67,41,0,0 ; mulps 0x2943(%rip),%xmm0 # 5d50 <_sk_callback_sse41+0xbd0> - DB 102,15,111,13,75,41,0,0 ; movdqa 0x294b(%rip),%xmm1 # 5d60 <_sk_callback_sse41+0xbe0> + DB 15,89,5,68,41,0,0 ; mulps 0x2944(%rip),%xmm0 # 5d20 <_sk_callback_sse41+0xbd1> + DB 102,15,111,13,76,41,0,0 ; movdqa 0x294c(%rip),%xmm1 # 5d30 <_sk_callback_sse41+0xbe1> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,77,41,0,0 ; mulps 0x294d(%rip),%xmm1 # 5d70 <_sk_callback_sse41+0xbf0> - DB 102,15,219,21,85,41,0,0 ; pand 0x2955(%rip),%xmm2 # 5d80 <_sk_callback_sse41+0xc00> + DB 15,89,13,78,41,0,0 ; mulps 0x294e(%rip),%xmm1 # 5d40 <_sk_callback_sse41+0xbf1> + DB 102,15,219,21,86,41,0,0 ; pand 0x2956(%rip),%xmm2 # 5d50 <_sk_callback_sse41+0xc01> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,91,41,0,0 ; mulps 0x295b(%rip),%xmm2 # 5d90 <_sk_callback_sse41+0xc10> + DB 15,89,21,92,41,0,0 ; mulps 0x295c(%rip),%xmm2 # 5d60 <_sk_callback_sse41+0xc11> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,98,41,0,0 ; movaps 0x2962(%rip),%xmm3 # 5da0 <_sk_callback_sse41+0xc20> + DB 15,40,29,99,41,0,0 ; movaps 0x2963(%rip),%xmm3 # 5d70 <_sk_callback_sse41+0xc21> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,53 ; je 3482 <_sk_load_565_sse41+0x9c> + DB 116,53 ; je 3451 <_sk_load_565_sse41+0x9c> DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,21 ; je 346c <_sk_load_565_sse41+0x86> + DB 116,21 ; je 343b <_sk_load_565_sse41+0x86> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,154 ; jne 33f7 <_sk_load_565_sse41+0x11> + DB 117,154 ; jne 33c6 <_sk_load_565_sse41+0x11> DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2 DB 102,65,15,110,4,82 ; movd (%r10,%rdx,2),%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 DB 102,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm2 - DB 233,117,255,255,255 ; jmpq 33f7 <_sk_load_565_sse41+0x11> + DB 233,117,255,255,255 ; jmpq 33c6 <_sk_load_565_sse41+0x11> DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax DB 102,15,110,208 ; movd %eax,%xmm2 - DB 233,103,255,255,255 ; jmpq 33f7 <_sk_load_565_sse41+0x11> + DB 233,103,255,255,255 ; jmpq 33c6 <_sk_load_565_sse41+0x11> PUBLIC _sk_gather_565_sse41 _sk_gather_565_sse41 LABEL PROC @@ -15390,19 +15344,19 @@ _sk_gather_565_sse41 LABEL PROC DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0 DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2 - DB 102,15,111,5,182,40,0,0 ; movdqa 0x28b6(%rip),%xmm0 # 5db0 <_sk_callback_sse41+0xc30> + DB 102,15,111,5,183,40,0,0 ; movdqa 0x28b7(%rip),%xmm0 # 5d80 <_sk_callback_sse41+0xc31> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,184,40,0,0 ; mulps 0x28b8(%rip),%xmm0 # 5dc0 <_sk_callback_sse41+0xc40> - DB 102,15,111,13,192,40,0,0 ; movdqa 0x28c0(%rip),%xmm1 # 5dd0 <_sk_callback_sse41+0xc50> + DB 15,89,5,185,40,0,0 ; mulps 0x28b9(%rip),%xmm0 # 5d90 <_sk_callback_sse41+0xc41> + DB 102,15,111,13,193,40,0,0 ; movdqa 0x28c1(%rip),%xmm1 # 5da0 <_sk_callback_sse41+0xc51> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,194,40,0,0 ; mulps 0x28c2(%rip),%xmm1 # 5de0 <_sk_callback_sse41+0xc60> - DB 102,15,219,21,202,40,0,0 ; pand 0x28ca(%rip),%xmm2 # 5df0 <_sk_callback_sse41+0xc70> + DB 15,89,13,195,40,0,0 ; mulps 0x28c3(%rip),%xmm1 # 5db0 <_sk_callback_sse41+0xc61> + DB 102,15,219,21,203,40,0,0 ; pand 0x28cb(%rip),%xmm2 # 5dc0 <_sk_callback_sse41+0xc71> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,208,40,0,0 ; mulps 0x28d0(%rip),%xmm2 # 5e00 <_sk_callback_sse41+0xc80> + DB 15,89,21,209,40,0,0 ; mulps 0x28d1(%rip),%xmm2 # 5dd0 <_sk_callback_sse41+0xc81> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,215,40,0,0 ; movaps 0x28d7(%rip),%xmm3 # 5e10 <_sk_callback_sse41+0xc90> + DB 15,40,29,216,40,0,0 ; movaps 0x28d8(%rip),%xmm3 # 5de0 <_sk_callback_sse41+0xc91> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -15410,12 +15364,12 @@ PUBLIC _sk_store_565_sse41 _sk_store_565_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,215,40,0,0 ; movaps 0x28d7(%rip),%xmm8 # 5e20 <_sk_callback_sse41+0xca0> + DB 68,15,40,5,216,40,0,0 ; movaps 0x28d8(%rip),%xmm8 # 5df0 <_sk_callback_sse41+0xca1> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9 - DB 68,15,40,21,204,40,0,0 ; movaps 0x28cc(%rip),%xmm10 # 5e30 <_sk_callback_sse41+0xcb0> + DB 68,15,40,21,205,40,0,0 ; movaps 0x28cd(%rip),%xmm10 # 5e00 <_sk_callback_sse41+0xcb1> DB 68,15,89,209 ; mulps %xmm1,%xmm10 DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10 DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10 @@ -15425,7 +15379,7 @@ _sk_store_565_sse41 LABEL PROC DB 102,69,15,86,194 ; orpd %xmm10,%xmm8 DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 359b <_sk_store_565_sse41+0x5f> + DB 117,10 ; jne 356a <_sk_store_565_sse41+0x5f> DB 242,68,15,17,4,80 ; movsd %xmm8,(%rax,%rdx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -15433,61 +15387,61 @@ _sk_store_565_sse41 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,35 ; je 35d1 <_sk_store_565_sse41+0x95> + DB 116,35 ; je 35a0 <_sk_store_565_sse41+0x95> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,15 ; je 35c3 <_sk_store_565_sse41+0x87> + DB 116,15 ; je 3592 <_sk_store_565_sse41+0x87> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,221 ; jne 3597 <_sk_store_565_sse41+0x5b> + DB 117,221 ; jne 3566 <_sk_store_565_sse41+0x5b> DB 102,68,15,58,21,68,80,4,4 ; pextrw $0x4,%xmm8,0x4(%rax,%rdx,2) DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8 DB 102,68,15,126,4,80 ; movd %xmm8,(%rax,%rdx,2) - DB 235,198 ; jmp 3597 <_sk_store_565_sse41+0x5b> + DB 235,198 ; jmp 3566 <_sk_store_565_sse41+0x5b> DB 102,68,15,58,21,4,80,0 ; pextrw $0x0,%xmm8,(%rax,%rdx,2) - DB 235,188 ; jmp 3597 <_sk_store_565_sse41+0x5b> + DB 235,188 ; jmp 3566 <_sk_store_565_sse41+0x5b> PUBLIC _sk_load_4444_sse41 _sk_load_4444_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,95 ; jne 3644 <_sk_load_4444_sse41+0x69> + DB 117,95 ; jne 3613 <_sk_load_4444_sse41+0x69> DB 102,65,15,56,51,28,82 ; pmovzxwd (%r10,%rdx,2),%xmm3 - DB 102,15,111,5,76,40,0,0 ; movdqa 0x284c(%rip),%xmm0 # 5e40 <_sk_callback_sse41+0xcc0> + DB 102,15,111,5,77,40,0,0 ; movdqa 0x284d(%rip),%xmm0 # 5e10 <_sk_callback_sse41+0xcc1> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,78,40,0,0 ; mulps 0x284e(%rip),%xmm0 # 5e50 <_sk_callback_sse41+0xcd0> - DB 102,15,111,13,86,40,0,0 ; movdqa 0x2856(%rip),%xmm1 # 5e60 <_sk_callback_sse41+0xce0> + DB 15,89,5,79,40,0,0 ; mulps 0x284f(%rip),%xmm0 # 5e20 <_sk_callback_sse41+0xcd1> + DB 102,15,111,13,87,40,0,0 ; movdqa 0x2857(%rip),%xmm1 # 5e30 <_sk_callback_sse41+0xce1> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,88,40,0,0 ; mulps 0x2858(%rip),%xmm1 # 5e70 <_sk_callback_sse41+0xcf0> - DB 102,15,111,21,96,40,0,0 ; movdqa 0x2860(%rip),%xmm2 # 5e80 <_sk_callback_sse41+0xd00> + DB 15,89,13,89,40,0,0 ; mulps 0x2859(%rip),%xmm1 # 5e40 <_sk_callback_sse41+0xcf1> + DB 102,15,111,21,97,40,0,0 ; movdqa 0x2861(%rip),%xmm2 # 5e50 <_sk_callback_sse41+0xd01> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,98,40,0,0 ; mulps 0x2862(%rip),%xmm2 # 5e90 <_sk_callback_sse41+0xd10> - DB 102,15,219,29,106,40,0,0 ; pand 0x286a(%rip),%xmm3 # 5ea0 <_sk_callback_sse41+0xd20> + DB 15,89,21,99,40,0,0 ; mulps 0x2863(%rip),%xmm2 # 5e60 <_sk_callback_sse41+0xd11> + DB 102,15,219,29,107,40,0,0 ; pand 0x286b(%rip),%xmm3 # 5e70 <_sk_callback_sse41+0xd21> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,112,40,0,0 ; mulps 0x2870(%rip),%xmm3 # 5eb0 <_sk_callback_sse41+0xd30> + DB 15,89,29,113,40,0,0 ; mulps 0x2871(%rip),%xmm3 # 5e80 <_sk_callback_sse41+0xd31> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,53 ; je 3686 <_sk_load_4444_sse41+0xab> + DB 116,53 ; je 3655 <_sk_load_4444_sse41+0xab> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,21 ; je 3670 <_sk_load_4444_sse41+0x95> + DB 116,21 ; je 363f <_sk_load_4444_sse41+0x95> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,139 ; jne 35ec <_sk_load_4444_sse41+0x11> + DB 117,139 ; jne 35bb <_sk_load_4444_sse41+0x11> DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 102,65,15,110,4,82 ; movd (%r10,%rdx,2),%xmm0 DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0 DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3 - DB 233,102,255,255,255 ; jmpq 35ec <_sk_load_4444_sse41+0x11> + DB 233,102,255,255,255 ; jmpq 35bb <_sk_load_4444_sse41+0x11> DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax DB 102,15,110,216 ; movd %eax,%xmm3 - DB 233,88,255,255,255 ; jmpq 35ec <_sk_load_4444_sse41+0x11> + DB 233,88,255,255,255 ; jmpq 35bb <_sk_load_4444_sse41+0x11> PUBLIC _sk_gather_4444_sse41 _sk_gather_4444_sse41 LABEL PROC @@ -15513,21 +15467,21 @@ _sk_gather_4444_sse41 LABEL PROC DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0 DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3 - DB 102,15,111,5,194,39,0,0 ; movdqa 0x27c2(%rip),%xmm0 # 5ec0 <_sk_callback_sse41+0xd40> + DB 102,15,111,5,195,39,0,0 ; movdqa 0x27c3(%rip),%xmm0 # 5e90 <_sk_callback_sse41+0xd41> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,196,39,0,0 ; mulps 0x27c4(%rip),%xmm0 # 5ed0 <_sk_callback_sse41+0xd50> - DB 102,15,111,13,204,39,0,0 ; movdqa 0x27cc(%rip),%xmm1 # 5ee0 <_sk_callback_sse41+0xd60> + DB 15,89,5,197,39,0,0 ; mulps 0x27c5(%rip),%xmm0 # 5ea0 <_sk_callback_sse41+0xd51> + DB 102,15,111,13,205,39,0,0 ; movdqa 0x27cd(%rip),%xmm1 # 5eb0 <_sk_callback_sse41+0xd61> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,206,39,0,0 ; mulps 0x27ce(%rip),%xmm1 # 5ef0 <_sk_callback_sse41+0xd70> - DB 102,15,111,21,214,39,0,0 ; movdqa 0x27d6(%rip),%xmm2 # 5f00 <_sk_callback_sse41+0xd80> + DB 15,89,13,207,39,0,0 ; mulps 0x27cf(%rip),%xmm1 # 5ec0 <_sk_callback_sse41+0xd71> + DB 102,15,111,21,215,39,0,0 ; movdqa 0x27d7(%rip),%xmm2 # 5ed0 <_sk_callback_sse41+0xd81> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,216,39,0,0 ; mulps 0x27d8(%rip),%xmm2 # 5f10 <_sk_callback_sse41+0xd90> - DB 102,15,219,29,224,39,0,0 ; pand 0x27e0(%rip),%xmm3 # 5f20 <_sk_callback_sse41+0xda0> + DB 15,89,21,217,39,0,0 ; mulps 0x27d9(%rip),%xmm2 # 5ee0 <_sk_callback_sse41+0xd91> + DB 102,15,219,29,225,39,0,0 ; pand 0x27e1(%rip),%xmm3 # 5ef0 <_sk_callback_sse41+0xda1> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,230,39,0,0 ; mulps 0x27e6(%rip),%xmm3 # 5f30 <_sk_callback_sse41+0xdb0> + DB 15,89,29,231,39,0,0 ; mulps 0x27e7(%rip),%xmm3 # 5f00 <_sk_callback_sse41+0xdb1> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -15536,7 +15490,7 @@ PUBLIC _sk_store_4444_sse41 _sk_store_4444_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,228,39,0,0 ; movaps 0x27e4(%rip),%xmm8 # 5f40 <_sk_callback_sse41+0xdc0> + DB 68,15,40,5,229,39,0,0 ; movaps 0x27e5(%rip),%xmm8 # 5f10 <_sk_callback_sse41+0xdc1> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -15556,7 +15510,7 @@ _sk_store_4444_sse41 LABEL PROC DB 102,69,15,86,194 ; orpd %xmm10,%xmm8 DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 37c2 <_sk_store_4444_sse41+0x73> + DB 117,10 ; jne 3791 <_sk_store_4444_sse41+0x73> DB 242,68,15,17,4,80 ; movsd %xmm8,(%rax,%rdx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -15564,36 +15518,36 @@ _sk_store_4444_sse41 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,35 ; je 37f8 <_sk_store_4444_sse41+0xa9> + DB 116,35 ; je 37c7 <_sk_store_4444_sse41+0xa9> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,15 ; je 37ea <_sk_store_4444_sse41+0x9b> + DB 116,15 ; je 37b9 <_sk_store_4444_sse41+0x9b> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,221 ; jne 37be <_sk_store_4444_sse41+0x6f> + DB 117,221 ; jne 378d <_sk_store_4444_sse41+0x6f> DB 102,68,15,58,21,68,80,4,4 ; pextrw $0x4,%xmm8,0x4(%rax,%rdx,2) DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8 DB 102,68,15,126,4,80 ; movd %xmm8,(%rax,%rdx,2) - DB 235,198 ; jmp 37be <_sk_store_4444_sse41+0x6f> + DB 235,198 ; jmp 378d <_sk_store_4444_sse41+0x6f> DB 102,68,15,58,21,4,80,0 ; pextrw $0x0,%xmm8,(%rax,%rdx,2) - DB 235,188 ; jmp 37be <_sk_store_4444_sse41+0x6f> + DB 235,188 ; jmp 378d <_sk_store_4444_sse41+0x6f> PUBLIC _sk_load_8888_sse41 _sk_load_8888_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax DB 77,133,192 ; test %r8,%r8 - DB 117,88 ; jne 3864 <_sk_load_8888_sse41+0x62> + DB 117,88 ; jne 3833 <_sk_load_8888_sse41+0x62> DB 243,15,111,28,144 ; movdqu (%rax,%rdx,4),%xmm3 - DB 102,15,111,5,55,39,0,0 ; movdqa 0x2737(%rip),%xmm0 # 5f50 <_sk_callback_sse41+0xdd0> + DB 102,15,111,5,56,39,0,0 ; movdqa 0x2738(%rip),%xmm0 # 5f20 <_sk_callback_sse41+0xdd1> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,56,39,0,0 ; movaps 0x2738(%rip),%xmm8 # 5f60 <_sk_callback_sse41+0xde0> + DB 68,15,40,5,57,39,0,0 ; movaps 0x2739(%rip),%xmm8 # 5f30 <_sk_callback_sse41+0xde1> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 - DB 102,15,56,0,13,55,39,0,0 ; pshufb 0x2737(%rip),%xmm1 # 5f70 <_sk_callback_sse41+0xdf0> + DB 102,15,56,0,13,56,39,0,0 ; pshufb 0x2738(%rip),%xmm1 # 5f40 <_sk_callback_sse41+0xdf1> DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,211 ; movdqa %xmm3,%xmm2 - DB 102,15,56,0,21,51,39,0,0 ; pshufb 0x2733(%rip),%xmm2 # 5f80 <_sk_callback_sse41+0xe00> + DB 102,15,56,0,21,52,39,0,0 ; pshufb 0x2734(%rip),%xmm2 # 5f50 <_sk_callback_sse41+0xe01> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -15604,19 +15558,19 @@ _sk_load_8888_sse41 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,43 ; je 389c <_sk_load_8888_sse41+0x9a> + DB 116,43 ; je 386b <_sk_load_8888_sse41+0x9a> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,17 ; je 388c <_sk_load_8888_sse41+0x8a> + DB 116,17 ; je 385b <_sk_load_8888_sse41+0x8a> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,144 ; jne 3811 <_sk_load_8888_sse41+0xf> + DB 117,144 ; jne 37e0 <_sk_load_8888_sse41+0xf> DB 102,15,110,68,144,8 ; movd 0x8(%rax,%rdx,4),%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 243,15,126,4,144 ; movq (%rax,%rdx,4),%xmm0 DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3 - DB 233,117,255,255,255 ; jmpq 3811 <_sk_load_8888_sse41+0xf> + DB 233,117,255,255,255 ; jmpq 37e0 <_sk_load_8888_sse41+0xf> DB 102,15,110,28,144 ; movd (%rax,%rdx,4),%xmm3 - DB 233,107,255,255,255 ; jmpq 3811 <_sk_load_8888_sse41+0xf> + DB 233,107,255,255,255 ; jmpq 37e0 <_sk_load_8888_sse41+0xf> PUBLIC _sk_gather_8888_sse41 _sk_gather_8888_sse41 LABEL PROC @@ -15639,17 +15593,17 @@ _sk_gather_8888_sse41 LABEL PROC DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3 DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3 DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3 - DB 102,15,111,5,137,38,0,0 ; movdqa 0x2689(%rip),%xmm0 # 5f90 <_sk_callback_sse41+0xe10> + DB 102,15,111,5,138,38,0,0 ; movdqa 0x268a(%rip),%xmm0 # 5f60 <_sk_callback_sse41+0xe11> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,138,38,0,0 ; movaps 0x268a(%rip),%xmm8 # 5fa0 <_sk_callback_sse41+0xe20> + DB 68,15,40,5,139,38,0,0 ; movaps 0x268b(%rip),%xmm8 # 5f70 <_sk_callback_sse41+0xe21> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 - DB 102,15,56,0,13,137,38,0,0 ; pshufb 0x2689(%rip),%xmm1 # 5fb0 <_sk_callback_sse41+0xe30> + DB 102,15,56,0,13,138,38,0,0 ; pshufb 0x268a(%rip),%xmm1 # 5f80 <_sk_callback_sse41+0xe31> DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,111,211 ; movdqa %xmm3,%xmm2 - DB 102,15,56,0,21,133,38,0,0 ; pshufb 0x2685(%rip),%xmm2 # 5fc0 <_sk_callback_sse41+0xe40> + DB 102,15,56,0,21,134,38,0,0 ; pshufb 0x2686(%rip),%xmm2 # 5f90 <_sk_callback_sse41+0xe41> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 102,15,114,211,24 ; psrld $0x18,%xmm3 @@ -15663,7 +15617,7 @@ PUBLIC _sk_store_8888_sse41 _sk_store_8888_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,112,38,0,0 ; movaps 0x2670(%rip),%xmm8 # 5fd0 <_sk_callback_sse41+0xe50> + DB 68,15,40,5,113,38,0,0 ; movaps 0x2671(%rip),%xmm8 # 5fa0 <_sk_callback_sse41+0xe51> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -15682,30 +15636,30 @@ _sk_store_8888_sse41 LABEL PROC DB 102,69,15,235,193 ; por %xmm9,%xmm8 DB 102,69,15,235,194 ; por %xmm10,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 39c0 <_sk_store_8888_sse41+0x6d> + DB 117,10 ; jne 398f <_sk_store_8888_sse41+0x6d> DB 243,68,15,127,4,144 ; movdqu %xmm8,(%rax,%rdx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,29 ; je 39ea <_sk_store_8888_sse41+0x97> + DB 116,29 ; je 39b9 <_sk_store_8888_sse41+0x97> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,15 ; je 39e2 <_sk_store_8888_sse41+0x8f> + DB 116,15 ; je 39b1 <_sk_store_8888_sse41+0x8f> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,227 ; jne 39bc <_sk_store_8888_sse41+0x69> + DB 117,227 ; jne 398b <_sk_store_8888_sse41+0x69> DB 102,68,15,58,22,68,144,8,2 ; pextrd $0x2,%xmm8,0x8(%rax,%rdx,4) DB 102,68,15,214,4,144 ; movq %xmm8,(%rax,%rdx,4) - DB 235,210 ; jmp 39bc <_sk_store_8888_sse41+0x69> + DB 235,210 ; jmp 398b <_sk_store_8888_sse41+0x69> DB 102,68,15,126,4,144 ; movd %xmm8,(%rax,%rdx,4) - DB 235,202 ; jmp 39bc <_sk_store_8888_sse41+0x69> + DB 235,202 ; jmp 398b <_sk_store_8888_sse41+0x69> PUBLIC _sk_load_f16_sse41 _sk_load_f16_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,60,1,0,0 ; jne 3b3c <_sk_load_f16_sse41+0x14a> + DB 15,133,60,1,0,0 ; jne 3b0b <_sk_load_f16_sse41+0x14a> DB 102,15,16,4,208 ; movupd (%rax,%rdx,8),%xmm0 DB 243,15,111,76,208,16 ; movdqu 0x10(%rax,%rdx,8),%xmm1 DB 102,68,15,40,200 ; movapd %xmm0,%xmm9 @@ -15715,18 +15669,18 @@ _sk_load_f16_sse41 LABEL PROC DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11 DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9 DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1 - DB 102,68,15,111,5,169,37,0,0 ; movdqa 0x25a9(%rip),%xmm8 # 5fe0 <_sk_callback_sse41+0xe60> + DB 102,68,15,111,5,170,37,0,0 ; movdqa 0x25aa(%rip),%xmm8 # 5fb0 <_sk_callback_sse41+0xe61> DB 102,15,111,209 ; movdqa %xmm1,%xmm2 DB 102,65,15,219,208 ; pand %xmm8,%xmm2 DB 102,15,239,202 ; pxor %xmm2,%xmm1 - DB 102,15,111,29,164,37,0,0 ; movdqa 0x25a4(%rip),%xmm3 # 5ff0 <_sk_callback_sse41+0xe70> + DB 102,15,111,29,165,37,0,0 ; movdqa 0x25a5(%rip),%xmm3 # 5fc0 <_sk_callback_sse41+0xe71> DB 102,15,114,242,16 ; pslld $0x10,%xmm2 DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0 DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0 DB 102,15,114,241,13 ; pslld $0xd,%xmm1 DB 102,15,235,202 ; por %xmm2,%xmm1 - DB 102,68,15,111,21,144,37,0,0 ; movdqa 0x2590(%rip),%xmm10 # 6000 <_sk_callback_sse41+0xe80> + DB 102,68,15,111,21,145,37,0,0 ; movdqa 0x2591(%rip),%xmm10 # 5fd0 <_sk_callback_sse41+0xe81> DB 102,65,15,254,202 ; paddd %xmm10,%xmm1 DB 102,15,219,193 ; pand %xmm1,%xmm0 DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11 @@ -15769,16 +15723,16 @@ _sk_load_f16_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,15,16,4,208 ; movsd (%rax,%rdx,8),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 3b54 <_sk_load_f16_sse41+0x162> + DB 117,13 ; jne 3b23 <_sk_load_f16_sse41+0x162> DB 243,15,126,192 ; movq %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,183,254,255,255 ; jmpq 3a0b <_sk_load_f16_sse41+0x19> + DB 233,183,254,255,255 ; jmpq 39da <_sk_load_f16_sse41+0x19> DB 102,15,22,68,208,8 ; movhpd 0x8(%rax,%rdx,8),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,163,254,255,255 ; jb 3a0b <_sk_load_f16_sse41+0x19> + DB 15,130,163,254,255,255 ; jb 39da <_sk_load_f16_sse41+0x19> DB 243,15,126,76,208,16 ; movq 0x10(%rax,%rdx,8),%xmm1 - DB 233,152,254,255,255 ; jmpq 3a0b <_sk_load_f16_sse41+0x19> + DB 233,152,254,255,255 ; jmpq 39da <_sk_load_f16_sse41+0x19> PUBLIC _sk_gather_f16_sse41 _sk_gather_f16_sse41 LABEL PROC @@ -15810,18 +15764,18 @@ _sk_gather_f16_sse41 LABEL PROC DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11 DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9 DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1 - DB 102,68,15,111,5,22,36,0,0 ; movdqa 0x2416(%rip),%xmm8 # 6010 <_sk_callback_sse41+0xe90> + DB 102,68,15,111,5,23,36,0,0 ; movdqa 0x2417(%rip),%xmm8 # 5fe0 <_sk_callback_sse41+0xe91> DB 102,15,111,209 ; movdqa %xmm1,%xmm2 DB 102,65,15,219,208 ; pand %xmm8,%xmm2 DB 102,15,239,202 ; pxor %xmm2,%xmm1 - DB 102,15,111,29,17,36,0,0 ; movdqa 0x2411(%rip),%xmm3 # 6020 <_sk_callback_sse41+0xea0> + DB 102,15,111,29,18,36,0,0 ; movdqa 0x2412(%rip),%xmm3 # 5ff0 <_sk_callback_sse41+0xea1> DB 102,15,114,242,16 ; pslld $0x10,%xmm2 DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0 DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0 DB 102,15,114,241,13 ; pslld $0xd,%xmm1 DB 102,15,235,202 ; por %xmm2,%xmm1 - DB 102,68,15,111,21,253,35,0,0 ; movdqa 0x23fd(%rip),%xmm10 # 6030 <_sk_callback_sse41+0xeb0> + DB 102,68,15,111,21,254,35,0,0 ; movdqa 0x23fe(%rip),%xmm10 # 6000 <_sk_callback_sse41+0xeb1> DB 102,65,15,254,202 ; paddd %xmm10,%xmm1 DB 102,15,219,193 ; pand %xmm1,%xmm0 DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11 @@ -15868,17 +15822,17 @@ PUBLIC _sk_store_f16_sse41 _sk_store_f16_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 102,68,15,111,21,50,35,0,0 ; movdqa 0x2332(%rip),%xmm10 # 6040 <_sk_callback_sse41+0xec0> + DB 102,68,15,111,21,51,35,0,0 ; movdqa 0x2333(%rip),%xmm10 # 6010 <_sk_callback_sse41+0xec1> DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11 DB 102,69,15,219,218 ; pand %xmm10,%xmm11 DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13 DB 102,69,15,239,235 ; pxor %xmm11,%xmm13 - DB 102,68,15,111,13,37,35,0,0 ; movdqa 0x2325(%rip),%xmm9 # 6050 <_sk_callback_sse41+0xed0> + DB 102,68,15,111,13,38,35,0,0 ; movdqa 0x2326(%rip),%xmm9 # 6020 <_sk_callback_sse41+0xed1> DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11 DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8 DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8 DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13 - DB 102,68,15,111,37,22,35,0,0 ; movdqa 0x2316(%rip),%xmm12 # 6060 <_sk_callback_sse41+0xee0> + DB 102,68,15,111,37,23,35,0,0 ; movdqa 0x2317(%rip),%xmm12 # 6030 <_sk_callback_sse41+0xee1> DB 102,69,15,235,220 ; por %xmm12,%xmm11 DB 102,69,15,254,221 ; paddd %xmm13,%xmm11 DB 102,69,15,223,195 ; pandn %xmm11,%xmm8 @@ -15922,7 +15876,7 @@ _sk_store_f16_sse41 LABEL PROC DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9 DB 102,69,15,98,203 ; punpckldq %xmm11,%xmm9 DB 77,133,192 ; test %r8,%r8 - DB 117,21 ; jne 3e40 <_sk_store_f16_sse41+0x140> + DB 117,21 ; jne 3e0f <_sk_store_f16_sse41+0x140> DB 68,15,17,12,208 ; movups %xmm9,(%rax,%rdx,8) DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8 DB 243,68,15,127,68,208,16 ; movdqu %xmm8,0x10(%rax,%rdx,8) @@ -15930,13 +15884,13 @@ _sk_store_f16_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 102,68,15,214,12,208 ; movq %xmm9,(%rax,%rdx,8) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 3e3c <_sk_store_f16_sse41+0x13c> + DB 116,240 ; je 3e0b <_sk_store_f16_sse41+0x13c> DB 102,68,15,23,76,208,8 ; movhpd %xmm9,0x8(%rax,%rdx,8) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 3e3c <_sk_store_f16_sse41+0x13c> + DB 114,227 ; jb 3e0b <_sk_store_f16_sse41+0x13c> DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8 DB 102,68,15,214,68,208,16 ; movq %xmm8,0x10(%rax,%rdx,8) - DB 235,213 ; jmp 3e3c <_sk_store_f16_sse41+0x13c> + DB 235,213 ; jmp 3e0b <_sk_store_f16_sse41+0x13c> PUBLIC _sk_load_u16_be_sse41 _sk_load_u16_be_sse41 LABEL PROC @@ -15944,7 +15898,7 @@ _sk_load_u16_be_sse41 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,185,0,0,0 ; jne 3f36 <_sk_load_u16_be_sse41+0xcf> + DB 15,133,185,0,0,0 ; jne 3f05 <_sk_load_u16_be_sse41+0xcf> DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0 DB 243,65,15,111,76,65,16 ; movdqu 0x10(%r9,%rax,2),%xmm1 DB 102,15,40,208 ; movapd %xmm0,%xmm2 @@ -15960,7 +15914,7 @@ _sk_load_u16_be_sse41 LABEL PROC DB 102,15,235,200 ; por %xmm0,%xmm1 DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,167,33,0,0 ; movaps 0x21a7(%rip),%xmm8 # 6070 <_sk_callback_sse41+0xef0> + DB 68,15,40,5,168,33,0,0 ; movaps 0x21a8(%rip),%xmm8 # 6040 <_sk_callback_sse41+0xef1> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -15988,16 +15942,16 @@ _sk_load_u16_be_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 3f4f <_sk_load_u16_be_sse41+0xe8> + DB 117,13 ; jne 3f1e <_sk_load_u16_be_sse41+0xe8> DB 243,15,126,192 ; movq %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,59,255,255,255 ; jmpq 3e8a <_sk_load_u16_be_sse41+0x23> + DB 233,59,255,255,255 ; jmpq 3e59 <_sk_load_u16_be_sse41+0x23> DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,38,255,255,255 ; jb 3e8a <_sk_load_u16_be_sse41+0x23> + DB 15,130,38,255,255,255 ; jb 3e59 <_sk_load_u16_be_sse41+0x23> DB 243,65,15,126,76,65,16 ; movq 0x10(%r9,%rax,2),%xmm1 - DB 233,26,255,255,255 ; jmpq 3e8a <_sk_load_u16_be_sse41+0x23> + DB 233,26,255,255,255 ; jmpq 3e59 <_sk_load_u16_be_sse41+0x23> PUBLIC _sk_load_rgb_u16_be_sse41 _sk_load_rgb_u16_be_sse41 LABEL PROC @@ -16005,7 +15959,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,82 ; lea (%rdx,%rdx,2),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,170,0,0,0 ; jne 402c <_sk_load_rgb_u16_be_sse41+0xbc> + DB 15,133,170,0,0,0 ; jne 3ffb <_sk_load_rgb_u16_be_sse41+0xbc> DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2 DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3 DB 102,15,115,219,4 ; psrldq $0x4,%xmm3 @@ -16025,7 +15979,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC DB 102,15,235,200 ; por %xmm0,%xmm1 DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,159,32,0,0 ; movaps 0x209f(%rip),%xmm8 # 6080 <_sk_callback_sse41+0xf00> + DB 68,15,40,5,160,32,0,0 ; movaps 0x20a0(%rip),%xmm8 # 6050 <_sk_callback_sse41+0xf01> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -16042,34 +15996,34 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,102,32,0,0 ; movaps 0x2066(%rip),%xmm3 # 6090 <_sk_callback_sse41+0xf10> + DB 15,40,29,103,32,0,0 ; movaps 0x2067(%rip),%xmm3 # 6060 <_sk_callback_sse41+0xf11> DB 255,224 ; jmpq *%rax DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2 DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 4051 <_sk_load_rgb_u16_be_sse41+0xe1> + DB 117,13 ; jne 4020 <_sk_load_rgb_u16_be_sse41+0xe1> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,85,255,255,255 ; jmpq 3fa6 <_sk_load_rgb_u16_be_sse41+0x36> + DB 233,85,255,255,255 ; jmpq 3f75 <_sk_load_rgb_u16_be_sse41+0x36> DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0 DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,24 ; jb 4082 <_sk_load_rgb_u16_be_sse41+0x112> + DB 114,24 ; jb 4051 <_sk_load_rgb_u16_be_sse41+0x112> DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3 DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,36,255,255,255 ; jmpq 3fa6 <_sk_load_rgb_u16_be_sse41+0x36> + DB 233,36,255,255,255 ; jmpq 3f75 <_sk_load_rgb_u16_be_sse41+0x36> DB 102,15,239,219 ; pxor %xmm3,%xmm3 - DB 233,27,255,255,255 ; jmpq 3fa6 <_sk_load_rgb_u16_be_sse41+0x36> + DB 233,27,255,255,255 ; jmpq 3f75 <_sk_load_rgb_u16_be_sse41+0x36> PUBLIC _sk_store_u16_be_sse41 _sk_store_u16_be_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax - DB 68,15,40,21,0,32,0,0 ; movaps 0x2000(%rip),%xmm10 # 60a0 <_sk_callback_sse41+0xf20> + DB 68,15,40,21,1,32,0,0 ; movaps 0x2001(%rip),%xmm10 # 6070 <_sk_callback_sse41+0xf21> DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 69,15,89,194 ; mulps %xmm10,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 @@ -16106,7 +16060,7 @@ _sk_store_u16_be_sse41 LABEL PROC DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10 DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10 DB 77,133,192 ; test %r8,%r8 - DB 117,21 ; jne 416e <_sk_store_u16_be_sse41+0xe3> + DB 117,21 ; jne 413d <_sk_store_u16_be_sse41+0xe3> DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2) DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8 DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2) @@ -16114,13 +16068,13 @@ _sk_store_u16_be_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 416a <_sk_store_u16_be_sse41+0xdf> + DB 116,240 ; je 4139 <_sk_store_u16_be_sse41+0xdf> DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 416a <_sk_store_u16_be_sse41+0xdf> + DB 114,227 ; jb 4139 <_sk_store_u16_be_sse41+0xdf> DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8 DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2) - DB 235,213 ; jmp 416a <_sk_store_u16_be_sse41+0xdf> + DB 235,213 ; jmp 4139 <_sk_store_u16_be_sse41+0xdf> PUBLIC _sk_load_f32_sse41 _sk_load_f32_sse41 LABEL PROC @@ -16131,7 +16085,7 @@ _sk_load_f32_sse41 LABEL PROC DB 72,193,224,4 ; shl $0x4,%rax DB 69,15,16,4,2 ; movups (%r10,%rax,1),%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,66 ; jne 41f5 <_sk_load_f32_sse41+0x60> + DB 117,66 ; jne 41c4 <_sk_load_f32_sse41+0x60> DB 67,15,16,68,138,16 ; movups 0x10(%r10,%r9,4),%xmm0 DB 67,15,16,92,138,32 ; movups 0x20(%r10,%r9,4),%xmm3 DB 71,15,16,76,138,48 ; movups 0x30(%r10,%r9,4),%xmm9 @@ -16151,17 +16105,17 @@ _sk_load_f32_sse41 LABEL PROC DB 255,224 ; jmpq *%rax DB 69,15,87,201 ; xorps %xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,8 ; jne 4207 <_sk_load_f32_sse41+0x72> + DB 117,8 ; jne 41d6 <_sk_load_f32_sse41+0x72> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 235,190 ; jmp 41c5 <_sk_load_f32_sse41+0x30> + DB 235,190 ; jmp 4194 <_sk_load_f32_sse41+0x30> DB 67,15,16,68,138,16 ; movups 0x10(%r10,%r9,4),%xmm0 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,8 ; jb 421b <_sk_load_f32_sse41+0x86> + DB 114,8 ; jb 41ea <_sk_load_f32_sse41+0x86> DB 67,15,16,92,138,32 ; movups 0x20(%r10,%r9,4),%xmm3 - DB 235,170 ; jmp 41c5 <_sk_load_f32_sse41+0x30> + DB 235,170 ; jmp 4194 <_sk_load_f32_sse41+0x30> DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 235,165 ; jmp 41c5 <_sk_load_f32_sse41+0x30> + DB 235,165 ; jmp 4194 <_sk_load_f32_sse41+0x30> PUBLIC _sk_store_f32_sse41 _sk_store_f32_sse41 LABEL PROC @@ -16185,7 +16139,7 @@ _sk_store_f32_sse41 LABEL PROC DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9 DB 102,69,15,17,36,2 ; movupd %xmm12,(%r10,%rax,1) DB 77,133,192 ; test %r8,%r8 - DB 117,29 ; jne 4292 <_sk_store_f32_sse41+0x72> + DB 117,29 ; jne 4261 <_sk_store_f32_sse41+0x72> DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10 DB 71,15,17,68,138,16 ; movups %xmm8,0x10(%r10,%r9,4) DB 102,71,15,17,76,138,32 ; movupd %xmm9,0x20(%r10,%r9,4) @@ -16193,12 +16147,12 @@ _sk_store_f32_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,246 ; je 428e <_sk_store_f32_sse41+0x6e> + DB 116,246 ; je 425d <_sk_store_f32_sse41+0x6e> DB 71,15,17,68,138,16 ; movups %xmm8,0x10(%r10,%r9,4) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,234 ; jb 428e <_sk_store_f32_sse41+0x6e> + DB 114,234 ; jb 425d <_sk_store_f32_sse41+0x6e> DB 102,71,15,17,76,138,32 ; movupd %xmm9,0x20(%r10,%r9,4) - DB 235,225 ; jmp 428e <_sk_store_f32_sse41+0x6e> + DB 235,225 ; jmp 425d <_sk_store_f32_sse41+0x6e> PUBLIC _sk_clamp_x_sse41 _sk_clamp_x_sse41 LABEL PROC @@ -16272,7 +16226,7 @@ _sk_mirror_x_sse41 LABEL PROC DB 65,15,92,194 ; subps %xmm10,%xmm0 DB 243,69,15,88,192 ; addss %xmm8,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 - DB 243,68,15,89,13,204,32,0,0 ; mulss 0x20cc(%rip),%xmm9 # 6470 <_sk_callback_sse41+0x12f0> + DB 243,68,15,89,13,205,32,0,0 ; mulss 0x20cd(%rip),%xmm9 # 6440 <_sk_callback_sse41+0x12f1> DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,89,200 ; mulps %xmm0,%xmm9 DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9 @@ -16298,7 +16252,7 @@ _sk_mirror_y_sse41 LABEL PROC DB 65,15,92,202 ; subps %xmm10,%xmm1 DB 243,69,15,88,192 ; addss %xmm8,%xmm8 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 - DB 243,68,15,89,13,105,32,0,0 ; mulss 0x2069(%rip),%xmm9 # 6474 <_sk_callback_sse41+0x12f4> + DB 243,68,15,89,13,106,32,0,0 ; mulss 0x206a(%rip),%xmm9 # 6444 <_sk_callback_sse41+0x12f5> DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 DB 68,15,89,201 ; mulps %xmm1,%xmm9 DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9 @@ -16318,7 +16272,7 @@ PUBLIC _sk_clamp_x_1_sse41 _sk_clamp_x_1_sse41 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 68,15,95,192 ; maxps %xmm0,%xmm8 - DB 68,15,93,5,91,28,0,0 ; minps 0x1c5b(%rip),%xmm8 # 60b0 <_sk_callback_sse41+0xf30> + DB 68,15,93,5,92,28,0,0 ; minps 0x1c5c(%rip),%xmm8 # 6080 <_sk_callback_sse41+0xf31> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -16332,9 +16286,9 @@ _sk_repeat_x_1_sse41 LABEL PROC PUBLIC _sk_mirror_x_1_sse41 _sk_mirror_x_1_sse41 LABEL PROC - DB 68,15,40,5,76,28,0,0 ; movaps 0x1c4c(%rip),%xmm8 # 60c0 <_sk_callback_sse41+0xf40> + DB 68,15,40,5,77,28,0,0 ; movaps 0x1c4d(%rip),%xmm8 # 6090 <_sk_callback_sse41+0xf41> DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,13,80,28,0,0 ; movaps 0x1c50(%rip),%xmm9 # 60d0 <_sk_callback_sse41+0xf50> + DB 68,15,40,13,81,28,0,0 ; movaps 0x1c51(%rip),%xmm9 # 60a0 <_sk_callback_sse41+0xf51> DB 68,15,89,200 ; mulps %xmm0,%xmm9 DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9 DB 69,15,88,201 ; addps %xmm9,%xmm9 @@ -16349,10 +16303,10 @@ _sk_mirror_x_1_sse41 LABEL PROC PUBLIC _sk_luminance_to_alpha_sse41 _sk_luminance_to_alpha_sse41 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 - DB 15,89,5,47,28,0,0 ; mulps 0x1c2f(%rip),%xmm0 # 60e0 <_sk_callback_sse41+0xf60> - DB 15,89,13,56,28,0,0 ; mulps 0x1c38(%rip),%xmm1 # 60f0 <_sk_callback_sse41+0xf70> + DB 15,89,5,48,28,0,0 ; mulps 0x1c30(%rip),%xmm0 # 60b0 <_sk_callback_sse41+0xf61> + DB 15,89,13,57,28,0,0 ; mulps 0x1c39(%rip),%xmm1 # 60c0 <_sk_callback_sse41+0xf71> DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,29,62,28,0,0 ; mulps 0x1c3e(%rip),%xmm3 # 6100 <_sk_callback_sse41+0xf80> + DB 15,89,29,63,28,0,0 ; mulps 0x1c3f(%rip),%xmm3 # 60d0 <_sk_callback_sse41+0xf81> DB 15,88,217 ; addps %xmm1,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 @@ -16619,9 +16573,9 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC DB 72,139,24 ; mov (%rax),%rbx DB 76,139,112,8 ; mov 0x8(%rax),%r14 DB 72,255,203 ; dec %rbx - DB 120,7 ; js 4900 <_sk_evenly_spaced_gradient_sse41+0x1a> + DB 120,7 ; js 48cf <_sk_evenly_spaced_gradient_sse41+0x1a> DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1 - DB 235,21 ; jmp 4915 <_sk_evenly_spaced_gradient_sse41+0x2f> + DB 235,21 ; jmp 48e4 <_sk_evenly_spaced_gradient_sse41+0x2f> DB 73,137,217 ; mov %rbx,%r9 DB 73,209,233 ; shr %r9 DB 131,227,1 ; and $0x1,%ebx @@ -16709,15 +16663,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC PUBLIC _sk_gauss_a_to_rgba_sse41 _sk_gauss_a_to_rgba_sse41 LABEL PROC - DB 15,40,5,77,22,0,0 ; movaps 0x164d(%rip),%xmm0 # 6110 <_sk_callback_sse41+0xf90> + DB 15,40,5,78,22,0,0 ; movaps 0x164e(%rip),%xmm0 # 60e0 <_sk_callback_sse41+0xf91> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,83,22,0,0 ; addps 0x1653(%rip),%xmm0 # 6120 <_sk_callback_sse41+0xfa0> + DB 15,88,5,84,22,0,0 ; addps 0x1654(%rip),%xmm0 # 60f0 <_sk_callback_sse41+0xfa1> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,89,22,0,0 ; addps 0x1659(%rip),%xmm0 # 6130 <_sk_callback_sse41+0xfb0> + DB 15,88,5,90,22,0,0 ; addps 0x165a(%rip),%xmm0 # 6100 <_sk_callback_sse41+0xfb1> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,95,22,0,0 ; addps 0x165f(%rip),%xmm0 # 6140 <_sk_callback_sse41+0xfc0> + DB 15,88,5,96,22,0,0 ; addps 0x1660(%rip),%xmm0 # 6110 <_sk_callback_sse41+0xfc1> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,101,22,0,0 ; addps 0x1665(%rip),%xmm0 # 6150 <_sk_callback_sse41+0xfd0> + DB 15,88,5,102,22,0,0 ; addps 0x1666(%rip),%xmm0 # 6120 <_sk_callback_sse41+0xfd1> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 @@ -16733,12 +16687,12 @@ _sk_gradient_sse41 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,249,2 ; cmp $0x2,%r9 - DB 114,50 ; jb 4b3e <_sk_gradient_sse41+0x46> + DB 114,50 ; jb 4b0d <_sk_gradient_sse41+0x46> DB 72,139,88,72 ; mov 0x48(%rax),%rbx DB 73,255,201 ; dec %r9 DB 72,131,195,4 ; add $0x4,%rbx DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 15,40,21,62,22,0,0 ; movaps 0x163e(%rip),%xmm2 # 6160 <_sk_callback_sse41+0xfe0> + DB 15,40,21,63,22,0,0 ; movaps 0x163f(%rip),%xmm2 # 6130 <_sk_callback_sse41+0xfe1> DB 243,15,16,27 ; movss (%rbx),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 @@ -16746,7 +16700,7 @@ _sk_gradient_sse41 LABEL PROC DB 102,15,254,203 ; paddd %xmm3,%xmm1 DB 72,131,195,4 ; add $0x4,%rbx DB 73,255,201 ; dec %r9 - DB 117,228 ; jne 4b22 <_sk_gradient_sse41+0x2a> + DB 117,228 ; jne 4af1 <_sk_gradient_sse41+0x2a> DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9 DB 69,137,202 ; mov %r9d,%r10d DB 73,193,233,32 ; shr $0x20,%r9 @@ -16872,26 +16826,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,40,236 ; movaps %xmm12,%xmm13 DB 69,15,89,237 ; mulps %xmm13,%xmm13 - DB 68,15,40,21,223,19,0,0 ; movaps 0x13df(%rip),%xmm10 # 6170 <_sk_callback_sse41+0xff0> + DB 68,15,40,21,224,19,0,0 ; movaps 0x13e0(%rip),%xmm10 # 6140 <_sk_callback_sse41+0xff1> DB 69,15,89,213 ; mulps %xmm13,%xmm10 - DB 68,15,88,21,227,19,0,0 ; addps 0x13e3(%rip),%xmm10 # 6180 <_sk_callback_sse41+0x1000> + DB 68,15,88,21,228,19,0,0 ; addps 0x13e4(%rip),%xmm10 # 6150 <_sk_callback_sse41+0x1001> DB 69,15,89,213 ; mulps %xmm13,%xmm10 - DB 68,15,88,21,231,19,0,0 ; addps 0x13e7(%rip),%xmm10 # 6190 <_sk_callback_sse41+0x1010> + DB 68,15,88,21,232,19,0,0 ; addps 0x13e8(%rip),%xmm10 # 6160 <_sk_callback_sse41+0x1011> DB 69,15,89,213 ; mulps %xmm13,%xmm10 - DB 68,15,88,21,235,19,0,0 ; addps 0x13eb(%rip),%xmm10 # 61a0 <_sk_callback_sse41+0x1020> + DB 68,15,88,21,236,19,0,0 ; addps 0x13ec(%rip),%xmm10 # 6170 <_sk_callback_sse41+0x1021> DB 69,15,89,212 ; mulps %xmm12,%xmm10 DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0 - DB 68,15,40,29,234,19,0,0 ; movaps 0x13ea(%rip),%xmm11 # 61b0 <_sk_callback_sse41+0x1030> + DB 68,15,40,29,235,19,0,0 ; movaps 0x13eb(%rip),%xmm11 # 6180 <_sk_callback_sse41+0x1031> DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10 DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9 - DB 68,15,40,29,227,19,0,0 ; movaps 0x13e3(%rip),%xmm11 # 61c0 <_sk_callback_sse41+0x1040> + DB 68,15,40,29,228,19,0,0 ; movaps 0x13e4(%rip),%xmm11 # 6190 <_sk_callback_sse41+0x1041> DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 65,15,40,193 ; movaps %xmm9,%xmm0 DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10 DB 15,40,193 ; movaps %xmm1,%xmm0 DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0 - DB 68,15,40,13,213,19,0,0 ; movaps 0x13d5(%rip),%xmm9 # 61d0 <_sk_callback_sse41+0x1050> + DB 68,15,40,13,214,19,0,0 ; movaps 0x13d6(%rip),%xmm9 # 61a0 <_sk_callback_sse41+0x1051> DB 69,15,92,202 ; subps %xmm10,%xmm9 DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10 DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8 @@ -16913,7 +16867,7 @@ _sk_xy_to_radius_sse41 LABEL PROC PUBLIC _sk_save_xy_sse41 _sk_save_xy_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,169,19,0,0 ; movaps 0x13a9(%rip),%xmm8 # 61e0 <_sk_callback_sse41+0x1060> + DB 68,15,40,5,170,19,0,0 ; movaps 0x13aa(%rip),%xmm8 # 61b0 <_sk_callback_sse41+0x1061> DB 15,17,0 ; movups %xmm0,(%rax) DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,88,200 ; addps %xmm8,%xmm9 @@ -16953,8 +16907,8 @@ _sk_bilinear_nx_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,43,19,0,0 ; addps 0x132b(%rip),%xmm0 # 61f0 <_sk_callback_sse41+0x1070> - DB 68,15,40,13,51,19,0,0 ; movaps 0x1333(%rip),%xmm9 # 6200 <_sk_callback_sse41+0x1080> + DB 15,88,5,44,19,0,0 ; addps 0x132c(%rip),%xmm0 # 61c0 <_sk_callback_sse41+0x1071> + DB 68,15,40,13,52,19,0,0 ; movaps 0x1334(%rip),%xmm9 # 61d0 <_sk_callback_sse41+0x1081> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -16965,7 +16919,7 @@ _sk_bilinear_px_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,34,19,0,0 ; addps 0x1322(%rip),%xmm0 # 6210 <_sk_callback_sse41+0x1090> + DB 15,88,5,35,19,0,0 ; addps 0x1323(%rip),%xmm0 # 61e0 <_sk_callback_sse41+0x1091> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -16975,8 +16929,8 @@ _sk_bilinear_ny_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,20,19,0,0 ; addps 0x1314(%rip),%xmm1 # 6220 <_sk_callback_sse41+0x10a0> - DB 68,15,40,13,28,19,0,0 ; movaps 0x131c(%rip),%xmm9 # 6230 <_sk_callback_sse41+0x10b0> + DB 15,88,13,21,19,0,0 ; addps 0x1315(%rip),%xmm1 # 61f0 <_sk_callback_sse41+0x10a1> + DB 68,15,40,13,29,19,0,0 ; movaps 0x131d(%rip),%xmm9 # 6200 <_sk_callback_sse41+0x10b1> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -16987,7 +16941,7 @@ _sk_bilinear_py_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,10,19,0,0 ; addps 0x130a(%rip),%xmm1 # 6240 <_sk_callback_sse41+0x10c0> + DB 15,88,13,11,19,0,0 ; addps 0x130b(%rip),%xmm1 # 6210 <_sk_callback_sse41+0x10c1> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -16997,13 +16951,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,253,18,0,0 ; addps 0x12fd(%rip),%xmm0 # 6250 <_sk_callback_sse41+0x10d0> - DB 68,15,40,13,5,19,0,0 ; movaps 0x1305(%rip),%xmm9 # 6260 <_sk_callback_sse41+0x10e0> + DB 15,88,5,254,18,0,0 ; addps 0x12fe(%rip),%xmm0 # 6220 <_sk_callback_sse41+0x10d1> + DB 68,15,40,13,6,19,0,0 ; movaps 0x1306(%rip),%xmm9 # 6230 <_sk_callback_sse41+0x10e1> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,1,19,0,0 ; mulps 0x1301(%rip),%xmm9 # 6270 <_sk_callback_sse41+0x10f0> - DB 68,15,88,13,9,19,0,0 ; addps 0x1309(%rip),%xmm9 # 6280 <_sk_callback_sse41+0x1100> + DB 68,15,89,13,2,19,0,0 ; mulps 0x1302(%rip),%xmm9 # 6240 <_sk_callback_sse41+0x10f1> + DB 68,15,88,13,10,19,0,0 ; addps 0x130a(%rip),%xmm9 # 6250 <_sk_callback_sse41+0x1101> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -17014,16 +16968,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,248,18,0,0 ; addps 0x12f8(%rip),%xmm0 # 6290 <_sk_callback_sse41+0x1110> - DB 68,15,40,13,0,19,0,0 ; movaps 0x1300(%rip),%xmm9 # 62a0 <_sk_callback_sse41+0x1120> + DB 15,88,5,249,18,0,0 ; addps 0x12f9(%rip),%xmm0 # 6260 <_sk_callback_sse41+0x1111> + DB 68,15,40,13,1,19,0,0 ; movaps 0x1301(%rip),%xmm9 # 6270 <_sk_callback_sse41+0x1121> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,4,19,0,0 ; movaps 0x1304(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x1130> + DB 68,15,40,5,5,19,0,0 ; movaps 0x1305(%rip),%xmm8 # 6280 <_sk_callback_sse41+0x1131> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,8,19,0,0 ; addps 0x1308(%rip),%xmm8 # 62c0 <_sk_callback_sse41+0x1140> + DB 68,15,88,5,9,19,0,0 ; addps 0x1309(%rip),%xmm8 # 6290 <_sk_callback_sse41+0x1141> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,12,19,0,0 ; addps 0x130c(%rip),%xmm8 # 62d0 <_sk_callback_sse41+0x1150> + DB 68,15,88,5,13,19,0,0 ; addps 0x130d(%rip),%xmm8 # 62a0 <_sk_callback_sse41+0x1151> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,16,19,0,0 ; addps 0x1310(%rip),%xmm8 # 62e0 <_sk_callback_sse41+0x1160> + DB 68,15,88,5,17,19,0,0 ; addps 0x1311(%rip),%xmm8 # 62b0 <_sk_callback_sse41+0x1161> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -17031,17 +16985,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC PUBLIC _sk_bicubic_p1x_sse41 _sk_bicubic_p1x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,10,19,0,0 ; movaps 0x130a(%rip),%xmm8 # 62f0 <_sk_callback_sse41+0x1170> + DB 68,15,40,5,11,19,0,0 ; movaps 0x130b(%rip),%xmm8 # 62c0 <_sk_callback_sse41+0x1171> DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9 DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,21,6,19,0,0 ; movaps 0x1306(%rip),%xmm10 # 6300 <_sk_callback_sse41+0x1180> + DB 68,15,40,21,7,19,0,0 ; movaps 0x1307(%rip),%xmm10 # 62d0 <_sk_callback_sse41+0x1181> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,10,19,0,0 ; addps 0x130a(%rip),%xmm10 # 6310 <_sk_callback_sse41+0x1190> + DB 68,15,88,21,11,19,0,0 ; addps 0x130b(%rip),%xmm10 # 62e0 <_sk_callback_sse41+0x1191> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,6,19,0,0 ; addps 0x1306(%rip),%xmm10 # 6320 <_sk_callback_sse41+0x11a0> + DB 68,15,88,21,7,19,0,0 ; addps 0x1307(%rip),%xmm10 # 62f0 <_sk_callback_sse41+0x11a1> DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -17051,11 +17005,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,249,18,0,0 ; addps 0x12f9(%rip),%xmm0 # 6330 <_sk_callback_sse41+0x11b0> + DB 15,88,5,250,18,0,0 ; addps 0x12fa(%rip),%xmm0 # 6300 <_sk_callback_sse41+0x11b1> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,249,18,0,0 ; mulps 0x12f9(%rip),%xmm8 # 6340 <_sk_callback_sse41+0x11c0> - DB 68,15,88,5,1,19,0,0 ; addps 0x1301(%rip),%xmm8 # 6350 <_sk_callback_sse41+0x11d0> + DB 68,15,89,5,250,18,0,0 ; mulps 0x12fa(%rip),%xmm8 # 6310 <_sk_callback_sse41+0x11c1> + DB 68,15,88,5,2,19,0,0 ; addps 0x1302(%rip),%xmm8 # 6320 <_sk_callback_sse41+0x11d1> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -17066,13 +17020,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,239,18,0,0 ; addps 0x12ef(%rip),%xmm1 # 6360 <_sk_callback_sse41+0x11e0> - DB 68,15,40,13,247,18,0,0 ; movaps 0x12f7(%rip),%xmm9 # 6370 <_sk_callback_sse41+0x11f0> + DB 15,88,13,240,18,0,0 ; addps 0x12f0(%rip),%xmm1 # 6330 <_sk_callback_sse41+0x11e1> + DB 68,15,40,13,248,18,0,0 ; movaps 0x12f8(%rip),%xmm9 # 6340 <_sk_callback_sse41+0x11f1> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,243,18,0,0 ; mulps 0x12f3(%rip),%xmm9 # 6380 <_sk_callback_sse41+0x1200> - DB 68,15,88,13,251,18,0,0 ; addps 0x12fb(%rip),%xmm9 # 6390 <_sk_callback_sse41+0x1210> + DB 68,15,89,13,244,18,0,0 ; mulps 0x12f4(%rip),%xmm9 # 6350 <_sk_callback_sse41+0x1201> + DB 68,15,88,13,252,18,0,0 ; addps 0x12fc(%rip),%xmm9 # 6360 <_sk_callback_sse41+0x1211> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -17083,16 +17037,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,233,18,0,0 ; addps 0x12e9(%rip),%xmm1 # 63a0 <_sk_callback_sse41+0x1220> - DB 68,15,40,13,241,18,0,0 ; movaps 0x12f1(%rip),%xmm9 # 63b0 <_sk_callback_sse41+0x1230> + DB 15,88,13,234,18,0,0 ; addps 0x12ea(%rip),%xmm1 # 6370 <_sk_callback_sse41+0x1221> + DB 68,15,40,13,242,18,0,0 ; movaps 0x12f2(%rip),%xmm9 # 6380 <_sk_callback_sse41+0x1231> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,245,18,0,0 ; movaps 0x12f5(%rip),%xmm8 # 63c0 <_sk_callback_sse41+0x1240> + DB 68,15,40,5,246,18,0,0 ; movaps 0x12f6(%rip),%xmm8 # 6390 <_sk_callback_sse41+0x1241> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,249,18,0,0 ; addps 0x12f9(%rip),%xmm8 # 63d0 <_sk_callback_sse41+0x1250> + DB 68,15,88,5,250,18,0,0 ; addps 0x12fa(%rip),%xmm8 # 63a0 <_sk_callback_sse41+0x1251> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,253,18,0,0 ; addps 0x12fd(%rip),%xmm8 # 63e0 <_sk_callback_sse41+0x1260> + DB 68,15,88,5,254,18,0,0 ; addps 0x12fe(%rip),%xmm8 # 63b0 <_sk_callback_sse41+0x1261> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,1,19,0,0 ; addps 0x1301(%rip),%xmm8 # 63f0 <_sk_callback_sse41+0x1270> + DB 68,15,88,5,2,19,0,0 ; addps 0x1302(%rip),%xmm8 # 63c0 <_sk_callback_sse41+0x1271> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -17100,17 +17054,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC PUBLIC _sk_bicubic_p1y_sse41 _sk_bicubic_p1y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,251,18,0,0 ; movaps 0x12fb(%rip),%xmm8 # 6400 <_sk_callback_sse41+0x1280> + DB 68,15,40,5,252,18,0,0 ; movaps 0x12fc(%rip),%xmm8 # 63d0 <_sk_callback_sse41+0x1281> DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9 DB 65,15,88,200 ; addps %xmm8,%xmm1 - DB 68,15,40,21,246,18,0,0 ; movaps 0x12f6(%rip),%xmm10 # 6410 <_sk_callback_sse41+0x1290> + DB 68,15,40,21,247,18,0,0 ; movaps 0x12f7(%rip),%xmm10 # 63e0 <_sk_callback_sse41+0x1291> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,250,18,0,0 ; addps 0x12fa(%rip),%xmm10 # 6420 <_sk_callback_sse41+0x12a0> + DB 68,15,88,21,251,18,0,0 ; addps 0x12fb(%rip),%xmm10 # 63f0 <_sk_callback_sse41+0x12a1> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,246,18,0,0 ; addps 0x12f6(%rip),%xmm10 # 6430 <_sk_callback_sse41+0x12b0> + DB 68,15,88,21,247,18,0,0 ; addps 0x12f7(%rip),%xmm10 # 6400 <_sk_callback_sse41+0x12b1> DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -17120,11 +17074,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,232,18,0,0 ; addps 0x12e8(%rip),%xmm1 # 6440 <_sk_callback_sse41+0x12c0> + DB 15,88,13,233,18,0,0 ; addps 0x12e9(%rip),%xmm1 # 6410 <_sk_callback_sse41+0x12c1> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,232,18,0,0 ; mulps 0x12e8(%rip),%xmm8 # 6450 <_sk_callback_sse41+0x12d0> - DB 68,15,88,5,240,18,0,0 ; addps 0x12f0(%rip),%xmm8 # 6460 <_sk_callback_sse41+0x12e0> + DB 68,15,89,5,233,18,0,0 ; mulps 0x12e9(%rip),%xmm8 # 6420 <_sk_callback_sse41+0x12d1> + DB 68,15,88,5,241,18,0,0 ; addps 0x12f1(%rip),%xmm8 # 6430 <_sk_callback_sse41+0x12e1> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -17342,11 +17296,11 @@ ALIGN 16 DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%rdi) DB 0,224 ; add %ah,%al DB 64,0,0 ; add %al,(%rax) - DB 224,64 ; loopne 5428 <.literal16+0x1d8> + DB 224,64 ; loopne 53f8 <.literal16+0x1d8> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 542c <.literal16+0x1dc> + DB 224,64 ; loopne 53fc <.literal16+0x1dc> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 5430 <.literal16+0x1e0> + DB 224,64 ; loopne 5400 <.literal16+0x1e0> DB 154 ; (bad) DB 153 ; cltd DB 153 ; cltd @@ -17366,13 +17320,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5451 <.literal16+0x201> + DB 71,225,61 ; rex.RXB loope 5421 <.literal16+0x201> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5455 <.literal16+0x205> + DB 71,225,61 ; rex.RXB loope 5425 <.literal16+0x205> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5459 <.literal16+0x209> + DB 71,225,61 ; rex.RXB loope 5429 <.literal16+0x209> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 545d <.literal16+0x20d> + DB 71,225,61 ; rex.RXB loope 542d <.literal16+0x20d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -17397,13 +17351,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5491 <.literal16+0x241> + DB 71,225,61 ; rex.RXB loope 5461 <.literal16+0x241> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5495 <.literal16+0x245> + DB 71,225,61 ; rex.RXB loope 5465 <.literal16+0x245> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5499 <.literal16+0x249> + DB 71,225,61 ; rex.RXB loope 5469 <.literal16+0x249> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 549d <.literal16+0x24d> + DB 71,225,61 ; rex.RXB loope 546d <.literal16+0x24d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -17428,13 +17382,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 54d1 <.literal16+0x281> + DB 71,225,61 ; rex.RXB loope 54a1 <.literal16+0x281> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 54d5 <.literal16+0x285> + DB 71,225,61 ; rex.RXB loope 54a5 <.literal16+0x285> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 54d9 <.literal16+0x289> + DB 71,225,61 ; rex.RXB loope 54a9 <.literal16+0x289> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 54dd <.literal16+0x28d> + DB 71,225,61 ; rex.RXB loope 54ad <.literal16+0x28d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -17459,13 +17413,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5511 <.literal16+0x2c1> + DB 71,225,61 ; rex.RXB loope 54e1 <.literal16+0x2c1> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5515 <.literal16+0x2c5> + DB 71,225,61 ; rex.RXB loope 54e5 <.literal16+0x2c5> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5519 <.literal16+0x2c9> + DB 71,225,61 ; rex.RXB loope 54e9 <.literal16+0x2c9> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 551d <.literal16+0x2cd> + DB 71,225,61 ; rex.RXB loope 54ed <.literal16+0x2cd> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -17482,10 +17436,10 @@ ALIGN 16 DB 0,1 ; add %al,(%rcx) DB 255 ; (bad) DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005508 <_sk_callback_sse41+0xa000388> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0054d8 <_sk_callback_sse41+0xa000389> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005510 <_sk_callback_sse41+0x3000390> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30054e0 <_sk_callback_sse41+0x3000391> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -17504,11 +17458,11 @@ ALIGN 16 DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax) DB 67,0,0 ; rex.XB add %al,(%r8) - DB 127,67 ; jg 557b <.literal16+0x32b> + DB 127,67 ; jg 554b <.literal16+0x32b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 557f <.literal16+0x32f> + DB 127,67 ; jg 554f <.literal16+0x32f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5583 <.literal16+0x333> + DB 127,67 ; jg 5553 <.literal16+0x333> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -17743,13 +17697,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 5759 <.literal16+0x509> + DB 224,7 ; loopne 5729 <.literal16+0x509> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 575d <.literal16+0x50d> + DB 224,7 ; loopne 572d <.literal16+0x50d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5761 <.literal16+0x511> + DB 224,7 ; loopne 5731 <.literal16+0x511> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5765 <.literal16+0x515> + DB 224,7 ; loopne 5735 <.literal16+0x515> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -17783,10 +17737,10 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 1,255 ; add %edi,%edi DB 255 ; (bad) - DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a0057a8 <_sk_callback_sse41+0xa000628> + DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a005778 <_sk_callback_sse41+0xa000629> DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 30057b0 <_sk_callback_sse41+0x3000630> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005780 <_sk_callback_sse41+0x3000631> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -17841,11 +17795,11 @@ ALIGN 16 DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 587b <.literal16+0x62b> + DB 127,67 ; jg 584b <.literal16+0x62b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 587f <.literal16+0x62f> + DB 127,67 ; jg 584f <.literal16+0x62f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5883 <.literal16+0x633> + DB 127,67 ; jg 5853 <.literal16+0x633> DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax) DB 128,59,129 ; cmpb $0x81,(%rbx) DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax) @@ -17860,16 +17814,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 5874 <.literal16+0x624> + DB 127,0 ; jg 5844 <.literal16+0x624> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5878 <.literal16+0x628> + DB 127,0 ; jg 5848 <.literal16+0x628> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 587c <.literal16+0x62c> + DB 127,0 ; jg 584c <.literal16+0x62c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5880 <.literal16+0x630> + DB 127,0 ; jg 5850 <.literal16+0x630> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -17878,7 +17832,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 5905 <.literal16+0x6b5> + DB 119,115 ; ja 58d5 <.literal16+0x6b5> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -17889,7 +17843,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 5869 <.literal16+0x619> + DB 117,191 ; jne 5839 <.literal16+0x619> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -17901,7 +17855,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a398aa <_sk_callback_sse41+0xffffffffe9a3472a> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3987a <_sk_callback_sse41+0xffffffffe9a3472b> DB 220,63 ; fdivrl (%rdi) DB 81 ; push %rcx DB 140,242 ; mov %?,%edx @@ -17956,16 +17910,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 5944 <.literal16+0x6f4> + DB 127,0 ; jg 5914 <.literal16+0x6f4> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5948 <.literal16+0x6f8> + DB 127,0 ; jg 5918 <.literal16+0x6f8> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 594c <.literal16+0x6fc> + DB 127,0 ; jg 591c <.literal16+0x6fc> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5950 <.literal16+0x700> + DB 127,0 ; jg 5920 <.literal16+0x700> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -17974,7 +17928,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 59d5 <.literal16+0x785> + DB 119,115 ; ja 59a5 <.literal16+0x785> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -17985,7 +17939,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 5939 <.literal16+0x6e9> + DB 117,191 ; jne 5909 <.literal16+0x6e9> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -17997,7 +17951,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a3997a <_sk_callback_sse41+0xffffffffe9a347fa> + DB 233,220,63,163,233 ; jmpq ffffffffe9a3994a <_sk_callback_sse41+0xffffffffe9a347fb> DB 220,63 ; fdivrl (%rdi) DB 81 ; push %rcx DB 140,242 ; mov %?,%edx @@ -18052,16 +18006,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 5a14 <.literal16+0x7c4> + DB 127,0 ; jg 59e4 <.literal16+0x7c4> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5a18 <.literal16+0x7c8> + DB 127,0 ; jg 59e8 <.literal16+0x7c8> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5a1c <.literal16+0x7cc> + DB 127,0 ; jg 59ec <.literal16+0x7cc> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5a20 <.literal16+0x7d0> + DB 127,0 ; jg 59f0 <.literal16+0x7d0> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -18070,7 +18024,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 5aa5 <.literal16+0x855> + DB 119,115 ; ja 5a75 <.literal16+0x855> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -18081,7 +18035,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 5a09 <.literal16+0x7b9> + DB 117,191 ; jne 59d9 <.literal16+0x7b9> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -18093,7 +18047,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a39a4a <_sk_callback_sse41+0xffffffffe9a348ca> + DB 233,220,63,163,233 ; jmpq ffffffffe9a39a1a <_sk_callback_sse41+0xffffffffe9a348cb> DB 220,63 ; fdivrl (%rdi) DB 81 ; push %rcx DB 140,242 ; mov %?,%edx @@ -18148,16 +18102,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 5ae4 <.literal16+0x894> + DB 127,0 ; jg 5ab4 <.literal16+0x894> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5ae8 <.literal16+0x898> + DB 127,0 ; jg 5ab8 <.literal16+0x898> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5aec <.literal16+0x89c> + DB 127,0 ; jg 5abc <.literal16+0x89c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5af0 <.literal16+0x8a0> + DB 127,0 ; jg 5ac0 <.literal16+0x8a0> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -18166,7 +18120,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 5b75 <.literal16+0x925> + DB 119,115 ; ja 5b45 <.literal16+0x925> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -18177,7 +18131,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 5ad9 <.literal16+0x889> + DB 117,191 ; jne 5aa9 <.literal16+0x889> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -18189,7 +18143,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a39b1a <_sk_callback_sse41+0xffffffffe9a3499a> + DB 233,220,63,163,233 ; jmpq ffffffffe9a39aea <_sk_callback_sse41+0xffffffffe9a3499b> DB 220,63 ; fdivrl (%rdi) DB 81 ; push %rcx DB 140,242 ; mov %?,%edx @@ -18240,13 +18194,13 @@ ALIGN 16 DB 200,66,0,0 ; enterq $0x42,$0x0 DB 200,66,0,0 ; enterq $0x42,$0x0 DB 200,66,0,0 ; enterq $0x42,$0x0 - DB 127,67 ; jg 5bf7 <.literal16+0x9a7> + DB 127,67 ; jg 5bc7 <.literal16+0x9a7> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5bfb <.literal16+0x9ab> + DB 127,67 ; jg 5bcb <.literal16+0x9ab> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5bff <.literal16+0x9af> + DB 127,67 ; jg 5bcf <.literal16+0x9af> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5c03 <.literal16+0x9b3> + DB 127,67 ; jg 5bd3 <.literal16+0x9b3> DB 0,0 ; add %al,(%rax) DB 0,195 ; add %al,%bl DB 0,0 ; add %al,(%rax) @@ -18293,16 +18247,16 @@ ALIGN 16 DB 128,3,62 ; addb $0x3e,(%rbx) DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 5c83 <.literal16+0xa33> + DB 118,63 ; jbe 5c53 <.literal16+0xa33> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 5c87 <.literal16+0xa37> + DB 118,63 ; jbe 5c57 <.literal16+0xa37> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 5c8b <.literal16+0xa3b> + DB 118,63 ; jbe 5c5b <.literal16+0xa3b> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 5c8f <.literal16+0xa3f> + DB 118,63 ; jbe 5c5f <.literal16+0xa3f> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) @@ -18322,11 +18276,11 @@ ALIGN 16 DB 128,59,0 ; cmpb $0x0,(%rbx) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5cdb <.literal16+0xa8b> + DB 127,67 ; jg 5cab <.literal16+0xa8b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5cdf <.literal16+0xa8f> + DB 127,67 ; jg 5caf <.literal16+0xa8f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5ce3 <.literal16+0xa93> + DB 127,67 ; jg 5cb3 <.literal16+0xa93> DB 0,4,0 ; add %al,(%rax,%rax,1) DB 0,0 ; add %al,(%rax) DB 0,0 ; add %al,(%rax) @@ -18369,7 +18323,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005d30 <_sk_callback_sse41+0x3000bb0> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005d00 <_sk_callback_sse41+0x3000bb1> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -18398,13 +18352,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 5d69 <.literal16+0xb19> + DB 224,7 ; loopne 5d39 <.literal16+0xb19> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5d6d <.literal16+0xb1d> + DB 224,7 ; loopne 5d3d <.literal16+0xb1d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5d71 <.literal16+0xb21> + DB 224,7 ; loopne 5d41 <.literal16+0xb21> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5d75 <.literal16+0xb25> + DB 224,7 ; loopne 5d45 <.literal16+0xb25> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -18450,13 +18404,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 5dd9 <.literal16+0xb89> + DB 224,7 ; loopne 5da9 <.literal16+0xb89> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5ddd <.literal16+0xb8d> + DB 224,7 ; loopne 5dad <.literal16+0xb8d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5de1 <.literal16+0xb91> + DB 224,7 ; loopne 5db1 <.literal16+0xb91> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5de5 <.literal16+0xb95> + DB 224,7 ; loopne 5db5 <.literal16+0xb95> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -18494,13 +18448,13 @@ ALIGN 16 DB 65,0,0 ; add %al,(%r8) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 5e76 <.literal16+0xc26> + DB 124,66 ; jl 5e46 <.literal16+0xc26> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 5e7a <.literal16+0xc2a> + DB 124,66 ; jl 5e4a <.literal16+0xc2a> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 5e7e <.literal16+0xc2e> + DB 124,66 ; jl 5e4e <.literal16+0xc2e> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 5e82 <.literal16+0xc32> + DB 124,66 ; jl 5e52 <.literal16+0xc32> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 0,240 ; add %dh,%al @@ -18590,13 +18544,13 @@ ALIGN 16 DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax) DB 61,137,136,136,61 ; cmp $0x3d888889,%eax DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 5f85 <.literal16+0xd35> + DB 112,65 ; jo 5f55 <.literal16+0xd35> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 5f89 <.literal16+0xd39> + DB 112,65 ; jo 5f59 <.literal16+0xd39> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 5f8d <.literal16+0xd3d> + DB 112,65 ; jo 5f5d <.literal16+0xd3d> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 5f91 <.literal16+0xd41> + DB 112,65 ; jo 5f61 <.literal16+0xd41> DB 255,0 ; incl (%rax) DB 0,0 ; add %al,(%rax) DB 255,0 ; incl (%rax) @@ -18611,7 +18565,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005f80 <_sk_callback_sse41+0x3000e00> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005f50 <_sk_callback_sse41+0x3000e01> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -18638,7 +18592,7 @@ ALIGN 16 DB 5,255,255,255,9 ; add $0x9ffffff,%eax DB 255 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005fc0 <_sk_callback_sse41+0x3000e40> + DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 3005f90 <_sk_callback_sse41+0x3000e41> DB 255 ; (bad) DB 255 ; (bad) DB 255,6 ; incl (%rsi) @@ -18653,11 +18607,11 @@ ALIGN 16 DB 255,0 ; incl (%rax) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 601b <.literal16+0xdcb> + DB 127,67 ; jg 5feb <.literal16+0xdcb> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 601f <.literal16+0xdcf> + DB 127,67 ; jg 5fef <.literal16+0xdcf> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6023 <.literal16+0xdd3> + DB 127,67 ; jg 5ff3 <.literal16+0xdd3> DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) DB 0,0 ; add %al,(%rax) DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) @@ -18733,13 +18687,13 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 255 ; (bad) - DB 127,71 ; jg 60eb <.literal16+0xe9b> + DB 127,71 ; jg 60bb <.literal16+0xe9b> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 60ef <.literal16+0xe9f> + DB 127,71 ; jg 60bf <.literal16+0xe9f> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 60f3 <.literal16+0xea3> + DB 127,71 ; jg 60c3 <.literal16+0xea3> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 60f7 <.literal16+0xea7> + DB 127,71 ; jg 60c7 <.literal16+0xea7> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -18785,10 +18739,10 @@ ALIGN 16 DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax DB 152 ; cwtl DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx) - DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc0722a <_sk_callback_sse41+0x2dc020aa> + DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc071fa <_sk_callback_sse41+0x2dc020ab> DB 17,192 ; adc %eax,%eax DB 45,16,17,192,18 ; sub $0x12c01110,%eax - DB 120,57 ; js 615c <.literal16+0xf0c> + DB 120,57 ; js 612c <.literal16+0xf0c> DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil @@ -18910,11 +18864,11 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,114 ; cmpb $0x72,(%rdi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt 6292 <.literal16+0x1042> + DB 62,114,28 ; jb,pt 6262 <.literal16+0x1042> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6296 <.literal16+0x1046> + DB 62,114,28 ; jb,pt 6266 <.literal16+0x1046> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 629a <.literal16+0x104a> + DB 62,114,28 ; jb,pt 626a <.literal16+0x104a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -18958,7 +18912,7 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f125 <_sk_callback_sse41+0x3d639fa5> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f0f5 <_sk_callback_sse41+0x3d639fa6> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -18984,7 +18938,7 @@ ALIGN 16 DB 0,192 ; add %al,%al DB 63 ; (bad) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f165 <_sk_callback_sse41+0x3d639fe5> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f135 <_sk_callback_sse41+0x3d639fe6> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al @@ -18993,13 +18947,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al DB 63 ; (bad) - DB 114,28 ; jb 635e <.literal16+0x110e> + DB 114,28 ; jb 632e <.literal16+0x110e> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6362 <.literal16+0x1112> + DB 62,114,28 ; jb,pt 6332 <.literal16+0x1112> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6366 <.literal16+0x1116> + DB 62,114,28 ; jb,pt 6336 <.literal16+0x1116> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 636a <.literal16+0x111a> + DB 62,114,28 ; jb,pt 633a <.literal16+0x111a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -19020,11 +18974,11 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,114 ; cmpb $0x72,(%rdi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt 63a2 <.literal16+0x1152> + DB 62,114,28 ; jb,pt 6372 <.literal16+0x1152> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 63a6 <.literal16+0x1156> + DB 62,114,28 ; jb,pt 6376 <.literal16+0x1156> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 63aa <.literal16+0x115a> + DB 62,114,28 ; jb,pt 637a <.literal16+0x115a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -19068,7 +19022,7 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f235 <_sk_callback_sse41+0x3d63a0b5> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f205 <_sk_callback_sse41+0x3d63a0b6> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -19094,7 +19048,7 @@ ALIGN 16 DB 0,192 ; add %al,%al DB 63 ; (bad) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f275 <_sk_callback_sse41+0x3d63a0f5> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f245 <_sk_callback_sse41+0x3d63a0f6> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al @@ -19103,13 +19057,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al DB 63 ; (bad) - DB 114,28 ; jb 646e <.literal16+0x121e> + DB 114,28 ; jb 643e <.literal16+0x121e> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6472 <_sk_callback_sse41+0x12f2> + DB 62,114,28 ; jb,pt 6442 <_sk_callback_sse41+0x12f3> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6476 <_sk_callback_sse41+0x12f6> + DB 62,114,28 ; jb,pt 6446 <_sk_callback_sse41+0x12f7> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 647a <_sk_callback_sse41+0x12fa> + DB 62,114,28 ; jb,pt 644a <_sk_callback_sse41+0x12fb> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -19150,50 +19104,34 @@ _sk_start_pipeline_sse2 LABEL PROC DB 15,41,189,48,255,255,255 ; movaps %xmm7,-0xd0(%rbp) DB 15,41,181,32,255,255,255 ; movaps %xmm6,-0xe0(%rbp) DB 72,137,211 ; mov %rdx,%rbx - DB 73,137,207 ; mov %rcx,%r15 + DB 73,137,204 ; mov %rcx,%r12 DB 76,139,117,48 ; mov 0x30(%rbp),%r14 DB 76,137,206 ; mov %r9,%rsi DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,197 ; mov %rax,%r13 - DB 73,137,244 ; mov %rsi,%r12 - DB 73,141,79,4 ; lea 0x4(%r15),%rcx + DB 73,137,247 ; mov %rsi,%r15 + DB 73,141,76,36,4 ; lea 0x4(%r12),%rcx DB 76,57,193 ; cmp %r8,%rcx - DB 118,5 ; jbe 7b <_sk_start_pipeline_sse2+0x7b> - DB 76,137,250 ; mov %r15,%rdx - DB 235,75 ; jmp c6 <_sk_start_pipeline_sse2+0xc6> + DB 118,5 ; jbe 7c <_sk_start_pipeline_sse2+0x7c> + DB 76,137,226 ; mov %r12,%rdx + DB 235,49 ; jmp ad <_sk_start_pipeline_sse2+0xad> DB 76,137,133,24,255,255,255 ; mov %r8,-0xe8(%rbp) - DB 65,184,0,0,0,0 ; mov $0x0,%r8d - DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 15,87,201 ; xorps %xmm1,%xmm1 - DB 15,87,210 ; xorps %xmm2,%xmm2 - DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 15,87,228 ; xorps %xmm4,%xmm4 - DB 15,87,237 ; xorps %xmm5,%xmm5 - DB 15,87,246 ; xorps %xmm6,%xmm6 - DB 15,87,255 ; xorps %xmm7,%xmm7 + DB 69,49,192 ; xor %r8d,%r8d DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi - DB 76,137,250 ; mov %r15,%rdx + DB 76,137,254 ; mov %r15,%rsi + DB 76,137,226 ; mov %r12,%rdx DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 76,139,133,24,255,255,255 ; mov -0xe8(%rbp),%r8 - DB 73,141,87,4 ; lea 0x4(%r15),%rdx - DB 73,131,199,8 ; add $0x8,%r15 - DB 77,57,199 ; cmp %r8,%r15 - DB 73,137,215 ; mov %rdx,%r15 - DB 118,188 ; jbe 82 <_sk_start_pipeline_sse2+0x82> + DB 73,141,84,36,4 ; lea 0x4(%r12),%rdx + DB 73,131,196,8 ; add $0x8,%r12 + DB 77,57,196 ; cmp %r8,%r12 + DB 73,137,212 ; mov %rdx,%r12 + DB 118,214 ; jbe 83 <_sk_start_pipeline_sse2+0x83> DB 73,41,208 ; sub %rdx,%r8 - DB 116,36 ; je ef <_sk_start_pipeline_sse2+0xef> - DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 15,87,201 ; xorps %xmm1,%xmm1 - DB 15,87,210 ; xorps %xmm2,%xmm2 - DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 15,87,228 ; xorps %xmm4,%xmm4 - DB 15,87,237 ; xorps %xmm5,%xmm5 - DB 15,87,246 ; xorps %xmm6,%xmm6 - DB 15,87,255 ; xorps %xmm7,%xmm7 + DB 116,12 ; je be <_sk_start_pipeline_sse2+0xbe> DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi + DB 76,137,254 ; mov %r15,%rsi DB 72,137,217 ; mov %rbx,%rcx DB 65,255,213 ; callq *%r13 DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6 @@ -19226,7 +19164,7 @@ _sk_seed_shader_sse2 LABEL PROC DB 102,15,110,194 ; movd %edx,%xmm0 DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0 DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1 - DB 15,40,21,167,85,0,0 ; movaps 0x55a7(%rip),%xmm2 # 5700 <_sk_callback_sse2+0xd7> + DB 15,40,21,168,85,0,0 ; movaps 0x55a8(%rip),%xmm2 # 56d0 <_sk_callback_sse2+0xd8> DB 15,88,202 ; addps %xmm2,%xmm1 DB 15,16,7 ; movups (%rdi),%xmm0 DB 15,88,193 ; addps %xmm1,%xmm0 @@ -19235,7 +19173,7 @@ _sk_seed_shader_sse2 LABEL PROC DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,88,202 ; addps %xmm2,%xmm1 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,21,150,85,0,0 ; movaps 0x5596(%rip),%xmm2 # 5710 <_sk_callback_sse2+0xe7> + DB 15,40,21,151,85,0,0 ; movaps 0x5597(%rip),%xmm2 # 56e0 <_sk_callback_sse2+0xe8> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,228 ; xorps %xmm4,%xmm4 DB 15,87,237 ; xorps %xmm5,%xmm5 @@ -19253,14 +19191,14 @@ _sk_dither_sse2 LABEL PROC DB 102,68,15,110,193 ; movd %ecx,%xmm8 DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8 DB 102,69,15,239,193 ; pxor %xmm9,%xmm8 - DB 102,68,15,111,21,100,85,0,0 ; movdqa 0x5564(%rip),%xmm10 # 5720 <_sk_callback_sse2+0xf7> + DB 102,68,15,111,21,101,85,0,0 ; movdqa 0x5565(%rip),%xmm10 # 56f0 <_sk_callback_sse2+0xf8> DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11 DB 102,69,15,219,218 ; pand %xmm10,%xmm11 DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11 DB 102,69,15,219,209 ; pand %xmm9,%xmm10 DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10 - DB 102,68,15,111,37,80,85,0,0 ; movdqa 0x5550(%rip),%xmm12 # 5730 <_sk_callback_sse2+0x107> - DB 102,68,15,111,45,87,85,0,0 ; movdqa 0x5557(%rip),%xmm13 # 5740 <_sk_callback_sse2+0x117> + DB 102,68,15,111,37,81,85,0,0 ; movdqa 0x5551(%rip),%xmm12 # 5700 <_sk_callback_sse2+0x108> + DB 102,68,15,111,45,88,85,0,0 ; movdqa 0x5558(%rip),%xmm13 # 5710 <_sk_callback_sse2+0x118> DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14 DB 102,69,15,219,245 ; pand %xmm13,%xmm14 DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14 @@ -19276,8 +19214,8 @@ _sk_dither_sse2 LABEL PROC DB 102,69,15,235,245 ; por %xmm13,%xmm14 DB 102,69,15,235,240 ; por %xmm8,%xmm14 DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8 - DB 68,15,89,5,18,85,0,0 ; mulps 0x5512(%rip),%xmm8 # 5750 <_sk_callback_sse2+0x127> - DB 68,15,88,5,26,85,0,0 ; addps 0x551a(%rip),%xmm8 # 5760 <_sk_callback_sse2+0x137> + DB 68,15,89,5,19,85,0,0 ; mulps 0x5513(%rip),%xmm8 # 5720 <_sk_callback_sse2+0x128> + DB 68,15,88,5,27,85,0,0 ; addps 0x551b(%rip),%xmm8 # 5730 <_sk_callback_sse2+0x138> DB 243,68,15,16,16 ; movss (%rax),%xmm10 DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -19344,7 +19282,7 @@ _sk_clear_sse2 LABEL PROC PUBLIC _sk_srcatop_sse2 _sk_srcatop_sse2 LABEL PROC DB 15,89,199 ; mulps %xmm7,%xmm0 - DB 68,15,40,5,116,84,0,0 ; movaps 0x5474(%rip),%xmm8 # 5770 <_sk_callback_sse2+0x147> + DB 68,15,40,5,117,84,0,0 ; movaps 0x5475(%rip),%xmm8 # 5740 <_sk_callback_sse2+0x148> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -19367,7 +19305,7 @@ PUBLIC _sk_dstatop_sse2 _sk_dstatop_sse2 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 DB 68,15,89,196 ; mulps %xmm4,%xmm8 - DB 68,15,40,13,55,84,0,0 ; movaps 0x5437(%rip),%xmm9 # 5780 <_sk_callback_sse2+0x157> + DB 68,15,40,13,56,84,0,0 ; movaps 0x5438(%rip),%xmm9 # 5750 <_sk_callback_sse2+0x158> DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 65,15,88,192 ; addps %xmm8,%xmm0 @@ -19408,7 +19346,7 @@ _sk_dstin_sse2 LABEL PROC PUBLIC _sk_srcout_sse2 _sk_srcout_sse2 LABEL PROC - DB 68,15,40,5,219,83,0,0 ; movaps 0x53db(%rip),%xmm8 # 5790 <_sk_callback_sse2+0x167> + DB 68,15,40,5,220,83,0,0 ; movaps 0x53dc(%rip),%xmm8 # 5760 <_sk_callback_sse2+0x168> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 @@ -19419,7 +19357,7 @@ _sk_srcout_sse2 LABEL PROC PUBLIC _sk_dstout_sse2 _sk_dstout_sse2 LABEL PROC - DB 68,15,40,5,203,83,0,0 ; movaps 0x53cb(%rip),%xmm8 # 57a0 <_sk_callback_sse2+0x177> + DB 68,15,40,5,204,83,0,0 ; movaps 0x53cc(%rip),%xmm8 # 5770 <_sk_callback_sse2+0x178> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 15,89,196 ; mulps %xmm4,%xmm0 @@ -19434,7 +19372,7 @@ _sk_dstout_sse2 LABEL PROC PUBLIC _sk_srcover_sse2 _sk_srcover_sse2 LABEL PROC - DB 68,15,40,5,174,83,0,0 ; movaps 0x53ae(%rip),%xmm8 # 57b0 <_sk_callback_sse2+0x187> + DB 68,15,40,5,175,83,0,0 ; movaps 0x53af(%rip),%xmm8 # 5780 <_sk_callback_sse2+0x188> DB 68,15,92,195 ; subps %xmm3,%xmm8 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -19452,7 +19390,7 @@ _sk_srcover_sse2 LABEL PROC PUBLIC _sk_dstover_sse2 _sk_dstover_sse2 LABEL PROC - DB 68,15,40,5,130,83,0,0 ; movaps 0x5382(%rip),%xmm8 # 57c0 <_sk_callback_sse2+0x197> + DB 68,15,40,5,131,83,0,0 ; movaps 0x5383(%rip),%xmm8 # 5790 <_sk_callback_sse2+0x198> DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -19476,7 +19414,7 @@ _sk_modulate_sse2 LABEL PROC PUBLIC _sk_multiply_sse2 _sk_multiply_sse2 LABEL PROC - DB 68,15,40,5,86,83,0,0 ; movaps 0x5356(%rip),%xmm8 # 57d0 <_sk_callback_sse2+0x1a7> + DB 68,15,40,5,87,83,0,0 ; movaps 0x5357(%rip),%xmm8 # 57a0 <_sk_callback_sse2+0x1a8> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 69,15,40,209 ; movaps %xmm9,%xmm10 @@ -19545,7 +19483,7 @@ _sk_screen_sse2 LABEL PROC PUBLIC _sk_xor__sse2 _sk_xor__sse2 LABEL PROC DB 68,15,40,195 ; movaps %xmm3,%xmm8 - DB 15,40,29,139,82,0,0 ; movaps 0x528b(%rip),%xmm3 # 57e0 <_sk_callback_sse2+0x1b7> + DB 15,40,29,140,82,0,0 ; movaps 0x528c(%rip),%xmm3 # 57b0 <_sk_callback_sse2+0x1b8> DB 68,15,40,203 ; movaps %xmm3,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 65,15,89,193 ; mulps %xmm9,%xmm0 @@ -19591,7 +19529,7 @@ _sk_darken_sse2 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,95,209 ; maxps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,246,81,0,0 ; movaps 0x51f6(%rip),%xmm2 # 57f0 <_sk_callback_sse2+0x1c7> + DB 15,40,21,247,81,0,0 ; movaps 0x51f7(%rip),%xmm2 # 57c0 <_sk_callback_sse2+0x1c8> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -19623,7 +19561,7 @@ _sk_lighten_sse2 LABEL PROC DB 68,15,89,206 ; mulps %xmm6,%xmm9 DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,155,81,0,0 ; movaps 0x519b(%rip),%xmm2 # 5800 <_sk_callback_sse2+0x1d7> + DB 15,40,21,156,81,0,0 ; movaps 0x519c(%rip),%xmm2 # 57d0 <_sk_callback_sse2+0x1d8> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -19658,7 +19596,7 @@ _sk_difference_sse2 LABEL PROC DB 65,15,93,209 ; minps %xmm9,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,53,81,0,0 ; movaps 0x5135(%rip),%xmm2 # 5810 <_sk_callback_sse2+0x1e7> + DB 15,40,21,54,81,0,0 ; movaps 0x5136(%rip),%xmm2 # 57e0 <_sk_callback_sse2+0x1e8> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -19684,7 +19622,7 @@ _sk_exclusion_sse2 LABEL PROC DB 15,89,214 ; mulps %xmm6,%xmm2 DB 15,88,210 ; addps %xmm2,%xmm2 DB 68,15,92,194 ; subps %xmm2,%xmm8 - DB 15,40,21,245,80,0,0 ; movaps 0x50f5(%rip),%xmm2 # 5820 <_sk_callback_sse2+0x1f7> + DB 15,40,21,246,80,0,0 ; movaps 0x50f6(%rip),%xmm2 # 57f0 <_sk_callback_sse2+0x1f8> DB 15,92,211 ; subps %xmm3,%xmm2 DB 15,89,215 ; mulps %xmm7,%xmm2 DB 15,88,218 ; addps %xmm2,%xmm3 @@ -19695,7 +19633,7 @@ _sk_exclusion_sse2 LABEL PROC PUBLIC _sk_colorburn_sse2 _sk_colorburn_sse2 LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 - DB 68,15,40,21,232,80,0,0 ; movaps 0x50e8(%rip),%xmm10 # 5830 <_sk_callback_sse2+0x207> + DB 68,15,40,21,233,80,0,0 ; movaps 0x50e9(%rip),%xmm10 # 5800 <_sk_callback_sse2+0x208> DB 69,15,40,202 ; movaps %xmm10,%xmm9 DB 68,15,92,207 ; subps %xmm7,%xmm9 DB 69,15,40,217 ; movaps %xmm9,%xmm11 @@ -19787,7 +19725,7 @@ _sk_colorburn_sse2 LABEL PROC PUBLIC _sk_colordodge_sse2 _sk_colordodge_sse2 LABEL PROC DB 68,15,40,200 ; movaps %xmm0,%xmm9 - DB 68,15,40,21,158,79,0,0 ; movaps 0x4f9e(%rip),%xmm10 # 5840 <_sk_callback_sse2+0x217> + DB 68,15,40,21,159,79,0,0 ; movaps 0x4f9f(%rip),%xmm10 # 5810 <_sk_callback_sse2+0x218> DB 69,15,40,218 ; movaps %xmm10,%xmm11 DB 68,15,92,223 ; subps %xmm7,%xmm11 DB 69,15,40,227 ; movaps %xmm11,%xmm12 @@ -19880,7 +19818,7 @@ _sk_hardlight_sse2 LABEL PROC DB 15,41,52,36 ; movaps %xmm6,(%rsp) DB 15,40,245 ; movaps %xmm5,%xmm6 DB 15,40,236 ; movaps %xmm4,%xmm5 - DB 68,15,40,29,80,78,0,0 ; movaps 0x4e50(%rip),%xmm11 # 5850 <_sk_callback_sse2+0x227> + DB 68,15,40,29,81,78,0,0 ; movaps 0x4e51(%rip),%xmm11 # 5820 <_sk_callback_sse2+0x228> DB 69,15,40,211 ; movaps %xmm11,%xmm10 DB 68,15,92,215 ; subps %xmm7,%xmm10 DB 69,15,40,194 ; movaps %xmm10,%xmm8 @@ -19967,7 +19905,7 @@ PUBLIC _sk_overlay_sse2 _sk_overlay_sse2 LABEL PROC DB 68,15,40,193 ; movaps %xmm1,%xmm8 DB 68,15,40,232 ; movaps %xmm0,%xmm13 - DB 68,15,40,13,27,77,0,0 ; movaps 0x4d1b(%rip),%xmm9 # 5860 <_sk_callback_sse2+0x237> + DB 68,15,40,13,28,77,0,0 ; movaps 0x4d1c(%rip),%xmm9 # 5830 <_sk_callback_sse2+0x238> DB 69,15,40,209 ; movaps %xmm9,%xmm10 DB 68,15,92,215 ; subps %xmm7,%xmm10 DB 69,15,40,218 ; movaps %xmm10,%xmm11 @@ -20057,7 +19995,7 @@ _sk_softlight_sse2 LABEL PROC DB 68,15,40,213 ; movaps %xmm5,%xmm10 DB 68,15,94,215 ; divps %xmm7,%xmm10 DB 69,15,84,212 ; andps %xmm12,%xmm10 - DB 68,15,40,13,213,75,0,0 ; movaps 0x4bd5(%rip),%xmm9 # 5870 <_sk_callback_sse2+0x247> + DB 68,15,40,13,214,75,0,0 ; movaps 0x4bd6(%rip),%xmm9 # 5840 <_sk_callback_sse2+0x248> DB 69,15,40,249 ; movaps %xmm9,%xmm15 DB 69,15,92,250 ; subps %xmm10,%xmm15 DB 69,15,40,218 ; movaps %xmm10,%xmm11 @@ -20070,10 +20008,10 @@ _sk_softlight_sse2 LABEL PROC DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 15,89,192 ; mulps %xmm0,%xmm0 DB 65,15,88,194 ; addps %xmm10,%xmm0 - DB 68,15,40,53,175,75,0,0 ; movaps 0x4baf(%rip),%xmm14 # 5880 <_sk_callback_sse2+0x257> + DB 68,15,40,53,176,75,0,0 ; movaps 0x4bb0(%rip),%xmm14 # 5850 <_sk_callback_sse2+0x258> DB 69,15,88,222 ; addps %xmm14,%xmm11 DB 68,15,89,216 ; mulps %xmm0,%xmm11 - DB 68,15,40,21,175,75,0,0 ; movaps 0x4baf(%rip),%xmm10 # 5890 <_sk_callback_sse2+0x267> + DB 68,15,40,21,176,75,0,0 ; movaps 0x4bb0(%rip),%xmm10 # 5860 <_sk_callback_sse2+0x268> DB 69,15,89,234 ; mulps %xmm10,%xmm13 DB 69,15,88,235 ; addps %xmm11,%xmm13 DB 15,88,228 ; addps %xmm4,%xmm4 @@ -20218,7 +20156,7 @@ _sk_hue_sse2 LABEL PROC DB 68,15,40,209 ; movaps %xmm1,%xmm10 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 68,15,89,211 ; mulps %xmm3,%xmm10 - DB 68,15,40,5,235,73,0,0 ; movaps 0x49eb(%rip),%xmm8 # 58d0 <_sk_callback_sse2+0x2a7> + DB 68,15,40,5,236,73,0,0 ; movaps 0x49ec(%rip),%xmm8 # 58a0 <_sk_callback_sse2+0x2a8> DB 69,15,40,216 ; movaps %xmm8,%xmm11 DB 15,40,207 ; movaps %xmm7,%xmm1 DB 68,15,92,217 ; subps %xmm1,%xmm11 @@ -20266,12 +20204,12 @@ _sk_hue_sse2 LABEL PROC DB 69,15,84,206 ; andps %xmm14,%xmm9 DB 69,15,84,214 ; andps %xmm14,%xmm10 DB 65,15,84,214 ; andps %xmm14,%xmm2 - DB 68,15,40,61,248,72,0,0 ; movaps 0x48f8(%rip),%xmm15 # 58a0 <_sk_callback_sse2+0x277> + DB 68,15,40,61,249,72,0,0 ; movaps 0x48f9(%rip),%xmm15 # 5870 <_sk_callback_sse2+0x278> DB 65,15,89,231 ; mulps %xmm15,%xmm4 - DB 15,40,5,253,72,0,0 ; movaps 0x48fd(%rip),%xmm0 # 58b0 <_sk_callback_sse2+0x287> + DB 15,40,5,254,72,0,0 ; movaps 0x48fe(%rip),%xmm0 # 5880 <_sk_callback_sse2+0x288> DB 15,89,240 ; mulps %xmm0,%xmm6 DB 15,88,244 ; addps %xmm4,%xmm6 - DB 68,15,40,53,255,72,0,0 ; movaps 0x48ff(%rip),%xmm14 # 58c0 <_sk_callback_sse2+0x297> + DB 68,15,40,53,0,73,0,0 ; movaps 0x4900(%rip),%xmm14 # 5890 <_sk_callback_sse2+0x298> DB 68,15,40,239 ; movaps %xmm7,%xmm13 DB 69,15,89,238 ; mulps %xmm14,%xmm13 DB 68,15,88,238 ; addps %xmm6,%xmm13 @@ -20449,14 +20387,14 @@ _sk_saturation_sse2 LABEL PROC DB 68,15,84,211 ; andps %xmm3,%xmm10 DB 68,15,84,203 ; andps %xmm3,%xmm9 DB 15,84,195 ; andps %xmm3,%xmm0 - DB 68,15,40,5,140,70,0,0 ; movaps 0x468c(%rip),%xmm8 # 58e0 <_sk_callback_sse2+0x2b7> + DB 68,15,40,5,141,70,0,0 ; movaps 0x468d(%rip),%xmm8 # 58b0 <_sk_callback_sse2+0x2b8> DB 15,40,214 ; movaps %xmm6,%xmm2 DB 65,15,89,208 ; mulps %xmm8,%xmm2 - DB 15,40,13,142,70,0,0 ; movaps 0x468e(%rip),%xmm1 # 58f0 <_sk_callback_sse2+0x2c7> + DB 15,40,13,143,70,0,0 ; movaps 0x468f(%rip),%xmm1 # 58c0 <_sk_callback_sse2+0x2c8> DB 15,40,221 ; movaps %xmm5,%xmm3 DB 15,89,217 ; mulps %xmm1,%xmm3 DB 15,88,218 ; addps %xmm2,%xmm3 - DB 68,15,40,37,141,70,0,0 ; movaps 0x468d(%rip),%xmm12 # 5900 <_sk_callback_sse2+0x2d7> + DB 68,15,40,37,142,70,0,0 ; movaps 0x468e(%rip),%xmm12 # 58d0 <_sk_callback_sse2+0x2d8> DB 69,15,89,236 ; mulps %xmm12,%xmm13 DB 68,15,88,235 ; addps %xmm3,%xmm13 DB 65,15,40,210 ; movaps %xmm10,%xmm2 @@ -20501,7 +20439,7 @@ _sk_saturation_sse2 LABEL PROC DB 15,40,223 ; movaps %xmm7,%xmm3 DB 15,40,236 ; movaps %xmm4,%xmm5 DB 15,89,221 ; mulps %xmm5,%xmm3 - DB 68,15,40,5,242,69,0,0 ; movaps 0x45f2(%rip),%xmm8 # 5910 <_sk_callback_sse2+0x2e7> + DB 68,15,40,5,243,69,0,0 ; movaps 0x45f3(%rip),%xmm8 # 58e0 <_sk_callback_sse2+0x2e8> DB 65,15,40,224 ; movaps %xmm8,%xmm4 DB 68,15,92,199 ; subps %xmm7,%xmm8 DB 15,88,253 ; addps %xmm5,%xmm7 @@ -20602,14 +20540,14 @@ _sk_color_sse2 LABEL PROC DB 68,15,40,213 ; movaps %xmm5,%xmm10 DB 69,15,89,208 ; mulps %xmm8,%xmm10 DB 65,15,40,208 ; movaps %xmm8,%xmm2 - DB 68,15,40,45,138,68,0,0 ; movaps 0x448a(%rip),%xmm13 # 5920 <_sk_callback_sse2+0x2f7> + DB 68,15,40,45,139,68,0,0 ; movaps 0x448b(%rip),%xmm13 # 58f0 <_sk_callback_sse2+0x2f8> DB 68,15,40,198 ; movaps %xmm6,%xmm8 DB 69,15,89,197 ; mulps %xmm13,%xmm8 - DB 68,15,40,53,138,68,0,0 ; movaps 0x448a(%rip),%xmm14 # 5930 <_sk_callback_sse2+0x307> + DB 68,15,40,53,139,68,0,0 ; movaps 0x448b(%rip),%xmm14 # 5900 <_sk_callback_sse2+0x308> DB 65,15,40,195 ; movaps %xmm11,%xmm0 DB 65,15,89,198 ; mulps %xmm14,%xmm0 DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,29,134,68,0,0 ; movaps 0x4486(%rip),%xmm11 # 5940 <_sk_callback_sse2+0x317> + DB 68,15,40,29,135,68,0,0 ; movaps 0x4487(%rip),%xmm11 # 5910 <_sk_callback_sse2+0x318> DB 69,15,89,227 ; mulps %xmm11,%xmm12 DB 68,15,88,224 ; addps %xmm0,%xmm12 DB 65,15,40,193 ; movaps %xmm9,%xmm0 @@ -20617,7 +20555,7 @@ _sk_color_sse2 LABEL PROC DB 69,15,40,250 ; movaps %xmm10,%xmm15 DB 69,15,89,254 ; mulps %xmm14,%xmm15 DB 68,15,88,248 ; addps %xmm0,%xmm15 - DB 68,15,40,5,114,68,0,0 ; movaps 0x4472(%rip),%xmm8 # 5950 <_sk_callback_sse2+0x327> + DB 68,15,40,5,115,68,0,0 ; movaps 0x4473(%rip),%xmm8 # 5920 <_sk_callback_sse2+0x328> DB 65,15,40,224 ; movaps %xmm8,%xmm4 DB 15,92,226 ; subps %xmm2,%xmm4 DB 15,89,252 ; mulps %xmm4,%xmm7 @@ -20753,15 +20691,15 @@ _sk_luminosity_sse2 LABEL PROC DB 68,15,40,205 ; movaps %xmm5,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 DB 15,89,222 ; mulps %xmm6,%xmm3 - DB 68,15,40,37,132,66,0,0 ; movaps 0x4284(%rip),%xmm12 # 5960 <_sk_callback_sse2+0x337> + DB 68,15,40,37,133,66,0,0 ; movaps 0x4285(%rip),%xmm12 # 5930 <_sk_callback_sse2+0x338> DB 68,15,40,199 ; movaps %xmm7,%xmm8 DB 69,15,89,196 ; mulps %xmm12,%xmm8 - DB 68,15,40,45,132,66,0,0 ; movaps 0x4284(%rip),%xmm13 # 5970 <_sk_callback_sse2+0x347> + DB 68,15,40,45,133,66,0,0 ; movaps 0x4285(%rip),%xmm13 # 5940 <_sk_callback_sse2+0x348> DB 68,15,40,241 ; movaps %xmm1,%xmm14 DB 69,15,89,245 ; mulps %xmm13,%xmm14 DB 69,15,88,240 ; addps %xmm8,%xmm14 - DB 68,15,40,29,128,66,0,0 ; movaps 0x4280(%rip),%xmm11 # 5980 <_sk_callback_sse2+0x357> - DB 68,15,40,5,136,66,0,0 ; movaps 0x4288(%rip),%xmm8 # 5990 <_sk_callback_sse2+0x367> + DB 68,15,40,29,129,66,0,0 ; movaps 0x4281(%rip),%xmm11 # 5950 <_sk_callback_sse2+0x358> + DB 68,15,40,5,137,66,0,0 ; movaps 0x4289(%rip),%xmm8 # 5960 <_sk_callback_sse2+0x368> DB 69,15,40,248 ; movaps %xmm8,%xmm15 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 68,15,92,248 ; subps %xmm0,%xmm15 @@ -20896,10 +20834,10 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,227,0,0,0 ; jne 19e2 <_sk_srcover_rgba_8888_sse2+0xf1> + DB 15,133,227,0,0,0 ; jne 19b1 <_sk_srcover_rgba_8888_sse2+0xf1> DB 243,68,15,111,4,144 ; movdqu (%rax,%rdx,4),%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 102,15,111,53,144,64,0,0 ; movdqa 0x4090(%rip),%xmm6 # 59a0 <_sk_callback_sse2+0x377> + DB 102,15,111,53,145,64,0,0 ; movdqa 0x4091(%rip),%xmm6 # 5970 <_sk_callback_sse2+0x378> DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4 DB 102,15,219,230 ; pand %xmm6,%xmm4 DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4 @@ -20913,9 +20851,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6 DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8 DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7 - DB 68,15,40,5,96,64,0,0 ; movaps 0x4060(%rip),%xmm8 # 59b0 <_sk_callback_sse2+0x387> + DB 68,15,40,5,97,64,0,0 ; movaps 0x4061(%rip),%xmm8 # 5980 <_sk_callback_sse2+0x388> DB 68,15,92,195 ; subps %xmm3,%xmm8 - DB 68,15,40,37,100,64,0,0 ; movaps 0x4064(%rip),%xmm12 # 59c0 <_sk_callback_sse2+0x397> + DB 68,15,40,37,101,64,0,0 ; movaps 0x4065(%rip),%xmm12 # 5990 <_sk_callback_sse2+0x398> DB 65,15,89,196 ; mulps %xmm12,%xmm0 DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 68,15,89,204 ; mulps %xmm4,%xmm9 @@ -20941,7 +20879,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 102,15,114,240,24 ; pslld $0x18,%xmm0 DB 102,15,235,194 ; por %xmm2,%xmm0 DB 102,15,235,193 ; por %xmm1,%xmm0 - DB 117,82 ; jne 1a1b <_sk_srcover_rgba_8888_sse2+0x12a> + DB 117,82 ; jne 19ea <_sk_srcover_rgba_8888_sse2+0x12a> DB 243,15,127,4,144 ; movdqu %xmm0,(%rax,%rdx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,193 ; movaps %xmm9,%xmm0 @@ -20952,32 +20890,32 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,87 ; je 1a46 <_sk_srcover_rgba_8888_sse2+0x155> + DB 116,87 ; je 1a15 <_sk_srcover_rgba_8888_sse2+0x155> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,22 ; je 1a10 <_sk_srcover_rgba_8888_sse2+0x11f> + DB 116,22 ; je 19df <_sk_srcover_rgba_8888_sse2+0x11f> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 15,133,1,255,255,255 ; jne 1905 <_sk_srcover_rgba_8888_sse2+0x14> + DB 15,133,1,255,255,255 ; jne 18d4 <_sk_srcover_rgba_8888_sse2+0x14> DB 102,15,110,100,144,8 ; movd 0x8(%rax,%rdx,4),%xmm4 DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8 DB 102,68,15,18,4,144 ; movlpd (%rax,%rdx,4),%xmm8 - DB 233,234,254,255,255 ; jmpq 1905 <_sk_srcover_rgba_8888_sse2+0x14> + DB 233,234,254,255,255 ; jmpq 18d4 <_sk_srcover_rgba_8888_sse2+0x14> DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,41 ; je 1a51 <_sk_srcover_rgba_8888_sse2+0x160> + DB 116,41 ; je 1a20 <_sk_srcover_rgba_8888_sse2+0x160> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,17 ; je 1a3f <_sk_srcover_rgba_8888_sse2+0x14e> + DB 116,17 ; je 1a0e <_sk_srcover_rgba_8888_sse2+0x14e> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,154 ; jne 19ce <_sk_srcover_rgba_8888_sse2+0xdd> + DB 117,154 ; jne 199d <_sk_srcover_rgba_8888_sse2+0xdd> DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 DB 102,15,126,76,144,8 ; movd %xmm1,0x8(%rax,%rdx,4) DB 102,15,214,4,144 ; movq %xmm0,(%rax,%rdx,4) - DB 235,136 ; jmp 19ce <_sk_srcover_rgba_8888_sse2+0xdd> + DB 235,136 ; jmp 199d <_sk_srcover_rgba_8888_sse2+0xdd> DB 102,68,15,110,4,144 ; movd (%rax,%rdx,4),%xmm8 - DB 233,180,254,255,255 ; jmpq 1905 <_sk_srcover_rgba_8888_sse2+0x14> + DB 233,180,254,255,255 ; jmpq 18d4 <_sk_srcover_rgba_8888_sse2+0x14> DB 102,15,126,4,144 ; movd %xmm0,(%rax,%rdx,4) - DB 233,115,255,255,255 ; jmpq 19ce <_sk_srcover_rgba_8888_sse2+0xdd> + DB 233,115,255,255,255 ; jmpq 199d <_sk_srcover_rgba_8888_sse2+0xdd> PUBLIC _sk_clamp_0_sse2 _sk_clamp_0_sse2 LABEL PROC @@ -20991,7 +20929,7 @@ _sk_clamp_0_sse2 LABEL PROC PUBLIC _sk_clamp_1_sse2 _sk_clamp_1_sse2 LABEL PROC - DB 68,15,40,5,85,63,0,0 ; movaps 0x3f55(%rip),%xmm8 # 59d0 <_sk_callback_sse2+0x3a7> + DB 68,15,40,5,86,63,0,0 ; movaps 0x3f56(%rip),%xmm8 # 59a0 <_sk_callback_sse2+0x3a8> DB 65,15,93,192 ; minps %xmm8,%xmm0 DB 65,15,93,200 ; minps %xmm8,%xmm1 DB 65,15,93,208 ; minps %xmm8,%xmm2 @@ -21001,7 +20939,7 @@ _sk_clamp_1_sse2 LABEL PROC PUBLIC _sk_clamp_a_sse2 _sk_clamp_a_sse2 LABEL PROC - DB 15,93,29,74,63,0,0 ; minps 0x3f4a(%rip),%xmm3 # 59e0 <_sk_callback_sse2+0x3b7> + DB 15,93,29,75,63,0,0 ; minps 0x3f4b(%rip),%xmm3 # 59b0 <_sk_callback_sse2+0x3b8> DB 15,93,195 ; minps %xmm3,%xmm0 DB 15,93,203 ; minps %xmm3,%xmm1 DB 15,93,211 ; minps %xmm3,%xmm2 @@ -21074,7 +21012,7 @@ _sk_premul_sse2 LABEL PROC PUBLIC _sk_unpremul_sse2 _sk_unpremul_sse2 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 - DB 68,15,40,13,181,62,0,0 ; movaps 0x3eb5(%rip),%xmm9 # 59f0 <_sk_callback_sse2+0x3c7> + DB 68,15,40,13,182,62,0,0 ; movaps 0x3eb6(%rip),%xmm9 # 59c0 <_sk_callback_sse2+0x3c8> DB 68,15,94,203 ; divps %xmm3,%xmm9 DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8 DB 69,15,84,193 ; andps %xmm9,%xmm8 @@ -21086,20 +21024,20 @@ _sk_unpremul_sse2 LABEL PROC PUBLIC _sk_from_srgb_sse2 _sk_from_srgb_sse2 LABEL PROC - DB 68,15,40,5,160,62,0,0 ; movaps 0x3ea0(%rip),%xmm8 # 5a00 <_sk_callback_sse2+0x3d7> + DB 68,15,40,5,161,62,0,0 ; movaps 0x3ea1(%rip),%xmm8 # 59d0 <_sk_callback_sse2+0x3d8> DB 68,15,40,232 ; movaps %xmm0,%xmm13 DB 69,15,89,232 ; mulps %xmm8,%xmm13 DB 68,15,40,216 ; movaps %xmm0,%xmm11 DB 69,15,89,219 ; mulps %xmm11,%xmm11 - DB 68,15,40,13,152,62,0,0 ; movaps 0x3e98(%rip),%xmm9 # 5a10 <_sk_callback_sse2+0x3e7> + DB 68,15,40,13,153,62,0,0 ; movaps 0x3e99(%rip),%xmm9 # 59e0 <_sk_callback_sse2+0x3e8> DB 68,15,40,240 ; movaps %xmm0,%xmm14 DB 69,15,89,241 ; mulps %xmm9,%xmm14 - DB 68,15,40,21,152,62,0,0 ; movaps 0x3e98(%rip),%xmm10 # 5a20 <_sk_callback_sse2+0x3f7> + DB 68,15,40,21,153,62,0,0 ; movaps 0x3e99(%rip),%xmm10 # 59f0 <_sk_callback_sse2+0x3f8> DB 69,15,88,242 ; addps %xmm10,%xmm14 DB 69,15,89,243 ; mulps %xmm11,%xmm14 - DB 68,15,40,29,152,62,0,0 ; movaps 0x3e98(%rip),%xmm11 # 5a30 <_sk_callback_sse2+0x407> + DB 68,15,40,29,153,62,0,0 ; movaps 0x3e99(%rip),%xmm11 # 5a00 <_sk_callback_sse2+0x408> DB 69,15,88,243 ; addps %xmm11,%xmm14 - DB 68,15,40,37,156,62,0,0 ; movaps 0x3e9c(%rip),%xmm12 # 5a40 <_sk_callback_sse2+0x417> + DB 68,15,40,37,157,62,0,0 ; movaps 0x3e9d(%rip),%xmm12 # 5a10 <_sk_callback_sse2+0x418> DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0 DB 68,15,84,232 ; andps %xmm0,%xmm13 DB 65,15,85,198 ; andnps %xmm14,%xmm0 @@ -21134,22 +21072,22 @@ _sk_from_srgb_sse2 LABEL PROC PUBLIC _sk_to_srgb_sse2 _sk_to_srgb_sse2 LABEL PROC DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13 - DB 68,15,40,5,41,62,0,0 ; movaps 0x3e29(%rip),%xmm8 # 5a50 <_sk_callback_sse2+0x427> + DB 68,15,40,5,42,62,0,0 ; movaps 0x3e2a(%rip),%xmm8 # 5a20 <_sk_callback_sse2+0x428> DB 68,15,40,240 ; movaps %xmm0,%xmm14 DB 69,15,89,240 ; mulps %xmm8,%xmm14 - DB 68,15,40,13,41,62,0,0 ; movaps 0x3e29(%rip),%xmm9 # 5a60 <_sk_callback_sse2+0x437> + DB 68,15,40,13,42,62,0,0 ; movaps 0x3e2a(%rip),%xmm9 # 5a30 <_sk_callback_sse2+0x438> DB 69,15,40,253 ; movaps %xmm13,%xmm15 DB 69,15,89,249 ; mulps %xmm9,%xmm15 - DB 68,15,40,21,41,62,0,0 ; movaps 0x3e29(%rip),%xmm10 # 5a70 <_sk_callback_sse2+0x447> + DB 68,15,40,21,42,62,0,0 ; movaps 0x3e2a(%rip),%xmm10 # 5a40 <_sk_callback_sse2+0x448> DB 69,15,88,250 ; addps %xmm10,%xmm15 DB 69,15,89,253 ; mulps %xmm13,%xmm15 - DB 68,15,40,29,41,62,0,0 ; movaps 0x3e29(%rip),%xmm11 # 5a80 <_sk_callback_sse2+0x457> + DB 68,15,40,29,42,62,0,0 ; movaps 0x3e2a(%rip),%xmm11 # 5a50 <_sk_callback_sse2+0x458> DB 69,15,88,251 ; addps %xmm11,%xmm15 - DB 68,15,40,37,45,62,0,0 ; movaps 0x3e2d(%rip),%xmm12 # 5a90 <_sk_callback_sse2+0x467> + DB 68,15,40,37,46,62,0,0 ; movaps 0x3e2e(%rip),%xmm12 # 5a60 <_sk_callback_sse2+0x468> DB 69,15,88,236 ; addps %xmm12,%xmm13 DB 69,15,83,237 ; rcpps %xmm13,%xmm13 DB 69,15,89,239 ; mulps %xmm15,%xmm13 - DB 68,15,40,61,41,62,0,0 ; movaps 0x3e29(%rip),%xmm15 # 5aa0 <_sk_callback_sse2+0x477> + DB 68,15,40,61,42,62,0,0 ; movaps 0x3e2a(%rip),%xmm15 # 5a70 <_sk_callback_sse2+0x478> DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0 DB 68,15,84,240 ; andps %xmm0,%xmm14 DB 65,15,85,197 ; andnps %xmm13,%xmm0 @@ -21197,7 +21135,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC DB 68,15,93,218 ; minps %xmm2,%xmm11 DB 65,15,40,202 ; movaps %xmm10,%xmm1 DB 65,15,92,203 ; subps %xmm11,%xmm1 - DB 68,15,40,45,130,61,0,0 ; movaps 0x3d82(%rip),%xmm13 # 5ab0 <_sk_callback_sse2+0x487> + DB 68,15,40,45,131,61,0,0 ; movaps 0x3d83(%rip),%xmm13 # 5a80 <_sk_callback_sse2+0x488> DB 68,15,94,233 ; divps %xmm1,%xmm13 DB 65,15,40,194 ; movaps %xmm10,%xmm0 DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0 @@ -21206,30 +21144,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,40,241 ; movaps %xmm9,%xmm14 DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14 - DB 68,15,84,53,104,61,0,0 ; andps 0x3d68(%rip),%xmm14 # 5ac0 <_sk_callback_sse2+0x497> + DB 68,15,84,53,105,61,0,0 ; andps 0x3d69(%rip),%xmm14 # 5a90 <_sk_callback_sse2+0x498> DB 69,15,88,244 ; addps %xmm12,%xmm14 DB 69,15,40,250 ; movaps %xmm10,%xmm15 DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15 DB 65,15,92,208 ; subps %xmm8,%xmm2 DB 65,15,89,213 ; mulps %xmm13,%xmm2 - DB 68,15,40,37,91,61,0,0 ; movaps 0x3d5b(%rip),%xmm12 # 5ad0 <_sk_callback_sse2+0x4a7> + DB 68,15,40,37,92,61,0,0 ; movaps 0x3d5c(%rip),%xmm12 # 5aa0 <_sk_callback_sse2+0x4a8> DB 65,15,88,212 ; addps %xmm12,%xmm2 DB 69,15,92,193 ; subps %xmm9,%xmm8 DB 69,15,89,197 ; mulps %xmm13,%xmm8 - DB 68,15,88,5,87,61,0,0 ; addps 0x3d57(%rip),%xmm8 # 5ae0 <_sk_callback_sse2+0x4b7> + DB 68,15,88,5,88,61,0,0 ; addps 0x3d58(%rip),%xmm8 # 5ab0 <_sk_callback_sse2+0x4b8> DB 65,15,84,215 ; andps %xmm15,%xmm2 DB 69,15,85,248 ; andnps %xmm8,%xmm15 DB 68,15,86,250 ; orps %xmm2,%xmm15 DB 68,15,84,240 ; andps %xmm0,%xmm14 DB 65,15,85,199 ; andnps %xmm15,%xmm0 DB 65,15,86,198 ; orps %xmm14,%xmm0 - DB 15,89,5,72,61,0,0 ; mulps 0x3d48(%rip),%xmm0 # 5af0 <_sk_callback_sse2+0x4c7> + DB 15,89,5,73,61,0,0 ; mulps 0x3d49(%rip),%xmm0 # 5ac0 <_sk_callback_sse2+0x4c8> DB 69,15,40,194 ; movaps %xmm10,%xmm8 DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8 DB 65,15,84,192 ; andps %xmm8,%xmm0 DB 69,15,92,226 ; subps %xmm10,%xmm12 DB 69,15,88,211 ; addps %xmm11,%xmm10 - DB 68,15,40,13,59,61,0,0 ; movaps 0x3d3b(%rip),%xmm9 # 5b00 <_sk_callback_sse2+0x4d7> + DB 68,15,40,13,60,61,0,0 ; movaps 0x3d3c(%rip),%xmm9 # 5ad0 <_sk_callback_sse2+0x4d8> DB 65,15,40,210 ; movaps %xmm10,%xmm2 DB 65,15,89,209 ; mulps %xmm9,%xmm2 DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9 @@ -21252,7 +21190,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp) DB 68,15,40,218 ; movaps %xmm2,%xmm11 DB 15,40,240 ; movaps %xmm0,%xmm6 - DB 68,15,40,13,246,60,0,0 ; movaps 0x3cf6(%rip),%xmm9 # 5b10 <_sk_callback_sse2+0x4e7> + DB 68,15,40,13,247,60,0,0 ; movaps 0x3cf7(%rip),%xmm9 # 5ae0 <_sk_callback_sse2+0x4e8> DB 69,15,40,209 ; movaps %xmm9,%xmm10 DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10 DB 15,40,193 ; movaps %xmm1,%xmm0 @@ -21269,28 +21207,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 69,15,88,211 ; addps %xmm11,%xmm10 DB 69,15,88,219 ; addps %xmm11,%xmm11 DB 69,15,92,218 ; subps %xmm10,%xmm11 - DB 15,40,5,192,60,0,0 ; movaps 0x3cc0(%rip),%xmm0 # 5b20 <_sk_callback_sse2+0x4f7> + DB 15,40,5,193,60,0,0 ; movaps 0x3cc1(%rip),%xmm0 # 5af0 <_sk_callback_sse2+0x4f8> DB 15,88,198 ; addps %xmm6,%xmm0 DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 DB 15,40,216 ; movaps %xmm0,%xmm3 DB 15,194,217,1 ; cmpltps %xmm1,%xmm3 - DB 15,84,29,184,60,0,0 ; andps 0x3cb8(%rip),%xmm3 # 5b30 <_sk_callback_sse2+0x507> + DB 15,84,29,185,60,0,0 ; andps 0x3cb9(%rip),%xmm3 # 5b00 <_sk_callback_sse2+0x508> DB 15,92,203 ; subps %xmm3,%xmm1 DB 15,92,193 ; subps %xmm1,%xmm0 - DB 68,15,40,45,186,60,0,0 ; movaps 0x3cba(%rip),%xmm13 # 5b40 <_sk_callback_sse2+0x517> + DB 68,15,40,45,187,60,0,0 ; movaps 0x3cbb(%rip),%xmm13 # 5b10 <_sk_callback_sse2+0x518> DB 69,15,40,197 ; movaps %xmm13,%xmm8 DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8 DB 69,15,40,242 ; movaps %xmm10,%xmm14 DB 69,15,92,243 ; subps %xmm11,%xmm14 DB 65,15,40,217 ; movaps %xmm9,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 - DB 15,40,21,202,60,0,0 ; movaps 0x3cca(%rip),%xmm2 # 5b70 <_sk_callback_sse2+0x547> + DB 15,40,21,203,60,0,0 ; movaps 0x3ccb(%rip),%xmm2 # 5b40 <_sk_callback_sse2+0x548> DB 68,15,40,250 ; movaps %xmm2,%xmm15 DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15 - DB 15,40,13,154,60,0,0 ; movaps 0x3c9a(%rip),%xmm1 # 5b50 <_sk_callback_sse2+0x527> + DB 15,40,13,155,60,0,0 ; movaps 0x3c9b(%rip),%xmm1 # 5b20 <_sk_callback_sse2+0x528> DB 15,89,193 ; mulps %xmm1,%xmm0 - DB 15,40,45,160,60,0,0 ; movaps 0x3ca0(%rip),%xmm5 # 5b60 <_sk_callback_sse2+0x537> + DB 15,40,45,161,60,0,0 ; movaps 0x3ca1(%rip),%xmm5 # 5b30 <_sk_callback_sse2+0x538> DB 15,40,229 ; movaps %xmm5,%xmm4 DB 15,92,224 ; subps %xmm0,%xmm4 DB 65,15,89,230 ; mulps %xmm14,%xmm4 @@ -21313,7 +21251,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 15,40,222 ; movaps %xmm6,%xmm3 DB 15,194,216,1 ; cmpltps %xmm0,%xmm3 - DB 15,84,29,21,60,0,0 ; andps 0x3c15(%rip),%xmm3 # 5b30 <_sk_callback_sse2+0x507> + DB 15,84,29,22,60,0,0 ; andps 0x3c16(%rip),%xmm3 # 5b00 <_sk_callback_sse2+0x508> DB 15,92,195 ; subps %xmm3,%xmm0 DB 68,15,40,230 ; movaps %xmm6,%xmm12 DB 68,15,92,224 ; subps %xmm0,%xmm12 @@ -21343,12 +21281,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC DB 15,40,60,36 ; movaps (%rsp),%xmm7 DB 15,40,231 ; movaps %xmm7,%xmm4 DB 15,85,227 ; andnps %xmm3,%xmm4 - DB 15,88,53,238,59,0,0 ; addps 0x3bee(%rip),%xmm6 # 5b80 <_sk_callback_sse2+0x557> + DB 15,88,53,239,59,0,0 ; addps 0x3bef(%rip),%xmm6 # 5b50 <_sk_callback_sse2+0x558> DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 DB 15,40,222 ; movaps %xmm6,%xmm3 DB 15,194,216,1 ; cmpltps %xmm0,%xmm3 - DB 15,84,29,137,59,0,0 ; andps 0x3b89(%rip),%xmm3 # 5b30 <_sk_callback_sse2+0x507> + DB 15,84,29,138,59,0,0 ; andps 0x3b8a(%rip),%xmm3 # 5b00 <_sk_callback_sse2+0x508> DB 15,92,195 ; subps %xmm3,%xmm0 DB 15,92,240 ; subps %xmm0,%xmm6 DB 15,89,206 ; mulps %xmm6,%xmm1 @@ -21405,13 +21343,13 @@ _sk_scale_u8_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,61 ; jne 209e <_sk_scale_u8_sse2+0x47> + DB 117,61 ; jne 206d <_sk_scale_u8_sse2+0x47> DB 102,69,15,110,4,18 ; movd (%r10,%rdx,1),%xmm8 DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8 DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 - DB 102,68,15,219,5,22,59,0,0 ; pand 0x3b16(%rip),%xmm8 # 5b90 <_sk_callback_sse2+0x567> + DB 102,68,15,219,5,23,59,0,0 ; pand 0x3b17(%rip),%xmm8 # 5b60 <_sk_callback_sse2+0x568> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,26,59,0,0 ; mulps 0x3b1a(%rip),%xmm8 # 5ba0 <_sk_callback_sse2+0x577> + DB 68,15,89,5,27,59,0,0 ; mulps 0x3b1b(%rip),%xmm8 # 5b70 <_sk_callback_sse2+0x578> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 65,15,89,208 ; mulps %xmm8,%xmm2 @@ -21422,12 +21360,12 @@ _sk_scale_u8_sse2 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,61 ; je 20e8 <_sk_scale_u8_sse2+0x91> + DB 116,61 ; je 20b7 <_sk_scale_u8_sse2+0x91> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,23 ; je 20cd <_sk_scale_u8_sse2+0x76> + DB 116,23 ; je 209c <_sk_scale_u8_sse2+0x76> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,181 ; jne 2071 <_sk_scale_u8_sse2+0x1a> + DB 117,181 ; jne 2040 <_sk_scale_u8_sse2+0x1a> DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8 @@ -21436,10 +21374,10 @@ _sk_scale_u8_sse2 LABEL PROC DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9 DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 DB 242,69,15,16,193 ; movsd %xmm9,%xmm8 - DB 235,137 ; jmp 2071 <_sk_scale_u8_sse2+0x1a> + DB 235,137 ; jmp 2040 <_sk_scale_u8_sse2+0x1a> DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 233,122,255,255,255 ; jmpq 2071 <_sk_scale_u8_sse2+0x1a> + DB 233,122,255,255,255 ; jmpq 2040 <_sk_scale_u8_sse2+0x1a> PUBLIC _sk_lerp_1_float_sse2 _sk_lerp_1_float_sse2 LABEL PROC @@ -21466,13 +21404,13 @@ _sk_lerp_u8_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,81 ; jne 218a <_sk_lerp_u8_sse2+0x5b> + DB 117,81 ; jne 2159 <_sk_lerp_u8_sse2+0x5b> DB 102,69,15,110,4,18 ; movd (%r10,%rdx,1),%xmm8 DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8 DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 - DB 102,68,15,219,5,94,58,0,0 ; pand 0x3a5e(%rip),%xmm8 # 5bb0 <_sk_callback_sse2+0x587> + DB 102,68,15,219,5,95,58,0,0 ; pand 0x3a5f(%rip),%xmm8 # 5b80 <_sk_callback_sse2+0x588> DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,98,58,0,0 ; mulps 0x3a62(%rip),%xmm8 # 5bc0 <_sk_callback_sse2+0x597> + DB 68,15,89,5,99,58,0,0 ; mulps 0x3a63(%rip),%xmm8 # 5b90 <_sk_callback_sse2+0x598> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -21490,12 +21428,12 @@ _sk_lerp_u8_sse2 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,64 ; je 21d7 <_sk_lerp_u8_sse2+0xa8> + DB 116,64 ; je 21a6 <_sk_lerp_u8_sse2+0xa8> DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,23 ; je 21b9 <_sk_lerp_u8_sse2+0x8a> + DB 116,23 ; je 2188 <_sk_lerp_u8_sse2+0x8a> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,161 ; jne 2149 <_sk_lerp_u8_sse2+0x1a> + DB 117,161 ; jne 2118 <_sk_lerp_u8_sse2+0x1a> DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8 @@ -21504,30 +21442,30 @@ _sk_lerp_u8_sse2 LABEL PROC DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9 DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 DB 242,69,15,16,193 ; movsd %xmm9,%xmm8 - DB 233,114,255,255,255 ; jmpq 2149 <_sk_lerp_u8_sse2+0x1a> + DB 233,114,255,255,255 ; jmpq 2118 <_sk_lerp_u8_sse2+0x1a> DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 233,99,255,255,255 ; jmpq 2149 <_sk_lerp_u8_sse2+0x1a> + DB 233,99,255,255,255 ; jmpq 2118 <_sk_lerp_u8_sse2+0x1a> PUBLIC _sk_lerp_565_sse2 _sk_lerp_565_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,156,0,0,0 ; jne 2290 <_sk_lerp_565_sse2+0xaa> + DB 15,133,156,0,0,0 ; jne 225f <_sk_lerp_565_sse2+0xaa> DB 243,69,15,126,12,82 ; movq (%r10,%rdx,2),%xmm9 DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9 - DB 102,68,15,111,5,200,57,0,0 ; movdqa 0x39c8(%rip),%xmm8 # 5bd0 <_sk_callback_sse2+0x5a7> + DB 102,68,15,111,5,201,57,0,0 ; movdqa 0x39c9(%rip),%xmm8 # 5ba0 <_sk_callback_sse2+0x5a8> DB 102,69,15,219,193 ; pand %xmm9,%xmm8 DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 - DB 68,15,89,5,199,57,0,0 ; mulps 0x39c7(%rip),%xmm8 # 5be0 <_sk_callback_sse2+0x5b7> - DB 102,68,15,111,21,206,57,0,0 ; movdqa 0x39ce(%rip),%xmm10 # 5bf0 <_sk_callback_sse2+0x5c7> + DB 68,15,89,5,200,57,0,0 ; mulps 0x39c8(%rip),%xmm8 # 5bb0 <_sk_callback_sse2+0x5b8> + DB 102,68,15,111,21,207,57,0,0 ; movdqa 0x39cf(%rip),%xmm10 # 5bc0 <_sk_callback_sse2+0x5c8> DB 102,69,15,219,209 ; pand %xmm9,%xmm10 DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 - DB 68,15,89,21,205,57,0,0 ; mulps 0x39cd(%rip),%xmm10 # 5c00 <_sk_callback_sse2+0x5d7> - DB 102,68,15,219,13,212,57,0,0 ; pand 0x39d4(%rip),%xmm9 # 5c10 <_sk_callback_sse2+0x5e7> + DB 68,15,89,21,206,57,0,0 ; mulps 0x39ce(%rip),%xmm10 # 5bd0 <_sk_callback_sse2+0x5d8> + DB 102,68,15,219,13,213,57,0,0 ; pand 0x39d5(%rip),%xmm9 # 5be0 <_sk_callback_sse2+0x5e8> DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9 - DB 68,15,89,13,216,57,0,0 ; mulps 0x39d8(%rip),%xmm9 # 5c20 <_sk_callback_sse2+0x5f7> + DB 68,15,89,13,217,57,0,0 ; mulps 0x39d9(%rip),%xmm9 # 5bf0 <_sk_callback_sse2+0x5f8> DB 15,92,196 ; subps %xmm4,%xmm0 DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 15,88,196 ; addps %xmm4,%xmm0 @@ -21552,34 +21490,34 @@ _sk_lerp_565_sse2 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,59 ; je 22d8 <_sk_lerp_565_sse2+0xf2> + DB 116,59 ; je 22a7 <_sk_lerp_565_sse2+0xf2> DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,27 ; je 22c3 <_sk_lerp_565_sse2+0xdd> + DB 116,27 ; je 2292 <_sk_lerp_565_sse2+0xdd> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 15,133,77,255,255,255 ; jne 21ff <_sk_lerp_565_sse2+0x19> + DB 15,133,77,255,255,255 ; jne 21ce <_sk_lerp_565_sse2+0x19> DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 102,69,15,112,200,69 ; pshufd $0x45,%xmm8,%xmm9 DB 102,69,15,110,4,82 ; movd (%r10,%rdx,2),%xmm8 DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8 DB 242,69,15,16,200 ; movsd %xmm8,%xmm9 - DB 233,39,255,255,255 ; jmpq 21ff <_sk_lerp_565_sse2+0x19> + DB 233,39,255,255,255 ; jmpq 21ce <_sk_lerp_565_sse2+0x19> DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax DB 102,68,15,110,200 ; movd %eax,%xmm9 - DB 233,24,255,255,255 ; jmpq 21ff <_sk_lerp_565_sse2+0x19> + DB 233,24,255,255,255 ; jmpq 21ce <_sk_lerp_565_sse2+0x19> PUBLIC _sk_load_tables_sse2 _sk_load_tables_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 77,133,192 ; test %r8,%r8 - DB 15,133,36,1,0,0 ; jne 2419 <_sk_load_tables_sse2+0x132> + DB 15,133,36,1,0,0 ; jne 23e8 <_sk_load_tables_sse2+0x132> DB 243,69,15,111,12,145 ; movdqu (%r9,%rdx,4),%xmm9 DB 65,87 ; push %r15 DB 65,86 ; push %r14 DB 83 ; push %rbx - DB 102,68,15,111,5,39,57,0,0 ; movdqa 0x3927(%rip),%xmm8 # 5c30 <_sk_callback_sse2+0x607> + DB 102,68,15,111,5,40,57,0,0 ; movdqa 0x3928(%rip),%xmm8 # 5c00 <_sk_callback_sse2+0x608> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 @@ -21635,7 +21573,7 @@ _sk_load_tables_sse2 LABEL PROC DB 65,15,20,208 ; unpcklps %xmm8,%xmm2 DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9 DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3 - DB 15,89,29,48,56,0,0 ; mulps 0x3830(%rip),%xmm3 # 5c40 <_sk_callback_sse2+0x617> + DB 15,89,29,49,56,0,0 ; mulps 0x3831(%rip),%xmm3 # 5c10 <_sk_callback_sse2+0x618> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -21644,18 +21582,18 @@ _sk_load_tables_sse2 LABEL PROC DB 69,137,194 ; mov %r8d,%r10d DB 65,128,226,3 ; and $0x3,%r10b DB 65,128,250,1 ; cmp $0x1,%r10b - DB 116,45 ; je 2453 <_sk_load_tables_sse2+0x16c> + DB 116,45 ; je 2422 <_sk_load_tables_sse2+0x16c> DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 65,128,250,2 ; cmp $0x2,%r10b - DB 116,23 ; je 2448 <_sk_load_tables_sse2+0x161> + DB 116,23 ; je 2417 <_sk_load_tables_sse2+0x161> DB 65,128,250,3 ; cmp $0x3,%r10b - DB 15,133,192,254,255,255 ; jne 22fb <_sk_load_tables_sse2+0x14> + DB 15,133,192,254,255,255 ; jne 22ca <_sk_load_tables_sse2+0x14> DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0 DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9 DB 102,69,15,18,12,145 ; movlpd (%r9,%rdx,4),%xmm9 - DB 233,168,254,255,255 ; jmpq 22fb <_sk_load_tables_sse2+0x14> + DB 233,168,254,255,255 ; jmpq 22ca <_sk_load_tables_sse2+0x14> DB 102,69,15,110,12,145 ; movd (%r9,%rdx,4),%xmm9 - DB 233,157,254,255,255 ; jmpq 22fb <_sk_load_tables_sse2+0x14> + DB 233,157,254,255,255 ; jmpq 22ca <_sk_load_tables_sse2+0x14> PUBLIC _sk_load_tables_u16_be_sse2 _sk_load_tables_u16_be_sse2 LABEL PROC @@ -21663,7 +21601,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,101,1,0,0 ; jne 25d9 <_sk_load_tables_u16_be_sse2+0x17b> + DB 15,133,101,1,0,0 ; jne 25a8 <_sk_load_tables_u16_be_sse2+0x17b> DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0 DB 102,67,15,16,76,81,16 ; movupd 0x10(%r9,%r10,2),%xmm1 DB 65,87 ; push %r15 @@ -21675,7 +21613,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9 - DB 102,68,15,111,21,165,55,0,0 ; movdqa 0x37a5(%rip),%xmm10 # 5c50 <_sk_callback_sse2+0x627> + DB 102,68,15,111,21,166,55,0,0 ; movdqa 0x37a6(%rip),%xmm10 # 5c20 <_sk_callback_sse2+0x628> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,194 ; pand %xmm10,%xmm0 DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 @@ -21737,7 +21675,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 102,65,15,235,217 ; por %xmm9,%xmm3 DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3 DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,144,54,0,0 ; mulps 0x3690(%rip),%xmm3 # 5c60 <_sk_callback_sse2+0x637> + DB 15,89,29,145,54,0,0 ; mulps 0x3691(%rip),%xmm3 # 5c30 <_sk_callback_sse2+0x638> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 65,94 ; pop %r14 @@ -21745,17 +21683,17 @@ _sk_load_tables_u16_be_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,17 ; jne 25f6 <_sk_load_tables_u16_be_sse2+0x198> + DB 117,17 ; jne 25c5 <_sk_load_tables_u16_be_sse2+0x198> DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 - DB 233,139,254,255,255 ; jmpq 2481 <_sk_load_tables_u16_be_sse2+0x23> + DB 233,139,254,255,255 ; jmpq 2450 <_sk_load_tables_u16_be_sse2+0x23> DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,118,254,255,255 ; jb 2481 <_sk_load_tables_u16_be_sse2+0x23> + DB 15,130,118,254,255,255 ; jb 2450 <_sk_load_tables_u16_be_sse2+0x23> DB 242,67,15,16,76,81,16 ; movsd 0x10(%r9,%r10,2),%xmm1 - DB 233,106,254,255,255 ; jmpq 2481 <_sk_load_tables_u16_be_sse2+0x23> + DB 233,106,254,255,255 ; jmpq 2450 <_sk_load_tables_u16_be_sse2+0x23> PUBLIC _sk_load_tables_rgb_u16_be_sse2 _sk_load_tables_rgb_u16_be_sse2 LABEL PROC @@ -21763,7 +21701,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10 DB 77,133,192 ; test %r8,%r8 - DB 15,133,84,1,0,0 ; jne 277d <_sk_load_tables_rgb_u16_be_sse2+0x166> + DB 15,133,84,1,0,0 ; jne 274c <_sk_load_tables_rgb_u16_be_sse2+0x166> DB 243,71,15,111,28,81 ; movdqu (%r9,%r10,2),%xmm11 DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1 DB 102,15,115,217,4 ; psrldq $0x4,%xmm1 @@ -21778,7 +21716,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10 DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0 DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0 - DB 102,68,15,111,5,255,53,0,0 ; movdqa 0x35ff(%rip),%xmm8 # 5c70 <_sk_callback_sse2+0x647> + DB 102,68,15,111,5,0,54,0,0 ; movdqa 0x3600(%rip),%xmm8 # 5c40 <_sk_callback_sse2+0x648> DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 DB 102,65,15,219,192 ; pand %xmm8,%xmm0 DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 @@ -21834,7 +21772,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 15,20,211 ; unpcklps %xmm3,%xmm2 DB 65,15,20,208 ; unpcklps %xmm8,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,10,53,0,0 ; movaps 0x350a(%rip),%xmm3 # 5c80 <_sk_callback_sse2+0x657> + DB 15,40,29,11,53,0,0 ; movaps 0x350b(%rip),%xmm3 # 5c50 <_sk_callback_sse2+0x658> DB 91 ; pop %rbx DB 65,94 ; pop %r14 DB 65,95 ; pop %r15 @@ -21843,21 +21781,21 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC DB 102,71,15,196,92,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm11 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,14 ; jne 27a3 <_sk_load_tables_rgb_u16_be_sse2+0x18c> + DB 117,14 ; jne 2772 <_sk_load_tables_rgb_u16_be_sse2+0x18c> DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 - DB 233,172,254,255,255 ; jmpq 264f <_sk_load_tables_rgb_u16_be_sse2+0x38> + DB 233,172,254,255,255 ; jmpq 261e <_sk_load_tables_rgb_u16_be_sse2+0x38> DB 102,71,15,110,84,81,6 ; movd 0x6(%r9,%r10,2),%xmm10 DB 102,71,15,196,84,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm10 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,24 ; jb 27d4 <_sk_load_tables_rgb_u16_be_sse2+0x1bd> + DB 114,24 ; jb 27a3 <_sk_load_tables_rgb_u16_be_sse2+0x1bd> DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1 DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,123,254,255,255 ; jmpq 264f <_sk_load_tables_rgb_u16_be_sse2+0x38> + DB 233,123,254,255,255 ; jmpq 261e <_sk_load_tables_rgb_u16_be_sse2+0x38> DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,114,254,255,255 ; jmpq 264f <_sk_load_tables_rgb_u16_be_sse2+0x38> + DB 233,114,254,255,255 ; jmpq 261e <_sk_load_tables_rgb_u16_be_sse2+0x38> PUBLIC _sk_byte_tables_sse2 _sk_byte_tables_sse2 LABEL PROC @@ -21866,7 +21804,7 @@ _sk_byte_tables_sse2 LABEL PROC DB 65,86 ; push %r14 DB 83 ; push %rbx DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,163,52,0,0 ; movaps 0x34a3(%rip),%xmm8 # 5c90 <_sk_callback_sse2+0x667> + DB 68,15,40,5,164,52,0,0 ; movaps 0x34a4(%rip),%xmm8 # 5c60 <_sk_callback_sse2+0x668> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0 DB 102,73,15,126,193 ; movq %xmm0,%r9 @@ -21894,7 +21832,7 @@ _sk_byte_tables_sse2 LABEL PROC DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0 DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,21,61,52,0,0 ; movaps 0x343d(%rip),%xmm10 # 5ca0 <_sk_callback_sse2+0x677> + DB 68,15,40,21,62,52,0,0 ; movaps 0x343e(%rip),%xmm10 # 5c70 <_sk_callback_sse2+0x678> DB 65,15,89,194 ; mulps %xmm10,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -22013,7 +21951,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0 DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,21,133,50,0,0 ; movaps 0x3285(%rip),%xmm10 # 5cb0 <_sk_callback_sse2+0x687> + DB 68,15,40,21,134,50,0,0 ; movaps 0x3286(%rip),%xmm10 # 5c80 <_sk_callback_sse2+0x688> DB 65,15,89,194 ; mulps %xmm10,%xmm0 DB 65,15,89,200 ; mulps %xmm8,%xmm1 DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1 @@ -22210,15 +22148,15 @@ _sk_parametric_r_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,185,47,0,0 ; mulps 0x2fb9(%rip),%xmm9 # 5cc0 <_sk_callback_sse2+0x697> - DB 68,15,84,21,193,47,0,0 ; andps 0x2fc1(%rip),%xmm10 # 5cd0 <_sk_callback_sse2+0x6a7> - DB 68,15,86,21,201,47,0,0 ; orps 0x2fc9(%rip),%xmm10 # 5ce0 <_sk_callback_sse2+0x6b7> - DB 68,15,88,13,209,47,0,0 ; addps 0x2fd1(%rip),%xmm9 # 5cf0 <_sk_callback_sse2+0x6c7> - DB 68,15,40,37,217,47,0,0 ; movaps 0x2fd9(%rip),%xmm12 # 5d00 <_sk_callback_sse2+0x6d7> + DB 68,15,89,13,186,47,0,0 ; mulps 0x2fba(%rip),%xmm9 # 5c90 <_sk_callback_sse2+0x698> + DB 68,15,84,21,194,47,0,0 ; andps 0x2fc2(%rip),%xmm10 # 5ca0 <_sk_callback_sse2+0x6a8> + DB 68,15,86,21,202,47,0,0 ; orps 0x2fca(%rip),%xmm10 # 5cb0 <_sk_callback_sse2+0x6b8> + DB 68,15,88,13,210,47,0,0 ; addps 0x2fd2(%rip),%xmm9 # 5cc0 <_sk_callback_sse2+0x6c8> + DB 68,15,40,37,218,47,0,0 ; movaps 0x2fda(%rip),%xmm12 # 5cd0 <_sk_callback_sse2+0x6d8> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,217,47,0,0 ; addps 0x2fd9(%rip),%xmm10 # 5d10 <_sk_callback_sse2+0x6e7> - DB 68,15,40,37,225,47,0,0 ; movaps 0x2fe1(%rip),%xmm12 # 5d20 <_sk_callback_sse2+0x6f7> + DB 68,15,88,21,218,47,0,0 ; addps 0x2fda(%rip),%xmm10 # 5ce0 <_sk_callback_sse2+0x6e8> + DB 68,15,40,37,226,47,0,0 ; movaps 0x2fe2(%rip),%xmm12 # 5cf0 <_sk_callback_sse2+0x6f8> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -22226,22 +22164,22 @@ _sk_parametric_r_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,203,47,0,0 ; movaps 0x2fcb(%rip),%xmm10 # 5d30 <_sk_callback_sse2+0x707> + DB 68,15,40,21,204,47,0,0 ; movaps 0x2fcc(%rip),%xmm10 # 5d00 <_sk_callback_sse2+0x708> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,191,47,0,0 ; addps 0x2fbf(%rip),%xmm9 # 5d40 <_sk_callback_sse2+0x717> - DB 68,15,40,37,199,47,0,0 ; movaps 0x2fc7(%rip),%xmm12 # 5d50 <_sk_callback_sse2+0x727> + DB 68,15,88,13,192,47,0,0 ; addps 0x2fc0(%rip),%xmm9 # 5d10 <_sk_callback_sse2+0x718> + DB 68,15,40,37,200,47,0,0 ; movaps 0x2fc8(%rip),%xmm12 # 5d20 <_sk_callback_sse2+0x728> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,199,47,0,0 ; movaps 0x2fc7(%rip),%xmm12 # 5d60 <_sk_callback_sse2+0x737> + DB 68,15,40,37,200,47,0,0 ; movaps 0x2fc8(%rip),%xmm12 # 5d30 <_sk_callback_sse2+0x738> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,203,47,0,0 ; movaps 0x2fcb(%rip),%xmm13 # 5d70 <_sk_callback_sse2+0x747> + DB 68,15,40,45,204,47,0,0 ; movaps 0x2fcc(%rip),%xmm13 # 5d40 <_sk_callback_sse2+0x748> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,203,47,0,0 ; mulps 0x2fcb(%rip),%xmm13 # 5d80 <_sk_callback_sse2+0x757> + DB 68,15,89,45,204,47,0,0 ; mulps 0x2fcc(%rip),%xmm13 # 5d50 <_sk_callback_sse2+0x758> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -22275,15 +22213,15 @@ _sk_parametric_g_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,75,47,0,0 ; mulps 0x2f4b(%rip),%xmm9 # 5d90 <_sk_callback_sse2+0x767> - DB 68,15,84,21,83,47,0,0 ; andps 0x2f53(%rip),%xmm10 # 5da0 <_sk_callback_sse2+0x777> - DB 68,15,86,21,91,47,0,0 ; orps 0x2f5b(%rip),%xmm10 # 5db0 <_sk_callback_sse2+0x787> - DB 68,15,88,13,99,47,0,0 ; addps 0x2f63(%rip),%xmm9 # 5dc0 <_sk_callback_sse2+0x797> - DB 68,15,40,37,107,47,0,0 ; movaps 0x2f6b(%rip),%xmm12 # 5dd0 <_sk_callback_sse2+0x7a7> + DB 68,15,89,13,76,47,0,0 ; mulps 0x2f4c(%rip),%xmm9 # 5d60 <_sk_callback_sse2+0x768> + DB 68,15,84,21,84,47,0,0 ; andps 0x2f54(%rip),%xmm10 # 5d70 <_sk_callback_sse2+0x778> + DB 68,15,86,21,92,47,0,0 ; orps 0x2f5c(%rip),%xmm10 # 5d80 <_sk_callback_sse2+0x788> + DB 68,15,88,13,100,47,0,0 ; addps 0x2f64(%rip),%xmm9 # 5d90 <_sk_callback_sse2+0x798> + DB 68,15,40,37,108,47,0,0 ; movaps 0x2f6c(%rip),%xmm12 # 5da0 <_sk_callback_sse2+0x7a8> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,107,47,0,0 ; addps 0x2f6b(%rip),%xmm10 # 5de0 <_sk_callback_sse2+0x7b7> - DB 68,15,40,37,115,47,0,0 ; movaps 0x2f73(%rip),%xmm12 # 5df0 <_sk_callback_sse2+0x7c7> + DB 68,15,88,21,108,47,0,0 ; addps 0x2f6c(%rip),%xmm10 # 5db0 <_sk_callback_sse2+0x7b8> + DB 68,15,40,37,116,47,0,0 ; movaps 0x2f74(%rip),%xmm12 # 5dc0 <_sk_callback_sse2+0x7c8> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -22291,22 +22229,22 @@ _sk_parametric_g_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,93,47,0,0 ; movaps 0x2f5d(%rip),%xmm10 # 5e00 <_sk_callback_sse2+0x7d7> + DB 68,15,40,21,94,47,0,0 ; movaps 0x2f5e(%rip),%xmm10 # 5dd0 <_sk_callback_sse2+0x7d8> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,81,47,0,0 ; addps 0x2f51(%rip),%xmm9 # 5e10 <_sk_callback_sse2+0x7e7> - DB 68,15,40,37,89,47,0,0 ; movaps 0x2f59(%rip),%xmm12 # 5e20 <_sk_callback_sse2+0x7f7> + DB 68,15,88,13,82,47,0,0 ; addps 0x2f52(%rip),%xmm9 # 5de0 <_sk_callback_sse2+0x7e8> + DB 68,15,40,37,90,47,0,0 ; movaps 0x2f5a(%rip),%xmm12 # 5df0 <_sk_callback_sse2+0x7f8> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,89,47,0,0 ; movaps 0x2f59(%rip),%xmm12 # 5e30 <_sk_callback_sse2+0x807> + DB 68,15,40,37,90,47,0,0 ; movaps 0x2f5a(%rip),%xmm12 # 5e00 <_sk_callback_sse2+0x808> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,93,47,0,0 ; movaps 0x2f5d(%rip),%xmm13 # 5e40 <_sk_callback_sse2+0x817> + DB 68,15,40,45,94,47,0,0 ; movaps 0x2f5e(%rip),%xmm13 # 5e10 <_sk_callback_sse2+0x818> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,93,47,0,0 ; mulps 0x2f5d(%rip),%xmm13 # 5e50 <_sk_callback_sse2+0x827> + DB 68,15,89,45,94,47,0,0 ; mulps 0x2f5e(%rip),%xmm13 # 5e20 <_sk_callback_sse2+0x828> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -22340,15 +22278,15 @@ _sk_parametric_b_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,221,46,0,0 ; mulps 0x2edd(%rip),%xmm9 # 5e60 <_sk_callback_sse2+0x837> - DB 68,15,84,21,229,46,0,0 ; andps 0x2ee5(%rip),%xmm10 # 5e70 <_sk_callback_sse2+0x847> - DB 68,15,86,21,237,46,0,0 ; orps 0x2eed(%rip),%xmm10 # 5e80 <_sk_callback_sse2+0x857> - DB 68,15,88,13,245,46,0,0 ; addps 0x2ef5(%rip),%xmm9 # 5e90 <_sk_callback_sse2+0x867> - DB 68,15,40,37,253,46,0,0 ; movaps 0x2efd(%rip),%xmm12 # 5ea0 <_sk_callback_sse2+0x877> + DB 68,15,89,13,222,46,0,0 ; mulps 0x2ede(%rip),%xmm9 # 5e30 <_sk_callback_sse2+0x838> + DB 68,15,84,21,230,46,0,0 ; andps 0x2ee6(%rip),%xmm10 # 5e40 <_sk_callback_sse2+0x848> + DB 68,15,86,21,238,46,0,0 ; orps 0x2eee(%rip),%xmm10 # 5e50 <_sk_callback_sse2+0x858> + DB 68,15,88,13,246,46,0,0 ; addps 0x2ef6(%rip),%xmm9 # 5e60 <_sk_callback_sse2+0x868> + DB 68,15,40,37,254,46,0,0 ; movaps 0x2efe(%rip),%xmm12 # 5e70 <_sk_callback_sse2+0x878> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,253,46,0,0 ; addps 0x2efd(%rip),%xmm10 # 5eb0 <_sk_callback_sse2+0x887> - DB 68,15,40,37,5,47,0,0 ; movaps 0x2f05(%rip),%xmm12 # 5ec0 <_sk_callback_sse2+0x897> + DB 68,15,88,21,254,46,0,0 ; addps 0x2efe(%rip),%xmm10 # 5e80 <_sk_callback_sse2+0x888> + DB 68,15,40,37,6,47,0,0 ; movaps 0x2f06(%rip),%xmm12 # 5e90 <_sk_callback_sse2+0x898> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -22356,22 +22294,22 @@ _sk_parametric_b_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,239,46,0,0 ; movaps 0x2eef(%rip),%xmm10 # 5ed0 <_sk_callback_sse2+0x8a7> + DB 68,15,40,21,240,46,0,0 ; movaps 0x2ef0(%rip),%xmm10 # 5ea0 <_sk_callback_sse2+0x8a8> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,227,46,0,0 ; addps 0x2ee3(%rip),%xmm9 # 5ee0 <_sk_callback_sse2+0x8b7> - DB 68,15,40,37,235,46,0,0 ; movaps 0x2eeb(%rip),%xmm12 # 5ef0 <_sk_callback_sse2+0x8c7> + DB 68,15,88,13,228,46,0,0 ; addps 0x2ee4(%rip),%xmm9 # 5eb0 <_sk_callback_sse2+0x8b8> + DB 68,15,40,37,236,46,0,0 ; movaps 0x2eec(%rip),%xmm12 # 5ec0 <_sk_callback_sse2+0x8c8> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,235,46,0,0 ; movaps 0x2eeb(%rip),%xmm12 # 5f00 <_sk_callback_sse2+0x8d7> + DB 68,15,40,37,236,46,0,0 ; movaps 0x2eec(%rip),%xmm12 # 5ed0 <_sk_callback_sse2+0x8d8> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,239,46,0,0 ; movaps 0x2eef(%rip),%xmm13 # 5f10 <_sk_callback_sse2+0x8e7> + DB 68,15,40,45,240,46,0,0 ; movaps 0x2ef0(%rip),%xmm13 # 5ee0 <_sk_callback_sse2+0x8e8> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,239,46,0,0 ; mulps 0x2eef(%rip),%xmm13 # 5f20 <_sk_callback_sse2+0x8f7> + DB 68,15,89,45,240,46,0,0 ; mulps 0x2ef0(%rip),%xmm13 # 5ef0 <_sk_callback_sse2+0x8f8> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -22405,15 +22343,15 @@ _sk_parametric_a_sse2 LABEL PROC DB 69,15,88,209 ; addps %xmm9,%xmm10 DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11 DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9 - DB 68,15,89,13,111,46,0,0 ; mulps 0x2e6f(%rip),%xmm9 # 5f30 <_sk_callback_sse2+0x907> - DB 68,15,84,21,119,46,0,0 ; andps 0x2e77(%rip),%xmm10 # 5f40 <_sk_callback_sse2+0x917> - DB 68,15,86,21,127,46,0,0 ; orps 0x2e7f(%rip),%xmm10 # 5f50 <_sk_callback_sse2+0x927> - DB 68,15,88,13,135,46,0,0 ; addps 0x2e87(%rip),%xmm9 # 5f60 <_sk_callback_sse2+0x937> - DB 68,15,40,37,143,46,0,0 ; movaps 0x2e8f(%rip),%xmm12 # 5f70 <_sk_callback_sse2+0x947> + DB 68,15,89,13,112,46,0,0 ; mulps 0x2e70(%rip),%xmm9 # 5f00 <_sk_callback_sse2+0x908> + DB 68,15,84,21,120,46,0,0 ; andps 0x2e78(%rip),%xmm10 # 5f10 <_sk_callback_sse2+0x918> + DB 68,15,86,21,128,46,0,0 ; orps 0x2e80(%rip),%xmm10 # 5f20 <_sk_callback_sse2+0x928> + DB 68,15,88,13,136,46,0,0 ; addps 0x2e88(%rip),%xmm9 # 5f30 <_sk_callback_sse2+0x938> + DB 68,15,40,37,144,46,0,0 ; movaps 0x2e90(%rip),%xmm12 # 5f40 <_sk_callback_sse2+0x948> DB 69,15,89,226 ; mulps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,88,21,143,46,0,0 ; addps 0x2e8f(%rip),%xmm10 # 5f80 <_sk_callback_sse2+0x957> - DB 68,15,40,37,151,46,0,0 ; movaps 0x2e97(%rip),%xmm12 # 5f90 <_sk_callback_sse2+0x967> + DB 68,15,88,21,144,46,0,0 ; addps 0x2e90(%rip),%xmm10 # 5f50 <_sk_callback_sse2+0x958> + DB 68,15,40,37,152,46,0,0 ; movaps 0x2e98(%rip),%xmm12 # 5f60 <_sk_callback_sse2+0x968> DB 69,15,94,226 ; divps %xmm10,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 DB 69,15,89,203 ; mulps %xmm11,%xmm9 @@ -22421,22 +22359,22 @@ _sk_parametric_a_sse2 LABEL PROC DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13 - DB 68,15,40,21,129,46,0,0 ; movaps 0x2e81(%rip),%xmm10 # 5fa0 <_sk_callback_sse2+0x977> + DB 68,15,40,21,130,46,0,0 ; movaps 0x2e82(%rip),%xmm10 # 5f70 <_sk_callback_sse2+0x978> DB 69,15,84,234 ; andps %xmm10,%xmm13 DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,229 ; subps %xmm13,%xmm12 DB 69,15,40,233 ; movaps %xmm9,%xmm13 DB 69,15,92,236 ; subps %xmm12,%xmm13 - DB 68,15,88,13,117,46,0,0 ; addps 0x2e75(%rip),%xmm9 # 5fb0 <_sk_callback_sse2+0x987> - DB 68,15,40,37,125,46,0,0 ; movaps 0x2e7d(%rip),%xmm12 # 5fc0 <_sk_callback_sse2+0x997> + DB 68,15,88,13,118,46,0,0 ; addps 0x2e76(%rip),%xmm9 # 5f80 <_sk_callback_sse2+0x988> + DB 68,15,40,37,126,46,0,0 ; movaps 0x2e7e(%rip),%xmm12 # 5f90 <_sk_callback_sse2+0x998> DB 69,15,89,229 ; mulps %xmm13,%xmm12 DB 69,15,92,204 ; subps %xmm12,%xmm9 - DB 68,15,40,37,125,46,0,0 ; movaps 0x2e7d(%rip),%xmm12 # 5fd0 <_sk_callback_sse2+0x9a7> + DB 68,15,40,37,126,46,0,0 ; movaps 0x2e7e(%rip),%xmm12 # 5fa0 <_sk_callback_sse2+0x9a8> DB 69,15,92,229 ; subps %xmm13,%xmm12 - DB 68,15,40,45,129,46,0,0 ; movaps 0x2e81(%rip),%xmm13 # 5fe0 <_sk_callback_sse2+0x9b7> + DB 68,15,40,45,130,46,0,0 ; movaps 0x2e82(%rip),%xmm13 # 5fb0 <_sk_callback_sse2+0x9b8> DB 69,15,94,236 ; divps %xmm12,%xmm13 DB 69,15,88,233 ; addps %xmm9,%xmm13 - DB 68,15,89,45,129,46,0,0 ; mulps 0x2e81(%rip),%xmm13 # 5ff0 <_sk_callback_sse2+0x9c7> + DB 68,15,89,45,130,46,0,0 ; mulps 0x2e82(%rip),%xmm13 # 5fc0 <_sk_callback_sse2+0x9c8> DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9 DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12 DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12 @@ -22451,29 +22389,29 @@ _sk_parametric_a_sse2 LABEL PROC PUBLIC _sk_lab_to_xyz_sse2 _sk_lab_to_xyz_sse2 LABEL PROC - DB 15,89,5,94,46,0,0 ; mulps 0x2e5e(%rip),%xmm0 # 6000 <_sk_callback_sse2+0x9d7> - DB 68,15,40,5,102,46,0,0 ; movaps 0x2e66(%rip),%xmm8 # 6010 <_sk_callback_sse2+0x9e7> + DB 15,89,5,95,46,0,0 ; mulps 0x2e5f(%rip),%xmm0 # 5fd0 <_sk_callback_sse2+0x9d8> + DB 68,15,40,5,103,46,0,0 ; movaps 0x2e67(%rip),%xmm8 # 5fe0 <_sk_callback_sse2+0x9e8> DB 65,15,89,200 ; mulps %xmm8,%xmm1 - DB 68,15,40,13,106,46,0,0 ; movaps 0x2e6a(%rip),%xmm9 # 6020 <_sk_callback_sse2+0x9f7> + DB 68,15,40,13,107,46,0,0 ; movaps 0x2e6b(%rip),%xmm9 # 5ff0 <_sk_callback_sse2+0x9f8> DB 65,15,88,201 ; addps %xmm9,%xmm1 DB 65,15,89,208 ; mulps %xmm8,%xmm2 DB 65,15,88,209 ; addps %xmm9,%xmm2 - DB 15,88,5,103,46,0,0 ; addps 0x2e67(%rip),%xmm0 # 6030 <_sk_callback_sse2+0xa07> - DB 15,89,5,112,46,0,0 ; mulps 0x2e70(%rip),%xmm0 # 6040 <_sk_callback_sse2+0xa17> - DB 15,89,13,121,46,0,0 ; mulps 0x2e79(%rip),%xmm1 # 6050 <_sk_callback_sse2+0xa27> + DB 15,88,5,104,46,0,0 ; addps 0x2e68(%rip),%xmm0 # 6000 <_sk_callback_sse2+0xa08> + DB 15,89,5,113,46,0,0 ; mulps 0x2e71(%rip),%xmm0 # 6010 <_sk_callback_sse2+0xa18> + DB 15,89,13,122,46,0,0 ; mulps 0x2e7a(%rip),%xmm1 # 6020 <_sk_callback_sse2+0xa28> DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,21,127,46,0,0 ; mulps 0x2e7f(%rip),%xmm2 # 6060 <_sk_callback_sse2+0xa37> + DB 15,89,21,128,46,0,0 ; mulps 0x2e80(%rip),%xmm2 # 6030 <_sk_callback_sse2+0xa38> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 68,15,92,202 ; subps %xmm2,%xmm9 DB 68,15,40,225 ; movaps %xmm1,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 DB 68,15,89,225 ; mulps %xmm1,%xmm12 - DB 15,40,21,116,46,0,0 ; movaps 0x2e74(%rip),%xmm2 # 6070 <_sk_callback_sse2+0xa47> + DB 15,40,21,117,46,0,0 ; movaps 0x2e75(%rip),%xmm2 # 6040 <_sk_callback_sse2+0xa48> DB 68,15,40,194 ; movaps %xmm2,%xmm8 DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8 - DB 68,15,40,21,115,46,0,0 ; movaps 0x2e73(%rip),%xmm10 # 6080 <_sk_callback_sse2+0xa57> + DB 68,15,40,21,116,46,0,0 ; movaps 0x2e74(%rip),%xmm10 # 6050 <_sk_callback_sse2+0xa58> DB 65,15,88,202 ; addps %xmm10,%xmm1 - DB 68,15,40,29,119,46,0,0 ; movaps 0x2e77(%rip),%xmm11 # 6090 <_sk_callback_sse2+0xa67> + DB 68,15,40,29,120,46,0,0 ; movaps 0x2e78(%rip),%xmm11 # 6060 <_sk_callback_sse2+0xa68> DB 65,15,89,203 ; mulps %xmm11,%xmm1 DB 69,15,84,224 ; andps %xmm8,%xmm12 DB 68,15,85,193 ; andnps %xmm1,%xmm8 @@ -22497,8 +22435,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC DB 15,84,194 ; andps %xmm2,%xmm0 DB 65,15,85,209 ; andnps %xmm9,%xmm2 DB 15,86,208 ; orps %xmm0,%xmm2 - DB 68,15,89,5,39,46,0,0 ; mulps 0x2e27(%rip),%xmm8 # 60a0 <_sk_callback_sse2+0xa77> - DB 15,89,21,48,46,0,0 ; mulps 0x2e30(%rip),%xmm2 # 60b0 <_sk_callback_sse2+0xa87> + DB 68,15,89,5,40,46,0,0 ; mulps 0x2e28(%rip),%xmm8 # 6070 <_sk_callback_sse2+0xa78> + DB 15,89,21,49,46,0,0 ; mulps 0x2e31(%rip),%xmm2 # 6080 <_sk_callback_sse2+0xa88> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -22508,13 +22446,13 @@ _sk_load_a8_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,46 ; jne 32c0 <_sk_load_a8_sse2+0x38> + DB 117,46 ; jne 328f <_sk_load_a8_sse2+0x38> DB 102,65,15,110,4,18 ; movd (%r10,%rdx,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 - DB 102,15,219,5,24,46,0,0 ; pand 0x2e18(%rip),%xmm0 # 60c0 <_sk_callback_sse2+0xa97> + DB 102,15,219,5,25,46,0,0 ; pand 0x2e19(%rip),%xmm0 # 6090 <_sk_callback_sse2+0xa98> DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,30,46,0,0 ; mulps 0x2e1e(%rip),%xmm3 # 60d0 <_sk_callback_sse2+0xaa7> + DB 15,89,29,31,46,0,0 ; mulps 0x2e1f(%rip),%xmm3 # 60a0 <_sk_callback_sse2+0xaa8> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 @@ -22523,12 +22461,12 @@ _sk_load_a8_sse2 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,54 ; je 3303 <_sk_load_a8_sse2+0x7b> + DB 116,54 ; je 32d2 <_sk_load_a8_sse2+0x7b> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,21 ; je 32ec <_sk_load_a8_sse2+0x64> + DB 116,21 ; je 32bb <_sk_load_a8_sse2+0x64> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,195 ; jne 32a0 <_sk_load_a8_sse2+0x18> + DB 117,195 ; jne 326f <_sk_load_a8_sse2+0x18> DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -22537,10 +22475,10 @@ _sk_load_a8_sse2 LABEL PROC DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 242,15,16,193 ; movsd %xmm1,%xmm0 - DB 235,157 ; jmp 32a0 <_sk_load_a8_sse2+0x18> + DB 235,157 ; jmp 326f <_sk_load_a8_sse2+0x18> DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,146 ; jmp 32a0 <_sk_load_a8_sse2+0x18> + DB 235,146 ; jmp 326f <_sk_load_a8_sse2+0x18> PUBLIC _sk_gather_a8_sse2 _sk_gather_a8_sse2 LABEL PROC @@ -22580,7 +22518,7 @@ _sk_gather_a8_sse2 LABEL PROC DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0 DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0 DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3 - DB 15,89,29,63,45,0,0 ; mulps 0x2d3f(%rip),%xmm3 # 60e0 <_sk_callback_sse2+0xab7> + DB 15,89,29,64,45,0,0 ; mulps 0x2d40(%rip),%xmm3 # 60b0 <_sk_callback_sse2+0xab8> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 @@ -22594,7 +22532,7 @@ _sk_store_a8_sse2 LABEL PROC DB 72,131,236,40 ; sub $0x28,%rsp DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 - DB 68,15,40,5,45,45,0,0 ; movaps 0x2d2d(%rip),%xmm8 # 60f0 <_sk_callback_sse2+0xac7> + DB 68,15,40,5,46,45,0,0 ; movaps 0x2d2e(%rip),%xmm8 # 60c0 <_sk_callback_sse2+0xac8> DB 68,15,89,195 ; mulps %xmm3,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8 @@ -22602,7 +22540,7 @@ _sk_store_a8_sse2 LABEL PROC DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8 DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 33f8 <_sk_store_a8_sse2+0x46> + DB 117,17 ; jne 33c7 <_sk_store_a8_sse2+0x46> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 65,137,4,18 ; mov %eax,(%r10,%rdx,1) DB 72,173 ; lods %ds:(%rsi),%rax @@ -22613,51 +22551,51 @@ _sk_store_a8_sse2 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,59 ; je 344a <_sk_store_a8_sse2+0x98> + DB 116,59 ; je 3419 <_sk_store_a8_sse2+0x98> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,22 ; je 342b <_sk_store_a8_sse2+0x79> + DB 116,22 ; je 33fa <_sk_store_a8_sse2+0x79> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,213 ; jne 33f0 <_sk_store_a8_sse2+0x3e> + DB 117,213 ; jne 33bf <_sk_store_a8_sse2+0x3e> DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp) DB 138,68,36,24 ; mov 0x18(%rsp),%al DB 65,136,68,18,2 ; mov %al,0x2(%r10,%rdx,1) - DB 102,68,15,219,5,204,44,0,0 ; pand 0x2ccc(%rip),%xmm8 # 6100 <_sk_callback_sse2+0xad7> + DB 102,68,15,219,5,205,44,0,0 ; pand 0x2ccd(%rip),%xmm8 # 60d0 <_sk_callback_sse2+0xad8> DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 102,68,15,126,192 ; movd %xmm8,%eax DB 102,65,137,4,18 ; mov %ax,(%r10,%rdx,1) - DB 235,166 ; jmp 33f0 <_sk_store_a8_sse2+0x3e> + DB 235,166 ; jmp 33bf <_sk_store_a8_sse2+0x3e> DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp) DB 138,4,36 ; mov (%rsp),%al DB 65,136,4,18 ; mov %al,(%r10,%rdx,1) - DB 235,151 ; jmp 33f0 <_sk_store_a8_sse2+0x3e> + DB 235,151 ; jmp 33bf <_sk_store_a8_sse2+0x3e> PUBLIC _sk_load_g8_sse2 _sk_load_g8_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,49 ; jne 3494 <_sk_load_g8_sse2+0x3b> + DB 117,49 ; jne 3463 <_sk_load_g8_sse2+0x3b> DB 102,65,15,110,4,18 ; movd (%r10,%rdx,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 - DB 102,15,219,5,151,44,0,0 ; pand 0x2c97(%rip),%xmm0 # 6110 <_sk_callback_sse2+0xae7> + DB 102,15,219,5,152,44,0,0 ; pand 0x2c98(%rip),%xmm0 # 60e0 <_sk_callback_sse2+0xae8> DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,157,44,0,0 ; mulps 0x2c9d(%rip),%xmm0 # 6120 <_sk_callback_sse2+0xaf7> + DB 15,89,5,158,44,0,0 ; mulps 0x2c9e(%rip),%xmm0 # 60f0 <_sk_callback_sse2+0xaf8> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,164,44,0,0 ; movaps 0x2ca4(%rip),%xmm3 # 6130 <_sk_callback_sse2+0xb07> + DB 15,40,29,165,44,0,0 ; movaps 0x2ca5(%rip),%xmm3 # 6100 <_sk_callback_sse2+0xb08> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,54 ; je 34d7 <_sk_load_g8_sse2+0x7e> + DB 116,54 ; je 34a6 <_sk_load_g8_sse2+0x7e> DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,21 ; je 34c0 <_sk_load_g8_sse2+0x67> + DB 116,21 ; je 348f <_sk_load_g8_sse2+0x67> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,192 ; jne 3471 <_sk_load_g8_sse2+0x18> + DB 117,192 ; jne 3440 <_sk_load_g8_sse2+0x18> DB 65,15,182,68,18,2 ; movzbl 0x2(%r10,%rdx,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0 @@ -22666,10 +22604,10 @@ _sk_load_g8_sse2 LABEL PROC DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1 DB 242,15,16,193 ; movsd %xmm1,%xmm0 - DB 235,154 ; jmp 3471 <_sk_load_g8_sse2+0x18> + DB 235,154 ; jmp 3440 <_sk_load_g8_sse2+0x18> DB 65,15,182,4,18 ; movzbl (%r10,%rdx,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,143 ; jmp 3471 <_sk_load_g8_sse2+0x18> + DB 235,143 ; jmp 3440 <_sk_load_g8_sse2+0x18> PUBLIC _sk_gather_g8_sse2 _sk_gather_g8_sse2 LABEL PROC @@ -22709,9 +22647,9 @@ _sk_gather_g8_sse2 LABEL PROC DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0 DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,203,43,0,0 ; mulps 0x2bcb(%rip),%xmm0 # 6140 <_sk_callback_sse2+0xb17> + DB 15,89,5,204,43,0,0 ; mulps 0x2bcc(%rip),%xmm0 # 6110 <_sk_callback_sse2+0xb18> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,210,43,0,0 ; movaps 0x2bd2(%rip),%xmm3 # 6150 <_sk_callback_sse2+0xb27> + DB 15,40,29,211,43,0,0 ; movaps 0x2bd3(%rip),%xmm3 # 6120 <_sk_callback_sse2+0xb28> DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 DB 91 ; pop %rbx @@ -22723,9 +22661,9 @@ _sk_gather_i8_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,193 ; mov %rax,%r9 DB 77,133,201 ; test %r9,%r9 - DB 116,5 ; je 3597 <_sk_gather_i8_sse2+0xf> + DB 116,5 ; je 3566 <_sk_gather_i8_sse2+0xf> DB 76,137,200 ; mov %r9,%rax - DB 235,2 ; jmp 3599 <_sk_gather_i8_sse2+0x11> + DB 235,2 ; jmp 3568 <_sk_gather_i8_sse2+0x11> DB 72,173 ; lods %ds:(%rsi),%rax DB 85 ; push %rbp DB 65,86 ; push %r14 @@ -22777,11 +22715,11 @@ _sk_gather_i8_sse2 LABEL PROC DB 102,66,15,110,76,149,0 ; movd 0x0(%rbp,%r10,4),%xmm1 DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9 DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9 - DB 102,15,111,21,235,42,0,0 ; movdqa 0x2aeb(%rip),%xmm2 # 6160 <_sk_callback_sse2+0xb37> + DB 102,15,111,21,236,42,0,0 ; movdqa 0x2aec(%rip),%xmm2 # 6130 <_sk_callback_sse2+0xb38> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,231,42,0,0 ; movaps 0x2ae7(%rip),%xmm8 # 6170 <_sk_callback_sse2+0xb47> + DB 68,15,40,5,232,42,0,0 ; movaps 0x2ae8(%rip),%xmm8 # 6140 <_sk_callback_sse2+0xb48> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -22807,42 +22745,42 @@ _sk_load_565_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,83 ; jne 372a <_sk_load_565_sse2+0x5d> + DB 117,83 ; jne 36f9 <_sk_load_565_sse2+0x5d> DB 243,65,15,126,20,82 ; movq (%r10,%rdx,2),%xmm2 DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2 - DB 102,15,111,5,151,42,0,0 ; movdqa 0x2a97(%rip),%xmm0 # 6180 <_sk_callback_sse2+0xb57> + DB 102,15,111,5,152,42,0,0 ; movdqa 0x2a98(%rip),%xmm0 # 6150 <_sk_callback_sse2+0xb58> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,153,42,0,0 ; mulps 0x2a99(%rip),%xmm0 # 6190 <_sk_callback_sse2+0xb67> - DB 102,15,111,13,161,42,0,0 ; movdqa 0x2aa1(%rip),%xmm1 # 61a0 <_sk_callback_sse2+0xb77> + DB 15,89,5,154,42,0,0 ; mulps 0x2a9a(%rip),%xmm0 # 6160 <_sk_callback_sse2+0xb68> + DB 102,15,111,13,162,42,0,0 ; movdqa 0x2aa2(%rip),%xmm1 # 6170 <_sk_callback_sse2+0xb78> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,163,42,0,0 ; mulps 0x2aa3(%rip),%xmm1 # 61b0 <_sk_callback_sse2+0xb87> - DB 102,15,219,21,171,42,0,0 ; pand 0x2aab(%rip),%xmm2 # 61c0 <_sk_callback_sse2+0xb97> + DB 15,89,13,164,42,0,0 ; mulps 0x2aa4(%rip),%xmm1 # 6180 <_sk_callback_sse2+0xb88> + DB 102,15,219,21,172,42,0,0 ; pand 0x2aac(%rip),%xmm2 # 6190 <_sk_callback_sse2+0xb98> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,177,42,0,0 ; mulps 0x2ab1(%rip),%xmm2 # 61d0 <_sk_callback_sse2+0xba7> + DB 15,89,21,178,42,0,0 ; mulps 0x2ab2(%rip),%xmm2 # 61a0 <_sk_callback_sse2+0xba8> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,184,42,0,0 ; movaps 0x2ab8(%rip),%xmm3 # 61e0 <_sk_callback_sse2+0xbb7> + DB 15,40,29,185,42,0,0 ; movaps 0x2ab9(%rip),%xmm3 # 61b0 <_sk_callback_sse2+0xbb8> DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,50 ; je 3769 <_sk_load_565_sse2+0x9c> + DB 116,50 ; je 3738 <_sk_load_565_sse2+0x9c> DB 102,15,239,210 ; pxor %xmm2,%xmm2 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,21 ; je 3756 <_sk_load_565_sse2+0x89> + DB 116,21 ; je 3725 <_sk_load_565_sse2+0x89> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,154 ; jne 36e1 <_sk_load_565_sse2+0x14> + DB 117,154 ; jne 36b0 <_sk_load_565_sse2+0x14> DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2 DB 102,65,15,110,4,82 ; movd (%r10,%rdx,2),%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 DB 242,15,16,208 ; movsd %xmm0,%xmm2 - DB 233,120,255,255,255 ; jmpq 36e1 <_sk_load_565_sse2+0x14> + DB 233,120,255,255,255 ; jmpq 36b0 <_sk_load_565_sse2+0x14> DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax DB 102,15,110,208 ; movd %eax,%xmm2 - DB 233,106,255,255,255 ; jmpq 36e1 <_sk_load_565_sse2+0x14> + DB 233,106,255,255,255 ; jmpq 36b0 <_sk_load_565_sse2+0x14> PUBLIC _sk_gather_565_sse2 _sk_gather_565_sse2 LABEL PROC @@ -22875,19 +22813,19 @@ _sk_gather_565_sse2 LABEL PROC DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2 - DB 102,15,111,5,243,41,0,0 ; movdqa 0x29f3(%rip),%xmm0 # 61f0 <_sk_callback_sse2+0xbc7> + DB 102,15,111,5,244,41,0,0 ; movdqa 0x29f4(%rip),%xmm0 # 61c0 <_sk_callback_sse2+0xbc8> DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,245,41,0,0 ; mulps 0x29f5(%rip),%xmm0 # 6200 <_sk_callback_sse2+0xbd7> - DB 102,15,111,13,253,41,0,0 ; movdqa 0x29fd(%rip),%xmm1 # 6210 <_sk_callback_sse2+0xbe7> + DB 15,89,5,246,41,0,0 ; mulps 0x29f6(%rip),%xmm0 # 61d0 <_sk_callback_sse2+0xbd8> + DB 102,15,111,13,254,41,0,0 ; movdqa 0x29fe(%rip),%xmm1 # 61e0 <_sk_callback_sse2+0xbe8> DB 102,15,219,202 ; pand %xmm2,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,255,41,0,0 ; mulps 0x29ff(%rip),%xmm1 # 6220 <_sk_callback_sse2+0xbf7> - DB 102,15,219,21,7,42,0,0 ; pand 0x2a07(%rip),%xmm2 # 6230 <_sk_callback_sse2+0xc07> + DB 15,89,13,0,42,0,0 ; mulps 0x2a00(%rip),%xmm1 # 61f0 <_sk_callback_sse2+0xbf8> + DB 102,15,219,21,8,42,0,0 ; pand 0x2a08(%rip),%xmm2 # 6200 <_sk_callback_sse2+0xc08> DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,13,42,0,0 ; mulps 0x2a0d(%rip),%xmm2 # 6240 <_sk_callback_sse2+0xc17> + DB 15,89,21,14,42,0,0 ; mulps 0x2a0e(%rip),%xmm2 # 6210 <_sk_callback_sse2+0xc18> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,20,42,0,0 ; movaps 0x2a14(%rip),%xmm3 # 6250 <_sk_callback_sse2+0xc27> + DB 15,40,29,21,42,0,0 ; movaps 0x2a15(%rip),%xmm3 # 6220 <_sk_callback_sse2+0xc28> DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -22895,12 +22833,12 @@ PUBLIC _sk_store_565_sse2 _sk_store_565_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 - DB 68,15,40,5,20,42,0,0 ; movaps 0x2a14(%rip),%xmm8 # 6260 <_sk_callback_sse2+0xc37> + DB 68,15,40,5,21,42,0,0 ; movaps 0x2a15(%rip),%xmm8 # 6230 <_sk_callback_sse2+0xc38> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9 - DB 68,15,40,21,9,42,0,0 ; movaps 0x2a09(%rip),%xmm10 # 6270 <_sk_callback_sse2+0xc47> + DB 68,15,40,21,10,42,0,0 ; movaps 0x2a0a(%rip),%xmm10 # 6240 <_sk_callback_sse2+0xc48> DB 68,15,89,209 ; mulps %xmm1,%xmm10 DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10 DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10 @@ -22912,7 +22850,7 @@ _sk_store_565_sse2 LABEL PROC DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8 DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 38a9 <_sk_store_565_sse2+0x6a> + DB 117,10 ; jne 3878 <_sk_store_565_sse2+0x6a> DB 242,69,15,17,4,82 ; movsd %xmm8,(%r10,%rdx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -22920,64 +22858,64 @@ _sk_store_565_sse2 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,38 ; je 38e1 <_sk_store_565_sse2+0xa2> + DB 116,38 ; je 38b0 <_sk_store_565_sse2+0xa2> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,18 ; je 38d3 <_sk_store_565_sse2+0x94> + DB 116,18 ; je 38a2 <_sk_store_565_sse2+0x94> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,222 ; jne 38a5 <_sk_store_565_sse2+0x66> + DB 117,222 ; jne 3874 <_sk_store_565_sse2+0x66> DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax DB 102,65,137,68,82,4 ; mov %ax,0x4(%r10,%rdx,2) DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8 DB 102,69,15,126,4,82 ; movd %xmm8,(%r10,%rdx,2) - DB 235,196 ; jmp 38a5 <_sk_store_565_sse2+0x66> + DB 235,196 ; jmp 3874 <_sk_store_565_sse2+0x66> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 102,65,137,4,82 ; mov %ax,(%r10,%rdx,2) - DB 235,184 ; jmp 38a5 <_sk_store_565_sse2+0x66> + DB 235,184 ; jmp 3874 <_sk_store_565_sse2+0x66> PUBLIC _sk_load_4444_sse2 _sk_load_4444_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 DB 77,133,192 ; test %r8,%r8 - DB 117,98 ; jne 3959 <_sk_load_4444_sse2+0x6c> + DB 117,98 ; jne 3928 <_sk_load_4444_sse2+0x6c> DB 243,65,15,126,28,82 ; movq (%r10,%rdx,2),%xmm3 DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3 - DB 102,15,111,5,119,41,0,0 ; movdqa 0x2977(%rip),%xmm0 # 6280 <_sk_callback_sse2+0xc57> + DB 102,15,111,5,120,41,0,0 ; movdqa 0x2978(%rip),%xmm0 # 6250 <_sk_callback_sse2+0xc58> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,121,41,0,0 ; mulps 0x2979(%rip),%xmm0 # 6290 <_sk_callback_sse2+0xc67> - DB 102,15,111,13,129,41,0,0 ; movdqa 0x2981(%rip),%xmm1 # 62a0 <_sk_callback_sse2+0xc77> + DB 15,89,5,122,41,0,0 ; mulps 0x297a(%rip),%xmm0 # 6260 <_sk_callback_sse2+0xc68> + DB 102,15,111,13,130,41,0,0 ; movdqa 0x2982(%rip),%xmm1 # 6270 <_sk_callback_sse2+0xc78> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,131,41,0,0 ; mulps 0x2983(%rip),%xmm1 # 62b0 <_sk_callback_sse2+0xc87> - DB 102,15,111,21,139,41,0,0 ; movdqa 0x298b(%rip),%xmm2 # 62c0 <_sk_callback_sse2+0xc97> + DB 15,89,13,132,41,0,0 ; mulps 0x2984(%rip),%xmm1 # 6280 <_sk_callback_sse2+0xc88> + DB 102,15,111,21,140,41,0,0 ; movdqa 0x298c(%rip),%xmm2 # 6290 <_sk_callback_sse2+0xc98> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,141,41,0,0 ; mulps 0x298d(%rip),%xmm2 # 62d0 <_sk_callback_sse2+0xca7> - DB 102,15,219,29,149,41,0,0 ; pand 0x2995(%rip),%xmm3 # 62e0 <_sk_callback_sse2+0xcb7> + DB 15,89,21,142,41,0,0 ; mulps 0x298e(%rip),%xmm2 # 62a0 <_sk_callback_sse2+0xca8> + DB 102,15,219,29,150,41,0,0 ; pand 0x2996(%rip),%xmm3 # 62b0 <_sk_callback_sse2+0xcb8> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,155,41,0,0 ; mulps 0x299b(%rip),%xmm3 # 62f0 <_sk_callback_sse2+0xcc7> + DB 15,89,29,156,41,0,0 ; mulps 0x299c(%rip),%xmm3 # 62c0 <_sk_callback_sse2+0xcc8> DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,50 ; je 3998 <_sk_load_4444_sse2+0xab> + DB 116,50 ; je 3967 <_sk_load_4444_sse2+0xab> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,21 ; je 3985 <_sk_load_4444_sse2+0x98> + DB 116,21 ; je 3954 <_sk_load_4444_sse2+0x98> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,139 ; jne 3901 <_sk_load_4444_sse2+0x14> + DB 117,139 ; jne 38d0 <_sk_load_4444_sse2+0x14> DB 65,15,183,68,82,4 ; movzwl 0x4(%r10,%rdx,2),%eax DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 102,65,15,110,4,82 ; movd (%r10,%rdx,2),%xmm0 DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0 DB 242,15,16,216 ; movsd %xmm0,%xmm3 - DB 233,105,255,255,255 ; jmpq 3901 <_sk_load_4444_sse2+0x14> + DB 233,105,255,255,255 ; jmpq 38d0 <_sk_load_4444_sse2+0x14> DB 65,15,183,4,82 ; movzwl (%r10,%rdx,2),%eax DB 102,15,110,216 ; movd %eax,%xmm3 - DB 233,91,255,255,255 ; jmpq 3901 <_sk_load_4444_sse2+0x14> + DB 233,91,255,255,255 ; jmpq 38d0 <_sk_load_4444_sse2+0x14> PUBLIC _sk_gather_4444_sse2 _sk_gather_4444_sse2 LABEL PROC @@ -23010,21 +22948,21 @@ _sk_gather_4444_sse2 LABEL PROC DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3 DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3 - DB 102,15,111,5,212,40,0,0 ; movdqa 0x28d4(%rip),%xmm0 # 6300 <_sk_callback_sse2+0xcd7> + DB 102,15,111,5,213,40,0,0 ; movdqa 0x28d5(%rip),%xmm0 # 62d0 <_sk_callback_sse2+0xcd8> DB 102,15,219,195 ; pand %xmm3,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 15,89,5,214,40,0,0 ; mulps 0x28d6(%rip),%xmm0 # 6310 <_sk_callback_sse2+0xce7> - DB 102,15,111,13,222,40,0,0 ; movdqa 0x28de(%rip),%xmm1 # 6320 <_sk_callback_sse2+0xcf7> + DB 15,89,5,215,40,0,0 ; mulps 0x28d7(%rip),%xmm0 # 62e0 <_sk_callback_sse2+0xce8> + DB 102,15,111,13,223,40,0,0 ; movdqa 0x28df(%rip),%xmm1 # 62f0 <_sk_callback_sse2+0xcf8> DB 102,15,219,203 ; pand %xmm3,%xmm1 DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1 - DB 15,89,13,224,40,0,0 ; mulps 0x28e0(%rip),%xmm1 # 6330 <_sk_callback_sse2+0xd07> - DB 102,15,111,21,232,40,0,0 ; movdqa 0x28e8(%rip),%xmm2 # 6340 <_sk_callback_sse2+0xd17> + DB 15,89,13,225,40,0,0 ; mulps 0x28e1(%rip),%xmm1 # 6300 <_sk_callback_sse2+0xd08> + DB 102,15,111,21,233,40,0,0 ; movdqa 0x28e9(%rip),%xmm2 # 6310 <_sk_callback_sse2+0xd18> DB 102,15,219,211 ; pand %xmm3,%xmm2 DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 - DB 15,89,21,234,40,0,0 ; mulps 0x28ea(%rip),%xmm2 # 6350 <_sk_callback_sse2+0xd27> - DB 102,15,219,29,242,40,0,0 ; pand 0x28f2(%rip),%xmm3 # 6360 <_sk_callback_sse2+0xd37> + DB 15,89,21,235,40,0,0 ; mulps 0x28eb(%rip),%xmm2 # 6320 <_sk_callback_sse2+0xd28> + DB 102,15,219,29,243,40,0,0 ; pand 0x28f3(%rip),%xmm3 # 6330 <_sk_callback_sse2+0xd38> DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3 - DB 15,89,29,248,40,0,0 ; mulps 0x28f8(%rip),%xmm3 # 6370 <_sk_callback_sse2+0xd47> + DB 15,89,29,249,40,0,0 ; mulps 0x28f9(%rip),%xmm3 # 6340 <_sk_callback_sse2+0xd48> DB 72,173 ; lods %ds:(%rsi),%rax DB 91 ; pop %rbx DB 255,224 ; jmpq *%rax @@ -23033,7 +22971,7 @@ PUBLIC _sk_store_4444_sse2 _sk_store_4444_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,16 ; mov (%rax),%r10 - DB 68,15,40,5,246,40,0,0 ; movaps 0x28f6(%rip),%xmm8 # 6380 <_sk_callback_sse2+0xd57> + DB 68,15,40,5,247,40,0,0 ; movaps 0x28f7(%rip),%xmm8 # 6350 <_sk_callback_sse2+0xd58> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -23055,7 +22993,7 @@ _sk_store_4444_sse2 LABEL PROC DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8 DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 3afb <_sk_store_4444_sse2+0x7e> + DB 117,10 ; jne 3aca <_sk_store_4444_sse2+0x7e> DB 242,69,15,17,4,82 ; movsd %xmm8,(%r10,%rdx,2) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -23063,32 +23001,32 @@ _sk_store_4444_sse2 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,38 ; je 3b33 <_sk_store_4444_sse2+0xb6> + DB 116,38 ; je 3b02 <_sk_store_4444_sse2+0xb6> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,18 ; je 3b25 <_sk_store_4444_sse2+0xa8> + DB 116,18 ; je 3af4 <_sk_store_4444_sse2+0xa8> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,222 ; jne 3af7 <_sk_store_4444_sse2+0x7a> + DB 117,222 ; jne 3ac6 <_sk_store_4444_sse2+0x7a> DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax DB 102,65,137,68,82,4 ; mov %ax,0x4(%r10,%rdx,2) DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8 DB 102,69,15,126,4,82 ; movd %xmm8,(%r10,%rdx,2) - DB 235,196 ; jmp 3af7 <_sk_store_4444_sse2+0x7a> + DB 235,196 ; jmp 3ac6 <_sk_store_4444_sse2+0x7a> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 102,65,137,4,82 ; mov %ax,(%r10,%rdx,2) - DB 235,184 ; jmp 3af7 <_sk_store_4444_sse2+0x7a> + DB 235,184 ; jmp 3ac6 <_sk_store_4444_sse2+0x7a> PUBLIC _sk_load_8888_sse2 _sk_load_8888_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax DB 77,133,192 ; test %r8,%r8 - DB 117,98 ; jne 3bab <_sk_load_8888_sse2+0x6c> + DB 117,98 ; jne 3b7a <_sk_load_8888_sse2+0x6c> DB 243,68,15,111,12,144 ; movdqu (%rax,%rdx,4),%xmm9 - DB 102,15,111,21,57,40,0,0 ; movdqa 0x2839(%rip),%xmm2 # 6390 <_sk_callback_sse2+0xd67> + DB 102,15,111,21,58,40,0,0 ; movdqa 0x283a(%rip),%xmm2 # 6360 <_sk_callback_sse2+0xd68> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,53,40,0,0 ; movaps 0x2835(%rip),%xmm8 # 63a0 <_sk_callback_sse2+0xd77> + DB 68,15,40,5,54,40,0,0 ; movaps 0x2836(%rip),%xmm8 # 6370 <_sk_callback_sse2+0xd78> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -23108,18 +23046,18 @@ _sk_load_8888_sse2 LABEL PROC DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,40 ; je 3be0 <_sk_load_8888_sse2+0xa1> + DB 116,40 ; je 3baf <_sk_load_8888_sse2+0xa1> DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,18 ; je 3bd5 <_sk_load_8888_sse2+0x96> + DB 116,18 ; je 3ba4 <_sk_load_8888_sse2+0x96> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,134 ; jne 3b4f <_sk_load_8888_sse2+0x10> + DB 117,134 ; jne 3b1e <_sk_load_8888_sse2+0x10> DB 102,15,110,68,144,8 ; movd 0x8(%rax,%rdx,4),%xmm0 DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9 DB 102,68,15,18,12,144 ; movlpd (%rax,%rdx,4),%xmm9 - DB 233,111,255,255,255 ; jmpq 3b4f <_sk_load_8888_sse2+0x10> + DB 233,111,255,255,255 ; jmpq 3b1e <_sk_load_8888_sse2+0x10> DB 102,68,15,110,12,144 ; movd (%rax,%rdx,4),%xmm9 - DB 233,100,255,255,255 ; jmpq 3b4f <_sk_load_8888_sse2+0x10> + DB 233,100,255,255,255 ; jmpq 3b1e <_sk_load_8888_sse2+0x10> PUBLIC _sk_gather_8888_sse2 _sk_gather_8888_sse2 LABEL PROC @@ -23151,11 +23089,11 @@ _sk_gather_8888_sse2 LABEL PROC DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1 DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9 DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9 - DB 102,15,111,21,67,39,0,0 ; movdqa 0x2743(%rip),%xmm2 # 63b0 <_sk_callback_sse2+0xd87> + DB 102,15,111,21,68,39,0,0 ; movdqa 0x2744(%rip),%xmm2 # 6380 <_sk_callback_sse2+0xd88> DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0 DB 102,15,219,194 ; pand %xmm2,%xmm0 DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0 - DB 68,15,40,5,63,39,0,0 ; movaps 0x273f(%rip),%xmm8 # 63c0 <_sk_callback_sse2+0xd97> + DB 68,15,40,5,64,39,0,0 ; movaps 0x2740(%rip),%xmm8 # 6390 <_sk_callback_sse2+0xd98> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1 DB 102,15,114,209,8 ; psrld $0x8,%xmm1 @@ -23178,7 +23116,7 @@ PUBLIC _sk_store_8888_sse2 _sk_store_8888_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 68,15,40,5,1,39,0,0 ; movaps 0x2701(%rip),%xmm8 # 63d0 <_sk_callback_sse2+0xda7> + DB 68,15,40,5,2,39,0,0 ; movaps 0x2702(%rip),%xmm8 # 63a0 <_sk_callback_sse2+0xda8> DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9 @@ -23197,31 +23135,31 @@ _sk_store_8888_sse2 LABEL PROC DB 102,69,15,235,193 ; por %xmm9,%xmm8 DB 102,69,15,235,194 ; por %xmm10,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 3d2f <_sk_store_8888_sse2+0x6d> + DB 117,10 ; jne 3cfe <_sk_store_8888_sse2+0x6d> DB 243,68,15,127,4,144 ; movdqu %xmm8,(%rax,%rdx,4) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,3 ; and $0x3,%r9b DB 65,128,249,1 ; cmp $0x1,%r9b - DB 116,33 ; je 3d5d <_sk_store_8888_sse2+0x9b> + DB 116,33 ; je 3d2c <_sk_store_8888_sse2+0x9b> DB 65,128,249,2 ; cmp $0x2,%r9b - DB 116,19 ; je 3d55 <_sk_store_8888_sse2+0x93> + DB 116,19 ; je 3d24 <_sk_store_8888_sse2+0x93> DB 65,128,249,3 ; cmp $0x3,%r9b - DB 117,227 ; jne 3d2b <_sk_store_8888_sse2+0x69> + DB 117,227 ; jne 3cfa <_sk_store_8888_sse2+0x69> DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9 DB 102,68,15,126,76,144,8 ; movd %xmm9,0x8(%rax,%rdx,4) DB 102,68,15,214,4,144 ; movq %xmm8,(%rax,%rdx,4) - DB 235,206 ; jmp 3d2b <_sk_store_8888_sse2+0x69> + DB 235,206 ; jmp 3cfa <_sk_store_8888_sse2+0x69> DB 102,68,15,126,4,144 ; movd %xmm8,(%rax,%rdx,4) - DB 235,198 ; jmp 3d2b <_sk_store_8888_sse2+0x69> + DB 235,198 ; jmp 3cfa <_sk_store_8888_sse2+0x69> PUBLIC _sk_load_f16_sse2 _sk_load_f16_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,96,1,0,0 ; jne 3ed3 <_sk_load_f16_sse2+0x16e> + DB 15,133,96,1,0,0 ; jne 3ea2 <_sk_load_f16_sse2+0x16e> DB 102,15,16,4,208 ; movupd (%rax,%rdx,8),%xmm0 DB 102,15,16,76,208,16 ; movupd 0x10(%rax,%rdx,8),%xmm1 DB 102,68,15,40,192 ; movapd %xmm0,%xmm8 @@ -23233,7 +23171,7 @@ _sk_load_f16_sse2 LABEL PROC DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1 DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1 - DB 102,68,15,111,13,45,38,0,0 ; movdqa 0x262d(%rip),%xmm9 # 63e0 <_sk_callback_sse2+0xdb7> + DB 102,68,15,111,13,46,38,0,0 ; movdqa 0x262e(%rip),%xmm9 # 63b0 <_sk_callback_sse2+0xdb8> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,193 ; pand %xmm9,%xmm0 DB 102,15,239,200 ; pxor %xmm0,%xmm1 @@ -23241,11 +23179,11 @@ _sk_load_f16_sse2 LABEL PROC DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13 DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13 DB 102,68,15,235,232 ; por %xmm0,%xmm13 - DB 102,68,15,111,29,18,38,0,0 ; movdqa 0x2612(%rip),%xmm11 # 63f0 <_sk_callback_sse2+0xdc7> + DB 102,68,15,111,29,19,38,0,0 ; movdqa 0x2613(%rip),%xmm11 # 63c0 <_sk_callback_sse2+0xdc8> DB 102,69,15,254,235 ; paddd %xmm11,%xmm13 - DB 102,68,15,111,37,20,38,0,0 ; movdqa 0x2614(%rip),%xmm12 # 6400 <_sk_callback_sse2+0xdd7> + DB 102,68,15,111,37,21,38,0,0 ; movdqa 0x2615(%rip),%xmm12 # 63d0 <_sk_callback_sse2+0xdd8> DB 102,65,15,239,204 ; pxor %xmm12,%xmm1 - DB 102,15,111,29,23,38,0,0 ; movdqa 0x2617(%rip),%xmm3 # 6410 <_sk_callback_sse2+0xde7> + DB 102,15,111,29,24,38,0,0 ; movdqa 0x2618(%rip),%xmm3 # 63e0 <_sk_callback_sse2+0xde8> DB 102,15,111,195 ; movdqa %xmm3,%xmm0 DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0 DB 102,65,15,223,197 ; pandn %xmm13,%xmm0 @@ -23293,17 +23231,17 @@ _sk_load_f16_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,15,16,4,208 ; movsd (%rax,%rdx,8),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,17 ; jne 3eef <_sk_load_f16_sse2+0x18a> + DB 117,17 ; jne 3ebe <_sk_load_f16_sse2+0x18a> DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 - DB 233,143,254,255,255 ; jmpq 3d7e <_sk_load_f16_sse2+0x19> + DB 233,143,254,255,255 ; jmpq 3d4d <_sk_load_f16_sse2+0x19> DB 102,15,22,68,208,8 ; movhpd 0x8(%rax,%rdx,8),%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,123,254,255,255 ; jb 3d7e <_sk_load_f16_sse2+0x19> + DB 15,130,123,254,255,255 ; jb 3d4d <_sk_load_f16_sse2+0x19> DB 242,15,16,76,208,16 ; movsd 0x10(%rax,%rdx,8),%xmm1 - DB 233,112,254,255,255 ; jmpq 3d7e <_sk_load_f16_sse2+0x19> + DB 233,112,254,255,255 ; jmpq 3d4d <_sk_load_f16_sse2+0x19> PUBLIC _sk_gather_f16_sse2 _sk_gather_f16_sse2 LABEL PROC @@ -23343,7 +23281,7 @@ _sk_gather_f16_sse2 LABEL PROC DB 102,69,15,239,210 ; pxor %xmm10,%xmm10 DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1 DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1 - DB 102,68,15,111,13,105,36,0,0 ; movdqa 0x2469(%rip),%xmm9 # 6420 <_sk_callback_sse2+0xdf7> + DB 102,68,15,111,13,106,36,0,0 ; movdqa 0x246a(%rip),%xmm9 # 63f0 <_sk_callback_sse2+0xdf8> DB 102,15,111,193 ; movdqa %xmm1,%xmm0 DB 102,65,15,219,193 ; pand %xmm9,%xmm0 DB 102,15,239,200 ; pxor %xmm0,%xmm1 @@ -23351,11 +23289,11 @@ _sk_gather_f16_sse2 LABEL PROC DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13 DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13 DB 102,68,15,235,232 ; por %xmm0,%xmm13 - DB 102,68,15,111,29,78,36,0,0 ; movdqa 0x244e(%rip),%xmm11 # 6430 <_sk_callback_sse2+0xe07> + DB 102,68,15,111,29,79,36,0,0 ; movdqa 0x244f(%rip),%xmm11 # 6400 <_sk_callback_sse2+0xe08> DB 102,69,15,254,235 ; paddd %xmm11,%xmm13 - DB 102,68,15,111,37,80,36,0,0 ; movdqa 0x2450(%rip),%xmm12 # 6440 <_sk_callback_sse2+0xe17> + DB 102,68,15,111,37,81,36,0,0 ; movdqa 0x2451(%rip),%xmm12 # 6410 <_sk_callback_sse2+0xe18> DB 102,65,15,239,204 ; pxor %xmm12,%xmm1 - DB 102,15,111,29,83,36,0,0 ; movdqa 0x2453(%rip),%xmm3 # 6450 <_sk_callback_sse2+0xe27> + DB 102,15,111,29,84,36,0,0 ; movdqa 0x2454(%rip),%xmm3 # 6420 <_sk_callback_sse2+0xe28> DB 102,15,111,195 ; movdqa %xmm3,%xmm0 DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0 DB 102,65,15,223,197 ; pandn %xmm13,%xmm0 @@ -23407,17 +23345,17 @@ PUBLIC _sk_store_f16_sse2 _sk_store_f16_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 72,139,0 ; mov (%rax),%rax - DB 102,68,15,111,21,122,35,0,0 ; movdqa 0x237a(%rip),%xmm10 # 6460 <_sk_callback_sse2+0xe37> + DB 102,68,15,111,21,123,35,0,0 ; movdqa 0x237b(%rip),%xmm10 # 6430 <_sk_callback_sse2+0xe38> DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12 DB 102,69,15,219,226 ; pand %xmm10,%xmm12 DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13 DB 102,69,15,239,236 ; pxor %xmm12,%xmm13 - DB 102,68,15,111,13,109,35,0,0 ; movdqa 0x236d(%rip),%xmm9 # 6470 <_sk_callback_sse2+0xe47> + DB 102,68,15,111,13,110,35,0,0 ; movdqa 0x236e(%rip),%xmm9 # 6440 <_sk_callback_sse2+0xe48> DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12 DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8 DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8 DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13 - DB 102,68,15,111,29,94,35,0,0 ; movdqa 0x235e(%rip),%xmm11 # 6480 <_sk_callback_sse2+0xe57> + DB 102,68,15,111,29,95,35,0,0 ; movdqa 0x235f(%rip),%xmm11 # 6450 <_sk_callback_sse2+0xe58> DB 102,69,15,235,227 ; por %xmm11,%xmm12 DB 102,69,15,254,229 ; paddd %xmm13,%xmm12 DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12 @@ -23469,7 +23407,7 @@ _sk_store_f16_sse2 LABEL PROC DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9 DB 102,69,15,98,204 ; punpckldq %xmm12,%xmm9 DB 77,133,192 ; test %r8,%r8 - DB 117,21 ; jne 4244 <_sk_store_f16_sse2+0x16c> + DB 117,21 ; jne 4213 <_sk_store_f16_sse2+0x16c> DB 68,15,17,12,208 ; movups %xmm9,(%rax,%rdx,8) DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8 DB 243,68,15,127,68,208,16 ; movdqu %xmm8,0x10(%rax,%rdx,8) @@ -23477,13 +23415,13 @@ _sk_store_f16_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 102,68,15,214,12,208 ; movq %xmm9,(%rax,%rdx,8) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 4240 <_sk_store_f16_sse2+0x168> + DB 116,240 ; je 420f <_sk_store_f16_sse2+0x168> DB 102,68,15,23,76,208,8 ; movhpd %xmm9,0x8(%rax,%rdx,8) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 4240 <_sk_store_f16_sse2+0x168> + DB 114,227 ; jb 420f <_sk_store_f16_sse2+0x168> DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8 DB 102,68,15,214,68,208,16 ; movq %xmm8,0x10(%rax,%rdx,8) - DB 235,213 ; jmp 4240 <_sk_store_f16_sse2+0x168> + DB 235,213 ; jmp 420f <_sk_store_f16_sse2+0x168> PUBLIC _sk_load_u16_be_sse2 _sk_load_u16_be_sse2 LABEL PROC @@ -23491,7 +23429,7 @@ _sk_load_u16_be_sse2 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,190,0,0,0 ; jne 433f <_sk_load_u16_be_sse2+0xd4> + DB 15,133,190,0,0,0 ; jne 430e <_sk_load_u16_be_sse2+0xd4> DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0 DB 102,65,15,16,76,65,16 ; movupd 0x10(%r9,%rax,2),%xmm1 DB 102,15,40,208 ; movapd %xmm0,%xmm2 @@ -23508,7 +23446,7 @@ _sk_load_u16_be_sse2 LABEL PROC DB 102,69,15,239,201 ; pxor %xmm9,%xmm9 DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1 DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0 - DB 68,15,40,5,190,33,0,0 ; movaps 0x21be(%rip),%xmm8 # 6490 <_sk_callback_sse2+0xe67> + DB 68,15,40,5,191,33,0,0 ; movaps 0x21bf(%rip),%xmm8 # 6460 <_sk_callback_sse2+0xe68> DB 65,15,89,192 ; mulps %xmm8,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -23536,17 +23474,17 @@ _sk_load_u16_be_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,17 ; jne 435c <_sk_load_u16_be_sse2+0xf1> + DB 117,17 ; jne 432b <_sk_load_u16_be_sse2+0xf1> DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 - DB 233,50,255,255,255 ; jmpq 428e <_sk_load_u16_be_sse2+0x23> + DB 233,50,255,255,255 ; jmpq 425d <_sk_load_u16_be_sse2+0x23> DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0 DB 102,15,87,201 ; xorpd %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 15,130,29,255,255,255 ; jb 428e <_sk_load_u16_be_sse2+0x23> + DB 15,130,29,255,255,255 ; jb 425d <_sk_load_u16_be_sse2+0x23> DB 242,65,15,16,76,65,16 ; movsd 0x10(%r9,%rax,2),%xmm1 - DB 233,17,255,255,255 ; jmpq 428e <_sk_load_u16_be_sse2+0x23> + DB 233,17,255,255,255 ; jmpq 425d <_sk_load_u16_be_sse2+0x23> PUBLIC _sk_load_rgb_u16_be_sse2 _sk_load_rgb_u16_be_sse2 LABEL PROC @@ -23554,7 +23492,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,82 ; lea (%rdx,%rdx,2),%rax DB 77,133,192 ; test %r8,%r8 - DB 15,133,175,0,0,0 ; jne 443e <_sk_load_rgb_u16_be_sse2+0xc1> + DB 15,133,175,0,0,0 ; jne 440d <_sk_load_rgb_u16_be_sse2+0xc1> DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2 DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3 DB 102,15,115,219,4 ; psrldq $0x4,%xmm3 @@ -23575,7 +23513,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1 DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0 - DB 68,15,40,13,173,32,0,0 ; movaps 0x20ad(%rip),%xmm9 # 64a0 <_sk_callback_sse2+0xe77> + DB 68,15,40,13,174,32,0,0 ; movaps 0x20ae(%rip),%xmm9 # 6470 <_sk_callback_sse2+0xe78> DB 65,15,89,193 ; mulps %xmm9,%xmm0 DB 102,15,111,203 ; movdqa %xmm3,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 @@ -23592,34 +23530,34 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2 DB 65,15,89,209 ; mulps %xmm9,%xmm2 DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,116,32,0,0 ; movaps 0x2074(%rip),%xmm3 # 64b0 <_sk_callback_sse2+0xe87> + DB 15,40,29,117,32,0,0 ; movaps 0x2075(%rip),%xmm3 # 6480 <_sk_callback_sse2+0xe88> DB 255,224 ; jmpq *%rax DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2 DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,13 ; jne 4463 <_sk_load_rgb_u16_be_sse2+0xe6> + DB 117,13 ; jne 4432 <_sk_load_rgb_u16_be_sse2+0xe6> DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,239,192 ; pxor %xmm0,%xmm0 - DB 233,80,255,255,255 ; jmpq 43b3 <_sk_load_rgb_u16_be_sse2+0x36> + DB 233,80,255,255,255 ; jmpq 4382 <_sk_load_rgb_u16_be_sse2+0x36> DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0 DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,24 ; jb 4494 <_sk_load_rgb_u16_be_sse2+0x117> + DB 114,24 ; jb 4463 <_sk_load_rgb_u16_be_sse2+0x117> DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3 DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3 DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 233,31,255,255,255 ; jmpq 43b3 <_sk_load_rgb_u16_be_sse2+0x36> + DB 233,31,255,255,255 ; jmpq 4382 <_sk_load_rgb_u16_be_sse2+0x36> DB 102,15,239,219 ; pxor %xmm3,%xmm3 - DB 233,22,255,255,255 ; jmpq 43b3 <_sk_load_rgb_u16_be_sse2+0x36> + DB 233,22,255,255,255 ; jmpq 4382 <_sk_load_rgb_u16_be_sse2+0x36> PUBLIC _sk_store_u16_be_sse2 _sk_store_u16_be_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,8 ; mov (%rax),%r9 DB 72,141,4,149,0,0,0,0 ; lea 0x0(,%rdx,4),%rax - DB 68,15,40,21,14,32,0,0 ; movaps 0x200e(%rip),%xmm10 # 64c0 <_sk_callback_sse2+0xe97> + DB 68,15,40,21,15,32,0,0 ; movaps 0x200f(%rip),%xmm10 # 6490 <_sk_callback_sse2+0xe98> DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 69,15,89,194 ; mulps %xmm10,%xmm8 DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8 @@ -23664,7 +23602,7 @@ _sk_store_u16_be_sse2 LABEL PROC DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10 DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10 DB 77,133,192 ; test %r8,%r8 - DB 117,21 ; jne 45ac <_sk_store_u16_be_sse2+0x10f> + DB 117,21 ; jne 457b <_sk_store_u16_be_sse2+0x10f> DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2) DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8 DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2) @@ -23672,13 +23610,13 @@ _sk_store_u16_be_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2) DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,240 ; je 45a8 <_sk_store_u16_be_sse2+0x10b> + DB 116,240 ; je 4577 <_sk_store_u16_be_sse2+0x10b> DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,227 ; jb 45a8 <_sk_store_u16_be_sse2+0x10b> + DB 114,227 ; jb 4577 <_sk_store_u16_be_sse2+0x10b> DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8 DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2) - DB 235,213 ; jmp 45a8 <_sk_store_u16_be_sse2+0x10b> + DB 235,213 ; jmp 4577 <_sk_store_u16_be_sse2+0x10b> PUBLIC _sk_load_f32_sse2 _sk_load_f32_sse2 LABEL PROC @@ -23689,7 +23627,7 @@ _sk_load_f32_sse2 LABEL PROC DB 72,193,224,4 ; shl $0x4,%rax DB 69,15,16,4,2 ; movups (%r10,%rax,1),%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,66 ; jne 4633 <_sk_load_f32_sse2+0x60> + DB 117,66 ; jne 4602 <_sk_load_f32_sse2+0x60> DB 67,15,16,68,138,16 ; movups 0x10(%r10,%r9,4),%xmm0 DB 67,15,16,92,138,32 ; movups 0x20(%r10,%r9,4),%xmm3 DB 71,15,16,76,138,48 ; movups 0x30(%r10,%r9,4),%xmm9 @@ -23709,17 +23647,17 @@ _sk_load_f32_sse2 LABEL PROC DB 255,224 ; jmpq *%rax DB 69,15,87,201 ; xorps %xmm9,%xmm9 DB 73,131,248,1 ; cmp $0x1,%r8 - DB 117,8 ; jne 4645 <_sk_load_f32_sse2+0x72> + DB 117,8 ; jne 4614 <_sk_load_f32_sse2+0x72> DB 15,87,219 ; xorps %xmm3,%xmm3 DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 235,190 ; jmp 4603 <_sk_load_f32_sse2+0x30> + DB 235,190 ; jmp 45d2 <_sk_load_f32_sse2+0x30> DB 67,15,16,68,138,16 ; movups 0x10(%r10,%r9,4),%xmm0 DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,8 ; jb 4659 <_sk_load_f32_sse2+0x86> + DB 114,8 ; jb 4628 <_sk_load_f32_sse2+0x86> DB 67,15,16,92,138,32 ; movups 0x20(%r10,%r9,4),%xmm3 - DB 235,170 ; jmp 4603 <_sk_load_f32_sse2+0x30> + DB 235,170 ; jmp 45d2 <_sk_load_f32_sse2+0x30> DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 235,165 ; jmp 4603 <_sk_load_f32_sse2+0x30> + DB 235,165 ; jmp 45d2 <_sk_load_f32_sse2+0x30> PUBLIC _sk_store_f32_sse2 _sk_store_f32_sse2 LABEL PROC @@ -23743,7 +23681,7 @@ _sk_store_f32_sse2 LABEL PROC DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9 DB 102,69,15,17,36,2 ; movupd %xmm12,(%r10,%rax,1) DB 77,133,192 ; test %r8,%r8 - DB 117,29 ; jne 46d0 <_sk_store_f32_sse2+0x72> + DB 117,29 ; jne 469f <_sk_store_f32_sse2+0x72> DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10 DB 71,15,17,68,138,16 ; movups %xmm8,0x10(%r10,%r9,4) DB 102,71,15,17,76,138,32 ; movupd %xmm9,0x20(%r10,%r9,4) @@ -23751,12 +23689,12 @@ _sk_store_f32_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax DB 73,131,248,1 ; cmp $0x1,%r8 - DB 116,246 ; je 46cc <_sk_store_f32_sse2+0x6e> + DB 116,246 ; je 469b <_sk_store_f32_sse2+0x6e> DB 71,15,17,68,138,16 ; movups %xmm8,0x10(%r10,%r9,4) DB 73,131,248,3 ; cmp $0x3,%r8 - DB 114,234 ; jb 46cc <_sk_store_f32_sse2+0x6e> + DB 114,234 ; jb 469b <_sk_store_f32_sse2+0x6e> DB 102,71,15,17,76,138,32 ; movupd %xmm9,0x20(%r10,%r9,4) - DB 235,225 ; jmp 46cc <_sk_store_f32_sse2+0x6e> + DB 235,225 ; jmp 469b <_sk_store_f32_sse2+0x6e> PUBLIC _sk_clamp_x_sse2 _sk_clamp_x_sse2 LABEL PROC @@ -23796,7 +23734,7 @@ _sk_repeat_x_sse2 LABEL PROC DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10 DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,84,13,103,29,0,0 ; andps 0x1d67(%rip),%xmm9 # 64d0 <_sk_callback_sse2+0xea7> + DB 68,15,84,13,104,29,0,0 ; andps 0x1d68(%rip),%xmm9 # 64a0 <_sk_callback_sse2+0xea8> DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -23817,7 +23755,7 @@ _sk_repeat_y_sse2 LABEL PROC DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10 DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,84,13,40,29,0,0 ; andps 0x1d28(%rip),%xmm9 # 64e0 <_sk_callback_sse2+0xeb7> + DB 68,15,84,13,41,29,0,0 ; andps 0x1d29(%rip),%xmm9 # 64b0 <_sk_callback_sse2+0xeb8> DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8 DB 69,15,89,208 ; mulps %xmm8,%xmm10 @@ -23838,13 +23776,13 @@ _sk_mirror_x_sse2 LABEL PROC DB 65,15,92,192 ; subps %xmm8,%xmm0 DB 243,69,15,88,201 ; addss %xmm9,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 - DB 243,68,15,89,21,248,32,0,0 ; mulss 0x20f8(%rip),%xmm10 # 6900 <_sk_callback_sse2+0x12d7> + DB 243,68,15,89,21,249,32,0,0 ; mulss 0x20f9(%rip),%xmm10 # 68d0 <_sk_callback_sse2+0x12d8> DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 68,15,89,208 ; mulps %xmm0,%xmm10 DB 243,69,15,91,218 ; cvttps2dq %xmm10,%xmm11 DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11 DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10 - DB 68,15,84,21,201,28,0,0 ; andps 0x1cc9(%rip),%xmm10 # 64f0 <_sk_callback_sse2+0xec7> + DB 68,15,84,21,202,28,0,0 ; andps 0x1cca(%rip),%xmm10 # 64c0 <_sk_callback_sse2+0xec8> DB 69,15,87,228 ; xorps %xmm12,%xmm12 DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 69,15,89,217 ; mulps %xmm9,%xmm11 @@ -23868,13 +23806,13 @@ _sk_mirror_y_sse2 LABEL PROC DB 65,15,92,200 ; subps %xmm8,%xmm1 DB 243,69,15,88,201 ; addss %xmm9,%xmm9 DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9 - DB 243,68,15,89,21,130,32,0,0 ; mulss 0x2082(%rip),%xmm10 # 6904 <_sk_callback_sse2+0x12db> + DB 243,68,15,89,21,131,32,0,0 ; mulss 0x2083(%rip),%xmm10 # 68d4 <_sk_callback_sse2+0x12dc> DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10 DB 68,15,89,209 ; mulps %xmm1,%xmm10 DB 243,69,15,91,218 ; cvttps2dq %xmm10,%xmm11 DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11 DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10 - DB 68,15,84,21,95,28,0,0 ; andps 0x1c5f(%rip),%xmm10 # 6500 <_sk_callback_sse2+0xed7> + DB 68,15,84,21,96,28,0,0 ; andps 0x1c60(%rip),%xmm10 # 64d0 <_sk_callback_sse2+0xed8> DB 69,15,87,228 ; xorps %xmm12,%xmm12 DB 69,15,92,218 ; subps %xmm10,%xmm11 DB 69,15,89,217 ; mulps %xmm9,%xmm11 @@ -23892,7 +23830,7 @@ PUBLIC _sk_clamp_x_1_sse2 _sk_clamp_x_1_sse2 LABEL PROC DB 69,15,87,192 ; xorps %xmm8,%xmm8 DB 68,15,95,192 ; maxps %xmm0,%xmm8 - DB 68,15,93,5,49,28,0,0 ; minps 0x1c31(%rip),%xmm8 # 6510 <_sk_callback_sse2+0xee7> + DB 68,15,93,5,50,28,0,0 ; minps 0x1c32(%rip),%xmm8 # 64e0 <_sk_callback_sse2+0xee8> DB 72,173 ; lods %ds:(%rsi),%rax DB 65,15,40,192 ; movaps %xmm8,%xmm0 DB 255,224 ; jmpq *%rax @@ -23903,7 +23841,7 @@ _sk_repeat_x_1_sse2 LABEL PROC DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8 DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9 - DB 68,15,84,13,31,28,0,0 ; andps 0x1c1f(%rip),%xmm9 # 6520 <_sk_callback_sse2+0xef7> + DB 68,15,84,13,32,28,0,0 ; andps 0x1c20(%rip),%xmm9 # 64f0 <_sk_callback_sse2+0xef8> DB 69,15,92,193 ; subps %xmm9,%xmm8 DB 65,15,92,192 ; subps %xmm8,%xmm0 DB 72,173 ; lods %ds:(%rsi),%rax @@ -23911,14 +23849,14 @@ _sk_repeat_x_1_sse2 LABEL PROC PUBLIC _sk_mirror_x_1_sse2 _sk_mirror_x_1_sse2 LABEL PROC - DB 68,15,40,5,27,28,0,0 ; movaps 0x1c1b(%rip),%xmm8 # 6530 <_sk_callback_sse2+0xf07> + DB 68,15,40,5,28,28,0,0 ; movaps 0x1c1c(%rip),%xmm8 # 6500 <_sk_callback_sse2+0xf08> DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,13,31,28,0,0 ; movaps 0x1c1f(%rip),%xmm9 # 6540 <_sk_callback_sse2+0xf17> + DB 68,15,40,13,32,28,0,0 ; movaps 0x1c20(%rip),%xmm9 # 6510 <_sk_callback_sse2+0xf18> DB 68,15,89,200 ; mulps %xmm0,%xmm9 DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10 DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,84,13,21,28,0,0 ; andps 0x1c15(%rip),%xmm9 # 6550 <_sk_callback_sse2+0xf27> + DB 68,15,84,13,22,28,0,0 ; andps 0x1c16(%rip),%xmm9 # 6520 <_sk_callback_sse2+0xf28> DB 69,15,87,219 ; xorps %xmm11,%xmm11 DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,88,210 ; addps %xmm10,%xmm10 @@ -23932,10 +23870,10 @@ _sk_mirror_x_1_sse2 LABEL PROC PUBLIC _sk_luminance_to_alpha_sse2 _sk_luminance_to_alpha_sse2 LABEL PROC DB 15,40,218 ; movaps %xmm2,%xmm3 - DB 15,89,5,251,27,0,0 ; mulps 0x1bfb(%rip),%xmm0 # 6560 <_sk_callback_sse2+0xf37> - DB 15,89,13,4,28,0,0 ; mulps 0x1c04(%rip),%xmm1 # 6570 <_sk_callback_sse2+0xf47> + DB 15,89,5,252,27,0,0 ; mulps 0x1bfc(%rip),%xmm0 # 6530 <_sk_callback_sse2+0xf38> + DB 15,89,13,5,28,0,0 ; mulps 0x1c05(%rip),%xmm1 # 6540 <_sk_callback_sse2+0xf48> DB 15,88,200 ; addps %xmm0,%xmm1 - DB 15,89,29,10,28,0,0 ; mulps 0x1c0a(%rip),%xmm3 # 6580 <_sk_callback_sse2+0xf57> + DB 15,89,29,11,28,0,0 ; mulps 0x1c0b(%rip),%xmm3 # 6550 <_sk_callback_sse2+0xf58> DB 15,88,217 ; addps %xmm1,%xmm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 15,87,192 ; xorps %xmm0,%xmm0 @@ -24201,9 +24139,9 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC DB 72,139,24 ; mov (%rax),%rbx DB 76,139,112,8 ; mov 0x8(%rax),%r14 DB 72,255,203 ; dec %rbx - DB 120,7 ; js 4db2 <_sk_evenly_spaced_gradient_sse2+0x18> + DB 120,7 ; js 4d81 <_sk_evenly_spaced_gradient_sse2+0x18> DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1 - DB 235,21 ; jmp 4dc7 <_sk_evenly_spaced_gradient_sse2+0x2d> + DB 235,21 ; jmp 4d96 <_sk_evenly_spaced_gradient_sse2+0x2d> DB 73,137,217 ; mov %rbx,%r9 DB 73,209,233 ; shr %r9 DB 131,227,1 ; and $0x1,%ebx @@ -24299,15 +24237,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC PUBLIC _sk_gauss_a_to_rgba_sse2 _sk_gauss_a_to_rgba_sse2 LABEL PROC - DB 15,40,5,61,22,0,0 ; movaps 0x163d(%rip),%xmm0 # 6590 <_sk_callback_sse2+0xf67> + DB 15,40,5,62,22,0,0 ; movaps 0x163e(%rip),%xmm0 # 6560 <_sk_callback_sse2+0xf68> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,67,22,0,0 ; addps 0x1643(%rip),%xmm0 # 65a0 <_sk_callback_sse2+0xf77> + DB 15,88,5,68,22,0,0 ; addps 0x1644(%rip),%xmm0 # 6570 <_sk_callback_sse2+0xf78> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,73,22,0,0 ; addps 0x1649(%rip),%xmm0 # 65b0 <_sk_callback_sse2+0xf87> + DB 15,88,5,74,22,0,0 ; addps 0x164a(%rip),%xmm0 # 6580 <_sk_callback_sse2+0xf88> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,79,22,0,0 ; addps 0x164f(%rip),%xmm0 # 65c0 <_sk_callback_sse2+0xf97> + DB 15,88,5,80,22,0,0 ; addps 0x1650(%rip),%xmm0 # 6590 <_sk_callback_sse2+0xf98> DB 15,89,195 ; mulps %xmm3,%xmm0 - DB 15,88,5,85,22,0,0 ; addps 0x1655(%rip),%xmm0 # 65d0 <_sk_callback_sse2+0xfa7> + DB 15,88,5,86,22,0,0 ; addps 0x1656(%rip),%xmm0 # 65a0 <_sk_callback_sse2+0xfa8> DB 72,173 ; lods %ds:(%rsi),%rax DB 15,40,200 ; movaps %xmm0,%xmm1 DB 15,40,208 ; movaps %xmm0,%xmm2 @@ -24323,12 +24261,12 @@ _sk_gradient_sse2 LABEL PROC DB 76,139,8 ; mov (%rax),%r9 DB 102,15,239,201 ; pxor %xmm1,%xmm1 DB 73,131,249,2 ; cmp $0x2,%r9 - DB 114,50 ; jb 4fce <_sk_gradient_sse2+0x46> + DB 114,50 ; jb 4f9d <_sk_gradient_sse2+0x46> DB 72,139,88,72 ; mov 0x48(%rax),%rbx DB 73,255,201 ; dec %r9 DB 72,131,195,4 ; add $0x4,%rbx DB 102,15,239,201 ; pxor %xmm1,%xmm1 - DB 15,40,21,46,22,0,0 ; movaps 0x162e(%rip),%xmm2 # 65e0 <_sk_callback_sse2+0xfb7> + DB 15,40,21,47,22,0,0 ; movaps 0x162f(%rip),%xmm2 # 65b0 <_sk_callback_sse2+0xfb8> DB 243,15,16,27 ; movss (%rbx),%xmm3 DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3 DB 15,194,216,2 ; cmpleps %xmm0,%xmm3 @@ -24336,7 +24274,7 @@ _sk_gradient_sse2 LABEL PROC DB 102,15,254,203 ; paddd %xmm3,%xmm1 DB 72,131,195,4 ; add $0x4,%rbx DB 73,255,201 ; dec %r9 - DB 117,228 ; jne 4fb2 <_sk_gradient_sse2+0x2a> + DB 117,228 ; jne 4f81 <_sk_gradient_sse2+0x2a> DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2 DB 102,73,15,126,211 ; movq %xmm2,%r11 DB 69,137,217 ; mov %r11d,%r9d @@ -24471,29 +24409,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC DB 69,15,94,220 ; divps %xmm12,%xmm11 DB 69,15,40,227 ; movaps %xmm11,%xmm12 DB 69,15,89,228 ; mulps %xmm12,%xmm12 - DB 68,15,40,45,239,19,0,0 ; movaps 0x13ef(%rip),%xmm13 # 65f0 <_sk_callback_sse2+0xfc7> + DB 68,15,40,45,240,19,0,0 ; movaps 0x13f0(%rip),%xmm13 # 65c0 <_sk_callback_sse2+0xfc8> DB 69,15,89,236 ; mulps %xmm12,%xmm13 - DB 68,15,88,45,243,19,0,0 ; addps 0x13f3(%rip),%xmm13 # 6600 <_sk_callback_sse2+0xfd7> + DB 68,15,88,45,244,19,0,0 ; addps 0x13f4(%rip),%xmm13 # 65d0 <_sk_callback_sse2+0xfd8> DB 69,15,89,236 ; mulps %xmm12,%xmm13 - DB 68,15,88,45,247,19,0,0 ; addps 0x13f7(%rip),%xmm13 # 6610 <_sk_callback_sse2+0xfe7> + DB 68,15,88,45,248,19,0,0 ; addps 0x13f8(%rip),%xmm13 # 65e0 <_sk_callback_sse2+0xfe8> DB 69,15,89,236 ; mulps %xmm12,%xmm13 - DB 68,15,88,45,251,19,0,0 ; addps 0x13fb(%rip),%xmm13 # 6620 <_sk_callback_sse2+0xff7> + DB 68,15,88,45,252,19,0,0 ; addps 0x13fc(%rip),%xmm13 # 65f0 <_sk_callback_sse2+0xff8> DB 69,15,89,235 ; mulps %xmm11,%xmm13 DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9 - DB 68,15,40,21,250,19,0,0 ; movaps 0x13fa(%rip),%xmm10 # 6630 <_sk_callback_sse2+0x1007> + DB 68,15,40,21,251,19,0,0 ; movaps 0x13fb(%rip),%xmm10 # 6600 <_sk_callback_sse2+0x1008> DB 69,15,92,213 ; subps %xmm13,%xmm10 DB 69,15,84,209 ; andps %xmm9,%xmm10 DB 69,15,85,205 ; andnps %xmm13,%xmm9 DB 69,15,86,202 ; orps %xmm10,%xmm9 DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8 - DB 68,15,40,21,237,19,0,0 ; movaps 0x13ed(%rip),%xmm10 # 6640 <_sk_callback_sse2+0x1017> + DB 68,15,40,21,238,19,0,0 ; movaps 0x13ee(%rip),%xmm10 # 6610 <_sk_callback_sse2+0x1018> DB 69,15,92,209 ; subps %xmm9,%xmm10 DB 69,15,84,208 ; andps %xmm8,%xmm10 DB 69,15,85,193 ; andnps %xmm9,%xmm8 DB 69,15,86,194 ; orps %xmm10,%xmm8 DB 68,15,40,201 ; movaps %xmm1,%xmm9 DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9 - DB 68,15,40,21,220,19,0,0 ; movaps 0x13dc(%rip),%xmm10 # 6650 <_sk_callback_sse2+0x1027> + DB 68,15,40,21,221,19,0,0 ; movaps 0x13dd(%rip),%xmm10 # 6620 <_sk_callback_sse2+0x1028> DB 69,15,92,208 ; subps %xmm8,%xmm10 DB 69,15,84,209 ; andps %xmm9,%xmm10 DB 69,15,85,200 ; andnps %xmm8,%xmm9 @@ -24516,7 +24454,7 @@ _sk_xy_to_radius_sse2 LABEL PROC PUBLIC _sk_save_xy_sse2 _sk_save_xy_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,174,19,0,0 ; movaps 0x13ae(%rip),%xmm8 # 6660 <_sk_callback_sse2+0x1037> + DB 68,15,40,5,175,19,0,0 ; movaps 0x13af(%rip),%xmm8 # 6630 <_sk_callback_sse2+0x1038> DB 15,17,0 ; movups %xmm0,(%rax) DB 68,15,40,200 ; movaps %xmm0,%xmm9 DB 69,15,88,200 ; addps %xmm8,%xmm9 @@ -24524,7 +24462,7 @@ _sk_save_xy_sse2 LABEL PROC DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10 DB 69,15,40,217 ; movaps %xmm9,%xmm11 DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11 - DB 68,15,40,37,153,19,0,0 ; movaps 0x1399(%rip),%xmm12 # 6670 <_sk_callback_sse2+0x1047> + DB 68,15,40,37,154,19,0,0 ; movaps 0x139a(%rip),%xmm12 # 6640 <_sk_callback_sse2+0x1048> DB 69,15,84,220 ; andps %xmm12,%xmm11 DB 69,15,92,211 ; subps %xmm11,%xmm10 DB 69,15,92,202 ; subps %xmm10,%xmm9 @@ -24567,8 +24505,8 @@ _sk_bilinear_nx_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,18,19,0,0 ; addps 0x1312(%rip),%xmm0 # 6680 <_sk_callback_sse2+0x1057> - DB 68,15,40,13,26,19,0,0 ; movaps 0x131a(%rip),%xmm9 # 6690 <_sk_callback_sse2+0x1067> + DB 15,88,5,19,19,0,0 ; addps 0x1313(%rip),%xmm0 # 6650 <_sk_callback_sse2+0x1058> + DB 68,15,40,13,27,19,0,0 ; movaps 0x131b(%rip),%xmm9 # 6660 <_sk_callback_sse2+0x1068> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -24579,7 +24517,7 @@ _sk_bilinear_px_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,9,19,0,0 ; addps 0x1309(%rip),%xmm0 # 66a0 <_sk_callback_sse2+0x1077> + DB 15,88,5,10,19,0,0 ; addps 0x130a(%rip),%xmm0 # 6670 <_sk_callback_sse2+0x1078> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -24589,8 +24527,8 @@ _sk_bilinear_ny_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,251,18,0,0 ; addps 0x12fb(%rip),%xmm1 # 66b0 <_sk_callback_sse2+0x1087> - DB 68,15,40,13,3,19,0,0 ; movaps 0x1303(%rip),%xmm9 # 66c0 <_sk_callback_sse2+0x1097> + DB 15,88,13,252,18,0,0 ; addps 0x12fc(%rip),%xmm1 # 6680 <_sk_callback_sse2+0x1088> + DB 68,15,40,13,4,19,0,0 ; movaps 0x1304(%rip),%xmm9 # 6690 <_sk_callback_sse2+0x1098> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -24601,7 +24539,7 @@ _sk_bilinear_py_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,241,18,0,0 ; addps 0x12f1(%rip),%xmm1 # 66d0 <_sk_callback_sse2+0x10a7> + DB 15,88,13,242,18,0,0 ; addps 0x12f2(%rip),%xmm1 # 66a0 <_sk_callback_sse2+0x10a8> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -24611,13 +24549,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,228,18,0,0 ; addps 0x12e4(%rip),%xmm0 # 66e0 <_sk_callback_sse2+0x10b7> - DB 68,15,40,13,236,18,0,0 ; movaps 0x12ec(%rip),%xmm9 # 66f0 <_sk_callback_sse2+0x10c7> + DB 15,88,5,229,18,0,0 ; addps 0x12e5(%rip),%xmm0 # 66b0 <_sk_callback_sse2+0x10b8> + DB 68,15,40,13,237,18,0,0 ; movaps 0x12ed(%rip),%xmm9 # 66c0 <_sk_callback_sse2+0x10c8> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,232,18,0,0 ; mulps 0x12e8(%rip),%xmm9 # 6700 <_sk_callback_sse2+0x10d7> - DB 68,15,88,13,240,18,0,0 ; addps 0x12f0(%rip),%xmm9 # 6710 <_sk_callback_sse2+0x10e7> + DB 68,15,89,13,233,18,0,0 ; mulps 0x12e9(%rip),%xmm9 # 66d0 <_sk_callback_sse2+0x10d8> + DB 68,15,88,13,241,18,0,0 ; addps 0x12f1(%rip),%xmm9 # 66e0 <_sk_callback_sse2+0x10e8> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -24628,16 +24566,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,223,18,0,0 ; addps 0x12df(%rip),%xmm0 # 6720 <_sk_callback_sse2+0x10f7> - DB 68,15,40,13,231,18,0,0 ; movaps 0x12e7(%rip),%xmm9 # 6730 <_sk_callback_sse2+0x1107> + DB 15,88,5,224,18,0,0 ; addps 0x12e0(%rip),%xmm0 # 66f0 <_sk_callback_sse2+0x10f8> + DB 68,15,40,13,232,18,0,0 ; movaps 0x12e8(%rip),%xmm9 # 6700 <_sk_callback_sse2+0x1108> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,235,18,0,0 ; movaps 0x12eb(%rip),%xmm8 # 6740 <_sk_callback_sse2+0x1117> + DB 68,15,40,5,236,18,0,0 ; movaps 0x12ec(%rip),%xmm8 # 6710 <_sk_callback_sse2+0x1118> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,239,18,0,0 ; addps 0x12ef(%rip),%xmm8 # 6750 <_sk_callback_sse2+0x1127> + DB 68,15,88,5,240,18,0,0 ; addps 0x12f0(%rip),%xmm8 # 6720 <_sk_callback_sse2+0x1128> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,243,18,0,0 ; addps 0x12f3(%rip),%xmm8 # 6760 <_sk_callback_sse2+0x1137> + DB 68,15,88,5,244,18,0,0 ; addps 0x12f4(%rip),%xmm8 # 6730 <_sk_callback_sse2+0x1138> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,247,18,0,0 ; addps 0x12f7(%rip),%xmm8 # 6770 <_sk_callback_sse2+0x1147> + DB 68,15,88,5,248,18,0,0 ; addps 0x12f8(%rip),%xmm8 # 6740 <_sk_callback_sse2+0x1148> DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -24645,17 +24583,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC PUBLIC _sk_bicubic_p1x_sse2 _sk_bicubic_p1x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,241,18,0,0 ; movaps 0x12f1(%rip),%xmm8 # 6780 <_sk_callback_sse2+0x1157> + DB 68,15,40,5,242,18,0,0 ; movaps 0x12f2(%rip),%xmm8 # 6750 <_sk_callback_sse2+0x1158> DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9 DB 65,15,88,192 ; addps %xmm8,%xmm0 - DB 68,15,40,21,237,18,0,0 ; movaps 0x12ed(%rip),%xmm10 # 6790 <_sk_callback_sse2+0x1167> + DB 68,15,40,21,238,18,0,0 ; movaps 0x12ee(%rip),%xmm10 # 6760 <_sk_callback_sse2+0x1168> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,241,18,0,0 ; addps 0x12f1(%rip),%xmm10 # 67a0 <_sk_callback_sse2+0x1177> + DB 68,15,88,21,242,18,0,0 ; addps 0x12f2(%rip),%xmm10 # 6770 <_sk_callback_sse2+0x1178> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,237,18,0,0 ; addps 0x12ed(%rip),%xmm10 # 67b0 <_sk_callback_sse2+0x1187> + DB 68,15,88,21,238,18,0,0 ; addps 0x12ee(%rip),%xmm10 # 6780 <_sk_callback_sse2+0x1188> DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -24665,11 +24603,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,0 ; movups (%rax),%xmm0 DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8 - DB 15,88,5,224,18,0,0 ; addps 0x12e0(%rip),%xmm0 # 67c0 <_sk_callback_sse2+0x1197> + DB 15,88,5,225,18,0,0 ; addps 0x12e1(%rip),%xmm0 # 6790 <_sk_callback_sse2+0x1198> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,224,18,0,0 ; mulps 0x12e0(%rip),%xmm8 # 67d0 <_sk_callback_sse2+0x11a7> - DB 68,15,88,5,232,18,0,0 ; addps 0x12e8(%rip),%xmm8 # 67e0 <_sk_callback_sse2+0x11b7> + DB 68,15,89,5,225,18,0,0 ; mulps 0x12e1(%rip),%xmm8 # 67a0 <_sk_callback_sse2+0x11a8> + DB 68,15,88,5,233,18,0,0 ; addps 0x12e9(%rip),%xmm8 # 67b0 <_sk_callback_sse2+0x11b8> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -24680,13 +24618,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,214,18,0,0 ; addps 0x12d6(%rip),%xmm1 # 67f0 <_sk_callback_sse2+0x11c7> - DB 68,15,40,13,222,18,0,0 ; movaps 0x12de(%rip),%xmm9 # 6800 <_sk_callback_sse2+0x11d7> + DB 15,88,13,215,18,0,0 ; addps 0x12d7(%rip),%xmm1 # 67c0 <_sk_callback_sse2+0x11c8> + DB 68,15,40,13,223,18,0,0 ; movaps 0x12df(%rip),%xmm9 # 67d0 <_sk_callback_sse2+0x11d8> DB 69,15,92,200 ; subps %xmm8,%xmm9 DB 69,15,40,193 ; movaps %xmm9,%xmm8 DB 69,15,89,192 ; mulps %xmm8,%xmm8 - DB 68,15,89,13,218,18,0,0 ; mulps 0x12da(%rip),%xmm9 # 6810 <_sk_callback_sse2+0x11e7> - DB 68,15,88,13,226,18,0,0 ; addps 0x12e2(%rip),%xmm9 # 6820 <_sk_callback_sse2+0x11f7> + DB 68,15,89,13,219,18,0,0 ; mulps 0x12db(%rip),%xmm9 # 67e0 <_sk_callback_sse2+0x11e8> + DB 68,15,88,13,227,18,0,0 ; addps 0x12e3(%rip),%xmm9 # 67f0 <_sk_callback_sse2+0x11f8> DB 69,15,89,200 ; mulps %xmm8,%xmm9 DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -24697,16 +24635,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,208,18,0,0 ; addps 0x12d0(%rip),%xmm1 # 6830 <_sk_callback_sse2+0x1207> - DB 68,15,40,13,216,18,0,0 ; movaps 0x12d8(%rip),%xmm9 # 6840 <_sk_callback_sse2+0x1217> + DB 15,88,13,209,18,0,0 ; addps 0x12d1(%rip),%xmm1 # 6800 <_sk_callback_sse2+0x1208> + DB 68,15,40,13,217,18,0,0 ; movaps 0x12d9(%rip),%xmm9 # 6810 <_sk_callback_sse2+0x1218> DB 69,15,92,200 ; subps %xmm8,%xmm9 - DB 68,15,40,5,220,18,0,0 ; movaps 0x12dc(%rip),%xmm8 # 6850 <_sk_callback_sse2+0x1227> + DB 68,15,40,5,221,18,0,0 ; movaps 0x12dd(%rip),%xmm8 # 6820 <_sk_callback_sse2+0x1228> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,224,18,0,0 ; addps 0x12e0(%rip),%xmm8 # 6860 <_sk_callback_sse2+0x1237> + DB 68,15,88,5,225,18,0,0 ; addps 0x12e1(%rip),%xmm8 # 6830 <_sk_callback_sse2+0x1238> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,228,18,0,0 ; addps 0x12e4(%rip),%xmm8 # 6870 <_sk_callback_sse2+0x1247> + DB 68,15,88,5,229,18,0,0 ; addps 0x12e5(%rip),%xmm8 # 6840 <_sk_callback_sse2+0x1248> DB 69,15,89,193 ; mulps %xmm9,%xmm8 - DB 68,15,88,5,232,18,0,0 ; addps 0x12e8(%rip),%xmm8 # 6880 <_sk_callback_sse2+0x1257> + DB 68,15,88,5,233,18,0,0 ; addps 0x12e9(%rip),%xmm8 # 6850 <_sk_callback_sse2+0x1258> DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -24714,17 +24652,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC PUBLIC _sk_bicubic_p1y_sse2 _sk_bicubic_p1y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 68,15,40,5,226,18,0,0 ; movaps 0x12e2(%rip),%xmm8 # 6890 <_sk_callback_sse2+0x1267> + DB 68,15,40,5,227,18,0,0 ; movaps 0x12e3(%rip),%xmm8 # 6860 <_sk_callback_sse2+0x1268> DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9 DB 65,15,88,200 ; addps %xmm8,%xmm1 - DB 68,15,40,21,221,18,0,0 ; movaps 0x12dd(%rip),%xmm10 # 68a0 <_sk_callback_sse2+0x1277> + DB 68,15,40,21,222,18,0,0 ; movaps 0x12de(%rip),%xmm10 # 6870 <_sk_callback_sse2+0x1278> DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,225,18,0,0 ; addps 0x12e1(%rip),%xmm10 # 68b0 <_sk_callback_sse2+0x1287> + DB 68,15,88,21,226,18,0,0 ; addps 0x12e2(%rip),%xmm10 # 6880 <_sk_callback_sse2+0x1288> DB 69,15,89,209 ; mulps %xmm9,%xmm10 DB 69,15,88,208 ; addps %xmm8,%xmm10 DB 69,15,89,209 ; mulps %xmm9,%xmm10 - DB 68,15,88,21,221,18,0,0 ; addps 0x12dd(%rip),%xmm10 # 68c0 <_sk_callback_sse2+0x1297> + DB 68,15,88,21,222,18,0,0 ; addps 0x12de(%rip),%xmm10 # 6890 <_sk_callback_sse2+0x1298> DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -24734,11 +24672,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,72,32 ; movups 0x20(%rax),%xmm1 DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8 - DB 15,88,13,207,18,0,0 ; addps 0x12cf(%rip),%xmm1 # 68d0 <_sk_callback_sse2+0x12a7> + DB 15,88,13,208,18,0,0 ; addps 0x12d0(%rip),%xmm1 # 68a0 <_sk_callback_sse2+0x12a8> DB 69,15,40,200 ; movaps %xmm8,%xmm9 DB 69,15,89,201 ; mulps %xmm9,%xmm9 - DB 68,15,89,5,207,18,0,0 ; mulps 0x12cf(%rip),%xmm8 # 68e0 <_sk_callback_sse2+0x12b7> - DB 68,15,88,5,215,18,0,0 ; addps 0x12d7(%rip),%xmm8 # 68f0 <_sk_callback_sse2+0x12c7> + DB 68,15,89,5,208,18,0,0 ; mulps 0x12d0(%rip),%xmm8 # 68b0 <_sk_callback_sse2+0x12b8> + DB 68,15,88,5,216,18,0,0 ; addps 0x12d8(%rip),%xmm8 # 68c0 <_sk_callback_sse2+0x12c8> DB 69,15,89,193 ; mulps %xmm9,%xmm8 DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax) DB 72,173 ; lods %ds:(%rsi),%rax @@ -24956,11 +24894,11 @@ ALIGN 16 DB 128,191,0,0,128,191,0 ; cmpb $0x0,-0x40800000(%rdi) DB 0,224 ; add %ah,%al DB 64,0,0 ; add %al,(%rax) - DB 224,64 ; loopne 58d8 <.literal16+0x1d8> + DB 224,64 ; loopne 58a8 <.literal16+0x1d8> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 58dc <.literal16+0x1dc> + DB 224,64 ; loopne 58ac <.literal16+0x1dc> DB 0,0 ; add %al,(%rax) - DB 224,64 ; loopne 58e0 <.literal16+0x1e0> + DB 224,64 ; loopne 58b0 <.literal16+0x1e0> DB 154 ; (bad) DB 153 ; cltd DB 153 ; cltd @@ -24980,13 +24918,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5901 <.literal16+0x201> + DB 71,225,61 ; rex.RXB loope 58d1 <.literal16+0x201> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5905 <.literal16+0x205> + DB 71,225,61 ; rex.RXB loope 58d5 <.literal16+0x205> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5909 <.literal16+0x209> + DB 71,225,61 ; rex.RXB loope 58d9 <.literal16+0x209> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 590d <.literal16+0x20d> + DB 71,225,61 ; rex.RXB loope 58dd <.literal16+0x20d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -25011,13 +24949,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5941 <.literal16+0x241> + DB 71,225,61 ; rex.RXB loope 5911 <.literal16+0x241> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5945 <.literal16+0x245> + DB 71,225,61 ; rex.RXB loope 5915 <.literal16+0x245> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5949 <.literal16+0x249> + DB 71,225,61 ; rex.RXB loope 5919 <.literal16+0x249> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 594d <.literal16+0x24d> + DB 71,225,61 ; rex.RXB loope 591d <.literal16+0x24d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -25042,13 +24980,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5981 <.literal16+0x281> + DB 71,225,61 ; rex.RXB loope 5951 <.literal16+0x281> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5985 <.literal16+0x285> + DB 71,225,61 ; rex.RXB loope 5955 <.literal16+0x285> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 5989 <.literal16+0x289> + DB 71,225,61 ; rex.RXB loope 5959 <.literal16+0x289> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 598d <.literal16+0x28d> + DB 71,225,61 ; rex.RXB loope 595d <.literal16+0x28d> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -25073,13 +25011,13 @@ ALIGN 16 DB 10,23 ; or (%rdi),%dl DB 63 ; (bad) DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 59c1 <.literal16+0x2c1> + DB 71,225,61 ; rex.RXB loope 5991 <.literal16+0x2c1> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 59c5 <.literal16+0x2c5> + DB 71,225,61 ; rex.RXB loope 5995 <.literal16+0x2c5> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 59c9 <.literal16+0x2c9> + DB 71,225,61 ; rex.RXB loope 5999 <.literal16+0x2c9> DB 174 ; scas %es:(%rdi),%al - DB 71,225,61 ; rex.RXB loope 59cd <.literal16+0x2cd> + DB 71,225,61 ; rex.RXB loope 599d <.literal16+0x2cd> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -25100,11 +25038,11 @@ ALIGN 16 DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,127 ; add %al,0x7f00003f(%rax) DB 67,0,0 ; rex.XB add %al,(%r8) - DB 127,67 ; jg 5a0b <.literal16+0x30b> + DB 127,67 ; jg 59db <.literal16+0x30b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5a0f <.literal16+0x30f> + DB 127,67 ; jg 59df <.literal16+0x30f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5a13 <.literal16+0x313> + DB 127,67 ; jg 59e3 <.literal16+0x313> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -25344,13 +25282,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 5bf9 <.literal16+0x4f9> + DB 224,7 ; loopne 5bc9 <.literal16+0x4f9> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5bfd <.literal16+0x4fd> + DB 224,7 ; loopne 5bcd <.literal16+0x4fd> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5c01 <.literal16+0x501> + DB 224,7 ; loopne 5bd1 <.literal16+0x501> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 5c05 <.literal16+0x505> + DB 224,7 ; loopne 5bd5 <.literal16+0x505> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -25415,11 +25353,11 @@ ALIGN 16 DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5cdb <.literal16+0x5db> + DB 127,67 ; jg 5cab <.literal16+0x5db> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5cdf <.literal16+0x5df> + DB 127,67 ; jg 5caf <.literal16+0x5df> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 5ce3 <.literal16+0x5e3> + DB 127,67 ; jg 5cb3 <.literal16+0x5e3> DB 129,128,128,59,129,128,128,59,129,128; addl $0x80813b80,-0x7f7ec480(%rax) DB 128,59,129 ; cmpb $0x81,(%rbx) DB 128,128,59,129,128,128,59 ; addb $0x3b,-0x7f7f7ec5(%rax) @@ -25434,16 +25372,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 5cd4 <.literal16+0x5d4> + DB 127,0 ; jg 5ca4 <.literal16+0x5d4> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5cd8 <.literal16+0x5d8> + DB 127,0 ; jg 5ca8 <.literal16+0x5d8> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5cdc <.literal16+0x5dc> + DB 127,0 ; jg 5cac <.literal16+0x5dc> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5ce0 <.literal16+0x5e0> + DB 127,0 ; jg 5cb0 <.literal16+0x5e0> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -25452,7 +25390,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 5d65 <.literal16+0x665> + DB 119,115 ; ja 5d35 <.literal16+0x665> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -25463,7 +25401,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 5cc9 <.literal16+0x5c9> + DB 117,191 ; jne 5c99 <.literal16+0x5c9> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -25475,7 +25413,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a39d0a <_sk_callback_sse2+0xffffffffe9a346e1> + DB 233,220,63,163,233 ; jmpq ffffffffe9a39cda <_sk_callback_sse2+0xffffffffe9a346e2> DB 220,63 ; fdivrl (%rdi) DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) @@ -25529,16 +25467,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 5da4 <.literal16+0x6a4> + DB 127,0 ; jg 5d74 <.literal16+0x6a4> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5da8 <.literal16+0x6a8> + DB 127,0 ; jg 5d78 <.literal16+0x6a8> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5dac <.literal16+0x6ac> + DB 127,0 ; jg 5d7c <.literal16+0x6ac> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5db0 <.literal16+0x6b0> + DB 127,0 ; jg 5d80 <.literal16+0x6b0> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -25547,7 +25485,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 5e35 <.literal16+0x735> + DB 119,115 ; ja 5e05 <.literal16+0x735> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -25558,7 +25496,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 5d99 <.literal16+0x699> + DB 117,191 ; jne 5d69 <.literal16+0x699> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -25570,7 +25508,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a39dda <_sk_callback_sse2+0xffffffffe9a347b1> + DB 233,220,63,163,233 ; jmpq ffffffffe9a39daa <_sk_callback_sse2+0xffffffffe9a347b2> DB 220,63 ; fdivrl (%rdi) DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) @@ -25624,16 +25562,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 5e74 <.literal16+0x774> + DB 127,0 ; jg 5e44 <.literal16+0x774> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5e78 <.literal16+0x778> + DB 127,0 ; jg 5e48 <.literal16+0x778> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5e7c <.literal16+0x77c> + DB 127,0 ; jg 5e4c <.literal16+0x77c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5e80 <.literal16+0x780> + DB 127,0 ; jg 5e50 <.literal16+0x780> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -25642,7 +25580,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 5f05 <.literal16+0x805> + DB 119,115 ; ja 5ed5 <.literal16+0x805> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -25653,7 +25591,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 5e69 <.literal16+0x769> + DB 117,191 ; jne 5e39 <.literal16+0x769> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -25665,7 +25603,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a39eaa <_sk_callback_sse2+0xffffffffe9a34881> + DB 233,220,63,163,233 ; jmpq ffffffffe9a39e7a <_sk_callback_sse2+0xffffffffe9a34882> DB 220,63 ; fdivrl (%rdi) DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) @@ -25719,16 +25657,16 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 52,255 ; xor $0xff,%al DB 255 ; (bad) - DB 127,0 ; jg 5f44 <.literal16+0x844> + DB 127,0 ; jg 5f14 <.literal16+0x844> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5f48 <.literal16+0x848> + DB 127,0 ; jg 5f18 <.literal16+0x848> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5f4c <.literal16+0x84c> + DB 127,0 ; jg 5f1c <.literal16+0x84c> DB 255 ; (bad) DB 255 ; (bad) - DB 127,0 ; jg 5f50 <.literal16+0x850> + DB 127,0 ; jg 5f20 <.literal16+0x850> DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -25737,7 +25675,7 @@ ALIGN 16 DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) - DB 119,115 ; ja 5fd5 <.literal16+0x8d5> + DB 119,115 ; ja 5fa5 <.literal16+0x8d5> DB 248 ; clc DB 194,119,115 ; retq $0x7377 DB 248 ; clc @@ -25748,7 +25686,7 @@ ALIGN 16 DB 194,117,191 ; retq $0xbf75 DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) - DB 117,191 ; jne 5f39 <.literal16+0x839> + DB 117,191 ; jne 5f09 <.literal16+0x839> DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi DB 63 ; (bad) DB 249 ; stc @@ -25760,7 +25698,7 @@ ALIGN 16 DB 249 ; stc DB 68,180,62 ; rex.R mov $0x3e,%spl DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9 - DB 233,220,63,163,233 ; jmpq ffffffffe9a39f7a <_sk_callback_sse2+0xffffffffe9a34951> + DB 233,220,63,163,233 ; jmpq ffffffffe9a39f4a <_sk_callback_sse2+0xffffffffe9a34952> DB 220,63 ; fdivrl (%rdi) DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) @@ -25810,13 +25748,13 @@ ALIGN 16 DB 200,66,0,0 ; enterq $0x42,$0x0 DB 200,66,0,0 ; enterq $0x42,$0x0 DB 200,66,0,0 ; enterq $0x42,$0x0 - DB 127,67 ; jg 6057 <.literal16+0x957> + DB 127,67 ; jg 6027 <.literal16+0x957> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 605b <.literal16+0x95b> + DB 127,67 ; jg 602b <.literal16+0x95b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 605f <.literal16+0x95f> + DB 127,67 ; jg 602f <.literal16+0x95f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6063 <.literal16+0x963> + DB 127,67 ; jg 6033 <.literal16+0x963> DB 0,0 ; add %al,(%rax) DB 0,195 ; add %al,%bl DB 0,0 ; add %al,(%rax) @@ -25863,16 +25801,16 @@ ALIGN 16 DB 128,3,62 ; addb $0x3e,(%rbx) DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 60e3 <.literal16+0x9e3> + DB 118,63 ; jbe 60b3 <.literal16+0x9e3> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 60e7 <.literal16+0x9e7> + DB 118,63 ; jbe 60b7 <.literal16+0x9e7> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 60eb <.literal16+0x9eb> + DB 118,63 ; jbe 60bb <.literal16+0x9eb> DB 31 ; (bad) DB 215 ; xlat %ds:(%rbx) - DB 118,63 ; jbe 60ef <.literal16+0x9ef> + DB 118,63 ; jbe 60bf <.literal16+0x9ef> DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) DB 246,64,83,63 ; testb $0x3f,0x53(%rax) @@ -25892,11 +25830,11 @@ ALIGN 16 DB 128,59,0 ; cmpb $0x0,(%rbx) DB 0,127,67 ; add %bh,0x43(%rdi) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 613b <.literal16+0xa3b> + DB 127,67 ; jg 610b <.literal16+0xa3b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 613f <.literal16+0xa3f> + DB 127,67 ; jg 610f <.literal16+0xa3f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6143 <.literal16+0xa43> + DB 127,67 ; jg 6113 <.literal16+0xa43> DB 255,0 ; incl (%rax) DB 0,0 ; add %al,(%rax) DB 255,0 ; incl (%rax) @@ -25952,13 +25890,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 61a9 <.literal16+0xaa9> + DB 224,7 ; loopne 6179 <.literal16+0xaa9> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 61ad <.literal16+0xaad> + DB 224,7 ; loopne 617d <.literal16+0xaad> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 61b1 <.literal16+0xab1> + DB 224,7 ; loopne 6181 <.literal16+0xab1> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 61b5 <.literal16+0xab5> + DB 224,7 ; loopne 6185 <.literal16+0xab5> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -26004,13 +25942,13 @@ ALIGN 16 DB 132,55 ; test %dh,(%rdi) DB 8,33 ; or %ah,(%rcx) DB 132,55 ; test %dh,(%rdi) - DB 224,7 ; loopne 6219 <.literal16+0xb19> + DB 224,7 ; loopne 61e9 <.literal16+0xb19> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 621d <.literal16+0xb1d> + DB 224,7 ; loopne 61ed <.literal16+0xb1d> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6221 <.literal16+0xb21> + DB 224,7 ; loopne 61f1 <.literal16+0xb21> DB 0,0 ; add %al,(%rax) - DB 224,7 ; loopne 6225 <.literal16+0xb25> + DB 224,7 ; loopne 61f5 <.literal16+0xb25> DB 0,0 ; add %al,(%rax) DB 33,8 ; and %ecx,(%rax) DB 2,58 ; add (%rdx),%bh @@ -26048,13 +25986,13 @@ ALIGN 16 DB 65,0,0 ; add %al,(%r8) DB 248 ; clc DB 65,0,0 ; add %al,(%r8) - DB 124,66 ; jl 62b6 <.literal16+0xbb6> + DB 124,66 ; jl 6286 <.literal16+0xbb6> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 62ba <.literal16+0xbba> + DB 124,66 ; jl 628a <.literal16+0xbba> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 62be <.literal16+0xbbe> + DB 124,66 ; jl 628e <.literal16+0xbbe> DB 0,0 ; add %al,(%rax) - DB 124,66 ; jl 62c2 <.literal16+0xbc2> + DB 124,66 ; jl 6292 <.literal16+0xbc2> DB 0,240 ; add %dh,%al DB 0,0 ; add %al,(%rax) DB 0,240 ; add %dh,%al @@ -26144,13 +26082,13 @@ ALIGN 16 DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax) DB 61,137,136,136,61 ; cmp $0x3d888889,%eax DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 63c5 <.literal16+0xcc5> + DB 112,65 ; jo 6395 <.literal16+0xcc5> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 63c9 <.literal16+0xcc9> + DB 112,65 ; jo 6399 <.literal16+0xcc9> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 63cd <.literal16+0xccd> + DB 112,65 ; jo 639d <.literal16+0xccd> DB 0,0 ; add %al,(%rax) - DB 112,65 ; jo 63d1 <.literal16+0xcd1> + DB 112,65 ; jo 63a1 <.literal16+0xcd1> DB 255,0 ; incl (%rax) DB 0,0 ; add %al,(%rax) DB 255,0 ; incl (%rax) @@ -26172,11 +26110,11 @@ ALIGN 16 DB 128,59,129 ; cmpb $0x81,(%rbx) DB 128,128,59,0,0,127,67 ; addb $0x43,0x7f00003b(%rax) DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 641b <.literal16+0xd1b> + DB 127,67 ; jg 63eb <.literal16+0xd1b> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 641f <.literal16+0xd1f> + DB 127,67 ; jg 63ef <.literal16+0xd1f> DB 0,0 ; add %al,(%rax) - DB 127,67 ; jg 6423 <.literal16+0xd23> + DB 127,67 ; jg 63f3 <.literal16+0xd23> DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) DB 0,0 ; add %al,(%rax) DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax) @@ -26252,13 +26190,13 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 255 ; (bad) - DB 127,71 ; jg 650b <.literal16+0xe0b> + DB 127,71 ; jg 64db <.literal16+0xe0b> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 650f <.literal16+0xe0f> + DB 127,71 ; jg 64df <.literal16+0xe0f> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 6513 <.literal16+0xe13> + DB 127,71 ; jg 64e3 <.literal16+0xe13> DB 0,255 ; add %bh,%bh - DB 127,71 ; jg 6517 <.literal16+0xe17> + DB 127,71 ; jg 64e7 <.literal16+0xe17> DB 0,0 ; add %al,(%rax) DB 128,63,0 ; cmpb $0x0,(%rdi) DB 0,128,63,0,0,128 ; add %al,-0x7fffffc1(%rax) @@ -26335,10 +26273,10 @@ ALIGN 16 DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax DB 152 ; cwtl DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx) - DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc076aa <_sk_callback_sse2+0x2dc02081> + DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc0767a <_sk_callback_sse2+0x2dc02082> DB 17,192 ; adc %eax,%eax DB 45,16,17,192,18 ; sub $0x12c01110,%eax - DB 120,57 ; js 65dc <.literal16+0xedc> + DB 120,57 ; js 65ac <.literal16+0xedc> DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil DB 64,18,120,57 ; adc 0x39(%rax),%dil @@ -26466,11 +26404,11 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,114 ; cmpb $0x72,(%rdi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt 6722 <.literal16+0x1022> + DB 62,114,28 ; jb,pt 66f2 <.literal16+0x1022> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6726 <.literal16+0x1026> + DB 62,114,28 ; jb,pt 66f6 <.literal16+0x1026> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 672a <.literal16+0x102a> + DB 62,114,28 ; jb,pt 66fa <.literal16+0x102a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -26514,7 +26452,7 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f5b5 <_sk_callback_sse2+0x3d639f8c> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f585 <_sk_callback_sse2+0x3d639f8d> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -26540,7 +26478,7 @@ ALIGN 16 DB 0,192 ; add %al,%al DB 63 ; (bad) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f5f5 <_sk_callback_sse2+0x3d639fcc> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f5c5 <_sk_callback_sse2+0x3d639fcd> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al @@ -26549,13 +26487,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al DB 63 ; (bad) - DB 114,28 ; jb 67ee <.literal16+0x10ee> + DB 114,28 ; jb 67be <.literal16+0x10ee> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 67f2 <.literal16+0x10f2> + DB 62,114,28 ; jb,pt 67c2 <.literal16+0x10f2> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 67f6 <.literal16+0x10f6> + DB 62,114,28 ; jb,pt 67c6 <.literal16+0x10f6> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 67fa <.literal16+0x10fa> + DB 62,114,28 ; jb,pt 67ca <.literal16+0x10fa> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -26576,11 +26514,11 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 128,63,114 ; cmpb $0x72,(%rdi) DB 28,199 ; sbb $0xc7,%al - DB 62,114,28 ; jb,pt 6832 <.literal16+0x1132> + DB 62,114,28 ; jb,pt 6802 <.literal16+0x1132> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6836 <.literal16+0x1136> + DB 62,114,28 ; jb,pt 6806 <.literal16+0x1136> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 683a <.literal16+0x113a> + DB 62,114,28 ; jb,pt 680a <.literal16+0x113a> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -26624,7 +26562,7 @@ ALIGN 16 DB 0,0 ; add %al,(%rax) DB 0,63 ; add %bh,(%rdi) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f6c5 <_sk_callback_sse2+0x3d63a09c> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f695 <_sk_callback_sse2+0x3d63a09d> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 0,63 ; add %bh,(%rdi) DB 0,0 ; add %al,(%rax) @@ -26650,7 +26588,7 @@ ALIGN 16 DB 0,192 ; add %al,%al DB 63 ; (bad) DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi) - DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f705 <_sk_callback_sse2+0x3d63a0dc> + DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d63f6d5 <_sk_callback_sse2+0x3d63a0dd> DB 57,142,99,61,0,0 ; cmp %ecx,0x3d63(%rsi) DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al @@ -26659,13 +26597,13 @@ ALIGN 16 DB 192,63,0 ; sarb $0x0,(%rdi) DB 0,192 ; add %al,%al DB 63 ; (bad) - DB 114,28 ; jb 68fe <.literal16+0x11fe> + DB 114,28 ; jb 68ce <.literal16+0x11fe> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6902 <_sk_callback_sse2+0x12d9> + DB 62,114,28 ; jb,pt 68d2 <_sk_callback_sse2+0x12da> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 6906 <_sk_callback_sse2+0x12dd> + DB 62,114,28 ; jb,pt 68d6 <_sk_callback_sse2+0x12de> DB 199 ; (bad) - DB 62,114,28 ; jb,pt 690a <_sk_callback_sse2+0x12e1> + DB 62,114,28 ; jb,pt 68da <_sk_callback_sse2+0x12e2> DB 199 ; (bad) DB 62,171 ; ds stos %eax,%es:(%rdi) DB 170 ; stos %al,%es:(%rdi) @@ -26707,53 +26645,37 @@ _sk_start_pipeline_hsw_lowp LABEL PROC DB 197,248,41,181,32,255,255,255 ; vmovaps %xmm6,-0xe0(%rbp) DB 76,137,195 ; mov %r8,%rbx DB 73,137,210 ; mov %rdx,%r10 - DB 73,137,207 ; mov %rcx,%r15 + DB 73,137,204 ; mov %rcx,%r12 DB 76,139,117,48 ; mov 0x30(%rbp),%r14 DB 76,137,206 ; mov %r9,%rsi DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,197 ; mov %rax,%r13 - DB 73,137,244 ; mov %rsi,%r12 - DB 73,141,79,16 ; lea 0x10(%r15),%rcx + DB 73,137,247 ; mov %rsi,%r15 + DB 73,141,76,36,16 ; lea 0x10(%r12),%rcx DB 72,57,217 ; cmp %rbx,%rcx - DB 118,5 ; jbe 80 <_sk_start_pipeline_hsw_lowp+0x80> - DB 76,137,250 ; mov %r15,%rdx - DB 235,89 ; jmp d9 <_sk_start_pipeline_hsw_lowp+0xd9> + DB 118,5 ; jbe 81 <_sk_start_pipeline_hsw_lowp+0x81> + DB 76,137,226 ; mov %r12,%rdx + DB 235,55 ; jmp b8 <_sk_start_pipeline_hsw_lowp+0xb8> DB 72,137,157,24,255,255,255 ; mov %rbx,-0xe8(%rbp) - DB 65,184,0,0,0,0 ; mov $0x0,%r8d - DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 - DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 - DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2 - DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 - DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 - DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 - DB 197,204,87,246 ; vxorps %ymm6,%ymm6,%ymm6 - DB 197,196,87,255 ; vxorps %ymm7,%ymm7,%ymm7 + DB 69,49,192 ; xor %r8d,%r8d DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi - DB 76,137,250 ; mov %r15,%rdx + DB 76,137,254 ; mov %r15,%rsi + DB 76,137,226 ; mov %r12,%rdx DB 76,137,209 ; mov %r10,%rcx DB 76,137,211 ; mov %r10,%rbx DB 65,255,213 ; callq *%r13 DB 73,137,218 ; mov %rbx,%r10 DB 72,139,157,24,255,255,255 ; mov -0xe8(%rbp),%rbx - DB 73,141,87,16 ; lea 0x10(%r15),%rdx - DB 73,131,199,32 ; add $0x20,%r15 - DB 73,57,223 ; cmp %rbx,%r15 - DB 73,137,215 ; mov %rdx,%r15 - DB 118,174 ; jbe 87 <_sk_start_pipeline_hsw_lowp+0x87> + DB 73,141,84,36,16 ; lea 0x10(%r12),%rdx + DB 73,131,196,32 ; add $0x20,%r12 + DB 73,57,220 ; cmp %rbx,%r12 + DB 73,137,212 ; mov %rdx,%r12 + DB 118,208 ; jbe 88 <_sk_start_pipeline_hsw_lowp+0x88> DB 73,137,216 ; mov %rbx,%r8 DB 73,41,208 ; sub %rdx,%r8 - DB 116,44 ; je 10d <_sk_start_pipeline_hsw_lowp+0x10d> - DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0 - DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1 - DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2 - DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3 - DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4 - DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5 - DB 197,204,87,246 ; vxorps %ymm6,%ymm6,%ymm6 - DB 197,196,87,255 ; vxorps %ymm7,%ymm7,%ymm7 + DB 116,12 ; je cc <_sk_start_pipeline_hsw_lowp+0xcc> DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi + DB 76,137,254 ; mov %r15,%rsi DB 76,137,209 ; mov %r10,%rcx DB 65,255,213 ; callq *%r13 DB 72,137,216 ; mov %rbx,%rax @@ -26786,7 +26708,7 @@ _sk_just_return_hsw_lowp LABEL PROC PUBLIC _sk_constant_color_hsw_lowp _sk_constant_color_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,121,24,5,129,21,0,0 ; vbroadcastss 0x1581(%rip),%xmm0 # 16f8 <_sk_xor__hsw_lowp+0x78> + DB 196,226,121,24,5,130,21,0,0 ; vbroadcastss 0x1582(%rip),%xmm0 # 16b8 <_sk_xor__hsw_lowp+0x78> DB 197,248,88,24 ; vaddps (%rax),%xmm0,%xmm3 DB 196,226,125,121,195 ; vpbroadcastw %xmm3,%ymm0 DB 197,251,112,203,234 ; vpshuflw $0xea,%xmm3,%xmm1 @@ -26803,7 +26725,7 @@ _sk_constant_color_hsw_lowp LABEL PROC PUBLIC _sk_set_rgb_hsw_lowp _sk_set_rgb_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 197,250,16,21,68,21,0,0 ; vmovss 0x1544(%rip),%xmm2 # 16fc <_sk_xor__hsw_lowp+0x7c> + DB 197,250,16,21,69,21,0,0 ; vmovss 0x1545(%rip),%xmm2 # 16bc <_sk_xor__hsw_lowp+0x7c> DB 197,234,88,0 ; vaddss (%rax),%xmm2,%xmm0 DB 196,193,121,126,193 ; vmovd %xmm0,%r9d DB 196,193,121,110,193 ; vmovd %r9d,%xmm0 @@ -26835,19 +26757,19 @@ _sk_load_8888_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,210,0,0,0 ; jne 2f7 <_sk_load_8888_hsw_lowp+0xe0> + DB 15,133,210,0,0,0 ; jne 2b6 <_sk_load_8888_hsw_lowp+0xe0> DB 196,193,126,111,92,147,32 ; vmovdqu 0x20(%r11,%rdx,4),%ymm3 DB 196,65,126,111,4,147 ; vmovdqu (%r11,%rdx,4),%ymm8 - DB 197,253,111,5,230,20,0,0 ; vmovdqa 0x14e6(%rip),%ymm0 # 1720 <_sk_xor__hsw_lowp+0xa0> + DB 197,253,111,5,231,20,0,0 ; vmovdqa 0x14e7(%rip),%ymm0 # 16e0 <_sk_xor__hsw_lowp+0xa0> DB 196,226,61,0,200 ; vpshufb %ymm0,%ymm8,%ymm1 DB 196,227,253,0,201,232 ; vpermq $0xe8,%ymm1,%ymm1 DB 196,226,101,0,192 ; vpshufb %ymm0,%ymm3,%ymm0 DB 196,227,253,0,192,232 ; vpermq $0xe8,%ymm0,%ymm0 DB 196,227,117,56,192,1 ; vinserti128 $0x1,%xmm0,%ymm1,%ymm0 DB 197,253,113,240,8 ; vpsllw $0x8,%ymm0,%ymm0 - DB 196,98,125,121,13,220,20,0,0 ; vpbroadcastw 0x14dc(%rip),%ymm9 # 1740 <_sk_xor__hsw_lowp+0xc0> + DB 196,98,125,121,13,221,20,0,0 ; vpbroadcastw 0x14dd(%rip),%ymm9 # 1700 <_sk_xor__hsw_lowp+0xc0> DB 196,193,125,228,193 ; vpmulhuw %ymm9,%ymm0,%ymm0 - DB 197,253,111,13,239,20,0,0 ; vmovdqa 0x14ef(%rip),%ymm1 # 1760 <_sk_xor__hsw_lowp+0xe0> + DB 197,253,111,13,240,20,0,0 ; vmovdqa 0x14f0(%rip),%ymm1 # 1720 <_sk_xor__hsw_lowp+0xe0> DB 196,226,61,0,209 ; vpshufb %ymm1,%ymm8,%ymm2 DB 196,227,253,0,210,232 ; vpermq $0xe8,%ymm2,%ymm2 DB 196,226,101,0,201 ; vpshufb %ymm1,%ymm3,%ymm1 @@ -26855,7 +26777,7 @@ _sk_load_8888_hsw_lowp LABEL PROC DB 196,227,109,56,201,1 ; vinserti128 $0x1,%xmm1,%ymm2,%ymm1 DB 197,245,113,241,8 ; vpsllw $0x8,%ymm1,%ymm1 DB 196,193,117,228,201 ; vpmulhuw %ymm9,%ymm1,%ymm1 - DB 197,253,111,21,225,20,0,0 ; vmovdqa 0x14e1(%rip),%ymm2 # 1780 <_sk_xor__hsw_lowp+0x100> + DB 197,253,111,21,226,20,0,0 ; vmovdqa 0x14e2(%rip),%ymm2 # 1740 <_sk_xor__hsw_lowp+0x100> DB 196,98,61,0,210 ; vpshufb %ymm2,%ymm8,%ymm10 DB 196,67,253,0,210,232 ; vpermq $0xe8,%ymm10,%ymm10 DB 196,226,101,0,210 ; vpshufb %ymm2,%ymm3,%ymm2 @@ -26863,7 +26785,7 @@ _sk_load_8888_hsw_lowp LABEL PROC DB 196,227,45,56,210,1 ; vinserti128 $0x1,%xmm2,%ymm10,%ymm2 DB 197,237,113,242,8 ; vpsllw $0x8,%ymm2,%ymm2 DB 196,193,109,228,209 ; vpmulhuw %ymm9,%ymm2,%ymm2 - DB 197,125,111,21,211,20,0,0 ; vmovdqa 0x14d3(%rip),%ymm10 # 17a0 <_sk_xor__hsw_lowp+0x120> + DB 197,125,111,21,212,20,0,0 ; vmovdqa 0x14d4(%rip),%ymm10 # 1760 <_sk_xor__hsw_lowp+0x120> DB 196,66,61,0,194 ; vpshufb %ymm10,%ymm8,%ymm8 DB 196,67,253,0,192,232 ; vpermq $0xe8,%ymm8,%ymm8 DB 196,194,101,0,218 ; vpshufb %ymm10,%ymm3,%ymm3 @@ -26879,14 +26801,14 @@ _sk_load_8888_hsw_lowp LABEL PROC DB 196,65,61,239,192 ; vpxor %ymm8,%ymm8,%ymm8 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 15,135,30,255,255,255 ; ja 232 <_sk_load_8888_hsw_lowp+0x1b> + DB 15,135,30,255,255,255 ; ja 1f1 <_sk_load_8888_hsw_lowp+0x1b> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,29,1,0,0 ; lea 0x11d(%rip),%r10 # 43c <_sk_load_8888_hsw_lowp+0x225> + DB 76,141,21,30,1,0,0 ; lea 0x11e(%rip),%r10 # 3fc <_sk_load_8888_hsw_lowp+0x226> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,110,4,147 ; vmovd (%r11,%rdx,4),%xmm8 - DB 233,255,254,255,255 ; jmpq 232 <_sk_load_8888_hsw_lowp+0x1b> + DB 233,255,254,255,255 ; jmpq 1f1 <_sk_load_8888_hsw_lowp+0x1b> DB 196,193,121,110,68,147,8 ; vmovd 0x8(%r11,%rdx,4),%xmm0 DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -26894,7 +26816,7 @@ _sk_load_8888_hsw_lowp LABEL PROC DB 196,194,121,53,4,147 ; vpmovzxdq (%r11,%rdx,4),%xmm0 DB 197,249,112,192,232 ; vpshufd $0xe8,%xmm0,%xmm0 DB 196,99,61,2,192,3 ; vpblendd $0x3,%ymm0,%ymm8,%ymm8 - DB 233,211,254,255,255 ; jmpq 232 <_sk_load_8888_hsw_lowp+0x1b> + DB 233,211,254,255,255 ; jmpq 1f1 <_sk_load_8888_hsw_lowp+0x1b> DB 196,193,121,110,68,147,24 ; vmovd 0x18(%r11,%rdx,4),%xmm0 DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0 DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3 @@ -26907,7 +26829,7 @@ _sk_load_8888_hsw_lowp LABEL PROC DB 196,99,61,56,192,1 ; vinserti128 $0x1,%xmm0,%ymm8,%ymm8 DB 196,193,122,111,4,147 ; vmovdqu (%r11,%rdx,4),%xmm0 DB 196,67,125,2,192,240 ; vpblendd $0xf0,%ymm8,%ymm0,%ymm8 - DB 233,132,254,255,255 ; jmpq 232 <_sk_load_8888_hsw_lowp+0x1b> + DB 233,132,254,255,255 ; jmpq 1f1 <_sk_load_8888_hsw_lowp+0x1b> DB 196,193,121,110,68,147,40 ; vmovd 0x28(%r11,%rdx,4),%xmm0 DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -26916,7 +26838,7 @@ _sk_load_8888_hsw_lowp LABEL PROC DB 196,227,101,2,216,15 ; vpblendd $0xf,%ymm0,%ymm3,%ymm3 DB 196,193,121,110,68,147,32 ; vmovd 0x20(%r11,%rdx,4),%xmm0 DB 196,227,101,2,216,1 ; vpblendd $0x1,%ymm0,%ymm3,%ymm3 - DB 233,72,254,255,255 ; jmpq 22c <_sk_load_8888_hsw_lowp+0x15> + DB 233,72,254,255,255 ; jmpq 1eb <_sk_load_8888_hsw_lowp+0x15> DB 196,193,121,110,68,147,56 ; vmovd 0x38(%r11,%rdx,4),%xmm0 DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0 DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1 @@ -26930,40 +26852,41 @@ _sk_load_8888_hsw_lowp LABEL PROC DB 196,65,126,111,4,147 ; vmovdqu (%r11,%rdx,4),%ymm8 DB 196,193,122,111,68,147,32 ; vmovdqu 0x20(%r11,%rdx,4),%xmm0 DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3 - DB 233,248,253,255,255 ; jmpq 232 <_sk_load_8888_hsw_lowp+0x1b> - DB 102,144 ; xchg %ax,%ax - DB 236 ; in (%dx),%al + DB 233,248,253,255,255 ; jmpq 1f1 <_sk_load_8888_hsw_lowp+0x1b> + DB 15,31,0 ; nopl (%rax) + DB 235,254 ; jmp 3fc <_sk_load_8888_hsw_lowp+0x226> + DB 255 ; (bad) + DB 255,12,255 ; decl (%rdi,%rdi,8) + DB 255 ; (bad) + DB 255,246 ; push %rsi DB 254 ; (bad) DB 255 ; (bad) - DB 255,13,255,255,255,247 ; decl -0x8000001(%rip) # fffffffff8000444 <_sk_xor__hsw_lowp+0xfffffffff7ffedc4> - DB 254 ; (bad) + DB 255,96,255 ; jmpq *-0x1(%rax) DB 255 ; (bad) - DB 255,97,255 ; jmpq *-0x1(%rcx) + DB 255,76,255,255 ; decl -0x1(%rdi,%rdi,8) DB 255 ; (bad) - DB 255,77,255 ; decl -0x1(%rbp) + DB 56,255 ; cmp %bh,%bh + DB 255 ; (bad) + DB 255,34 ; jmpq *(%rdx) DB 255 ; (bad) DB 255 ; (bad) - DB 57,255 ; cmp %edi,%edi DB 255 ; (bad) - DB 255,35 ; jmpq *(%rbx) - DB 255 ; (bad) - DB 255 ; (bad) - DB 255,240 ; push %rax + DB 239 ; out %eax,(%dx) DB 253 ; std DB 255 ; (bad) - DB 255,150,255,255,255,136 ; callq *-0x77000001(%rsi) + DB 255,149,255,255,255,135 ; callq *-0x78000001(%rbp) DB 255 ; (bad) DB 255 ; (bad) - DB 255,114,255 ; pushq -0x1(%rdx) + DB 255,113,255 ; pushq -0x1(%rcx) DB 255 ; (bad) - DB 255,230 ; jmpq *%rsi + DB 255,229 ; jmpq *%rbp DB 255 ; (bad) DB 255 ; (bad) - DB 255,210 ; callq *%rdx + DB 255,209 ; callq *%rcx DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 190,255,255,255,168 ; mov $0xa8ffffff,%esi + DB 189,255,255,255,167 ; mov $0xa7ffffff,%ebp DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -26973,7 +26896,7 @@ _sk_store_8888_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 197,189,113,208,7 ; vpsrlw $0x7,%ymm0,%ymm8 - DB 196,98,125,121,13,53,19,0,0 ; vpbroadcastw 0x1335(%rip),%ymm9 # 17c0 <_sk_xor__hsw_lowp+0x140> + DB 196,98,125,121,13,53,19,0,0 ; vpbroadcastw 0x1335(%rip),%ymm9 # 1780 <_sk_xor__hsw_lowp+0x140> DB 196,65,61,234,193 ; vpminsw %ymm9,%ymm8,%ymm8 DB 196,66,125,51,208 ; vpmovzxwd %xmm8,%ymm10 DB 196,67,125,57,192,1 ; vextracti128 $0x1,%ymm8,%xmm8 @@ -27006,7 +26929,7 @@ _sk_store_8888_hsw_lowp LABEL PROC DB 196,65,29,235,198 ; vpor %ymm14,%ymm12,%ymm8 DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 546 <_sk_store_8888_hsw_lowp+0xce> + DB 117,17 ; jne 506 <_sk_store_8888_hsw_lowp+0xce> DB 196,65,126,127,4,147 ; vmovdqu %ymm8,(%r11,%rdx,4) DB 196,65,126,127,76,147,32 ; vmovdqu %ymm9,0x20(%r11,%rdx,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -27015,17 +26938,17 @@ _sk_store_8888_hsw_lowp LABEL PROC DB 65,128,225,15 ; and $0xf,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,236 ; ja 542 <_sk_store_8888_hsw_lowp+0xca> + DB 119,236 ; ja 502 <_sk_store_8888_hsw_lowp+0xca> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,175,0,0,0 ; lea 0xaf(%rip),%r10 # 610 <_sk_store_8888_hsw_lowp+0x198> + DB 76,141,21,175,0,0,0 ; lea 0xaf(%rip),%r10 # 5d0 <_sk_store_8888_hsw_lowp+0x198> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,126,4,147 ; vmovd %xmm8,(%r11,%rdx,4) - DB 235,208 ; jmp 542 <_sk_store_8888_hsw_lowp+0xca> + DB 235,208 ; jmp 502 <_sk_store_8888_hsw_lowp+0xca> DB 196,67,121,22,68,147,8,2 ; vpextrd $0x2,%xmm8,0x8(%r11,%rdx,4) DB 196,65,121,214,4,147 ; vmovq %xmm8,(%r11,%rdx,4) - DB 235,192 ; jmp 542 <_sk_store_8888_hsw_lowp+0xca> + DB 235,192 ; jmp 502 <_sk_store_8888_hsw_lowp+0xca> DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,67,121,22,76,147,24,2 ; vpextrd $0x2,%xmm9,0x18(%r11,%rdx,4) DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 @@ -27033,12 +26956,12 @@ _sk_store_8888_hsw_lowp LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,65,121,126,76,147,16 ; vmovd %xmm9,0x10(%r11,%rdx,4) DB 196,65,122,127,4,147 ; vmovdqu %xmm8,(%r11,%rdx,4) - DB 235,143 ; jmp 542 <_sk_store_8888_hsw_lowp+0xca> + DB 235,143 ; jmp 502 <_sk_store_8888_hsw_lowp+0xca> DB 196,67,121,22,76,147,40,2 ; vpextrd $0x2,%xmm9,0x28(%r11,%rdx,4) DB 196,67,121,22,76,147,36,1 ; vpextrd $0x1,%xmm9,0x24(%r11,%rdx,4) DB 196,65,121,126,76,147,32 ; vmovd %xmm9,0x20(%r11,%rdx,4) DB 196,65,126,127,4,147 ; vmovdqu %ymm8,(%r11,%rdx,4) - DB 233,109,255,255,255 ; jmpq 542 <_sk_store_8888_hsw_lowp+0xca> + DB 233,109,255,255,255 ; jmpq 502 <_sk_store_8888_hsw_lowp+0xca> DB 196,67,125,57,202,1 ; vextracti128 $0x1,%ymm9,%xmm10 DB 196,67,121,22,84,147,56,2 ; vpextrd $0x2,%xmm10,0x38(%r11,%rdx,4) DB 196,67,125,57,202,1 ; vextracti128 $0x1,%ymm9,%xmm10 @@ -27047,7 +26970,7 @@ _sk_store_8888_hsw_lowp LABEL PROC DB 196,65,121,126,84,147,48 ; vmovd %xmm10,0x30(%r11,%rdx,4) DB 196,65,126,127,4,147 ; vmovdqu %ymm8,(%r11,%rdx,4) DB 196,65,122,127,76,147,32 ; vmovdqu %xmm9,0x20(%r11,%rdx,4) - DB 233,50,255,255,255 ; jmpq 542 <_sk_store_8888_hsw_lowp+0xca> + DB 233,50,255,255,255 ; jmpq 502 <_sk_store_8888_hsw_lowp+0xca> DB 90 ; pop %rdx DB 255 ; (bad) DB 255 ; (bad) @@ -27088,11 +27011,11 @@ _sk_load_a8_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,45 ; jne 683 <_sk_load_a8_hsw_lowp+0x37> + DB 117,45 ; jne 643 <_sk_load_a8_hsw_lowp+0x37> DB 196,193,122,111,4,19 ; vmovdqu (%r11,%rdx,1),%xmm0 DB 196,226,125,48,192 ; vpmovzxbw %xmm0,%ymm0 DB 197,253,113,240,8 ; vpsllw $0x8,%ymm0,%ymm0 - DB 196,226,125,121,13,83,17,0,0 ; vpbroadcastw 0x1153(%rip),%ymm1 # 17c2 <_sk_xor__hsw_lowp+0x142> + DB 196,226,125,121,13,83,17,0,0 ; vpbroadcastw 0x1153(%rip),%ymm1 # 1782 <_sk_xor__hsw_lowp+0x142> DB 197,253,228,217 ; vpmulhuw %ymm1,%ymm0,%ymm3 DB 72,173 ; lods %ds:(%rsi),%rax DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0 @@ -27104,35 +27027,35 @@ _sk_load_a8_hsw_lowp LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,197 ; ja 65c <_sk_load_a8_hsw_lowp+0x10> + DB 119,197 ; ja 61c <_sk_load_a8_hsw_lowp+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 764 <_sk_load_a8_hsw_lowp+0x118> + DB 76,141,21,194,0,0,0 ; lea 0xc2(%rip),%r10 # 724 <_sk_load_a8_hsw_lowp+0x118> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,166 ; jmp 65c <_sk_load_a8_hsw_lowp+0x10> + DB 235,166 ; jmp 61c <_sk_load_a8_hsw_lowp+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,195,121,32,68,19,2,2 ; vpinsrb $0x2,0x2(%r11,%rdx,1),%xmm0,%xmm0 DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0 - DB 235,137 ; jmp 65c <_sk_load_a8_hsw_lowp+0x10> + DB 235,137 ; jmp 61c <_sk_load_a8_hsw_lowp+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,195,121,32,68,19,6,6 ; vpinsrb $0x6,0x6(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,5,5 ; vpinsrb $0x5,0x5(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,4,4 ; vpinsrb $0x4,0x4(%r11,%rdx,1),%xmm0,%xmm0 DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,92,255,255,255 ; jmpq 65c <_sk_load_a8_hsw_lowp+0x10> + DB 233,92,255,255,255 ; jmpq 61c <_sk_load_a8_hsw_lowp+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,195,121,32,68,19,10,10 ; vpinsrb $0xa,0xa(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,9,9 ; vpinsrb $0x9,0x9(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,8,8 ; vpinsrb $0x8,0x8(%r11,%rdx,1),%xmm0,%xmm0 DB 196,193,122,126,12,19 ; vmovq (%r11,%rdx,1),%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,47,255,255,255 ; jmpq 65c <_sk_load_a8_hsw_lowp+0x10> + DB 233,47,255,255,255 ; jmpq 61c <_sk_load_a8_hsw_lowp+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,195,121,32,68,19,14,14 ; vpinsrb $0xe,0xe(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,13,13 ; vpinsrb $0xd,0xd(%r11,%rdx,1),%xmm0,%xmm0 @@ -27140,7 +27063,7 @@ _sk_load_a8_hsw_lowp LABEL PROC DB 196,193,122,126,12,19 ; vmovq (%r11,%rdx,1),%xmm1 DB 196,195,113,34,76,19,8,2 ; vpinsrd $0x2,0x8(%r11,%rdx,1),%xmm1,%xmm1 DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0 - DB 233,250,254,255,255 ; jmpq 65c <_sk_load_a8_hsw_lowp+0x10> + DB 233,250,254,255,255 ; jmpq 61c <_sk_load_a8_hsw_lowp+0x10> DB 102,144 ; xchg %ax,%ax DB 71,255 ; rex.RXB (bad) DB 255 ; (bad) @@ -27152,7 +27075,7 @@ _sk_load_a8_hsw_lowp LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 123,255 ; jnp 779 <_sk_load_a8_hsw_lowp+0x12d> + DB 123,255 ; jnp 739 <_sk_load_a8_hsw_lowp+0x12d> DB 255 ; (bad) DB 255,111,255 ; ljmp *-0x1(%rdi) DB 255 ; (bad) @@ -27185,7 +27108,7 @@ _sk_store_a8_hsw_lowp LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,65,57,103,193 ; vpackuswb %xmm9,%xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,10 ; jne 7c4 <_sk_store_a8_hsw_lowp+0x24> + DB 117,10 ; jne 784 <_sk_store_a8_hsw_lowp+0x24> DB 196,65,122,127,4,19 ; vmovdqu %xmm8,(%r11,%rdx,1) DB 72,173 ; lods %ds:(%rsi),%rax DB 255,224 ; jmpq *%rax @@ -27193,32 +27116,32 @@ _sk_store_a8_hsw_lowp LABEL PROC DB 65,128,225,15 ; and $0xf,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,236 ; ja 7c0 <_sk_store_a8_hsw_lowp+0x20> + DB 119,236 ; ja 780 <_sk_store_a8_hsw_lowp+0x20> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,137,0,0,0 ; lea 0x89(%rip),%r10 # 868 <_sk_store_a8_hsw_lowp+0xc8> + DB 76,141,21,137,0,0,0 ; lea 0x89(%rip),%r10 # 828 <_sk_store_a8_hsw_lowp+0xc8> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,67,121,20,4,19,0 ; vpextrb $0x0,%xmm8,(%r11,%rdx,1) - DB 235,207 ; jmp 7c0 <_sk_store_a8_hsw_lowp+0x20> + DB 235,207 ; jmp 780 <_sk_store_a8_hsw_lowp+0x20> DB 196,67,121,20,68,19,2,2 ; vpextrb $0x2,%xmm8,0x2(%r11,%rdx,1) DB 196,67,121,21,4,19,0 ; vpextrw $0x0,%xmm8,(%r11,%rdx,1) - DB 235,190 ; jmp 7c0 <_sk_store_a8_hsw_lowp+0x20> + DB 235,190 ; jmp 780 <_sk_store_a8_hsw_lowp+0x20> DB 196,67,121,20,68,19,6,6 ; vpextrb $0x6,%xmm8,0x6(%r11,%rdx,1) DB 196,67,121,20,68,19,5,5 ; vpextrb $0x5,%xmm8,0x5(%r11,%rdx,1) DB 196,67,121,20,68,19,4,4 ; vpextrb $0x4,%xmm8,0x4(%r11,%rdx,1) DB 196,65,121,126,4,19 ; vmovd %xmm8,(%r11,%rdx,1) - DB 235,158 ; jmp 7c0 <_sk_store_a8_hsw_lowp+0x20> + DB 235,158 ; jmp 780 <_sk_store_a8_hsw_lowp+0x20> DB 196,67,121,20,68,19,10,10 ; vpextrb $0xa,%xmm8,0xa(%r11,%rdx,1) DB 196,67,121,20,68,19,9,9 ; vpextrb $0x9,%xmm8,0x9(%r11,%rdx,1) DB 196,67,121,20,68,19,8,8 ; vpextrb $0x8,%xmm8,0x8(%r11,%rdx,1) - DB 235,32 ; jmp 85c <_sk_store_a8_hsw_lowp+0xbc> + DB 235,32 ; jmp 81c <_sk_store_a8_hsw_lowp+0xbc> DB 196,67,121,20,68,19,14,14 ; vpextrb $0xe,%xmm8,0xe(%r11,%rdx,1) DB 196,67,121,20,68,19,13,13 ; vpextrb $0xd,%xmm8,0xd(%r11,%rdx,1) DB 196,67,121,20,68,19,12,12 ; vpextrb $0xc,%xmm8,0xc(%r11,%rdx,1) DB 196,67,121,22,68,19,8,2 ; vpextrd $0x2,%xmm8,0x8(%r11,%rdx,1) DB 196,65,121,214,4,19 ; vmovq %xmm8,(%r11,%rdx,1) - DB 233,89,255,255,255 ; jmpq 7c0 <_sk_store_a8_hsw_lowp+0x20> + DB 233,89,255,255,255 ; jmpq 780 <_sk_store_a8_hsw_lowp+0x20> DB 144 ; nop DB 128,255,255 ; cmp $0xff,%bh DB 255,145,255,255,255,137 ; callq *-0x76000001(%rcx) @@ -27259,14 +27182,14 @@ _sk_load_g8_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,50 ; jne 8e0 <_sk_load_g8_hsw_lowp+0x3c> + DB 117,50 ; jne 8a0 <_sk_load_g8_hsw_lowp+0x3c> DB 196,193,122,111,4,19 ; vmovdqu (%r11,%rdx,1),%xmm0 DB 196,226,125,48,192 ; vpmovzxbw %xmm0,%ymm0 DB 197,253,113,240,8 ; vpsllw $0x8,%ymm0,%ymm0 - DB 196,226,125,121,13,253,14,0,0 ; vpbroadcastw 0xefd(%rip),%ymm1 # 17c4 <_sk_xor__hsw_lowp+0x144> + DB 196,226,125,121,13,253,14,0,0 ; vpbroadcastw 0xefd(%rip),%ymm1 # 1784 <_sk_xor__hsw_lowp+0x144> DB 197,253,228,193 ; vpmulhuw %ymm1,%ymm0,%ymm0 DB 72,173 ; lods %ds:(%rsi),%rax - DB 196,226,125,121,29,240,14,0,0 ; vpbroadcastw 0xef0(%rip),%ymm3 # 17c6 <_sk_xor__hsw_lowp+0x146> + DB 196,226,125,121,29,240,14,0,0 ; vpbroadcastw 0xef0(%rip),%ymm3 # 1786 <_sk_xor__hsw_lowp+0x146> DB 197,253,111,200 ; vmovdqa %ymm0,%ymm1 DB 197,253,111,208 ; vmovdqa %ymm0,%ymm2 DB 255,224 ; jmpq *%rax @@ -27275,35 +27198,35 @@ _sk_load_g8_hsw_lowp LABEL PROC DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,192 ; ja 8b4 <_sk_load_g8_hsw_lowp+0x10> + DB 119,192 ; ja 874 <_sk_load_g8_hsw_lowp+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,193,0,0,0 ; lea 0xc1(%rip),%r10 # 9c0 <_sk_load_g8_hsw_lowp+0x11c> + DB 76,141,21,193,0,0,0 ; lea 0xc1(%rip),%r10 # 980 <_sk_load_g8_hsw_lowp+0x11c> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,249,110,192 ; vmovd %eax,%xmm0 - DB 235,161 ; jmp 8b4 <_sk_load_g8_hsw_lowp+0x10> + DB 235,161 ; jmp 874 <_sk_load_g8_hsw_lowp+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,195,121,32,68,19,2,2 ; vpinsrb $0x2,0x2(%r11,%rdx,1),%xmm0,%xmm0 DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax DB 197,249,110,200 ; vmovd %eax,%xmm1 DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0 - DB 235,132 ; jmp 8b4 <_sk_load_g8_hsw_lowp+0x10> + DB 235,132 ; jmp 874 <_sk_load_g8_hsw_lowp+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,195,121,32,68,19,6,6 ; vpinsrb $0x6,0x6(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,5,5 ; vpinsrb $0x5,0x5(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,4,4 ; vpinsrb $0x4,0x4(%r11,%rdx,1),%xmm0,%xmm0 DB 196,193,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm1 DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0 - DB 233,87,255,255,255 ; jmpq 8b4 <_sk_load_g8_hsw_lowp+0x10> + DB 233,87,255,255,255 ; jmpq 874 <_sk_load_g8_hsw_lowp+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,195,121,32,68,19,10,10 ; vpinsrb $0xa,0xa(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,9,9 ; vpinsrb $0x9,0x9(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,8,8 ; vpinsrb $0x8,0x8(%r11,%rdx,1),%xmm0,%xmm0 DB 196,193,122,126,12,19 ; vmovq (%r11,%rdx,1),%xmm1 DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0 - DB 233,42,255,255,255 ; jmpq 8b4 <_sk_load_g8_hsw_lowp+0x10> + DB 233,42,255,255,255 ; jmpq 874 <_sk_load_g8_hsw_lowp+0x10> DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0 DB 196,195,121,32,68,19,14,14 ; vpinsrb $0xe,0xe(%r11,%rdx,1),%xmm0,%xmm0 DB 196,195,121,32,68,19,13,13 ; vpinsrb $0xd,0xd(%r11,%rdx,1),%xmm0,%xmm0 @@ -27311,7 +27234,7 @@ _sk_load_g8_hsw_lowp LABEL PROC DB 196,193,122,126,12,19 ; vmovq (%r11,%rdx,1),%xmm1 DB 196,195,113,34,76,19,8,2 ; vpinsrd $0x2,0x8(%r11,%rdx,1),%xmm1,%xmm1 DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0 - DB 233,245,254,255,255 ; jmpq 8b4 <_sk_load_g8_hsw_lowp+0x10> + DB 233,245,254,255,255 ; jmpq 874 <_sk_load_g8_hsw_lowp+0x10> DB 144 ; nop DB 72,255 ; rex.W (bad) DB 255 ; (bad) @@ -27322,7 +27245,7 @@ _sk_load_g8_hsw_lowp LABEL PROC DB 255,140,255,255,255,132,255 ; decl -0x7b0001(%rdi,%rdi,8) DB 255 ; (bad) DB 255 ; (bad) - DB 124,255 ; jl 9d5 <_sk_load_g8_hsw_lowp+0x131> + DB 124,255 ; jl 995 <_sk_load_g8_hsw_lowp+0x131> DB 255 ; (bad) DB 255,112,255 ; pushq -0x1(%rax) DB 255 ; (bad) @@ -27352,20 +27275,20 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,220,1,0,0 ; jne be6 <_sk_srcover_rgba_8888_hsw_lowp+0x1ea> + DB 15,133,220,1,0,0 ; jne ba6 <_sk_srcover_rgba_8888_hsw_lowp+0x1ea> DB 196,193,126,111,124,147,32 ; vmovdqu 0x20(%r11,%rdx,4),%ymm7 DB 196,65,126,111,4,147 ; vmovdqu (%r11,%rdx,4),%ymm8 - DB 197,253,111,37,193,13,0,0 ; vmovdqa 0xdc1(%rip),%ymm4 # 17e0 <_sk_xor__hsw_lowp+0x160> + DB 197,253,111,37,193,13,0,0 ; vmovdqa 0xdc1(%rip),%ymm4 # 17a0 <_sk_xor__hsw_lowp+0x160> DB 196,226,61,0,236 ; vpshufb %ymm4,%ymm8,%ymm5 DB 196,227,253,0,237,232 ; vpermq $0xe8,%ymm5,%ymm5 DB 196,226,69,0,228 ; vpshufb %ymm4,%ymm7,%ymm4 DB 196,227,253,0,228,232 ; vpermq $0xe8,%ymm4,%ymm4 DB 196,227,85,56,228,1 ; vinserti128 $0x1,%xmm4,%ymm5,%ymm4 - DB 196,98,125,121,13,188,13,0,0 ; vpbroadcastw 0xdbc(%rip),%ymm9 # 1800 <_sk_xor__hsw_lowp+0x180> + DB 196,98,125,121,13,188,13,0,0 ; vpbroadcastw 0xdbc(%rip),%ymm9 # 17c0 <_sk_xor__hsw_lowp+0x180> DB 197,221,113,244,8 ; vpsllw $0x8,%ymm4,%ymm4 - DB 196,98,125,121,21,176,13,0,0 ; vpbroadcastw 0xdb0(%rip),%ymm10 # 1802 <_sk_xor__hsw_lowp+0x182> + DB 196,98,125,121,21,176,13,0,0 ; vpbroadcastw 0xdb0(%rip),%ymm10 # 17c2 <_sk_xor__hsw_lowp+0x182> DB 196,193,93,228,226 ; vpmulhuw %ymm10,%ymm4,%ymm4 - DB 197,253,111,45,193,13,0,0 ; vmovdqa 0xdc1(%rip),%ymm5 # 1820 <_sk_xor__hsw_lowp+0x1a0> + DB 197,253,111,45,193,13,0,0 ; vmovdqa 0xdc1(%rip),%ymm5 # 17e0 <_sk_xor__hsw_lowp+0x1a0> DB 196,226,61,0,245 ; vpshufb %ymm5,%ymm8,%ymm6 DB 196,227,253,0,246,232 ; vpermq $0xe8,%ymm6,%ymm6 DB 196,226,69,0,237 ; vpshufb %ymm5,%ymm7,%ymm5 @@ -27373,7 +27296,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,227,77,56,237,1 ; vinserti128 $0x1,%xmm5,%ymm6,%ymm5 DB 197,213,113,245,8 ; vpsllw $0x8,%ymm5,%ymm5 DB 196,193,85,228,234 ; vpmulhuw %ymm10,%ymm5,%ymm5 - DB 197,253,111,53,179,13,0,0 ; vmovdqa 0xdb3(%rip),%ymm6 # 1840 <_sk_xor__hsw_lowp+0x1c0> + DB 197,253,111,53,179,13,0,0 ; vmovdqa 0xdb3(%rip),%ymm6 # 1800 <_sk_xor__hsw_lowp+0x1c0> DB 196,98,61,0,222 ; vpshufb %ymm6,%ymm8,%ymm11 DB 196,67,253,0,219,232 ; vpermq $0xe8,%ymm11,%ymm11 DB 196,226,69,0,246 ; vpshufb %ymm6,%ymm7,%ymm6 @@ -27381,7 +27304,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,227,37,56,246,1 ; vinserti128 $0x1,%xmm6,%ymm11,%ymm6 DB 197,205,113,246,8 ; vpsllw $0x8,%ymm6,%ymm6 DB 196,193,77,228,242 ; vpmulhuw %ymm10,%ymm6,%ymm6 - DB 197,125,111,29,165,13,0,0 ; vmovdqa 0xda5(%rip),%ymm11 # 1860 <_sk_xor__hsw_lowp+0x1e0> + DB 197,125,111,29,165,13,0,0 ; vmovdqa 0xda5(%rip),%ymm11 # 1820 <_sk_xor__hsw_lowp+0x1e0> DB 196,66,61,0,195 ; vpshufb %ymm11,%ymm8,%ymm8 DB 196,67,253,0,192,232 ; vpermq $0xe8,%ymm8,%ymm8 DB 196,194,69,0,251 ; vpshufb %ymm11,%ymm7,%ymm7 @@ -27389,7 +27312,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,227,61,56,255,1 ; vinserti128 $0x1,%xmm7,%ymm8,%ymm7 DB 197,197,113,247,8 ; vpsllw $0x8,%ymm7,%ymm7 DB 196,193,69,228,250 ; vpmulhuw %ymm10,%ymm7,%ymm7 - DB 196,98,125,121,5,150,13,0,0 ; vpbroadcastw 0xd96(%rip),%ymm8 # 1880 <_sk_xor__hsw_lowp+0x200> + DB 196,98,125,121,5,150,13,0,0 ; vpbroadcastw 0xd96(%rip),%ymm8 # 1840 <_sk_xor__hsw_lowp+0x200> DB 197,61,249,195 ; vpsubw %ymm3,%ymm8,%ymm8 DB 196,66,93,11,208 ; vpmulhrsw %ymm8,%ymm4,%ymm10 DB 196,66,125,29,210 ; vpabsw %ymm10,%ymm10 @@ -27436,7 +27359,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,65,13,235,193 ; vpor %ymm9,%ymm14,%ymm8 DB 196,65,37,235,192 ; vpor %ymm8,%ymm11,%ymm8 DB 77,133,192 ; test %r8,%r8 - DB 117,77 ; jne c22 <_sk_srcover_rgba_8888_hsw_lowp+0x226> + DB 117,77 ; jne be2 <_sk_srcover_rgba_8888_hsw_lowp+0x226> DB 196,65,126,127,4,147 ; vmovdqu %ymm8,(%r11,%rdx,4) DB 196,65,126,127,84,147,32 ; vmovdqu %ymm10,0x20(%r11,%rdx,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -27447,26 +27370,26 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,65,61,239,192 ; vpxor %ymm8,%ymm8,%ymm8 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 15,135,20,254,255,255 ; ja a17 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + DB 15,135,20,254,255,255 ; ja 9d7 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,238,1,0,0 ; lea 0x1ee(%rip),%r10 # dfc <_sk_srcover_rgba_8888_hsw_lowp+0x400> + DB 76,141,21,238,1,0,0 ; lea 0x1ee(%rip),%r10 # dbc <_sk_srcover_rgba_8888_hsw_lowp+0x400> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,110,4,147 ; vmovd (%r11,%rdx,4),%xmm8 - DB 233,245,253,255,255 ; jmpq a17 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + DB 233,245,253,255,255 ; jmpq 9d7 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,15 ; and $0xf,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,176 ; ja be2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + DB 119,176 ; ja ba2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 76,141,13,251,1,0,0 ; lea 0x1fb(%rip),%r9 # e38 <_sk_srcover_rgba_8888_hsw_lowp+0x43c> + DB 76,141,13,251,1,0,0 ; lea 0x1fb(%rip),%r9 # df8 <_sk_srcover_rgba_8888_hsw_lowp+0x43c> DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax DB 76,1,200 ; add %r9,%rax DB 255,224 ; jmpq *%rax DB 196,65,121,126,4,147 ; vmovd %xmm8,(%r11,%rdx,4) - DB 235,148 ; jmp be2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + DB 235,148 ; jmp ba2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> DB 196,193,121,110,100,147,8 ; vmovd 0x8(%r11,%rdx,4),%xmm4 DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4 DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7 @@ -27474,7 +27397,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,194,121,53,36,147 ; vpmovzxdq (%r11,%rdx,4),%xmm4 DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4 DB 196,99,61,2,196,3 ; vpblendd $0x3,%ymm4,%ymm8,%ymm8 - DB 233,157,253,255,255 ; jmpq a17 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + DB 233,157,253,255,255 ; jmpq 9d7 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> DB 196,193,121,110,100,147,24 ; vmovd 0x18(%r11,%rdx,4),%xmm4 DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4 DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7 @@ -27487,7 +27410,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,99,61,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm8,%ymm8 DB 196,193,122,111,36,147 ; vmovdqu (%r11,%rdx,4),%xmm4 DB 196,67,93,2,192,240 ; vpblendd $0xf0,%ymm8,%ymm4,%ymm8 - DB 233,78,253,255,255 ; jmpq a17 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + DB 233,78,253,255,255 ; jmpq 9d7 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> DB 196,193,121,110,100,147,40 ; vmovd 0x28(%r11,%rdx,4),%xmm4 DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 @@ -27496,7 +27419,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,227,69,2,252,15 ; vpblendd $0xf,%ymm4,%ymm7,%ymm7 DB 196,193,121,110,100,147,32 ; vmovd 0x20(%r11,%rdx,4),%xmm4 DB 196,227,69,2,252,1 ; vpblendd $0x1,%ymm4,%ymm7,%ymm7 - DB 233,18,253,255,255 ; jmpq a11 <_sk_srcover_rgba_8888_hsw_lowp+0x15> + DB 233,18,253,255,255 ; jmpq 9d1 <_sk_srcover_rgba_8888_hsw_lowp+0x15> DB 196,193,121,110,100,147,56 ; vmovd 0x38(%r11,%rdx,4),%xmm4 DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4 DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5 @@ -27510,10 +27433,10 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,65,126,111,4,147 ; vmovdqu (%r11,%rdx,4),%ymm8 DB 196,193,122,111,100,147,32 ; vmovdqu 0x20(%r11,%rdx,4),%xmm4 DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7 - DB 233,194,252,255,255 ; jmpq a17 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> + DB 233,194,252,255,255 ; jmpq 9d7 <_sk_srcover_rgba_8888_hsw_lowp+0x1b> DB 196,67,121,22,68,147,8,2 ; vpextrd $0x2,%xmm8,0x8(%r11,%rdx,4) DB 196,65,121,214,4,147 ; vmovq %xmm8,(%r11,%rdx,4) - DB 233,122,254,255,255 ; jmpq be2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + DB 233,122,254,255,255 ; jmpq ba2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,67,121,22,76,147,24,2 ; vpextrd $0x2,%xmm9,0x18(%r11,%rdx,4) DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 @@ -27521,12 +27444,12 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9 DB 196,65,121,126,76,147,16 ; vmovd %xmm9,0x10(%r11,%rdx,4) DB 196,65,122,127,4,147 ; vmovdqu %xmm8,(%r11,%rdx,4) - DB 233,70,254,255,255 ; jmpq be2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + DB 233,70,254,255,255 ; jmpq ba2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> DB 196,67,121,22,84,147,40,2 ; vpextrd $0x2,%xmm10,0x28(%r11,%rdx,4) DB 196,67,121,22,84,147,36,1 ; vpextrd $0x1,%xmm10,0x24(%r11,%rdx,4) DB 196,65,121,126,84,147,32 ; vmovd %xmm10,0x20(%r11,%rdx,4) DB 196,65,126,127,4,147 ; vmovdqu %ymm8,(%r11,%rdx,4) - DB 233,36,254,255,255 ; jmpq be2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + DB 233,36,254,255,255 ; jmpq ba2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> DB 196,67,125,57,209,1 ; vextracti128 $0x1,%ymm10,%xmm9 DB 196,67,121,22,76,147,56,2 ; vpextrd $0x2,%xmm9,0x38(%r11,%rdx,4) DB 196,67,125,57,209,1 ; vextracti128 $0x1,%ymm10,%xmm9 @@ -27535,7 +27458,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 196,65,121,126,76,147,48 ; vmovd %xmm9,0x30(%r11,%rdx,4) DB 196,65,126,127,4,147 ; vmovdqu %ymm8,(%r11,%rdx,4) DB 196,65,122,127,84,147,32 ; vmovdqu %xmm10,0x20(%r11,%rdx,4) - DB 233,233,253,255,255 ; jmpq be2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> + DB 233,233,253,255,255 ; jmpq ba2 <_sk_srcover_rgba_8888_hsw_lowp+0x1e6> DB 15,31,0 ; nopl (%rax) DB 27,254 ; sbb %esi,%edi DB 255 ; (bad) @@ -27549,7 +27472,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 255 ; (bad) DB 255,148,254,255,255,126,254 ; callq *-0x1810001(%rsi,%rdi,8) DB 255 ; (bad) - DB 255,21,252,255,255,241 ; callq *-0xe000004(%rip) # fffffffff2000e19 <_sk_xor__hsw_lowp+0xfffffffff1fff799> + DB 255,21,252,255,255,241 ; callq *-0xe000004(%rip) # fffffffff2000dd9 <_sk_xor__hsw_lowp+0xfffffffff1fff799> DB 254 ; (bad) DB 255 ; (bad) DB 255,227 ; jmpq *%rbx @@ -27560,7 +27483,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 255 ; (bad) DB 255,65,255 ; incl -0x1(%rcx) DB 255 ; (bad) - DB 255,45,255,255,255,25 ; ljmp *0x19ffffff(%rip) # 1a000e30 <_sk_xor__hsw_lowp+0x19fff7b0> + DB 255,45,255,255,255,25 ; ljmp *0x19ffffff(%rip) # 1a000df0 <_sk_xor__hsw_lowp+0x19fff7b0> DB 255 ; (bad) DB 255 ; (bad) DB 255,3 ; incl (%rbx) @@ -27569,7 +27492,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 255,14 ; decl (%rsi) DB 254 ; (bad) DB 255 ; (bad) - DB 255,37,255,255,255,29 ; jmpq *0x1dffffff(%rip) # 1e000e40 <_sk_xor__hsw_lowp+0x1dfff7c0> + DB 255,37,255,255,255,29 ; jmpq *0x1dffffff(%rip) # 1e000e00 <_sk_xor__hsw_lowp+0x1dfff7c0> DB 255 ; (bad) DB 255 ; (bad) DB 255,89,255 ; lcall *-0x1(%rcx) @@ -27582,7 +27505,7 @@ _sk_srcover_rgba_8888_hsw_lowp LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 123,255 ; jnp e55 <_sk_srcover_rgba_8888_hsw_lowp+0x459> + DB 123,255 ; jnp e15 <_sk_srcover_rgba_8888_hsw_lowp+0x459> DB 255 ; (bad) DB 255,116,255,255 ; pushq -0x1(%rdi,%rdi,8) DB 255,108,255,255 ; ljmp *-0x1(%rdi,%rdi,8) @@ -27598,7 +27521,7 @@ PUBLIC _sk_scale_1_float_hsw_lowp _sk_scale_1_float_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 197,122,16,0 ; vmovss (%rax),%xmm8 - DB 197,58,88,5,126,8,0,0 ; vaddss 0x87e(%rip),%xmm8,%xmm8 # 1700 <_sk_xor__hsw_lowp+0x80> + DB 197,58,88,5,126,8,0,0 ; vaddss 0x87e(%rip),%xmm8,%xmm8 # 16c0 <_sk_xor__hsw_lowp+0x80> DB 197,121,126,192 ; vmovd %xmm8,%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 DB 196,66,125,121,192 ; vpbroadcastw %xmm8,%ymm8 @@ -27618,11 +27541,11 @@ _sk_scale_u8_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,75 ; jne f10 <_sk_scale_u8_hsw_lowp+0x55> + DB 117,75 ; jne ed0 <_sk_scale_u8_hsw_lowp+0x55> DB 196,65,122,111,4,19 ; vmovdqu (%r11,%rdx,1),%xmm8 DB 196,66,125,48,192 ; vpmovzxbw %xmm8,%ymm8 DB 196,193,61,113,240,8 ; vpsllw $0x8,%ymm8,%ymm8 - DB 196,98,125,121,13,163,9,0,0 ; vpbroadcastw 0x9a3(%rip),%ymm9 # 1882 <_sk_xor__hsw_lowp+0x202> + DB 196,98,125,121,13,163,9,0,0 ; vpbroadcastw 0x9a3(%rip),%ymm9 # 1842 <_sk_xor__hsw_lowp+0x202> DB 196,65,61,228,193 ; vpmulhuw %ymm9,%ymm8,%ymm8 DB 196,194,125,11,192 ; vpmulhrsw %ymm8,%ymm0,%ymm0 DB 196,226,125,29,192 ; vpabsw %ymm0,%ymm0 @@ -27639,35 +27562,35 @@ _sk_scale_u8_hsw_lowp LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 119,166 ; ja ecb <_sk_scale_u8_hsw_lowp+0x10> + DB 119,166 ; ja e8b <_sk_scale_u8_hsw_lowp+0x10> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,200,0,0,0 ; lea 0xc8(%rip),%r10 # ff8 <_sk_scale_u8_hsw_lowp+0x13d> + DB 76,141,21,200,0,0,0 ; lea 0xc8(%rip),%r10 # fb8 <_sk_scale_u8_hsw_lowp+0x13d> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 235,135 ; jmp ecb <_sk_scale_u8_hsw_lowp+0x10> + DB 235,135 ; jmp e8b <_sk_scale_u8_hsw_lowp+0x10> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,67,57,32,68,19,2,2 ; vpinsrb $0x2,0x2(%r11,%rdx,1),%xmm8,%xmm8 DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,67,57,14,193,1 ; vpblendw $0x1,%xmm9,%xmm8,%xmm8 - DB 233,102,255,255,255 ; jmpq ecb <_sk_scale_u8_hsw_lowp+0x10> + DB 233,102,255,255,255 ; jmpq e8b <_sk_scale_u8_hsw_lowp+0x10> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,67,57,32,68,19,6,6 ; vpinsrb $0x6,0x6(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,5,5 ; vpinsrb $0x5,0x5(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,4,4 ; vpinsrb $0x4,0x4(%r11,%rdx,1),%xmm8,%xmm8 DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9 DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8 - DB 233,56,255,255,255 ; jmpq ecb <_sk_scale_u8_hsw_lowp+0x10> + DB 233,56,255,255,255 ; jmpq e8b <_sk_scale_u8_hsw_lowp+0x10> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,67,57,32,68,19,10,10 ; vpinsrb $0xa,0xa(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,9,9 ; vpinsrb $0x9,0x9(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,8,8 ; vpinsrb $0x8,0x8(%r11,%rdx,1),%xmm8,%xmm8 DB 196,65,122,126,12,19 ; vmovq (%r11,%rdx,1),%xmm9 DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8 - DB 233,10,255,255,255 ; jmpq ecb <_sk_scale_u8_hsw_lowp+0x10> + DB 233,10,255,255,255 ; jmpq e8b <_sk_scale_u8_hsw_lowp+0x10> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,67,57,32,68,19,14,14 ; vpinsrb $0xe,0xe(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,13,13 ; vpinsrb $0xd,0xd(%r11,%rdx,1),%xmm8,%xmm8 @@ -27675,7 +27598,7 @@ _sk_scale_u8_hsw_lowp LABEL PROC DB 196,65,122,126,12,19 ; vmovq (%r11,%rdx,1),%xmm9 DB 196,67,49,34,76,19,8,2 ; vpinsrd $0x2,0x8(%r11,%rdx,1),%xmm9,%xmm9 DB 196,67,49,2,192,8 ; vpblendd $0x8,%xmm8,%xmm9,%xmm8 - DB 233,212,254,255,255 ; jmpq ecb <_sk_scale_u8_hsw_lowp+0x10> + DB 233,212,254,255,255 ; jmpq e8b <_sk_scale_u8_hsw_lowp+0x10> DB 144 ; nop DB 65,255 ; rex.B (bad) DB 255 ; (bad) @@ -27686,7 +27609,7 @@ _sk_scale_u8_hsw_lowp LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 122,255 ; jp 100d <_sk_scale_u8_hsw_lowp+0x152> + DB 122,255 ; jp fcd <_sk_scale_u8_hsw_lowp+0x152> DB 255 ; (bad) DB 255,109,255 ; ljmp *-0x1(%rbp) DB 255 ; (bad) @@ -27715,13 +27638,13 @@ PUBLIC _sk_lerp_1_float_hsw_lowp _sk_lerp_1_float_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 197,122,16,0 ; vmovss (%rax),%xmm8 - DB 197,58,88,5,194,6,0,0 ; vaddss 0x6c2(%rip),%xmm8,%xmm8 # 1704 <_sk_xor__hsw_lowp+0x84> + DB 197,58,88,5,194,6,0,0 ; vaddss 0x6c2(%rip),%xmm8,%xmm8 # 16c4 <_sk_xor__hsw_lowp+0x84> DB 197,121,126,192 ; vmovd %xmm8,%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 DB 196,66,125,121,192 ; vpbroadcastw %xmm8,%ymm8 DB 196,194,125,11,192 ; vpmulhrsw %ymm8,%ymm0,%ymm0 DB 196,226,125,29,192 ; vpabsw %ymm0,%ymm0 - DB 196,98,125,121,13,34,8,0,0 ; vpbroadcastw 0x822(%rip),%ymm9 # 1884 <_sk_xor__hsw_lowp+0x204> + DB 196,98,125,121,13,34,8,0,0 ; vpbroadcastw 0x822(%rip),%ymm9 # 1844 <_sk_xor__hsw_lowp+0x204> DB 196,65,53,249,200 ; vpsubw %ymm8,%ymm9,%ymm9 DB 196,66,93,11,209 ; vpmulhrsw %ymm9,%ymm4,%ymm10 DB 196,66,125,29,210 ; vpabsw %ymm10,%ymm10 @@ -27749,15 +27672,15 @@ _sk_lerp_u8_hsw_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,145,0,0,0 ; jne 1160 <_sk_lerp_u8_hsw_lowp+0x9f> + DB 15,133,145,0,0,0 ; jne 1120 <_sk_lerp_u8_hsw_lowp+0x9f> DB 196,65,122,111,4,19 ; vmovdqu (%r11,%rdx,1),%xmm8 DB 196,66,125,48,192 ; vpmovzxbw %xmm8,%ymm8 DB 196,193,61,113,240,8 ; vpsllw $0x8,%ymm8,%ymm8 - DB 196,98,125,121,13,157,7,0,0 ; vpbroadcastw 0x79d(%rip),%ymm9 # 1886 <_sk_xor__hsw_lowp+0x206> + DB 196,98,125,121,13,157,7,0,0 ; vpbroadcastw 0x79d(%rip),%ymm9 # 1846 <_sk_xor__hsw_lowp+0x206> DB 196,65,61,228,193 ; vpmulhuw %ymm9,%ymm8,%ymm8 DB 196,194,125,11,192 ; vpmulhrsw %ymm8,%ymm0,%ymm0 DB 196,226,125,29,192 ; vpabsw %ymm0,%ymm0 - DB 196,98,125,121,13,135,7,0,0 ; vpbroadcastw 0x787(%rip),%ymm9 # 1888 <_sk_xor__hsw_lowp+0x208> + DB 196,98,125,121,13,135,7,0,0 ; vpbroadcastw 0x787(%rip),%ymm9 # 1848 <_sk_xor__hsw_lowp+0x208> DB 196,65,53,249,200 ; vpsubw %ymm8,%ymm9,%ymm9 DB 196,66,93,11,209 ; vpmulhrsw %ymm9,%ymm4,%ymm10 DB 196,66,125,29,210 ; vpabsw %ymm10,%ymm10 @@ -27784,35 +27707,35 @@ _sk_lerp_u8_hsw_lowp LABEL PROC DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,14 ; cmp $0xe,%r9b - DB 15,135,92,255,255,255 ; ja 10d5 <_sk_lerp_u8_hsw_lowp+0x14> + DB 15,135,92,255,255,255 ; ja 1095 <_sk_lerp_u8_hsw_lowp+0x14> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,204,0,0,0 ; lea 0xcc(%rip),%r10 # 1250 <_sk_lerp_u8_hsw_lowp+0x18f> + DB 76,141,21,204,0,0,0 ; lea 0xcc(%rip),%r10 # 1210 <_sk_lerp_u8_hsw_lowp+0x18f> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 197,121,110,192 ; vmovd %eax,%xmm8 - DB 233,58,255,255,255 ; jmpq 10d5 <_sk_lerp_u8_hsw_lowp+0x14> + DB 233,58,255,255,255 ; jmpq 1095 <_sk_lerp_u8_hsw_lowp+0x14> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,67,57,32,68,19,2,2 ; vpinsrb $0x2,0x2(%r11,%rdx,1),%xmm8,%xmm8 DB 65,15,183,4,19 ; movzwl (%r11,%rdx,1),%eax DB 197,121,110,200 ; vmovd %eax,%xmm9 DB 196,67,57,14,193,1 ; vpblendw $0x1,%xmm9,%xmm8,%xmm8 - DB 233,25,255,255,255 ; jmpq 10d5 <_sk_lerp_u8_hsw_lowp+0x14> + DB 233,25,255,255,255 ; jmpq 1095 <_sk_lerp_u8_hsw_lowp+0x14> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,67,57,32,68,19,6,6 ; vpinsrb $0x6,0x6(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,5,5 ; vpinsrb $0x5,0x5(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,4,4 ; vpinsrb $0x4,0x4(%r11,%rdx,1),%xmm8,%xmm8 DB 196,65,121,110,12,19 ; vmovd (%r11,%rdx,1),%xmm9 DB 196,67,57,2,193,1 ; vpblendd $0x1,%xmm9,%xmm8,%xmm8 - DB 233,235,254,255,255 ; jmpq 10d5 <_sk_lerp_u8_hsw_lowp+0x14> + DB 233,235,254,255,255 ; jmpq 1095 <_sk_lerp_u8_hsw_lowp+0x14> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,67,57,32,68,19,10,10 ; vpinsrb $0xa,0xa(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,9,9 ; vpinsrb $0x9,0x9(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,8,8 ; vpinsrb $0x8,0x8(%r11,%rdx,1),%xmm8,%xmm8 DB 196,65,122,126,12,19 ; vmovq (%r11,%rdx,1),%xmm9 DB 196,67,49,2,192,12 ; vpblendd $0xc,%xmm8,%xmm9,%xmm8 - DB 233,189,254,255,255 ; jmpq 10d5 <_sk_lerp_u8_hsw_lowp+0x14> + DB 233,189,254,255,255 ; jmpq 1095 <_sk_lerp_u8_hsw_lowp+0x14> DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8 DB 196,67,57,32,68,19,14,14 ; vpinsrb $0xe,0xe(%r11,%rdx,1),%xmm8,%xmm8 DB 196,67,57,32,68,19,13,13 ; vpinsrb $0xd,0xd(%r11,%rdx,1),%xmm8,%xmm8 @@ -27820,7 +27743,7 @@ _sk_lerp_u8_hsw_lowp LABEL PROC DB 196,65,122,126,12,19 ; vmovq (%r11,%rdx,1),%xmm9 DB 196,67,49,34,76,19,8,2 ; vpinsrd $0x2,0x8(%r11,%rdx,1),%xmm9,%xmm9 DB 196,67,49,2,192,8 ; vpblendd $0x8,%xmm8,%xmm9,%xmm8 - DB 233,135,254,255,255 ; jmpq 10d5 <_sk_lerp_u8_hsw_lowp+0x14> + DB 233,135,254,255,255 ; jmpq 1095 <_sk_lerp_u8_hsw_lowp+0x14> DB 102,144 ; xchg %ax,%ax DB 61,255,255,255,88 ; cmp $0x58ffffff,%eax DB 255 ; (bad) @@ -27831,7 +27754,7 @@ _sk_lerp_u8_hsw_lowp LABEL PROC DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 121,255 ; jns 1265 <_sk_lerp_u8_hsw_lowp+0x1a4> + DB 121,255 ; jns 1225 <_sk_lerp_u8_hsw_lowp+0x1a4> DB 255 ; (bad) DB 255,108,255,255 ; ljmp *-0x1(%rdi,%rdi,8) DB 255,183,255,255,255,175 ; pushq -0x50000001(%rdi) @@ -27910,7 +27833,7 @@ PUBLIC _sk_srcatop_hsw_lowp _sk_srcatop_hsw_lowp LABEL PROC DB 196,226,125,11,199 ; vpmulhrsw %ymm7,%ymm0,%ymm0 DB 196,226,125,29,192 ; vpabsw %ymm0,%ymm0 - DB 196,98,125,121,5,107,5,0,0 ; vpbroadcastw 0x56b(%rip),%ymm8 # 188a <_sk_xor__hsw_lowp+0x20a> + DB 196,98,125,121,5,107,5,0,0 ; vpbroadcastw 0x56b(%rip),%ymm8 # 184a <_sk_xor__hsw_lowp+0x20a> DB 197,61,249,195 ; vpsubw %ymm3,%ymm8,%ymm8 DB 196,66,93,11,200 ; vpmulhrsw %ymm8,%ymm4,%ymm9 DB 196,66,125,29,201 ; vpabsw %ymm9,%ymm9 @@ -27937,7 +27860,7 @@ PUBLIC _sk_dstatop_hsw_lowp _sk_dstatop_hsw_lowp LABEL PROC DB 196,98,93,11,195 ; vpmulhrsw %ymm3,%ymm4,%ymm8 DB 196,66,125,29,192 ; vpabsw %ymm8,%ymm8 - DB 196,98,125,121,13,252,4,0,0 ; vpbroadcastw 0x4fc(%rip),%ymm9 # 188c <_sk_xor__hsw_lowp+0x20c> + DB 196,98,125,121,13,252,4,0,0 ; vpbroadcastw 0x4fc(%rip),%ymm9 # 184c <_sk_xor__hsw_lowp+0x20c> DB 197,53,249,207 ; vpsubw %ymm7,%ymm9,%ymm9 DB 196,194,125,11,193 ; vpmulhrsw %ymm9,%ymm0,%ymm0 DB 196,226,125,29,192 ; vpabsw %ymm0,%ymm0 @@ -27988,7 +27911,7 @@ _sk_dstin_hsw_lowp LABEL PROC PUBLIC _sk_srcout_hsw_lowp _sk_srcout_hsw_lowp LABEL PROC - DB 196,98,125,121,5,59,4,0,0 ; vpbroadcastw 0x43b(%rip),%ymm8 # 188e <_sk_xor__hsw_lowp+0x20e> + DB 196,98,125,121,5,59,4,0,0 ; vpbroadcastw 0x43b(%rip),%ymm8 # 184e <_sk_xor__hsw_lowp+0x20e> DB 197,61,249,199 ; vpsubw %ymm7,%ymm8,%ymm8 DB 196,194,125,11,192 ; vpmulhrsw %ymm8,%ymm0,%ymm0 DB 196,226,125,29,192 ; vpabsw %ymm0,%ymm0 @@ -28003,7 +27926,7 @@ _sk_srcout_hsw_lowp LABEL PROC PUBLIC _sk_dstout_hsw_lowp _sk_dstout_hsw_lowp LABEL PROC - DB 196,226,125,121,5,4,4,0,0 ; vpbroadcastw 0x404(%rip),%ymm0 # 1890 <_sk_xor__hsw_lowp+0x210> + DB 196,226,125,121,5,4,4,0,0 ; vpbroadcastw 0x404(%rip),%ymm0 # 1850 <_sk_xor__hsw_lowp+0x210> DB 197,253,249,219 ; vpsubw %ymm3,%ymm0,%ymm3 DB 196,226,93,11,195 ; vpmulhrsw %ymm3,%ymm4,%ymm0 DB 196,226,125,29,192 ; vpabsw %ymm0,%ymm0 @@ -28018,7 +27941,7 @@ _sk_dstout_hsw_lowp LABEL PROC PUBLIC _sk_srcover_hsw_lowp _sk_srcover_hsw_lowp LABEL PROC - DB 196,98,125,121,5,205,3,0,0 ; vpbroadcastw 0x3cd(%rip),%ymm8 # 1892 <_sk_xor__hsw_lowp+0x212> + DB 196,98,125,121,5,205,3,0,0 ; vpbroadcastw 0x3cd(%rip),%ymm8 # 1852 <_sk_xor__hsw_lowp+0x212> DB 197,61,249,195 ; vpsubw %ymm3,%ymm8,%ymm8 DB 196,66,93,11,200 ; vpmulhrsw %ymm8,%ymm4,%ymm9 DB 196,66,125,29,201 ; vpabsw %ymm9,%ymm9 @@ -28037,7 +27960,7 @@ _sk_srcover_hsw_lowp LABEL PROC PUBLIC _sk_dstover_hsw_lowp _sk_dstover_hsw_lowp LABEL PROC - DB 196,98,125,121,5,134,3,0,0 ; vpbroadcastw 0x386(%rip),%ymm8 # 1894 <_sk_xor__hsw_lowp+0x214> + DB 196,98,125,121,5,134,3,0,0 ; vpbroadcastw 0x386(%rip),%ymm8 # 1854 <_sk_xor__hsw_lowp+0x214> DB 197,61,249,199 ; vpsubw %ymm7,%ymm8,%ymm8 DB 196,194,125,11,192 ; vpmulhrsw %ymm8,%ymm0,%ymm0 DB 196,226,125,29,192 ; vpabsw %ymm0,%ymm0 @@ -28069,7 +27992,7 @@ _sk_modulate_hsw_lowp LABEL PROC PUBLIC _sk_multiply_hsw_lowp _sk_multiply_hsw_lowp LABEL PROC - DB 196,98,125,121,5,19,3,0,0 ; vpbroadcastw 0x313(%rip),%ymm8 # 1896 <_sk_xor__hsw_lowp+0x216> + DB 196,98,125,121,5,19,3,0,0 ; vpbroadcastw 0x313(%rip),%ymm8 # 1856 <_sk_xor__hsw_lowp+0x216> DB 197,61,249,207 ; vpsubw %ymm7,%ymm8,%ymm9 DB 196,66,125,11,209 ; vpmulhrsw %ymm9,%ymm0,%ymm10 DB 196,66,125,29,210 ; vpabsw %ymm10,%ymm10 @@ -28109,7 +28032,7 @@ _sk_multiply_hsw_lowp LABEL PROC PUBLIC _sk_screen_hsw_lowp _sk_screen_hsw_lowp LABEL PROC - DB 196,98,125,121,5,100,2,0,0 ; vpbroadcastw 0x264(%rip),%ymm8 # 1898 <_sk_xor__hsw_lowp+0x218> + DB 196,98,125,121,5,100,2,0,0 ; vpbroadcastw 0x264(%rip),%ymm8 # 1858 <_sk_xor__hsw_lowp+0x218> DB 197,61,249,200 ; vpsubw %ymm0,%ymm8,%ymm9 DB 196,98,53,11,204 ; vpmulhrsw %ymm4,%ymm9,%ymm9 DB 196,66,125,29,201 ; vpabsw %ymm9,%ymm9 @@ -28131,7 +28054,7 @@ _sk_screen_hsw_lowp LABEL PROC PUBLIC _sk_xor__hsw_lowp _sk_xor__hsw_lowp LABEL PROC - DB 196,98,125,121,5,17,2,0,0 ; vpbroadcastw 0x211(%rip),%ymm8 # 189a <_sk_xor__hsw_lowp+0x21a> + DB 196,98,125,121,5,17,2,0,0 ; vpbroadcastw 0x211(%rip),%ymm8 # 185a <_sk_xor__hsw_lowp+0x21a> DB 197,61,249,207 ; vpsubw %ymm7,%ymm8,%ymm9 DB 196,194,125,11,193 ; vpmulhrsw %ymm9,%ymm0,%ymm0 DB 196,226,125,29,192 ; vpabsw %ymm0,%ymm0 @@ -28201,7 +28124,7 @@ ALIGN 32 DB 255 ; (bad) DB 255 ; (bad) DB 255,17 ; callq *(%rcx) - DB 18,21,22,25,26,29 ; adc 0x1d1a1916(%rip),%dl # 1d1a308d <_sk_xor__hsw_lowp+0x1d1a1a0d> + DB 18,21,22,25,26,29 ; adc 0x1d1a1916(%rip),%dl # 1d1a304d <_sk_xor__hsw_lowp+0x1d1a1a0d> DB 30 ; (bad) DB 255 ; (bad) DB 255 ; (bad) @@ -28305,7 +28228,7 @@ ALIGN 32 DB 255 ; (bad) DB 255 ; (bad) DB 255,17 ; callq *(%rcx) - DB 18,21,22,25,26,29 ; adc 0x1d1a1916(%rip),%dl # 1d1a314d <_sk_xor__hsw_lowp+0x1d1a1acd> + DB 18,21,22,25,26,29 ; adc 0x1d1a1916(%rip),%dl # 1d1a310d <_sk_xor__hsw_lowp+0x1d1a1acd> DB 30 ; (bad) DB 255 ; (bad) DB 255 ; (bad) @@ -28396,53 +28319,37 @@ _sk_start_pipeline_ssse3_lowp LABEL PROC DB 15,41,181,32,255,255,255 ; movaps %xmm6,-0xe0(%rbp) DB 76,137,195 ; mov %r8,%rbx DB 73,137,210 ; mov %rdx,%r10 - DB 73,137,207 ; mov %rcx,%r15 + DB 73,137,204 ; mov %rcx,%r12 DB 76,139,117,48 ; mov 0x30(%rbp),%r14 DB 76,137,206 ; mov %r9,%rsi DB 72,173 ; lods %ds:(%rsi),%rax DB 73,137,197 ; mov %rax,%r13 - DB 73,137,244 ; mov %rsi,%r12 - DB 73,141,79,8 ; lea 0x8(%r15),%rcx + DB 73,137,247 ; mov %rsi,%r15 + DB 73,141,76,36,8 ; lea 0x8(%r12),%rcx DB 72,57,217 ; cmp %rbx,%rcx - DB 118,5 ; jbe 7e <_sk_start_pipeline_ssse3_lowp+0x7e> - DB 76,137,250 ; mov %r15,%rdx - DB 235,81 ; jmp cf <_sk_start_pipeline_ssse3_lowp+0xcf> + DB 118,5 ; jbe 7f <_sk_start_pipeline_ssse3_lowp+0x7f> + DB 76,137,226 ; mov %r12,%rdx + DB 235,55 ; jmp b6 <_sk_start_pipeline_ssse3_lowp+0xb6> DB 72,137,157,24,255,255,255 ; mov %rbx,-0xe8(%rbp) - DB 65,184,0,0,0,0 ; mov $0x0,%r8d - DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 15,87,201 ; xorps %xmm1,%xmm1 - DB 15,87,210 ; xorps %xmm2,%xmm2 - DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 15,87,228 ; xorps %xmm4,%xmm4 - DB 15,87,237 ; xorps %xmm5,%xmm5 - DB 15,87,246 ; xorps %xmm6,%xmm6 - DB 15,87,255 ; xorps %xmm7,%xmm7 + DB 69,49,192 ; xor %r8d,%r8d DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi - DB 76,137,250 ; mov %r15,%rdx + DB 76,137,254 ; mov %r15,%rsi + DB 76,137,226 ; mov %r12,%rdx DB 76,137,209 ; mov %r10,%rcx DB 76,137,211 ; mov %r10,%rbx DB 65,255,213 ; callq *%r13 DB 73,137,218 ; mov %rbx,%r10 DB 72,139,157,24,255,255,255 ; mov -0xe8(%rbp),%rbx - DB 73,141,87,8 ; lea 0x8(%r15),%rdx - DB 73,131,199,16 ; add $0x10,%r15 - DB 73,57,223 ; cmp %rbx,%r15 - DB 73,137,215 ; mov %rdx,%r15 - DB 118,182 ; jbe 85 <_sk_start_pipeline_ssse3_lowp+0x85> + DB 73,141,84,36,8 ; lea 0x8(%r12),%rdx + DB 73,131,196,16 ; add $0x10,%r12 + DB 73,57,220 ; cmp %rbx,%r12 + DB 73,137,212 ; mov %rdx,%r12 + DB 118,208 ; jbe 86 <_sk_start_pipeline_ssse3_lowp+0x86> DB 73,137,216 ; mov %rbx,%r8 DB 73,41,208 ; sub %rdx,%r8 - DB 116,36 ; je fb <_sk_start_pipeline_ssse3_lowp+0xfb> - DB 15,87,192 ; xorps %xmm0,%xmm0 - DB 15,87,201 ; xorps %xmm1,%xmm1 - DB 15,87,210 ; xorps %xmm2,%xmm2 - DB 15,87,219 ; xorps %xmm3,%xmm3 - DB 15,87,228 ; xorps %xmm4,%xmm4 - DB 15,87,237 ; xorps %xmm5,%xmm5 - DB 15,87,246 ; xorps %xmm6,%xmm6 - DB 15,87,255 ; xorps %xmm7,%xmm7 + DB 116,12 ; je ca <_sk_start_pipeline_ssse3_lowp+0xca> DB 76,137,247 ; mov %r14,%rdi - DB 76,137,230 ; mov %r12,%rsi + DB 76,137,254 ; mov %r15,%rsi DB 76,137,209 ; mov %r10,%rcx DB 65,255,213 ; callq *%r13 DB 72,137,216 ; mov %rbx,%rax @@ -28475,7 +28382,7 @@ PUBLIC _sk_constant_color_ssse3_lowp _sk_constant_color_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 15,16,24 ; movups (%rax),%xmm3 - DB 15,88,29,111,18,0,0 ; addps 0x126f(%rip),%xmm3 # 13d0 <_sk_xor__ssse3_lowp+0x9f> + DB 15,88,29,112,18,0,0 ; addps 0x1270(%rip),%xmm3 # 13a0 <_sk_xor__ssse3_lowp+0x9f> DB 242,15,112,195,0 ; pshuflw $0x0,%xmm3,%xmm0 DB 102,15,112,192,80 ; pshufd $0x50,%xmm0,%xmm0 DB 242,15,112,203,170 ; pshuflw $0xaa,%xmm3,%xmm1 @@ -28490,7 +28397,7 @@ _sk_constant_color_ssse3_lowp LABEL PROC PUBLIC _sk_set_rgb_ssse3_lowp _sk_set_rgb_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax - DB 243,15,16,21,57,20,0,0 ; movss 0x1439(%rip),%xmm2 # 15d0 <_sk_xor__ssse3_lowp+0x29f> + DB 243,15,16,21,58,20,0,0 ; movss 0x143a(%rip),%xmm2 # 15a0 <_sk_xor__ssse3_lowp+0x29f> DB 243,15,16,0 ; movss (%rax),%xmm0 DB 243,15,88,194 ; addss %xmm2,%xmm0 DB 102,65,15,126,193 ; movd %xmm0,%r9d @@ -28527,19 +28434,19 @@ _sk_load_8888_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,191,0,0,0 ; jne 2da <_sk_load_8888_ssse3_lowp+0xcd> + DB 15,133,191,0,0,0 ; jne 2a9 <_sk_load_8888_ssse3_lowp+0xcd> DB 69,15,16,68,147,16 ; movups 0x10(%r11,%rdx,4),%xmm8 DB 102,65,15,16,28,147 ; movupd (%r11,%rdx,4),%xmm3 - DB 102,15,111,13,177,17,0,0 ; movdqa 0x11b1(%rip),%xmm1 # 13e0 <_sk_xor__ssse3_lowp+0xaf> + DB 102,15,111,13,178,17,0,0 ; movdqa 0x11b2(%rip),%xmm1 # 13b0 <_sk_xor__ssse3_lowp+0xaf> DB 102,15,40,195 ; movapd %xmm3,%xmm0 DB 102,15,56,0,193 ; pshufb %xmm1,%xmm0 DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2 DB 102,15,56,0,209 ; pshufb %xmm1,%xmm2 DB 102,15,108,194 ; punpcklqdq %xmm2,%xmm0 DB 102,15,113,240,8 ; psllw $0x8,%xmm0 - DB 102,68,15,111,13,156,17,0,0 ; movdqa 0x119c(%rip),%xmm9 # 13f0 <_sk_xor__ssse3_lowp+0xbf> + DB 102,68,15,111,13,157,17,0,0 ; movdqa 0x119d(%rip),%xmm9 # 13c0 <_sk_xor__ssse3_lowp+0xbf> DB 102,65,15,228,193 ; pmulhuw %xmm9,%xmm0 - DB 102,68,15,111,21,158,17,0,0 ; movdqa 0x119e(%rip),%xmm10 # 1400 <_sk_xor__ssse3_lowp+0xcf> + DB 102,68,15,111,21,159,17,0,0 ; movdqa 0x119f(%rip),%xmm10 # 13d0 <_sk_xor__ssse3_lowp+0xcf> DB 102,15,40,203 ; movapd %xmm3,%xmm1 DB 102,65,15,56,0,202 ; pshufb %xmm10,%xmm1 DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2 @@ -28547,7 +28454,7 @@ _sk_load_8888_ssse3_lowp LABEL PROC DB 102,15,108,202 ; punpcklqdq %xmm2,%xmm1 DB 102,15,113,241,8 ; psllw $0x8,%xmm1 DB 102,65,15,228,201 ; pmulhuw %xmm9,%xmm1 - DB 102,68,15,111,21,130,17,0,0 ; movdqa 0x1182(%rip),%xmm10 # 1410 <_sk_xor__ssse3_lowp+0xdf> + DB 102,68,15,111,21,131,17,0,0 ; movdqa 0x1183(%rip),%xmm10 # 13e0 <_sk_xor__ssse3_lowp+0xdf> DB 102,15,40,211 ; movapd %xmm3,%xmm2 DB 102,65,15,56,0,210 ; pshufb %xmm10,%xmm2 DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11 @@ -28555,7 +28462,7 @@ _sk_load_8888_ssse3_lowp LABEL PROC DB 102,65,15,108,211 ; punpcklqdq %xmm11,%xmm2 DB 102,15,113,242,8 ; psllw $0x8,%xmm2 DB 102,65,15,228,209 ; pmulhuw %xmm9,%xmm2 - DB 102,68,15,111,21,101,17,0,0 ; movdqa 0x1165(%rip),%xmm10 # 1420 <_sk_xor__ssse3_lowp+0xef> + DB 102,68,15,111,21,102,17,0,0 ; movdqa 0x1166(%rip),%xmm10 # 13f0 <_sk_xor__ssse3_lowp+0xef> DB 102,65,15,56,0,218 ; pshufb %xmm10,%xmm3 DB 102,69,15,56,0,194 ; pshufb %xmm10,%xmm8 DB 102,65,15,108,216 ; punpcklqdq %xmm8,%xmm3 @@ -28569,18 +28476,18 @@ _sk_load_8888_ssse3_lowp LABEL PROC DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,48,255,255,255 ; ja 227 <_sk_load_8888_ssse3_lowp+0x1a> + DB 15,135,48,255,255,255 ; ja 1f6 <_sk_load_8888_ssse3_lowp+0x1a> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,94,0,0,0 ; lea 0x5e(%rip),%r10 # 360 <_sk_load_8888_ssse3_lowp+0x153> + DB 76,141,21,95,0,0,0 ; lea 0x5f(%rip),%r10 # 330 <_sk_load_8888_ssse3_lowp+0x154> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 243,65,15,16,28,147 ; movss (%r11,%rdx,4),%xmm3 - DB 233,17,255,255,255 ; jmpq 227 <_sk_load_8888_ssse3_lowp+0x1a> + DB 233,17,255,255,255 ; jmpq 1f6 <_sk_load_8888_ssse3_lowp+0x1a> DB 102,65,15,110,68,147,8 ; movd 0x8(%r11,%rdx,4),%xmm0 DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3 DB 102,65,15,18,28,147 ; movlpd (%r11,%rdx,4),%xmm3 - DB 233,250,254,255,255 ; jmpq 227 <_sk_load_8888_ssse3_lowp+0x1a> + DB 233,250,254,255,255 ; jmpq 1f6 <_sk_load_8888_ssse3_lowp+0x1a> DB 102,65,15,110,68,147,24 ; movd 0x18(%r11,%rdx,4),%xmm0 DB 102,68,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm8 DB 243,65,15,16,68,147,20 ; movss 0x14(%r11,%rdx,4),%xmm0 @@ -28589,24 +28496,25 @@ _sk_load_8888_ssse3_lowp LABEL PROC DB 68,15,40,192 ; movaps %xmm0,%xmm8 DB 243,65,15,16,68,147,16 ; movss 0x10(%r11,%rdx,4),%xmm0 DB 243,68,15,16,192 ; movss %xmm0,%xmm8 - DB 233,193,254,255,255 ; jmpq 221 <_sk_load_8888_ssse3_lowp+0x14> - DB 171 ; stos %eax,%es:(%rdi) + DB 233,193,254,255,255 ; jmpq 1f0 <_sk_load_8888_ssse3_lowp+0x14> + DB 144 ; nop + DB 170 ; stos %al,%es:(%rdi) DB 255 ; (bad) DB 255 ; (bad) - DB 255,194 ; inc %edx + DB 255,193 ; inc %ecx DB 255 ; (bad) DB 255 ; (bad) - DB 255,182,255,255,255,193 ; pushq -0x3e000001(%rsi) + DB 255,181,255,255,255,192 ; pushq -0x3f000001(%rbp) DB 254 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 239 ; out %eax,(%dx) + DB 238 ; out %al,(%dx) DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 218,255 ; (bad) + DB 217,255 ; fcos DB 255 ; (bad) - DB 255,205 ; dec %ebp + DB 255,204 ; dec %esp DB 255 ; (bad) DB 255 ; (bad) DB 255 ; .byte 0xff @@ -28617,7 +28525,7 @@ _sk_store_8888_ssse3_lowp LABEL PROC DB 76,139,24 ; mov (%rax),%r11 DB 102,68,15,111,192 ; movdqa %xmm0,%xmm8 DB 102,65,15,113,208,7 ; psrlw $0x7,%xmm8 - DB 102,68,15,111,21,155,16,0,0 ; movdqa 0x109b(%rip),%xmm10 # 1430 <_sk_xor__ssse3_lowp+0xff> + DB 102,68,15,111,21,155,16,0,0 ; movdqa 0x109b(%rip),%xmm10 # 1400 <_sk_xor__ssse3_lowp+0xff> DB 102,69,15,234,194 ; pminsw %xmm10,%xmm8 DB 102,69,15,239,219 ; pxor %xmm11,%xmm11 DB 102,69,15,111,232 ; movdqa %xmm8,%xmm13 @@ -28654,7 +28562,7 @@ _sk_store_8888_ssse3_lowp LABEL PROC DB 102,69,15,235,198 ; por %xmm14,%xmm8 DB 102,69,15,235,193 ; por %xmm9,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,17 ; jne 463 <_sk_store_8888_ssse3_lowp+0xe7> + DB 117,17 ; jne 433 <_sk_store_8888_ssse3_lowp+0xe7> DB 243,69,15,127,4,147 ; movdqu %xmm8,(%r11,%rdx,4) DB 243,69,15,127,84,147,16 ; movdqu %xmm10,0x10(%r11,%rdx,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -28663,25 +28571,25 @@ _sk_store_8888_ssse3_lowp LABEL PROC DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,236 ; ja 45f <_sk_store_8888_ssse3_lowp+0xe3> + DB 119,236 ; ja 42f <_sk_store_8888_ssse3_lowp+0xe3> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,82,0,0,0 ; lea 0x52(%rip),%r10 # 4d0 <_sk_store_8888_ssse3_lowp+0x154> + DB 76,141,21,82,0,0,0 ; lea 0x52(%rip),%r10 # 4a0 <_sk_store_8888_ssse3_lowp+0x154> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 102,69,15,126,4,147 ; movd %xmm8,(%r11,%rdx,4) - DB 235,208 ; jmp 45f <_sk_store_8888_ssse3_lowp+0xe3> + DB 235,208 ; jmp 42f <_sk_store_8888_ssse3_lowp+0xe3> DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9 DB 102,69,15,126,76,147,8 ; movd %xmm9,0x8(%r11,%rdx,4) DB 102,69,15,214,4,147 ; movq %xmm8,(%r11,%rdx,4) - DB 235,187 ; jmp 45f <_sk_store_8888_ssse3_lowp+0xe3> + DB 235,187 ; jmp 42f <_sk_store_8888_ssse3_lowp+0xe3> DB 102,69,15,112,202,78 ; pshufd $0x4e,%xmm10,%xmm9 DB 102,69,15,126,76,147,24 ; movd %xmm9,0x18(%r11,%rdx,4) DB 102,69,15,112,202,229 ; pshufd $0xe5,%xmm10,%xmm9 DB 102,69,15,126,76,147,20 ; movd %xmm9,0x14(%r11,%rdx,4) DB 102,69,15,126,84,147,16 ; movd %xmm10,0x10(%r11,%rdx,4) DB 243,69,15,127,4,147 ; movdqu %xmm8,(%r11,%rdx,4) - DB 235,146 ; jmp 45f <_sk_store_8888_ssse3_lowp+0xe3> + DB 235,146 ; jmp 42f <_sk_store_8888_ssse3_lowp+0xe3> DB 15,31,0 ; nopl (%rax) DB 183,255 ; mov $0xff,%bh DB 255 ; (bad) @@ -28709,11 +28617,11 @@ _sk_load_a8_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,37 ; jne 51b <_sk_load_a8_ssse3_lowp+0x2f> + DB 117,37 ; jne 4eb <_sk_load_a8_ssse3_lowp+0x2f> DB 243,65,15,126,28,19 ; movq (%r11,%rdx,1),%xmm3 DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3 DB 102,15,113,243,8 ; psllw $0x8,%xmm3 - DB 102,15,228,29,51,15,0,0 ; pmulhuw 0xf33(%rip),%xmm3 # 1440 <_sk_xor__ssse3_lowp+0x10f> + DB 102,15,228,29,51,15,0,0 ; pmulhuw 0xf33(%rip),%xmm3 # 1410 <_sk_xor__ssse3_lowp+0x10f> DB 72,173 ; lods %ds:(%rsi),%rax DB 102,15,87,192 ; xorpd %xmm0,%xmm0 DB 15,87,201 ; xorps %xmm1,%xmm1 @@ -28724,15 +28632,15 @@ _sk_load_a8_ssse3_lowp LABEL PROC DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,209 ; ja 500 <_sk_load_a8_ssse3_lowp+0x14> + DB 119,209 ; ja 4d0 <_sk_load_a8_ssse3_lowp+0x14> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,110,0,0,0 ; lea 0x6e(%rip),%r10 # 5a8 <_sk_load_a8_ssse3_lowp+0xbc> + DB 76,141,21,110,0,0,0 ; lea 0x6e(%rip),%r10 # 578 <_sk_load_a8_ssse3_lowp+0xbc> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 102,15,110,216 ; movd %eax,%xmm3 - DB 235,178 ; jmp 500 <_sk_load_a8_ssse3_lowp+0x14> + DB 235,178 ; jmp 4d0 <_sk_load_a8_ssse3_lowp+0x14> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3 @@ -28740,7 +28648,7 @@ _sk_load_a8_ssse3_lowp LABEL PROC DB 102,15,110,192 ; movd %eax,%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 243,15,16,216 ; movss %xmm0,%xmm3 - DB 235,144 ; jmp 500 <_sk_load_a8_ssse3_lowp+0x14> + DB 235,144 ; jmp 4d0 <_sk_load_a8_ssse3_lowp+0x14> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 102,15,239,219 ; pxor %xmm3,%xmm3 DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3 @@ -28751,7 +28659,7 @@ _sk_load_a8_ssse3_lowp LABEL PROC DB 102,65,15,110,4,19 ; movd (%r11,%rdx,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 242,15,16,216 ; movsd %xmm0,%xmm3 - DB 233,88,255,255,255 ; jmpq 500 <_sk_load_a8_ssse3_lowp+0x14> + DB 233,88,255,255,255 ; jmpq 4d0 <_sk_load_a8_ssse3_lowp+0x14> DB 155 ; fwait DB 255 ; (bad) DB 255 ; (bad) @@ -28782,7 +28690,7 @@ _sk_store_a8_ssse3_lowp LABEL PROC DB 102,65,15,113,208,7 ; psrlw $0x7,%xmm8 DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8 DB 77,133,192 ; test %r8,%r8 - DB 117,14 ; jne 5f0 <_sk_store_a8_ssse3_lowp+0x2c> + DB 117,14 ; jne 5c0 <_sk_store_a8_ssse3_lowp+0x2c> DB 242,69,15,17,4,19 ; movsd %xmm8,(%r11,%rdx,1) DB 72,173 ; lods %ds:(%rsi),%rax DB 72,131,196,88 ; add $0x58,%rsp @@ -28791,24 +28699,24 @@ _sk_store_a8_ssse3_lowp LABEL PROC DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,232 ; ja 5e8 <_sk_store_a8_ssse3_lowp+0x24> + DB 119,232 ; ja 5b8 <_sk_store_a8_ssse3_lowp+0x24> DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8 DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,132,0,0,0 ; lea 0x84(%rip),%r10 # 694 <_sk_store_a8_ssse3_lowp+0xd0> + DB 76,141,21,132,0,0,0 ; lea 0x84(%rip),%r10 # 664 <_sk_store_a8_ssse3_lowp+0xd0> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp) DB 138,4,36 ; mov (%rsp),%al DB 65,136,4,19 ; mov %al,(%r11,%rdx,1) - DB 235,192 ; jmp 5e8 <_sk_store_a8_ssse3_lowp+0x24> + DB 235,192 ; jmp 5b8 <_sk_store_a8_ssse3_lowp+0x24> DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp) DB 138,68,36,20 ; mov 0x14(%rsp),%al DB 65,136,68,19,2 ; mov %al,0x2(%r11,%rdx,1) - DB 102,68,15,56,0,5,30,14,0,0 ; pshufb 0xe1e(%rip),%xmm8 # 1460 <_sk_xor__ssse3_lowp+0x12f> + DB 102,68,15,56,0,5,30,14,0,0 ; pshufb 0xe1e(%rip),%xmm8 # 1430 <_sk_xor__ssse3_lowp+0x12f> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 102,65,137,4,19 ; mov %ax,(%r11,%rdx,1) - DB 235,154 ; jmp 5e8 <_sk_store_a8_ssse3_lowp+0x24> + DB 235,154 ; jmp 5b8 <_sk_store_a8_ssse3_lowp+0x24> DB 102,68,15,127,68,36,64 ; movdqa %xmm8,0x40(%rsp) DB 138,68,36,76 ; mov 0x4c(%rsp),%al DB 65,136,68,19,6 ; mov %al,0x6(%r11,%rdx,1) @@ -28818,9 +28726,9 @@ _sk_store_a8_ssse3_lowp LABEL PROC DB 102,68,15,127,68,36,32 ; movdqa %xmm8,0x20(%rsp) DB 138,68,36,40 ; mov 0x28(%rsp),%al DB 65,136,68,19,4 ; mov %al,0x4(%r11,%rdx,1) - DB 102,68,15,56,0,5,200,13,0,0 ; pshufb 0xdc8(%rip),%xmm8 # 1450 <_sk_xor__ssse3_lowp+0x11f> + DB 102,68,15,56,0,5,200,13,0,0 ; pshufb 0xdc8(%rip),%xmm8 # 1420 <_sk_xor__ssse3_lowp+0x11f> DB 102,69,15,126,4,19 ; movd %xmm8,(%r11,%rdx,1) - DB 233,85,255,255,255 ; jmpq 5e8 <_sk_store_a8_ssse3_lowp+0x24> + DB 233,85,255,255,255 ; jmpq 5b8 <_sk_store_a8_ssse3_lowp+0x24> DB 144 ; nop DB 133,255 ; test %edi,%edi DB 255 ; (bad) @@ -28847,13 +28755,13 @@ _sk_load_g8_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,42 ; jne 6e4 <_sk_load_g8_ssse3_lowp+0x34> + DB 117,42 ; jne 6b4 <_sk_load_g8_ssse3_lowp+0x34> DB 243,65,15,126,4,19 ; movq (%r11,%rdx,1),%xmm0 DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0 DB 102,15,113,240,8 ; psllw $0x8,%xmm0 - DB 102,15,228,5,159,13,0,0 ; pmulhuw 0xd9f(%rip),%xmm0 # 1470 <_sk_xor__ssse3_lowp+0x13f> + DB 102,15,228,5,159,13,0,0 ; pmulhuw 0xd9f(%rip),%xmm0 # 1440 <_sk_xor__ssse3_lowp+0x13f> DB 72,173 ; lods %ds:(%rsi),%rax - DB 15,40,29,166,13,0,0 ; movaps 0xda6(%rip),%xmm3 # 1480 <_sk_xor__ssse3_lowp+0x14f> + DB 15,40,29,166,13,0,0 ; movaps 0xda6(%rip),%xmm3 # 1450 <_sk_xor__ssse3_lowp+0x14f> DB 102,15,111,200 ; movdqa %xmm0,%xmm1 DB 102,15,111,208 ; movdqa %xmm0,%xmm2 DB 255,224 ; jmpq *%rax @@ -28862,15 +28770,15 @@ _sk_load_g8_ssse3_lowp LABEL PROC DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,204 ; ja 6c4 <_sk_load_g8_ssse3_lowp+0x14> + DB 119,204 ; ja 694 <_sk_load_g8_ssse3_lowp+0x14> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 774 <_sk_load_g8_ssse3_lowp+0xc4> + DB 76,141,21,113,0,0,0 ; lea 0x71(%rip),%r10 # 744 <_sk_load_g8_ssse3_lowp+0xc4> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 102,15,110,192 ; movd %eax,%xmm0 - DB 235,173 ; jmp 6c4 <_sk_load_g8_ssse3_lowp+0x14> + DB 235,173 ; jmp 694 <_sk_load_g8_ssse3_lowp+0x14> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0 @@ -28878,7 +28786,7 @@ _sk_load_g8_ssse3_lowp LABEL PROC DB 102,15,110,200 ; movd %eax,%xmm1 DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 243,15,16,193 ; movss %xmm1,%xmm0 - DB 235,139 ; jmp 6c4 <_sk_load_g8_ssse3_lowp+0x14> + DB 235,139 ; jmp 694 <_sk_load_g8_ssse3_lowp+0x14> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 102,15,239,192 ; pxor %xmm0,%xmm0 DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0 @@ -28889,7 +28797,7 @@ _sk_load_g8_ssse3_lowp LABEL PROC DB 102,65,15,110,12,19 ; movd (%r11,%rdx,1),%xmm1 DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1 DB 242,15,16,193 ; movsd %xmm1,%xmm0 - DB 233,83,255,255,255 ; jmpq 6c4 <_sk_load_g8_ssse3_lowp+0x14> + DB 233,83,255,255,255 ; jmpq 694 <_sk_load_g8_ssse3_lowp+0x14> DB 15,31,0 ; nopl (%rax) DB 152 ; cwtl DB 255 ; (bad) @@ -28918,21 +28826,21 @@ _sk_srcover_rgba_8888_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,17,2,0,0 ; jne 9b4 <_sk_srcover_rgba_8888_ssse3_lowp+0x224> + DB 15,133,17,2,0,0 ; jne 984 <_sk_srcover_rgba_8888_ssse3_lowp+0x224> DB 69,15,16,68,147,16 ; movups 0x10(%r11,%rdx,4),%xmm8 DB 102,65,15,16,60,147 ; movupd (%r11,%rdx,4),%xmm7 DB 72,131,236,24 ; sub $0x18,%rsp - DB 102,15,111,45,213,12,0,0 ; movdqa 0xcd5(%rip),%xmm5 # 1490 <_sk_xor__ssse3_lowp+0x15f> + DB 102,15,111,45,213,12,0,0 ; movdqa 0xcd5(%rip),%xmm5 # 1460 <_sk_xor__ssse3_lowp+0x15f> DB 102,15,40,231 ; movapd %xmm7,%xmm4 DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4 DB 102,65,15,111,240 ; movdqa %xmm8,%xmm6 DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6 DB 102,15,108,230 ; punpcklqdq %xmm6,%xmm4 - DB 102,15,111,13,198,12,0,0 ; movdqa 0xcc6(%rip),%xmm1 # 14a0 <_sk_xor__ssse3_lowp+0x16f> + DB 102,15,111,13,198,12,0,0 ; movdqa 0xcc6(%rip),%xmm1 # 1470 <_sk_xor__ssse3_lowp+0x16f> DB 102,15,113,244,8 ; psllw $0x8,%xmm4 - DB 102,68,15,111,13,200,12,0,0 ; movdqa 0xcc8(%rip),%xmm9 # 14b0 <_sk_xor__ssse3_lowp+0x17f> + DB 102,68,15,111,13,200,12,0,0 ; movdqa 0xcc8(%rip),%xmm9 # 1480 <_sk_xor__ssse3_lowp+0x17f> DB 102,65,15,228,225 ; pmulhuw %xmm9,%xmm4 - DB 102,68,15,111,21,202,12,0,0 ; movdqa 0xcca(%rip),%xmm10 # 14c0 <_sk_xor__ssse3_lowp+0x18f> + DB 102,68,15,111,21,202,12,0,0 ; movdqa 0xcca(%rip),%xmm10 # 1490 <_sk_xor__ssse3_lowp+0x18f> DB 102,15,40,239 ; movapd %xmm7,%xmm5 DB 102,65,15,56,0,234 ; pshufb %xmm10,%xmm5 DB 102,65,15,111,240 ; movdqa %xmm8,%xmm6 @@ -28940,7 +28848,7 @@ _sk_srcover_rgba_8888_ssse3_lowp LABEL PROC DB 102,15,108,238 ; punpcklqdq %xmm6,%xmm5 DB 102,15,113,245,8 ; psllw $0x8,%xmm5 DB 102,65,15,228,233 ; pmulhuw %xmm9,%xmm5 - DB 102,68,15,111,21,174,12,0,0 ; movdqa 0xcae(%rip),%xmm10 # 14d0 <_sk_xor__ssse3_lowp+0x19f> + DB 102,68,15,111,21,174,12,0,0 ; movdqa 0xcae(%rip),%xmm10 # 14a0 <_sk_xor__ssse3_lowp+0x19f> DB 102,15,40,247 ; movapd %xmm7,%xmm6 DB 102,65,15,56,0,242 ; pshufb %xmm10,%xmm6 DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11 @@ -28948,13 +28856,13 @@ _sk_srcover_rgba_8888_ssse3_lowp LABEL PROC DB 102,65,15,108,243 ; punpcklqdq %xmm11,%xmm6 DB 102,15,113,246,8 ; psllw $0x8,%xmm6 DB 102,65,15,228,241 ; pmulhuw %xmm9,%xmm6 - DB 102,68,15,111,21,145,12,0,0 ; movdqa 0xc91(%rip),%xmm10 # 14e0 <_sk_xor__ssse3_lowp+0x1af> + DB 102,68,15,111,21,145,12,0,0 ; movdqa 0xc91(%rip),%xmm10 # 14b0 <_sk_xor__ssse3_lowp+0x1af> DB 102,65,15,56,0,250 ; pshufb %xmm10,%xmm7 DB 102,69,15,56,0,194 ; pshufb %xmm10,%xmm8 DB 102,65,15,108,248 ; punpcklqdq %xmm8,%xmm7 DB 102,15,113,247,8 ; psllw $0x8,%xmm7 DB 102,65,15,228,249 ; pmulhuw %xmm9,%xmm7 - DB 102,68,15,111,29,125,12,0,0 ; movdqa 0xc7d(%rip),%xmm11 # 14f0 <_sk_xor__ssse3_lowp+0x1bf> + DB 102,68,15,111,29,125,12,0,0 ; movdqa 0xc7d(%rip),%xmm11 # 14c0 <_sk_xor__ssse3_lowp+0x1bf> DB 102,68,15,249,219 ; psubw %xmm3,%xmm11 DB 102,68,15,111,196 ; movdqa %xmm4,%xmm8 DB 102,69,15,56,11,195 ; pmulhrsw %xmm11,%xmm8 @@ -29010,7 +28918,7 @@ _sk_srcover_rgba_8888_ssse3_lowp LABEL PROC DB 102,65,15,235,192 ; por %xmm8,%xmm0 DB 102,15,235,194 ; por %xmm2,%xmm0 DB 77,133,192 ; test %r8,%r8 - DB 117,100 ; jne 9f0 <_sk_srcover_rgba_8888_ssse3_lowp+0x260> + DB 117,100 ; jne 9c0 <_sk_srcover_rgba_8888_ssse3_lowp+0x260> DB 243,65,15,127,4,147 ; movdqu %xmm0,(%r11,%rdx,4) DB 243,65,15,127,76,147,16 ; movdqu %xmm1,0x10(%r11,%rdx,4) DB 72,173 ; lods %ds:(%rsi),%rax @@ -29026,30 +28934,30 @@ _sk_srcover_rgba_8888_ssse3_lowp LABEL PROC DB 102,15,239,255 ; pxor %xmm7,%xmm7 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,222,253,255,255 ; ja 7af <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> + DB 15,135,222,253,255,255 ; ja 77f <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,208,0,0,0 ; lea 0xd0(%rip),%r10 # aac <_sk_srcover_rgba_8888_ssse3_lowp+0x31c> + DB 76,141,21,208,0,0,0 ; lea 0xd0(%rip),%r10 # a7c <_sk_srcover_rgba_8888_ssse3_lowp+0x31c> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 243,65,15,16,60,147 ; movss (%r11,%rdx,4),%xmm7 - DB 233,191,253,255,255 ; jmpq 7af <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> + DB 233,191,253,255,255 ; jmpq 77f <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> DB 69,137,193 ; mov %r8d,%r9d DB 65,128,225,7 ; and $0x7,%r9b DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,153 ; ja 999 <_sk_srcover_rgba_8888_ssse3_lowp+0x209> + DB 119,153 ; ja 969 <_sk_srcover_rgba_8888_ssse3_lowp+0x209> DB 65,15,182,193 ; movzbl %r9b,%eax - DB 76,141,13,189,0,0,0 ; lea 0xbd(%rip),%r9 # ac8 <_sk_srcover_rgba_8888_ssse3_lowp+0x338> + DB 76,141,13,189,0,0,0 ; lea 0xbd(%rip),%r9 # a98 <_sk_srcover_rgba_8888_ssse3_lowp+0x338> DB 73,99,4,129 ; movslq (%r9,%rax,4),%rax DB 76,1,200 ; add %r9,%rax DB 255,224 ; jmpq *%rax DB 102,65,15,126,4,147 ; movd %xmm0,(%r11,%rdx,4) - DB 233,122,255,255,255 ; jmpq 999 <_sk_srcover_rgba_8888_ssse3_lowp+0x209> + DB 233,122,255,255,255 ; jmpq 969 <_sk_srcover_rgba_8888_ssse3_lowp+0x209> DB 102,65,15,110,100,147,8 ; movd 0x8(%r11,%rdx,4),%xmm4 DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7 DB 102,65,15,18,60,147 ; movlpd (%r11,%rdx,4),%xmm7 - DB 233,121,253,255,255 ; jmpq 7af <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> + DB 233,121,253,255,255 ; jmpq 77f <_sk_srcover_rgba_8888_ssse3_lowp+0x1f> DB 102,65,15,110,100,147,24 ; movd 0x18(%r11,%rdx,4),%xmm4 DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8 DB 243,65,15,16,100,147,20 ; movss 0x14(%r11,%rdx,4),%xmm4 @@ -29058,23 +28966,23 @@ _sk_srcover_rgba_8888_ssse3_lowp LABEL PROC DB 68,15,40,196 ; movaps %xmm4,%xmm8 DB 243,65,15,16,100,147,16 ; movss 0x10(%r11,%rdx,4),%xmm4 DB 243,68,15,16,196 ; movss %xmm4,%xmm8 - DB 233,64,253,255,255 ; jmpq 7a9 <_sk_srcover_rgba_8888_ssse3_lowp+0x19> + DB 233,64,253,255,255 ; jmpq 779 <_sk_srcover_rgba_8888_ssse3_lowp+0x19> DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1 DB 102,65,15,126,76,147,8 ; movd %xmm1,0x8(%r11,%rdx,4) DB 102,65,15,214,4,147 ; movq %xmm0,(%r11,%rdx,4) - DB 233,25,255,255,255 ; jmpq 999 <_sk_srcover_rgba_8888_ssse3_lowp+0x209> + DB 233,25,255,255,255 ; jmpq 969 <_sk_srcover_rgba_8888_ssse3_lowp+0x209> DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2 DB 102,65,15,126,84,147,24 ; movd %xmm2,0x18(%r11,%rdx,4) DB 102,15,112,209,229 ; pshufd $0xe5,%xmm1,%xmm2 DB 102,65,15,126,84,147,20 ; movd %xmm2,0x14(%r11,%rdx,4) DB 102,65,15,126,76,147,16 ; movd %xmm1,0x10(%r11,%rdx,4) DB 243,65,15,127,4,147 ; movdqu %xmm0,(%r11,%rdx,4) - DB 233,239,254,255,255 ; jmpq 999 <_sk_srcover_rgba_8888_ssse3_lowp+0x209> + DB 233,239,254,255,255 ; jmpq 969 <_sk_srcover_rgba_8888_ssse3_lowp+0x209> DB 102,144 ; xchg %ax,%ax DB 57,255 ; cmp %edi,%edi DB 255 ; (bad) DB 255 ; (bad) - DB 127,255 ; jg ab1 <_sk_srcover_rgba_8888_ssse3_lowp+0x321> + DB 127,255 ; jg a81 <_sk_srcover_rgba_8888_ssse3_lowp+0x321> DB 255 ; (bad) DB 255,115,255 ; pushq -0x1(%rbx) DB 255 ; (bad) @@ -29109,7 +29017,7 @@ PUBLIC _sk_scale_1_float_ssse3_lowp _sk_scale_1_float_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 243,68,15,16,0 ; movss (%rax),%xmm8 - DB 243,68,15,88,5,224,10,0,0 ; addss 0xae0(%rip),%xmm8 # 15d4 <_sk_xor__ssse3_lowp+0x2a3> + DB 243,68,15,88,5,224,10,0,0 ; addss 0xae0(%rip),%xmm8 # 15a4 <_sk_xor__ssse3_lowp+0x2a3> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 242,69,15,112,192,0 ; pshuflw $0x0,%xmm8,%xmm8 @@ -29130,11 +29038,11 @@ _sk_scale_u8_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 117,74 ; jne b8e <_sk_scale_u8_ssse3_lowp+0x54> + DB 117,74 ; jne b5e <_sk_scale_u8_ssse3_lowp+0x54> DB 243,69,15,126,4,19 ; movq (%r11,%rdx,1),%xmm8 DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8 DB 102,65,15,113,240,8 ; psllw $0x8,%xmm8 - DB 102,68,15,228,5,162,9,0,0 ; pmulhuw 0x9a2(%rip),%xmm8 # 1500 <_sk_xor__ssse3_lowp+0x1cf> + DB 102,68,15,228,5,162,9,0,0 ; pmulhuw 0x9a2(%rip),%xmm8 # 14d0 <_sk_xor__ssse3_lowp+0x1cf> DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0 DB 102,15,56,29,192 ; pabsw %xmm0,%xmm0 DB 102,65,15,56,11,200 ; pmulhrsw %xmm8,%xmm1 @@ -29150,15 +29058,15 @@ _sk_scale_u8_ssse3_lowp LABEL PROC DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 119,172 ; ja b4f <_sk_scale_u8_ssse3_lowp+0x15> + DB 119,172 ; ja b1f <_sk_scale_u8_ssse3_lowp+0x15> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,126,0,0,0 ; lea 0x7e(%rip),%r10 # c2c <_sk_scale_u8_ssse3_lowp+0xf2> + DB 76,141,21,126,0,0,0 ; lea 0x7e(%rip),%r10 # bfc <_sk_scale_u8_ssse3_lowp+0xf2> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 235,140 ; jmp b4f <_sk_scale_u8_ssse3_lowp+0x15> + DB 235,140 ; jmp b1f <_sk_scale_u8_ssse3_lowp+0x15> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,68,15,196,192,2 ; pinsrw $0x2,%eax,%xmm8 @@ -29166,7 +29074,7 @@ _sk_scale_u8_ssse3_lowp LABEL PROC DB 102,68,15,110,200 ; movd %eax,%xmm9 DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9 DB 243,69,15,16,193 ; movss %xmm9,%xmm8 - DB 233,98,255,255,255 ; jmpq b4f <_sk_scale_u8_ssse3_lowp+0x15> + DB 233,98,255,255,255 ; jmpq b1f <_sk_scale_u8_ssse3_lowp+0x15> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,68,15,196,192,6 ; pinsrw $0x6,%eax,%xmm8 @@ -29177,7 +29085,7 @@ _sk_scale_u8_ssse3_lowp LABEL PROC DB 102,69,15,110,12,19 ; movd (%r11,%rdx,1),%xmm9 DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9 DB 242,69,15,16,193 ; movsd %xmm9,%xmm8 - DB 233,36,255,255,255 ; jmpq b4f <_sk_scale_u8_ssse3_lowp+0x15> + DB 233,36,255,255,255 ; jmpq b1f <_sk_scale_u8_ssse3_lowp+0x15> DB 144 ; nop DB 139,255 ; mov %edi,%edi DB 255 ; (bad) @@ -29203,14 +29111,14 @@ PUBLIC _sk_lerp_1_float_ssse3_lowp _sk_lerp_1_float_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 243,68,15,16,0 ; movss (%rax),%xmm8 - DB 243,68,15,88,5,128,9,0,0 ; addss 0x980(%rip),%xmm8 # 15d8 <_sk_xor__ssse3_lowp+0x2a7> + DB 243,68,15,88,5,128,9,0,0 ; addss 0x980(%rip),%xmm8 # 15a8 <_sk_xor__ssse3_lowp+0x2a7> DB 102,68,15,126,192 ; movd %xmm8,%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 DB 242,69,15,112,192,0 ; pshuflw $0x0,%xmm8,%xmm8 DB 102,69,15,112,192,80 ; pshufd $0x50,%xmm8,%xmm8 DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0 DB 102,68,15,56,29,200 ; pabsw %xmm0,%xmm9 - DB 102,68,15,111,21,141,8,0,0 ; movdqa 0x88d(%rip),%xmm10 # 1510 <_sk_xor__ssse3_lowp+0x1df> + DB 102,68,15,111,21,141,8,0,0 ; movdqa 0x88d(%rip),%xmm10 # 14e0 <_sk_xor__ssse3_lowp+0x1df> DB 102,69,15,249,208 ; psubw %xmm8,%xmm10 DB 102,15,111,196 ; movdqa %xmm4,%xmm0 DB 102,65,15,56,11,194 ; pmulhrsw %xmm10,%xmm0 @@ -29241,14 +29149,14 @@ _sk_lerp_u8_ssse3_lowp LABEL PROC DB 72,173 ; lods %ds:(%rsi),%rax DB 76,139,24 ; mov (%rax),%r11 DB 77,133,192 ; test %r8,%r8 - DB 15,133,169,0,0,0 ; jne db4 <_sk_lerp_u8_ssse3_lowp+0xb7> + DB 15,133,169,0,0,0 ; jne d84 <_sk_lerp_u8_ssse3_lowp+0xb7> DB 243,69,15,126,4,19 ; movq (%r11,%rdx,1),%xmm8 DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8 DB 102,65,15,113,240,8 ; psllw $0x8,%xmm8 - DB 102,68,15,228,5,251,7,0,0 ; pmulhuw 0x7fb(%rip),%xmm8 # 1520 <_sk_xor__ssse3_lowp+0x1ef> + DB 102,68,15,228,5,251,7,0,0 ; pmulhuw 0x7fb(%rip),%xmm8 # 14f0 <_sk_xor__ssse3_lowp+0x1ef> DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0 DB 102,68,15,56,29,200 ; pabsw %xmm0,%xmm9 - DB 102,68,15,111,21,246,7,0,0 ; movdqa 0x7f6(%rip),%xmm10 # 1530 <_sk_xor__ssse3_lowp+0x1ff> + DB 102,68,15,111,21,246,7,0,0 ; movdqa 0x7f6(%rip),%xmm10 # 1500 <_sk_xor__ssse3_lowp+0x1ff> DB 102,69,15,249,208 ; psubw %xmm8,%xmm10 DB 102,15,111,196 ; movdqa %xmm4,%xmm0 DB 102,65,15,56,11,194 ; pmulhrsw %xmm10,%xmm0 @@ -29278,15 +29186,15 @@ _sk_lerp_u8_ssse3_lowp LABEL PROC DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 65,254,201 ; dec %r9b DB 65,128,249,6 ; cmp $0x6,%r9b - DB 15,135,73,255,255,255 ; ja d16 <_sk_lerp_u8_ssse3_lowp+0x19> + DB 15,135,73,255,255,255 ; ja ce6 <_sk_lerp_u8_ssse3_lowp+0x19> DB 69,15,182,201 ; movzbl %r9b,%r9d - DB 76,141,21,128,0,0,0 ; lea 0x80(%rip),%r10 # e58 <_sk_lerp_u8_ssse3_lowp+0x15b> + DB 76,141,21,128,0,0,0 ; lea 0x80(%rip),%r10 # e28 <_sk_lerp_u8_ssse3_lowp+0x15b> DB 75,99,4,138 ; movslq (%r10,%r9,4),%rax DB 76,1,208 ; add %r10,%rax DB 255,224 ; jmpq *%rax DB 65,15,182,4,19 ; movzbl (%r11,%rdx,1),%eax DB 102,68,15,110,192 ; movd %eax,%xmm8 - DB 233,38,255,255,255 ; jmpq d16 <_sk_lerp_u8_ssse3_lowp+0x19> + DB 233,38,255,255,255 ; jmpq ce6 <_sk_lerp_u8_ssse3_lowp+0x19> DB 65,15,182,68,19,2 ; movzbl 0x2(%r11,%rdx,1),%eax DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,68,15,196,192,2 ; pinsrw $0x2,%eax,%xmm8 @@ -29294,7 +29202,7 @@ _sk_lerp_u8_ssse3_lowp LABEL PROC DB 102,68,15,110,200 ; movd %eax,%xmm9 DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9 DB 243,69,15,16,193 ; movss %xmm9,%xmm8 - DB 233,252,254,255,255 ; jmpq d16 <_sk_lerp_u8_ssse3_lowp+0x19> + DB 233,252,254,255,255 ; jmpq ce6 <_sk_lerp_u8_ssse3_lowp+0x19> DB 65,15,182,68,19,6 ; movzbl 0x6(%r11,%rdx,1),%eax DB 102,69,15,239,192 ; pxor %xmm8,%xmm8 DB 102,68,15,196,192,6 ; pinsrw $0x6,%eax,%xmm8 @@ -29305,14 +29213,14 @@ _sk_lerp_u8_ssse3_lowp LABEL PROC DB 102,69,15,110,12,19 ; movd (%r11,%rdx,1),%xmm9 DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9 DB 242,69,15,16,193 ; movsd %xmm9,%xmm8 - DB 233,190,254,255,255 ; jmpq d16 <_sk_lerp_u8_ssse3_lowp+0x19> + DB 233,190,254,255,255 ; jmpq ce6 <_sk_lerp_u8_ssse3_lowp+0x19> DB 137,255 ; mov %edi,%edi DB 255 ; (bad) DB 255,169,255,255,255,152 ; ljmp *-0x67000001(%rcx) DB 255 ; (bad) DB 255 ; (bad) DB 255 ; (bad) - DB 235,255 ; jmp e65 <_sk_lerp_u8_ssse3_lowp+0x168> + DB 235,255 ; jmp e35 <_sk_lerp_u8_ssse3_lowp+0x168> DB 255 ; (bad) DB 255 ; (bad) DB 223,255 ; (bad) @@ -29381,7 +29289,7 @@ PUBLIC _sk_srcatop_ssse3_lowp _sk_srcatop_ssse3_lowp LABEL PROC DB 102,15,56,11,199 ; pmulhrsw %xmm7,%xmm0 DB 102,68,15,56,29,192 ; pabsw %xmm0,%xmm8 - DB 102,68,15,111,13,73,6,0,0 ; movdqa 0x649(%rip),%xmm9 # 1540 <_sk_xor__ssse3_lowp+0x20f> + DB 102,68,15,111,13,73,6,0,0 ; movdqa 0x649(%rip),%xmm9 # 1510 <_sk_xor__ssse3_lowp+0x20f> DB 102,68,15,249,203 ; psubw %xmm3,%xmm9 DB 102,15,111,196 ; movdqa %xmm4,%xmm0 DB 102,65,15,56,11,193 ; pmulhrsw %xmm9,%xmm0 @@ -29412,7 +29320,7 @@ _sk_dstatop_ssse3_lowp LABEL PROC DB 102,68,15,111,196 ; movdqa %xmm4,%xmm8 DB 102,68,15,56,11,195 ; pmulhrsw %xmm3,%xmm8 DB 102,69,15,56,29,192 ; pabsw %xmm8,%xmm8 - DB 102,68,15,111,13,200,5,0,0 ; movdqa 0x5c8(%rip),%xmm9 # 1550 <_sk_xor__ssse3_lowp+0x21f> + DB 102,68,15,111,13,200,5,0,0 ; movdqa 0x5c8(%rip),%xmm9 # 1520 <_sk_xor__ssse3_lowp+0x21f> DB 102,68,15,249,207 ; psubw %xmm7,%xmm9 DB 102,65,15,56,11,193 ; pmulhrsw %xmm9,%xmm0 DB 102,15,56,29,192 ; pabsw %xmm0,%xmm0 @@ -29469,7 +29377,7 @@ _sk_dstin_ssse3_lowp LABEL PROC PUBLIC _sk_srcout_ssse3_lowp _sk_srcout_ssse3_lowp LABEL PROC - DB 102,68,15,111,5,238,4,0,0 ; movdqa 0x4ee(%rip),%xmm8 # 1560 <_sk_xor__ssse3_lowp+0x22f> + DB 102,68,15,111,5,238,4,0,0 ; movdqa 0x4ee(%rip),%xmm8 # 1530 <_sk_xor__ssse3_lowp+0x22f> DB 102,68,15,249,199 ; psubw %xmm7,%xmm8 DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0 DB 102,15,56,29,192 ; pabsw %xmm0,%xmm0 @@ -29484,7 +29392,7 @@ _sk_srcout_ssse3_lowp LABEL PROC PUBLIC _sk_dstout_ssse3_lowp _sk_dstout_ssse3_lowp LABEL PROC - DB 102,68,15,111,5,191,4,0,0 ; movdqa 0x4bf(%rip),%xmm8 # 1570 <_sk_xor__ssse3_lowp+0x23f> + DB 102,68,15,111,5,191,4,0,0 ; movdqa 0x4bf(%rip),%xmm8 # 1540 <_sk_xor__ssse3_lowp+0x23f> DB 102,68,15,249,195 ; psubw %xmm3,%xmm8 DB 102,15,111,196 ; movdqa %xmm4,%xmm0 DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0 @@ -29502,7 +29410,7 @@ _sk_dstout_ssse3_lowp LABEL PROC PUBLIC _sk_srcover_ssse3_lowp _sk_srcover_ssse3_lowp LABEL PROC - DB 102,68,15,111,5,132,4,0,0 ; movdqa 0x484(%rip),%xmm8 # 1580 <_sk_xor__ssse3_lowp+0x24f> + DB 102,68,15,111,5,132,4,0,0 ; movdqa 0x484(%rip),%xmm8 # 1550 <_sk_xor__ssse3_lowp+0x24f> DB 102,68,15,249,195 ; psubw %xmm3,%xmm8 DB 102,68,15,111,204 ; movdqa %xmm4,%xmm9 DB 102,69,15,56,11,200 ; pmulhrsw %xmm8,%xmm9 @@ -29524,7 +29432,7 @@ _sk_srcover_ssse3_lowp LABEL PROC PUBLIC _sk_dstover_ssse3_lowp _sk_dstover_ssse3_lowp LABEL PROC - DB 102,68,15,111,5,47,4,0,0 ; movdqa 0x42f(%rip),%xmm8 # 1590 <_sk_xor__ssse3_lowp+0x25f> + DB 102,68,15,111,5,47,4,0,0 ; movdqa 0x42f(%rip),%xmm8 # 1560 <_sk_xor__ssse3_lowp+0x25f> DB 102,68,15,249,199 ; psubw %xmm7,%xmm8 DB 102,65,15,56,11,192 ; pmulhrsw %xmm8,%xmm0 DB 102,15,56,29,192 ; pabsw %xmm0,%xmm0 @@ -29556,7 +29464,7 @@ _sk_modulate_ssse3_lowp LABEL PROC PUBLIC _sk_multiply_ssse3_lowp _sk_multiply_ssse3_lowp LABEL PROC - DB 102,68,15,111,5,196,3,0,0 ; movdqa 0x3c4(%rip),%xmm8 # 15a0 <_sk_xor__ssse3_lowp+0x26f> + DB 102,68,15,111,5,196,3,0,0 ; movdqa 0x3c4(%rip),%xmm8 # 1570 <_sk_xor__ssse3_lowp+0x26f> DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9 DB 102,68,15,249,207 ; psubw %xmm7,%xmm9 DB 102,68,15,111,208 ; movdqa %xmm0,%xmm10 @@ -29603,7 +29511,7 @@ _sk_multiply_ssse3_lowp LABEL PROC PUBLIC _sk_screen_ssse3_lowp _sk_screen_ssse3_lowp LABEL PROC - DB 102,68,15,111,5,234,2,0,0 ; movdqa 0x2ea(%rip),%xmm8 # 15b0 <_sk_xor__ssse3_lowp+0x27f> + DB 102,68,15,111,5,234,2,0,0 ; movdqa 0x2ea(%rip),%xmm8 # 1580 <_sk_xor__ssse3_lowp+0x27f> DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9 DB 102,68,15,249,200 ; psubw %xmm0,%xmm9 DB 102,68,15,56,11,204 ; pmulhrsw %xmm4,%xmm9 @@ -29628,7 +29536,7 @@ _sk_screen_ssse3_lowp LABEL PROC PUBLIC _sk_xor__ssse3_lowp _sk_xor__ssse3_lowp LABEL PROC - DB 102,68,15,111,5,134,2,0,0 ; movdqa 0x286(%rip),%xmm8 # 15c0 <_sk_xor__ssse3_lowp+0x28f> + DB 102,68,15,111,5,134,2,0,0 ; movdqa 0x286(%rip),%xmm8 # 1590 <_sk_xor__ssse3_lowp+0x28f> DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9 DB 102,68,15,249,207 ; psubw %xmm7,%xmm9 DB 102,65,15,56,11,193 ; pmulhrsw %xmm9,%xmm0 @@ -29671,7 +29579,7 @@ ALIGN 16 DB 12,13 ; or $0xd,%al DB 12,13 ; or $0xd,%al DB 14 ; (bad) - DB 15,129,128,129,128,129 ; jno ffffffff81809575 <_sk_xor__ssse3_lowp+0xffffffff81808244> + DB 15,129,128,129,128,129 ; jno ffffffff81809545 <_sk_xor__ssse3_lowp+0xffffffff81808244> DB 128,129,128,129,128,129,128 ; addb $0x80,-0x7e7f7e80(%rcx) DB 129,128,129,128,1,2,5,6,9,10 ; addl $0xa090605,0x2018081(%rax) DB 13,14,9,10,13 ; or $0xd0a090e,%eax diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp index 1ac444441a..9ca5a08776 100644 --- a/src/jumper/SkJumper_stages.cpp +++ b/src/jumper/SkJumper_stages.cpp @@ -53,7 +53,11 @@ using Stage = void(K* k, void** program, size_t x, size_t y, size_t tail, F,F,F, #endif MAYBE_MSABI extern "C" void WRAP(start_pipeline)(size_t x, size_t y, size_t limit, void** program, K* k) { +#if defined(JUMPER) + F v; +#else F v{}; +#endif auto start = (Stage*)load_and_inc(program); while (x + kStride <= limit) { start(k,program,x,y,0, v,v,v,v, v,v,v,v); diff --git a/src/jumper/SkJumper_stages_lowp.cpp b/src/jumper/SkJumper_stages_lowp.cpp index 38dd53079b..1b735f0fdc 100644 --- a/src/jumper/SkJumper_stages_lowp.cpp +++ b/src/jumper/SkJumper_stages_lowp.cpp @@ -71,7 +71,11 @@ using Stage = void(K* k, void** program, size_t x, size_t y, size_t tail, F,F,F, #endif MAYBE_MSABI extern "C" size_t WRAP(start_pipeline)(size_t x, size_t y, size_t limit, void** program, K* k) { +#if defined(JUMPER) + F v; +#else F v{}; +#endif auto start = (Stage*)load_and_inc(program); while (x + kStride <= limit) { start(k,program,x,y,0, v,v,v,v, v,v,v,v);