mirror of
https://github.com/KhronosGroup/SPIRV-Tools
synced 2024-11-27 13:50:07 +00:00
1dc2458060
This pass will look for adjacent loops that are compatible and legal to be fused. Loops are compatible if: - they both have one induction variable - they have the same upper and lower bounds - same initial value - same condition - they have the same update step - they are adjacent - there are no break/continue in either of them Fusion is legal if: - fused loops do not have any dependencies with dependence distance greater than 0 that did not exist in the original loops. - there are no function calls in the loops (could have side-effects) - there are no barriers in the loops It will fuse all such loops as long as the number of registers used for the fused loop stays under the threshold defined by max_registers_per_loop.
4582 lines
134 KiB
C++
4582 lines
134 KiB
C++
// Copyright (c) 2018 Google LLC.
|
|
//
|
|
// Licensed under the Apache License, Version 2.0 (the "License");
|
|
// you may not use this file except in compliance with the License.
|
|
// You may obtain a copy of the License at
|
|
//
|
|
// http://www.apache.org/licenses/LICENSE-2.0
|
|
//
|
|
// Unless required by applicable law or agreed to in writing, software
|
|
// distributed under the License is distributed on an "AS IS" BASIS,
|
|
// WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
|
|
// See the License for the specific language governing permissions and
|
|
// limitations under the License.
|
|
|
|
#include <gmock/gmock.h>
|
|
|
|
#include <algorithm>
|
|
#include <iterator>
|
|
#include <memory>
|
|
#include <string>
|
|
#include <vector>
|
|
|
|
#ifdef SPIRV_EFFCEE
|
|
#include "effcee/effcee.h"
|
|
#endif
|
|
|
|
#include "../pass_fixture.h"
|
|
#include "opt/loop_descriptor.h"
|
|
#include "opt/loop_fusion.h"
|
|
|
|
namespace {
|
|
|
|
using namespace spvtools;
|
|
|
|
using FusionLegalTest = PassTest<::testing::Test>;
|
|
|
|
bool Validate(const std::vector<uint32_t>& bin) {
|
|
spv_target_env target_env = SPV_ENV_UNIVERSAL_1_2;
|
|
spv_context spvContext = spvContextCreate(target_env);
|
|
spv_diagnostic diagnostic = nullptr;
|
|
spv_const_binary_t binary = {bin.data(), bin.size()};
|
|
spv_result_t error = spvValidate(spvContext, &binary, &diagnostic);
|
|
if (error != 0) spvDiagnosticPrint(diagnostic);
|
|
spvDiagnosticDestroy(diagnostic);
|
|
spvContextDestroy(spvContext);
|
|
return error == 0;
|
|
}
|
|
|
|
void Match(const std::string& checks, ir::IRContext* context) {
|
|
std::vector<uint32_t> bin;
|
|
context->module()->ToBinary(&bin, true);
|
|
EXPECT_TRUE(Validate(bin));
|
|
#ifdef SPIRV_EFFCEE
|
|
std::string assembly;
|
|
SpirvTools tools(SPV_ENV_UNIVERSAL_1_2);
|
|
EXPECT_TRUE(
|
|
tools.Disassemble(bin, &assembly, SPV_BINARY_TO_TEXT_OPTION_NO_HEADER))
|
|
<< "Disassembling failed for shader:\n"
|
|
<< assembly << std::endl;
|
|
auto match_result = effcee::Match(assembly, checks);
|
|
EXPECT_EQ(effcee::Result::Status::Ok, match_result.status())
|
|
<< match_result.message() << "\nChecking result:\n"
|
|
<< assembly;
|
|
#endif // ! SPIRV_EFFCEE
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
// No dependence, legal
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i] = a[i]*2;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
b[i] = b[i]+2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, DifferentArraysInLoops) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %34 "i"
|
|
OpName %42 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%28 = OpConstant %6 2
|
|
%32 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%34 = OpVariable %7 Function
|
|
%42 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%51 = OpPhi %6 %9 %5 %33 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %51 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%26 = OpAccessChain %7 %23 %51
|
|
%27 = OpLoad %6 %26
|
|
%29 = OpIMul %6 %27 %28
|
|
%30 = OpAccessChain %7 %23 %51
|
|
OpStore %30 %29
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%33 = OpIAdd %6 %51 %32
|
|
OpStore %8 %33
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %34 %9
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%52 = OpPhi %6 %9 %12 %50 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %17 %52 %16
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%45 = OpAccessChain %7 %42 %52
|
|
%46 = OpLoad %6 %45
|
|
%47 = OpIAdd %6 %46 %28
|
|
%48 = OpAccessChain %7 %42 %52
|
|
OpStore %48 %47
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%50 = OpIAdd %6 %52 %32
|
|
OpStore %34 %50
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 1u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Only loads to the same array, legal
|
|
for (int i = 0; i < 10; i++) {
|
|
b[i] = a[i]*2;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
c[i] = a[i]+2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, OnlyLoadsToSameArray) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "b"
|
|
OpName %25 "a"
|
|
OpName %35 "i"
|
|
OpName %43 "c"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%29 = OpConstant %6 2
|
|
%33 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%25 = OpVariable %22 Function
|
|
%35 = OpVariable %7 Function
|
|
%43 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%52 = OpPhi %6 %9 %5 %34 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %52 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%27 = OpAccessChain %7 %25 %52
|
|
%28 = OpLoad %6 %27
|
|
%30 = OpIMul %6 %28 %29
|
|
%31 = OpAccessChain %7 %23 %52
|
|
OpStore %31 %30
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%34 = OpIAdd %6 %52 %33
|
|
OpStore %8 %34
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %35 %9
|
|
OpBranch %36
|
|
%36 = OpLabel
|
|
%53 = OpPhi %6 %9 %12 %51 %39
|
|
OpLoopMerge %38 %39 None
|
|
OpBranch %40
|
|
%40 = OpLabel
|
|
%42 = OpSLessThan %17 %53 %16
|
|
OpBranchConditional %42 %37 %38
|
|
%37 = OpLabel
|
|
%46 = OpAccessChain %7 %25 %53
|
|
%47 = OpLoad %6 %46
|
|
%48 = OpIAdd %6 %47 %29
|
|
%49 = OpAccessChain %7 %43 %53
|
|
OpStore %49 %48
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%51 = OpIAdd %6 %53 %33
|
|
OpStore %35 %51
|
|
OpBranch %36
|
|
%38 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 1u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
// No loop-carried dependences, legal
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i] = a[i]*2;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
b[i] = a[i]+2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, NoLoopCarriedDependences) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %34 "i"
|
|
OpName %42 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%28 = OpConstant %6 2
|
|
%32 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%34 = OpVariable %7 Function
|
|
%42 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%51 = OpPhi %6 %9 %5 %33 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %51 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%26 = OpAccessChain %7 %23 %51
|
|
%27 = OpLoad %6 %26
|
|
%29 = OpIMul %6 %27 %28
|
|
%30 = OpAccessChain %7 %23 %51
|
|
OpStore %30 %29
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%33 = OpIAdd %6 %51 %32
|
|
OpStore %8 %33
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %34 %9
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%52 = OpPhi %6 %9 %12 %50 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %17 %52 %16
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%45 = OpAccessChain %7 %23 %52
|
|
%46 = OpLoad %6 %45
|
|
%47 = OpIAdd %6 %46 %28
|
|
%48 = OpAccessChain %7 %42 %52
|
|
OpStore %48 %47
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%50 = OpIAdd %6 %52 %32
|
|
OpStore %34 %50
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 1u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Parallelism inhibiting, but legal.
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i] = b[i] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
c[i] = a[i] + c[i-1];
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, ExistingLoopCarriedDependence) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %25 "b"
|
|
OpName %34 "i"
|
|
OpName %42 "c"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%29 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%25 = OpVariable %22 Function
|
|
%34 = OpVariable %7 Function
|
|
%42 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%55 = OpPhi %6 %9 %5 %33 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %55 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%27 = OpAccessChain %7 %25 %55
|
|
%28 = OpLoad %6 %27
|
|
%30 = OpIAdd %6 %28 %29
|
|
%31 = OpAccessChain %7 %23 %55
|
|
OpStore %31 %30
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%33 = OpIAdd %6 %55 %29
|
|
OpStore %8 %33
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %34 %9
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%56 = OpPhi %6 %9 %12 %54 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %17 %56 %16
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%45 = OpAccessChain %7 %23 %56
|
|
%46 = OpLoad %6 %45
|
|
%48 = OpISub %6 %56 %29
|
|
%49 = OpAccessChain %7 %42 %48
|
|
%50 = OpLoad %6 %49
|
|
%51 = OpIAdd %6 %46 %50
|
|
%52 = OpAccessChain %7 %42 %56
|
|
OpStore %52 %51
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%54 = OpIAdd %6 %56 %29
|
|
OpStore %34 %54
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[I_1:%\w+]] = OpISub {{%\w+}} [[PHI]] {{%\w+}}
|
|
CHECK-NEXT: [[LOAD_2:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_2]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 1u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Creates a loop-carried dependence, but negative, so legal
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i+1] = b[i] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
c[i] = a[i] + 2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, NegativeDistanceCreatedRAW) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %27 "b"
|
|
OpName %35 "i"
|
|
OpName %43 "c"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%25 = OpConstant %6 1
|
|
%48 = OpConstant %6 2
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%27 = OpVariable %22 Function
|
|
%35 = OpVariable %7 Function
|
|
%43 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%53 = OpPhi %6 %9 %5 %34 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %53 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%26 = OpIAdd %6 %53 %25
|
|
%29 = OpAccessChain %7 %27 %53
|
|
%30 = OpLoad %6 %29
|
|
%31 = OpIAdd %6 %30 %25
|
|
%32 = OpAccessChain %7 %23 %26
|
|
OpStore %32 %31
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%34 = OpIAdd %6 %53 %25
|
|
OpStore %8 %34
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %35 %9
|
|
OpBranch %36
|
|
%36 = OpLabel
|
|
%54 = OpPhi %6 %9 %12 %52 %39
|
|
OpLoopMerge %38 %39 None
|
|
OpBranch %40
|
|
%40 = OpLabel
|
|
%42 = OpSLessThan %17 %54 %16
|
|
OpBranchConditional %42 %37 %38
|
|
%37 = OpLabel
|
|
%46 = OpAccessChain %7 %23 %54
|
|
%47 = OpLoad %6 %46
|
|
%49 = OpIAdd %6 %47 %48
|
|
%50 = OpAccessChain %7 %43 %54
|
|
OpStore %50 %49
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%52 = OpIAdd %6 %54 %25
|
|
OpStore %35 %52
|
|
OpBranch %36
|
|
%38 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[I_1:%\w+]] = OpIAdd {{%\w+}} [[PHI]] {{%\w+}}
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
|
|
{
|
|
auto& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Legal
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i+1] = b[i] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
c[i] = a[i+1] + 2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, NoLoopCarriedDependencesAdjustedIndex) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %27 "b"
|
|
OpName %35 "i"
|
|
OpName %43 "c"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%25 = OpConstant %6 1
|
|
%49 = OpConstant %6 2
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%27 = OpVariable %22 Function
|
|
%35 = OpVariable %7 Function
|
|
%43 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%54 = OpPhi %6 %9 %5 %34 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %54 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%26 = OpIAdd %6 %54 %25
|
|
%29 = OpAccessChain %7 %27 %54
|
|
%30 = OpLoad %6 %29
|
|
%31 = OpIAdd %6 %30 %25
|
|
%32 = OpAccessChain %7 %23 %26
|
|
OpStore %32 %31
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%34 = OpIAdd %6 %54 %25
|
|
OpStore %8 %34
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %35 %9
|
|
OpBranch %36
|
|
%36 = OpLabel
|
|
%55 = OpPhi %6 %9 %12 %53 %39
|
|
OpLoopMerge %38 %39 None
|
|
OpBranch %40
|
|
%40 = OpLabel
|
|
%42 = OpSLessThan %17 %55 %16
|
|
OpBranchConditional %42 %37 %38
|
|
%37 = OpLabel
|
|
%46 = OpIAdd %6 %55 %25
|
|
%47 = OpAccessChain %7 %23 %46
|
|
%48 = OpLoad %6 %47
|
|
%50 = OpIAdd %6 %48 %49
|
|
%51 = OpAccessChain %7 %43 %55
|
|
OpStore %51 %50
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%53 = OpIAdd %6 %55 %25
|
|
OpStore %35 %53
|
|
OpBranch %36
|
|
%38 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[I_1:%\w+]] = OpIAdd {{%\w+}} [[PHI]] {{%\w+}}
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[I_1:%\w+]] = OpIAdd {{%\w+}} [[PHI]] {{%\w+}}
|
|
CHECK-NEXT: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 1u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Legal, independent locations in |a|, SIV
|
|
for (int i = 0; i < 10; i++) {
|
|
a[2*i+1] = b[i] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
c[i] = a[2*i] + 2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, IndependentSIV) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %29 "b"
|
|
OpName %37 "i"
|
|
OpName %45 "c"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%24 = OpConstant %6 2
|
|
%27 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%29 = OpVariable %22 Function
|
|
%37 = OpVariable %7 Function
|
|
%45 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%55 = OpPhi %6 %9 %5 %36 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %55 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%26 = OpIMul %6 %24 %55
|
|
%28 = OpIAdd %6 %26 %27
|
|
%31 = OpAccessChain %7 %29 %55
|
|
%32 = OpLoad %6 %31
|
|
%33 = OpIAdd %6 %32 %27
|
|
%34 = OpAccessChain %7 %23 %28
|
|
OpStore %34 %33
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%36 = OpIAdd %6 %55 %27
|
|
OpStore %8 %36
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %37 %9
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%56 = OpPhi %6 %9 %12 %54 %41
|
|
OpLoopMerge %40 %41 None
|
|
OpBranch %42
|
|
%42 = OpLabel
|
|
%44 = OpSLessThan %17 %56 %16
|
|
OpBranchConditional %44 %39 %40
|
|
%39 = OpLabel
|
|
%48 = OpIMul %6 %24 %56
|
|
%49 = OpAccessChain %7 %23 %48
|
|
%50 = OpLoad %6 %49
|
|
%51 = OpIAdd %6 %50 %24
|
|
%52 = OpAccessChain %7 %45 %56
|
|
OpStore %52 %51
|
|
OpBranch %41
|
|
%41 = OpLabel
|
|
%54 = OpIAdd %6 %56 %27
|
|
OpStore %37 %54
|
|
OpBranch %38
|
|
%40 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[I_2:%\w+]] = OpIMul {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: [[I_2_1:%\w+]] = OpIAdd {{%\w+}} [[I_2]] {{%\w+}}
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_2_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[I_2:%\w+]] = OpIMul {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_2]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 1u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Legal, independent locations in |a|, ZIV
|
|
for (int i = 0; i < 10; i++) {
|
|
a[1] = b[i] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
c[i] = a[9] + 2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, IndependentZIV) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %25 "b"
|
|
OpName %33 "i"
|
|
OpName %41 "c"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%24 = OpConstant %6 1
|
|
%43 = OpConstant %6 9
|
|
%46 = OpConstant %6 2
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%25 = OpVariable %22 Function
|
|
%33 = OpVariable %7 Function
|
|
%41 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%51 = OpPhi %6 %9 %5 %32 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %51 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%27 = OpAccessChain %7 %25 %51
|
|
%28 = OpLoad %6 %27
|
|
%29 = OpIAdd %6 %28 %24
|
|
%30 = OpAccessChain %7 %23 %24
|
|
OpStore %30 %29
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%32 = OpIAdd %6 %51 %24
|
|
OpStore %8 %32
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %33 %9
|
|
OpBranch %34
|
|
%34 = OpLabel
|
|
%52 = OpPhi %6 %9 %12 %50 %37
|
|
OpLoopMerge %36 %37 None
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%40 = OpSLessThan %17 %52 %16
|
|
OpBranchConditional %40 %35 %36
|
|
%35 = OpLabel
|
|
%44 = OpAccessChain %7 %23 %43
|
|
%45 = OpLoad %6 %44
|
|
%47 = OpIAdd %6 %45 %46
|
|
%48 = OpAccessChain %7 %41 %52
|
|
OpStore %48 %47
|
|
OpBranch %37
|
|
%37 = OpLabel
|
|
%50 = OpIAdd %6 %52 %24
|
|
OpStore %33 %50
|
|
OpBranch %34
|
|
%36 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK-NOT: OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK: OpStore
|
|
CHECK-NOT: OpPhi
|
|
CHECK-NOT: OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK: OpLoad
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 1u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[20] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Legal, non-overlapping sections in |a|
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i] = b[i] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
c[i] = a[i+10] + 2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, NonOverlappingAccesses) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %28 "b"
|
|
OpName %37 "i"
|
|
OpName %45 "c"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 20
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%25 = OpConstant %19 10
|
|
%26 = OpTypeArray %6 %25
|
|
%27 = OpTypePointer Function %26
|
|
%32 = OpConstant %6 1
|
|
%51 = OpConstant %6 2
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%28 = OpVariable %27 Function
|
|
%37 = OpVariable %7 Function
|
|
%45 = OpVariable %27 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%56 = OpPhi %6 %9 %5 %36 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %56 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%30 = OpAccessChain %7 %28 %56
|
|
%31 = OpLoad %6 %30
|
|
%33 = OpIAdd %6 %31 %32
|
|
%34 = OpAccessChain %7 %23 %56
|
|
OpStore %34 %33
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%36 = OpIAdd %6 %56 %32
|
|
OpStore %8 %36
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %37 %9
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%57 = OpPhi %6 %9 %12 %55 %41
|
|
OpLoopMerge %40 %41 None
|
|
OpBranch %42
|
|
%42 = OpLabel
|
|
%44 = OpSLessThan %17 %57 %16
|
|
OpBranchConditional %44 %39 %40
|
|
%39 = OpLabel
|
|
%48 = OpIAdd %6 %57 %16
|
|
%49 = OpAccessChain %7 %23 %48
|
|
%50 = OpLoad %6 %49
|
|
%52 = OpIAdd %6 %50 %51
|
|
%53 = OpAccessChain %7 %45 %57
|
|
OpStore %53 %52
|
|
OpBranch %41
|
|
%41 = OpLabel
|
|
%55 = OpIAdd %6 %57 %32
|
|
OpStore %37 %55
|
|
OpBranch %38
|
|
%40 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[I_10:%\w+]] = OpIAdd {{%\w+}} [[PHI]] {{%\w+}}
|
|
CHECK-NEXT: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_10]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 1u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Legal, 3 adjacent loops
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i] = b[i] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
c[i] = a[i] + 2;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
b[i] = c[i] + 10;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, AdjacentLoops) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %25 "b"
|
|
OpName %34 "i"
|
|
OpName %42 "c"
|
|
OpName %52 "i"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%29 = OpConstant %6 1
|
|
%47 = OpConstant %6 2
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%25 = OpVariable %22 Function
|
|
%34 = OpVariable %7 Function
|
|
%42 = OpVariable %22 Function
|
|
%52 = OpVariable %7 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%68 = OpPhi %6 %9 %5 %33 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %68 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%27 = OpAccessChain %7 %25 %68
|
|
%28 = OpLoad %6 %27
|
|
%30 = OpIAdd %6 %28 %29
|
|
%31 = OpAccessChain %7 %23 %68
|
|
OpStore %31 %30
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%33 = OpIAdd %6 %68 %29
|
|
OpStore %8 %33
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %34 %9
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%69 = OpPhi %6 %9 %12 %51 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %17 %69 %16
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%45 = OpAccessChain %7 %23 %69
|
|
%46 = OpLoad %6 %45
|
|
%48 = OpIAdd %6 %46 %47
|
|
%49 = OpAccessChain %7 %42 %69
|
|
OpStore %49 %48
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%51 = OpIAdd %6 %69 %29
|
|
OpStore %34 %51
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
OpStore %52 %9
|
|
OpBranch %53
|
|
%53 = OpLabel
|
|
%70 = OpPhi %6 %9 %37 %67 %56
|
|
OpLoopMerge %55 %56 None
|
|
OpBranch %57
|
|
%57 = OpLabel
|
|
%59 = OpSLessThan %17 %70 %16
|
|
OpBranchConditional %59 %54 %55
|
|
%54 = OpLabel
|
|
%62 = OpAccessChain %7 %42 %70
|
|
%63 = OpLoad %6 %62
|
|
%64 = OpIAdd %6 %63 %16
|
|
%65 = OpAccessChain %7 %25 %70
|
|
OpStore %65 %64
|
|
OpBranch %56
|
|
%56 = OpLabel
|
|
%67 = OpIAdd %6 %70 %29
|
|
OpStore %52 %67
|
|
OpBranch %53
|
|
%55 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 3u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[1], loops[2]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_2:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_2]]
|
|
CHECK: [[STORE_2:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_2]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
std::string checks_ = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_2:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_2]]
|
|
CHECK: [[STORE_2:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_2]]
|
|
)";
|
|
|
|
Match(checks_, context.get());
|
|
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 1u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10][10] a;
|
|
int[10][10] b;
|
|
int[10][10] c;
|
|
// Legal inner loop fusion
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
c[i][j] = a[i][j] + 2;
|
|
}
|
|
for (int j = 0; j < 10; j++) {
|
|
b[i][j] = c[i][j] + 10;
|
|
}
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, InnerLoopFusion) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %19 "j"
|
|
OpName %32 "c"
|
|
OpName %35 "a"
|
|
OpName %46 "j"
|
|
OpName %54 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%27 = OpTypeInt 32 0
|
|
%28 = OpConstant %27 10
|
|
%29 = OpTypeArray %6 %28
|
|
%30 = OpTypeArray %29 %28
|
|
%31 = OpTypePointer Function %30
|
|
%40 = OpConstant %6 2
|
|
%44 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%19 = OpVariable %7 Function
|
|
%32 = OpVariable %31 Function
|
|
%35 = OpVariable %31 Function
|
|
%46 = OpVariable %7 Function
|
|
%54 = OpVariable %31 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%67 = OpPhi %6 %9 %5 %66 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %67 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
OpStore %19 %9
|
|
OpBranch %20
|
|
%20 = OpLabel
|
|
%68 = OpPhi %6 %9 %11 %45 %23
|
|
OpLoopMerge %22 %23 None
|
|
OpBranch %24
|
|
%24 = OpLabel
|
|
%26 = OpSLessThan %17 %68 %16
|
|
OpBranchConditional %26 %21 %22
|
|
%21 = OpLabel
|
|
%38 = OpAccessChain %7 %35 %67 %68
|
|
%39 = OpLoad %6 %38
|
|
%41 = OpIAdd %6 %39 %40
|
|
%42 = OpAccessChain %7 %32 %67 %68
|
|
OpStore %42 %41
|
|
OpBranch %23
|
|
%23 = OpLabel
|
|
%45 = OpIAdd %6 %68 %44
|
|
OpStore %19 %45
|
|
OpBranch %20
|
|
%22 = OpLabel
|
|
OpStore %46 %9
|
|
OpBranch %47
|
|
%47 = OpLabel
|
|
%69 = OpPhi %6 %9 %22 %64 %50
|
|
OpLoopMerge %49 %50 None
|
|
OpBranch %51
|
|
%51 = OpLabel
|
|
%53 = OpSLessThan %17 %69 %16
|
|
OpBranchConditional %53 %48 %49
|
|
%48 = OpLabel
|
|
%59 = OpAccessChain %7 %32 %67 %69
|
|
%60 = OpLoad %6 %59
|
|
%61 = OpIAdd %6 %60 %16
|
|
%62 = OpAccessChain %7 %54 %67 %69
|
|
OpStore %62 %61
|
|
OpBranch %50
|
|
%50 = OpLabel
|
|
%64 = OpIAdd %6 %69 %44
|
|
OpStore %46 %64
|
|
OpBranch %47
|
|
%49 = OpLabel
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%66 = OpIAdd %6 %67 %44
|
|
OpStore %8 %66
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 3u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
auto loop_0 = loops[0];
|
|
auto loop_1 = loops[1];
|
|
auto loop_2 = loops[2];
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_1);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_2);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_2);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
|
|
auto& ld_final = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld_final.NumLoops(), 2u);
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
// 12
|
|
#version 440 core
|
|
void main() {
|
|
int[10][10] a;
|
|
int[10][10] b;
|
|
int[10][10] c;
|
|
// Legal both
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
c[i][j] = a[i][j] + 2;
|
|
}
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
b[i][j] = c[i][j] + 10;
|
|
}
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, OuterAndInnerLoop) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %19 "j"
|
|
OpName %32 "c"
|
|
OpName %35 "a"
|
|
OpName %48 "i"
|
|
OpName %56 "j"
|
|
OpName %64 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%27 = OpTypeInt 32 0
|
|
%28 = OpConstant %27 10
|
|
%29 = OpTypeArray %6 %28
|
|
%30 = OpTypeArray %29 %28
|
|
%31 = OpTypePointer Function %30
|
|
%40 = OpConstant %6 2
|
|
%44 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%19 = OpVariable %7 Function
|
|
%32 = OpVariable %31 Function
|
|
%35 = OpVariable %31 Function
|
|
%48 = OpVariable %7 Function
|
|
%56 = OpVariable %7 Function
|
|
%64 = OpVariable %31 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%77 = OpPhi %6 %9 %5 %47 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %77 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
OpStore %19 %9
|
|
OpBranch %20
|
|
%20 = OpLabel
|
|
%81 = OpPhi %6 %9 %11 %45 %23
|
|
OpLoopMerge %22 %23 None
|
|
OpBranch %24
|
|
%24 = OpLabel
|
|
%26 = OpSLessThan %17 %81 %16
|
|
OpBranchConditional %26 %21 %22
|
|
%21 = OpLabel
|
|
%38 = OpAccessChain %7 %35 %77 %81
|
|
%39 = OpLoad %6 %38
|
|
%41 = OpIAdd %6 %39 %40
|
|
%42 = OpAccessChain %7 %32 %77 %81
|
|
OpStore %42 %41
|
|
OpBranch %23
|
|
%23 = OpLabel
|
|
%45 = OpIAdd %6 %81 %44
|
|
OpStore %19 %45
|
|
OpBranch %20
|
|
%22 = OpLabel
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%47 = OpIAdd %6 %77 %44
|
|
OpStore %8 %47
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %48 %9
|
|
OpBranch %49
|
|
%49 = OpLabel
|
|
%78 = OpPhi %6 %9 %12 %76 %52
|
|
OpLoopMerge %51 %52 None
|
|
OpBranch %53
|
|
%53 = OpLabel
|
|
%55 = OpSLessThan %17 %78 %16
|
|
OpBranchConditional %55 %50 %51
|
|
%50 = OpLabel
|
|
OpStore %56 %9
|
|
OpBranch %57
|
|
%57 = OpLabel
|
|
%79 = OpPhi %6 %9 %50 %74 %60
|
|
OpLoopMerge %59 %60 None
|
|
OpBranch %61
|
|
%61 = OpLabel
|
|
%63 = OpSLessThan %17 %79 %16
|
|
OpBranchConditional %63 %58 %59
|
|
%58 = OpLabel
|
|
%69 = OpAccessChain %7 %32 %78 %79
|
|
%70 = OpLoad %6 %69
|
|
%71 = OpIAdd %6 %70 %16
|
|
%72 = OpAccessChain %7 %64 %78 %79
|
|
OpStore %72 %71
|
|
OpBranch %60
|
|
%60 = OpLabel
|
|
%74 = OpIAdd %6 %79 %44
|
|
OpStore %56 %74
|
|
OpBranch %57
|
|
%59 = OpLabel
|
|
OpBranch %52
|
|
%52 = OpLabel
|
|
%76 = OpIAdd %6 %78 %44
|
|
OpStore %48 %76
|
|
OpBranch %49
|
|
%51 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 4u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
auto loop_0 = loops[0];
|
|
auto loop_1 = loops[1];
|
|
auto loop_2 = loops[2];
|
|
auto loop_3 = loops[3];
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_1);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_2);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_2, loop_3);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_3);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_2);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
fusion.Fuse();
|
|
}
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK: [[PHI_2:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_2]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_2]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
|
|
{
|
|
auto& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 3u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
auto loop_0 = loops[0];
|
|
auto loop_1 = loops[1];
|
|
auto loop_2 = loops[2];
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_1);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_2);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_2);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
fusion.Fuse();
|
|
}
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
|
|
{
|
|
auto& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10][10] a;
|
|
int[10][10] b;
|
|
int[10][10] c;
|
|
// Legal both, more complex
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
if (i % 2 == 0 && j % 2 == 0) {
|
|
c[i][j] = a[i][j] + 2;
|
|
}
|
|
}
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
b[i][j] = c[i][j] + 10;
|
|
}
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, OuterAndInnerLoopMoreComplex) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %19 "j"
|
|
OpName %44 "c"
|
|
OpName %47 "a"
|
|
OpName %59 "i"
|
|
OpName %67 "j"
|
|
OpName %75 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%28 = OpConstant %6 2
|
|
%39 = OpTypeInt 32 0
|
|
%40 = OpConstant %39 10
|
|
%41 = OpTypeArray %6 %40
|
|
%42 = OpTypeArray %41 %40
|
|
%43 = OpTypePointer Function %42
|
|
%55 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%19 = OpVariable %7 Function
|
|
%44 = OpVariable %43 Function
|
|
%47 = OpVariable %43 Function
|
|
%59 = OpVariable %7 Function
|
|
%67 = OpVariable %7 Function
|
|
%75 = OpVariable %43 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%88 = OpPhi %6 %9 %5 %58 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %88 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
OpStore %19 %9
|
|
OpBranch %20
|
|
%20 = OpLabel
|
|
%92 = OpPhi %6 %9 %11 %56 %23
|
|
OpLoopMerge %22 %23 None
|
|
OpBranch %24
|
|
%24 = OpLabel
|
|
%26 = OpSLessThan %17 %92 %16
|
|
OpBranchConditional %26 %21 %22
|
|
%21 = OpLabel
|
|
%29 = OpSMod %6 %88 %28
|
|
%30 = OpIEqual %17 %29 %9
|
|
OpSelectionMerge %32 None
|
|
OpBranchConditional %30 %31 %32
|
|
%31 = OpLabel
|
|
%34 = OpSMod %6 %92 %28
|
|
%35 = OpIEqual %17 %34 %9
|
|
OpBranch %32
|
|
%32 = OpLabel
|
|
%36 = OpPhi %17 %30 %21 %35 %31
|
|
OpSelectionMerge %38 None
|
|
OpBranchConditional %36 %37 %38
|
|
%37 = OpLabel
|
|
%50 = OpAccessChain %7 %47 %88 %92
|
|
%51 = OpLoad %6 %50
|
|
%52 = OpIAdd %6 %51 %28
|
|
%53 = OpAccessChain %7 %44 %88 %92
|
|
OpStore %53 %52
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
OpBranch %23
|
|
%23 = OpLabel
|
|
%56 = OpIAdd %6 %92 %55
|
|
OpStore %19 %56
|
|
OpBranch %20
|
|
%22 = OpLabel
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%58 = OpIAdd %6 %88 %55
|
|
OpStore %8 %58
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %59 %9
|
|
OpBranch %60
|
|
%60 = OpLabel
|
|
%89 = OpPhi %6 %9 %12 %87 %63
|
|
OpLoopMerge %62 %63 None
|
|
OpBranch %64
|
|
%64 = OpLabel
|
|
%66 = OpSLessThan %17 %89 %16
|
|
OpBranchConditional %66 %61 %62
|
|
%61 = OpLabel
|
|
OpStore %67 %9
|
|
OpBranch %68
|
|
%68 = OpLabel
|
|
%90 = OpPhi %6 %9 %61 %85 %71
|
|
OpLoopMerge %70 %71 None
|
|
OpBranch %72
|
|
%72 = OpLabel
|
|
%74 = OpSLessThan %17 %90 %16
|
|
OpBranchConditional %74 %69 %70
|
|
%69 = OpLabel
|
|
%80 = OpAccessChain %7 %44 %89 %90
|
|
%81 = OpLoad %6 %80
|
|
%82 = OpIAdd %6 %81 %16
|
|
%83 = OpAccessChain %7 %75 %89 %90
|
|
OpStore %83 %82
|
|
OpBranch %71
|
|
%71 = OpLabel
|
|
%85 = OpIAdd %6 %90 %55
|
|
OpStore %67 %85
|
|
OpBranch %68
|
|
%70 = OpLabel
|
|
OpBranch %63
|
|
%63 = OpLabel
|
|
%87 = OpIAdd %6 %89 %55
|
|
OpStore %59 %87
|
|
OpBranch %60
|
|
%62 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 4u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
auto loop_0 = loops[0];
|
|
auto loop_1 = loops[1];
|
|
auto loop_2 = loops[2];
|
|
auto loop_3 = loops[3];
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_1);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_2);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_2, loop_3);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_3);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_2);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
fusion.Fuse();
|
|
}
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: OpPhi
|
|
CHECK-NEXT: OpSelectionMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK: [[PHI_2:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_2]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_2]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 3u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
auto loop_0 = loops[0];
|
|
auto loop_1 = loops[1];
|
|
auto loop_2 = loops[2];
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_1);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_2);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_2);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
fusion.Fuse();
|
|
}
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: OpPhi
|
|
CHECK-NEXT: OpSelectionMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10][10] a;
|
|
int[10][10] b;
|
|
int[10][10] c;
|
|
// Outer would have been illegal to fuse, but since written
|
|
// like this, inner loop fusion is legal.
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
c[i][j] = a[i][j] + 2;
|
|
}
|
|
for (int j = 0; j < 10; j++) {
|
|
b[i][j] = c[i+1][j] + 10;
|
|
}
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, InnerWithExistingDependenceOnOuter) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %19 "j"
|
|
OpName %32 "c"
|
|
OpName %35 "a"
|
|
OpName %46 "j"
|
|
OpName %54 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%27 = OpTypeInt 32 0
|
|
%28 = OpConstant %27 10
|
|
%29 = OpTypeArray %6 %28
|
|
%30 = OpTypeArray %29 %28
|
|
%31 = OpTypePointer Function %30
|
|
%40 = OpConstant %6 2
|
|
%44 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%19 = OpVariable %7 Function
|
|
%32 = OpVariable %31 Function
|
|
%35 = OpVariable %31 Function
|
|
%46 = OpVariable %7 Function
|
|
%54 = OpVariable %31 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%68 = OpPhi %6 %9 %5 %67 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %68 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
OpStore %19 %9
|
|
OpBranch %20
|
|
%20 = OpLabel
|
|
%69 = OpPhi %6 %9 %11 %45 %23
|
|
OpLoopMerge %22 %23 None
|
|
OpBranch %24
|
|
%24 = OpLabel
|
|
%26 = OpSLessThan %17 %69 %16
|
|
OpBranchConditional %26 %21 %22
|
|
%21 = OpLabel
|
|
%38 = OpAccessChain %7 %35 %68 %69
|
|
%39 = OpLoad %6 %38
|
|
%41 = OpIAdd %6 %39 %40
|
|
%42 = OpAccessChain %7 %32 %68 %69
|
|
OpStore %42 %41
|
|
OpBranch %23
|
|
%23 = OpLabel
|
|
%45 = OpIAdd %6 %69 %44
|
|
OpStore %19 %45
|
|
OpBranch %20
|
|
%22 = OpLabel
|
|
OpStore %46 %9
|
|
OpBranch %47
|
|
%47 = OpLabel
|
|
%70 = OpPhi %6 %9 %22 %65 %50
|
|
OpLoopMerge %49 %50 None
|
|
OpBranch %51
|
|
%51 = OpLabel
|
|
%53 = OpSLessThan %17 %70 %16
|
|
OpBranchConditional %53 %48 %49
|
|
%48 = OpLabel
|
|
%58 = OpIAdd %6 %68 %44
|
|
%60 = OpAccessChain %7 %32 %58 %70
|
|
%61 = OpLoad %6 %60
|
|
%62 = OpIAdd %6 %61 %16
|
|
%63 = OpAccessChain %7 %54 %68 %70
|
|
OpStore %63 %62
|
|
OpBranch %50
|
|
%50 = OpLabel
|
|
%65 = OpIAdd %6 %70 %44
|
|
OpStore %46 %65
|
|
OpBranch %47
|
|
%49 = OpLabel
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%67 = OpIAdd %6 %68 %44
|
|
OpStore %8 %67
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 3u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
auto loop_0 = loops[0];
|
|
auto loop_1 = loops[1];
|
|
auto loop_2 = loops[2];
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_1);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_2);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_2);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[I_1:%\w+]] = OpIAdd {{%\w+}} [[PHI_0]] {{%\w+}}
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_1]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// One dimensional arrays. Legal, outer dist 0, inner independent.
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
c[i] = a[j] + 2;
|
|
}
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
b[j] = c[i] + 10;
|
|
}
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, OuterAndInnerLoopOneDimArrays) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %19 "j"
|
|
OpName %31 "c"
|
|
OpName %33 "a"
|
|
OpName %45 "i"
|
|
OpName %53 "j"
|
|
OpName %61 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%27 = OpTypeInt 32 0
|
|
%28 = OpConstant %27 10
|
|
%29 = OpTypeArray %6 %28
|
|
%30 = OpTypePointer Function %29
|
|
%37 = OpConstant %6 2
|
|
%41 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%19 = OpVariable %7 Function
|
|
%31 = OpVariable %30 Function
|
|
%33 = OpVariable %30 Function
|
|
%45 = OpVariable %7 Function
|
|
%53 = OpVariable %7 Function
|
|
%61 = OpVariable %30 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%72 = OpPhi %6 %9 %5 %44 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %72 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
OpStore %19 %9
|
|
OpBranch %20
|
|
%20 = OpLabel
|
|
%76 = OpPhi %6 %9 %11 %42 %23
|
|
OpLoopMerge %22 %23 None
|
|
OpBranch %24
|
|
%24 = OpLabel
|
|
%26 = OpSLessThan %17 %76 %16
|
|
OpBranchConditional %26 %21 %22
|
|
%21 = OpLabel
|
|
%35 = OpAccessChain %7 %33 %76
|
|
%36 = OpLoad %6 %35
|
|
%38 = OpIAdd %6 %36 %37
|
|
%39 = OpAccessChain %7 %31 %72
|
|
OpStore %39 %38
|
|
OpBranch %23
|
|
%23 = OpLabel
|
|
%42 = OpIAdd %6 %76 %41
|
|
OpStore %19 %42
|
|
OpBranch %20
|
|
%22 = OpLabel
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%44 = OpIAdd %6 %72 %41
|
|
OpStore %8 %44
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %45 %9
|
|
OpBranch %46
|
|
%46 = OpLabel
|
|
%73 = OpPhi %6 %9 %12 %71 %49
|
|
OpLoopMerge %48 %49 None
|
|
OpBranch %50
|
|
%50 = OpLabel
|
|
%52 = OpSLessThan %17 %73 %16
|
|
OpBranchConditional %52 %47 %48
|
|
%47 = OpLabel
|
|
OpStore %53 %9
|
|
OpBranch %54
|
|
%54 = OpLabel
|
|
%74 = OpPhi %6 %9 %47 %69 %57
|
|
OpLoopMerge %56 %57 None
|
|
OpBranch %58
|
|
%58 = OpLabel
|
|
%60 = OpSLessThan %17 %74 %16
|
|
OpBranchConditional %60 %55 %56
|
|
%55 = OpLabel
|
|
%64 = OpAccessChain %7 %31 %73
|
|
%65 = OpLoad %6 %64
|
|
%66 = OpIAdd %6 %65 %16
|
|
%67 = OpAccessChain %7 %61 %74
|
|
OpStore %67 %66
|
|
OpBranch %57
|
|
%57 = OpLabel
|
|
%69 = OpIAdd %6 %74 %41
|
|
OpStore %53 %69
|
|
OpBranch %54
|
|
%56 = OpLabel
|
|
OpBranch %49
|
|
%49 = OpLabel
|
|
%71 = OpIAdd %6 %73 %41
|
|
OpStore %45 %71
|
|
OpBranch %46
|
|
%48 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 4u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
auto loop_0 = loops[0];
|
|
auto loop_1 = loops[1];
|
|
auto loop_2 = loops[2];
|
|
auto loop_3 = loops[3];
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_1);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_2);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_2, loop_3);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_2);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
fusion.Fuse();
|
|
}
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK: [[PHI_2:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_2]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 3u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
auto loop_0 = loops[0];
|
|
auto loop_1 = loops[1];
|
|
auto loop_2 = loops[2];
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_1);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_0, loop_2);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loop_1, loop_2);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Legal, creates a loop-carried dependence, but has negative distance
|
|
for (int i = 0; i < 10; i++) {
|
|
c[i] = a[i+1] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i] = c[i] + 2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, NegativeDistanceCreatedWAR) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "c"
|
|
OpName %25 "a"
|
|
OpName %35 "i"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%27 = OpConstant %6 1
|
|
%47 = OpConstant %6 2
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%25 = OpVariable %22 Function
|
|
%35 = OpVariable %7 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%52 = OpPhi %6 %9 %5 %34 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %52 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%28 = OpIAdd %6 %52 %27
|
|
%29 = OpAccessChain %7 %25 %28
|
|
%30 = OpLoad %6 %29
|
|
%31 = OpIAdd %6 %30 %27
|
|
%32 = OpAccessChain %7 %23 %52
|
|
OpStore %32 %31
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%34 = OpIAdd %6 %52 %27
|
|
OpStore %8 %34
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %35 %9
|
|
OpBranch %36
|
|
%36 = OpLabel
|
|
%53 = OpPhi %6 %9 %12 %51 %39
|
|
OpLoopMerge %38 %39 None
|
|
OpBranch %40
|
|
%40 = OpLabel
|
|
%42 = OpSLessThan %17 %53 %16
|
|
OpBranchConditional %42 %37 %38
|
|
%37 = OpLabel
|
|
%45 = OpAccessChain %7 %23 %53
|
|
%46 = OpLoad %6 %45
|
|
%48 = OpIAdd %6 %46 %47
|
|
%49 = OpAccessChain %7 %25 %53
|
|
OpStore %49 %48
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%51 = OpIAdd %6 %53 %27
|
|
OpStore %35 %51
|
|
OpBranch %36
|
|
%38 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK: [[I_1:%\w+]] = OpIAdd {{%\w+}} [[PHI]] {{%\w+}}
|
|
CHECK-NEXT: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
|
|
{
|
|
auto& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Legal, creates a loop-carried dependence, but has negative distance
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i+1] = b[i] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i] = c[i+1] + 2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, NegativeDistanceCreatedWAW) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %27 "b"
|
|
OpName %35 "i"
|
|
OpName %44 "c"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%25 = OpConstant %6 1
|
|
%49 = OpConstant %6 2
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%27 = OpVariable %22 Function
|
|
%35 = OpVariable %7 Function
|
|
%44 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%54 = OpPhi %6 %9 %5 %34 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %54 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%26 = OpIAdd %6 %54 %25
|
|
%29 = OpAccessChain %7 %27 %54
|
|
%30 = OpLoad %6 %29
|
|
%31 = OpIAdd %6 %30 %25
|
|
%32 = OpAccessChain %7 %23 %26
|
|
OpStore %32 %31
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%34 = OpIAdd %6 %54 %25
|
|
OpStore %8 %34
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %35 %9
|
|
OpBranch %36
|
|
%36 = OpLabel
|
|
%55 = OpPhi %6 %9 %12 %53 %39
|
|
OpLoopMerge %38 %39 None
|
|
OpBranch %40
|
|
%40 = OpLabel
|
|
%42 = OpSLessThan %17 %55 %16
|
|
OpBranchConditional %42 %37 %38
|
|
%37 = OpLabel
|
|
%46 = OpIAdd %6 %55 %25
|
|
%47 = OpAccessChain %7 %44 %46
|
|
%48 = OpLoad %6 %47
|
|
%50 = OpIAdd %6 %48 %49
|
|
%51 = OpAccessChain %7 %23 %55
|
|
OpStore %51 %50
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%53 = OpIAdd %6 %55 %25
|
|
OpStore %35 %53
|
|
OpBranch %36
|
|
%38 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[I_1:%\w+]] = OpIAdd {{%\w+}} [[PHI]] {{%\w+}}
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_1]]
|
|
CHECK-NEXT: OpStore
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[I_1:%\w+]] = OpIAdd {{%\w+}} [[PHI]] {{%\w+}}
|
|
CHECK-NEXT: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int[10] c;
|
|
// Legal, no loop-carried dependence
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i] = b[i] + 1;
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
a[i] = c[i+1] + 2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, NoLoopCarriedDependencesWAW) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %23 "a"
|
|
OpName %25 "b"
|
|
OpName %34 "i"
|
|
OpName %43 "c"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypeInt 32 0
|
|
%20 = OpConstant %19 10
|
|
%21 = OpTypeArray %6 %20
|
|
%22 = OpTypePointer Function %21
|
|
%29 = OpConstant %6 1
|
|
%48 = OpConstant %6 2
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%23 = OpVariable %22 Function
|
|
%25 = OpVariable %22 Function
|
|
%34 = OpVariable %7 Function
|
|
%43 = OpVariable %22 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%53 = OpPhi %6 %9 %5 %33 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %53 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%27 = OpAccessChain %7 %25 %53
|
|
%28 = OpLoad %6 %27
|
|
%30 = OpIAdd %6 %28 %29
|
|
%31 = OpAccessChain %7 %23 %53
|
|
OpStore %31 %30
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%33 = OpIAdd %6 %53 %29
|
|
OpStore %8 %33
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %34 %9
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%54 = OpPhi %6 %9 %12 %52 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %17 %54 %16
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%45 = OpIAdd %6 %54 %29
|
|
%46 = OpAccessChain %7 %43 %45
|
|
%47 = OpLoad %6 %46
|
|
%49 = OpIAdd %6 %47 %48
|
|
%50 = OpAccessChain %7 %23 %54
|
|
OpStore %50 %49
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%52 = OpIAdd %6 %54 %29
|
|
OpStore %34 %52
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[I_1:%\w+]] = OpIAdd {{%\w+}} [[PHI]] {{%\w+}}
|
|
CHECK-NEXT: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[I_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10][10] a;
|
|
int[10][10] b;
|
|
int[10][10] c;
|
|
// Legal outer. Continue and break are fine if nested in inner loops
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
if (j % 2 == 0) {
|
|
c[i][j] = a[i][j] + 2;
|
|
} else {
|
|
continue;
|
|
}
|
|
}
|
|
}
|
|
for (int i = 0; i < 10; i++) {
|
|
for (int j = 0; j < 10; j++) {
|
|
if (j % 2 == 0) {
|
|
b[i][j] = c[i][j] + 10;
|
|
} else {
|
|
break;
|
|
}
|
|
}
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, OuterloopWithBreakContinueInInner) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %19 "j"
|
|
OpName %38 "c"
|
|
OpName %41 "a"
|
|
OpName %55 "i"
|
|
OpName %63 "j"
|
|
OpName %76 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%28 = OpConstant %6 2
|
|
%33 = OpTypeInt 32 0
|
|
%34 = OpConstant %33 10
|
|
%35 = OpTypeArray %6 %34
|
|
%36 = OpTypeArray %35 %34
|
|
%37 = OpTypePointer Function %36
|
|
%51 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%19 = OpVariable %7 Function
|
|
%38 = OpVariable %37 Function
|
|
%41 = OpVariable %37 Function
|
|
%55 = OpVariable %7 Function
|
|
%63 = OpVariable %7 Function
|
|
%76 = OpVariable %37 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%91 = OpPhi %6 %9 %5 %54 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %91 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
OpStore %19 %9
|
|
OpBranch %20
|
|
%20 = OpLabel
|
|
%96 = OpPhi %6 %9 %11 %52 %23
|
|
OpLoopMerge %22 %23 None
|
|
OpBranch %24
|
|
%24 = OpLabel
|
|
%26 = OpSLessThan %17 %96 %16
|
|
OpBranchConditional %26 %21 %22
|
|
%21 = OpLabel
|
|
%29 = OpSMod %6 %96 %28
|
|
%30 = OpIEqual %17 %29 %9
|
|
OpSelectionMerge %32 None
|
|
OpBranchConditional %30 %31 %48
|
|
%31 = OpLabel
|
|
%44 = OpAccessChain %7 %41 %91 %96
|
|
%45 = OpLoad %6 %44
|
|
%46 = OpIAdd %6 %45 %28
|
|
%47 = OpAccessChain %7 %38 %91 %96
|
|
OpStore %47 %46
|
|
OpBranch %32
|
|
%48 = OpLabel
|
|
OpBranch %23
|
|
%32 = OpLabel
|
|
OpBranch %23
|
|
%23 = OpLabel
|
|
%52 = OpIAdd %6 %96 %51
|
|
OpStore %19 %52
|
|
OpBranch %20
|
|
%22 = OpLabel
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%54 = OpIAdd %6 %91 %51
|
|
OpStore %8 %54
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %55 %9
|
|
OpBranch %56
|
|
%56 = OpLabel
|
|
%92 = OpPhi %6 %9 %12 %90 %59
|
|
OpLoopMerge %58 %59 None
|
|
OpBranch %60
|
|
%60 = OpLabel
|
|
%62 = OpSLessThan %17 %92 %16
|
|
OpBranchConditional %62 %57 %58
|
|
%57 = OpLabel
|
|
OpStore %63 %9
|
|
OpBranch %64
|
|
%64 = OpLabel
|
|
%93 = OpPhi %6 %9 %57 %88 %67
|
|
OpLoopMerge %66 %67 None
|
|
OpBranch %68
|
|
%68 = OpLabel
|
|
%70 = OpSLessThan %17 %93 %16
|
|
OpBranchConditional %70 %65 %66
|
|
%65 = OpLabel
|
|
%72 = OpSMod %6 %93 %28
|
|
%73 = OpIEqual %17 %72 %9
|
|
OpSelectionMerge %75 None
|
|
OpBranchConditional %73 %74 %85
|
|
%74 = OpLabel
|
|
%81 = OpAccessChain %7 %38 %92 %93
|
|
%82 = OpLoad %6 %81
|
|
%83 = OpIAdd %6 %82 %16
|
|
%84 = OpAccessChain %7 %76 %92 %93
|
|
OpStore %84 %83
|
|
OpBranch %75
|
|
%85 = OpLabel
|
|
OpBranch %66
|
|
%75 = OpLabel
|
|
OpBranch %67
|
|
%67 = OpLabel
|
|
%88 = OpIAdd %6 %93 %51
|
|
OpStore %63 %88
|
|
OpBranch %64
|
|
%66 = OpLabel
|
|
OpBranch %59
|
|
%59 = OpLabel
|
|
%90 = OpIAdd %6 %92 %51
|
|
OpStore %55 %90
|
|
OpBranch %56
|
|
%58 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 4u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[2]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 3u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[1], loops[2]);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK: [[PHI_2:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_2]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]] [[PHI_2]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
// j loop preheader removed manually
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int i = 0;
|
|
int j = 0;
|
|
// No loop-carried dependences, legal
|
|
for (; i < 10; i++) {
|
|
a[i] = a[i]*2;
|
|
}
|
|
for (; j < 10; j++) {
|
|
b[j] = a[j]+2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, DifferentArraysInLoopsNoPreheader) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %10 "j"
|
|
OpName %24 "a"
|
|
OpName %42 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%17 = OpConstant %6 10
|
|
%18 = OpTypeBool
|
|
%20 = OpTypeInt 32 0
|
|
%21 = OpConstant %20 10
|
|
%22 = OpTypeArray %6 %21
|
|
%23 = OpTypePointer Function %22
|
|
%29 = OpConstant %6 2
|
|
%33 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%10 = OpVariable %7 Function
|
|
%24 = OpVariable %23 Function
|
|
%42 = OpVariable %23 Function
|
|
OpStore %8 %9
|
|
OpStore %10 %9
|
|
OpBranch %11
|
|
%11 = OpLabel
|
|
%51 = OpPhi %6 %9 %5 %34 %14
|
|
OpLoopMerge %35 %14 None
|
|
OpBranch %15
|
|
%15 = OpLabel
|
|
%19 = OpSLessThan %18 %51 %17
|
|
OpBranchConditional %19 %12 %35
|
|
%12 = OpLabel
|
|
%27 = OpAccessChain %7 %24 %51
|
|
%28 = OpLoad %6 %27
|
|
%30 = OpIMul %6 %28 %29
|
|
%31 = OpAccessChain %7 %24 %51
|
|
OpStore %31 %30
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%34 = OpIAdd %6 %51 %33
|
|
OpStore %8 %34
|
|
OpBranch %11
|
|
%35 = OpLabel
|
|
%52 = OpPhi %6 %9 %15 %50 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %18 %52 %17
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%45 = OpAccessChain %7 %24 %52
|
|
%46 = OpLoad %6 %45
|
|
%47 = OpIAdd %6 %46 %29
|
|
%48 = OpAccessChain %7 %42 %52
|
|
OpStore %48 %47
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%50 = OpIAdd %6 %52 %33
|
|
OpStore %10 %50
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
ld.CreatePreHeaderBlocksIfMissing();
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
// j & k loop preheaders removed manually
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
int i = 0;
|
|
int j = 0;
|
|
int k = 0;
|
|
// No loop-carried dependences, legal
|
|
for (; i < 10; i++) {
|
|
a[i] = a[i]*2;
|
|
}
|
|
for (; j < 10; j++) {
|
|
b[j] = a[j]+2;
|
|
}
|
|
for (; k < 10; k++) {
|
|
a[k] = a[k]*2;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, AdjacentLoopsNoPreheaders) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %10 "j"
|
|
OpName %11 "k"
|
|
OpName %25 "a"
|
|
OpName %43 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%18 = OpConstant %6 10
|
|
%19 = OpTypeBool
|
|
%21 = OpTypeInt 32 0
|
|
%22 = OpConstant %21 10
|
|
%23 = OpTypeArray %6 %22
|
|
%24 = OpTypePointer Function %23
|
|
%30 = OpConstant %6 2
|
|
%34 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%10 = OpVariable %7 Function
|
|
%11 = OpVariable %7 Function
|
|
%25 = OpVariable %24 Function
|
|
%43 = OpVariable %24 Function
|
|
OpStore %8 %9
|
|
OpStore %10 %9
|
|
OpStore %11 %9
|
|
OpBranch %12
|
|
%12 = OpLabel
|
|
%67 = OpPhi %6 %9 %5 %35 %15
|
|
OpLoopMerge %36 %15 None
|
|
OpBranch %16
|
|
%16 = OpLabel
|
|
%20 = OpSLessThan %19 %67 %18
|
|
OpBranchConditional %20 %13 %36
|
|
%13 = OpLabel
|
|
%28 = OpAccessChain %7 %25 %67
|
|
%29 = OpLoad %6 %28
|
|
%31 = OpIMul %6 %29 %30
|
|
%32 = OpAccessChain %7 %25 %67
|
|
OpStore %32 %31
|
|
OpBranch %15
|
|
%15 = OpLabel
|
|
%35 = OpIAdd %6 %67 %34
|
|
OpStore %8 %35
|
|
OpBranch %12
|
|
%36 = OpLabel
|
|
%68 = OpPhi %6 %9 %16 %51 %39
|
|
OpLoopMerge %52 %39 None
|
|
OpBranch %40
|
|
%40 = OpLabel
|
|
%42 = OpSLessThan %19 %68 %18
|
|
OpBranchConditional %42 %37 %52
|
|
%37 = OpLabel
|
|
%46 = OpAccessChain %7 %25 %68
|
|
%47 = OpLoad %6 %46
|
|
%48 = OpIAdd %6 %47 %30
|
|
%49 = OpAccessChain %7 %43 %68
|
|
OpStore %49 %48
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%51 = OpIAdd %6 %68 %34
|
|
OpStore %10 %51
|
|
OpBranch %36
|
|
%52 = OpLabel
|
|
%70 = OpPhi %6 %9 %40 %66 %55
|
|
OpLoopMerge %54 %55 None
|
|
OpBranch %56
|
|
%56 = OpLabel
|
|
%58 = OpSLessThan %19 %70 %18
|
|
OpBranchConditional %58 %53 %54
|
|
%53 = OpLabel
|
|
%61 = OpAccessChain %7 %25 %70
|
|
%62 = OpLoad %6 %61
|
|
%63 = OpIMul %6 %62 %30
|
|
%64 = OpAccessChain %7 %25 %70
|
|
OpStore %64 %63
|
|
OpBranch %55
|
|
%55 = OpLabel
|
|
%66 = OpIAdd %6 %70 %34
|
|
OpStore %11 %66
|
|
OpBranch %52
|
|
%54 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 3u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_FALSE(fusion.AreCompatible());
|
|
}
|
|
|
|
ld.CreatePreHeaderBlocksIfMissing();
|
|
|
|
{
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_0]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
CHECK: [[PHI_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_2:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_1]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_2]]
|
|
CHECK: [[STORE_2:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI_1]]
|
|
CHECK-NEXT: OpStore [[STORE_2]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK: [[STORE_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_2:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpLoad {{%\w+}} [[LOAD_2]]
|
|
CHECK: [[STORE_2:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_2]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
|
|
int sum_0 = 0;
|
|
int sum_1 = 0;
|
|
|
|
// No loop-carried dependences, legal
|
|
for (int i = 0; i < 10; i++) {
|
|
sum_0 += a[i];
|
|
}
|
|
for (int j = 0; j < 10; j++) {
|
|
sum_1 += b[j];
|
|
}
|
|
|
|
int total = sum_0 + sum_1;
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, IndependentReductions) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "sum_0"
|
|
OpName %10 "sum_1"
|
|
OpName %11 "i"
|
|
OpName %25 "a"
|
|
OpName %34 "j"
|
|
OpName %42 "b"
|
|
OpName %50 "total"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%18 = OpConstant %6 10
|
|
%19 = OpTypeBool
|
|
%21 = OpTypeInt 32 0
|
|
%22 = OpConstant %21 10
|
|
%23 = OpTypeArray %6 %22
|
|
%24 = OpTypePointer Function %23
|
|
%32 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%10 = OpVariable %7 Function
|
|
%11 = OpVariable %7 Function
|
|
%25 = OpVariable %24 Function
|
|
%34 = OpVariable %7 Function
|
|
%42 = OpVariable %24 Function
|
|
%50 = OpVariable %7 Function
|
|
OpStore %8 %9
|
|
OpStore %10 %9
|
|
OpStore %11 %9
|
|
OpBranch %12
|
|
%12 = OpLabel
|
|
%57 = OpPhi %6 %9 %5 %30 %15
|
|
%54 = OpPhi %6 %9 %5 %33 %15
|
|
OpLoopMerge %14 %15 None
|
|
OpBranch %16
|
|
%16 = OpLabel
|
|
%20 = OpSLessThan %19 %54 %18
|
|
OpBranchConditional %20 %13 %14
|
|
%13 = OpLabel
|
|
%27 = OpAccessChain %7 %25 %54
|
|
%28 = OpLoad %6 %27
|
|
%30 = OpIAdd %6 %57 %28
|
|
OpStore %8 %30
|
|
OpBranch %15
|
|
%15 = OpLabel
|
|
%33 = OpIAdd %6 %54 %32
|
|
OpStore %11 %33
|
|
OpBranch %12
|
|
%14 = OpLabel
|
|
OpStore %34 %9
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%58 = OpPhi %6 %9 %14 %47 %38
|
|
%55 = OpPhi %6 %9 %14 %49 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %19 %55 %18
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%44 = OpAccessChain %7 %42 %55
|
|
%45 = OpLoad %6 %44
|
|
%47 = OpIAdd %6 %58 %45
|
|
OpStore %10 %47
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%49 = OpIAdd %6 %55 %32
|
|
OpStore %34 %49
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
%53 = OpIAdd %6 %57 %58
|
|
OpStore %50 %53
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[SUM_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: [[SUM_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: [[LOAD_RES_0:%\w+]] = OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK-NEXT: [[ADD_RES_0:%\w+]] = OpIAdd {{%\w+}} [[SUM_0]] [[LOAD_RES_0]]
|
|
CHECK-NEXT: OpStore {{%\w+}} [[ADD_RES_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: [[LOAD_RES_1:%\w+]] = OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK-NEXT: [[ADD_RES_1:%\w+]] = OpIAdd {{%\w+}} [[SUM_1]] [[LOAD_RES_1]]
|
|
CHECK-NEXT: OpStore {{%\w+}} [[ADD_RES_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
|
|
int sum_0 = 0;
|
|
int sum_1 = 0;
|
|
|
|
// No loop-carried dependences, legal
|
|
for (int i = 0; i < 10; i++) {
|
|
sum_0 += a[i];
|
|
}
|
|
for (int j = 0; j < 10; j++) {
|
|
sum_1 += b[j];
|
|
}
|
|
|
|
int total = sum_0 + sum_1;
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, IndependentReductionsOneLCSSA) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "sum_0"
|
|
OpName %10 "sum_1"
|
|
OpName %11 "i"
|
|
OpName %25 "a"
|
|
OpName %34 "j"
|
|
OpName %42 "b"
|
|
OpName %50 "total"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%18 = OpConstant %6 10
|
|
%19 = OpTypeBool
|
|
%21 = OpTypeInt 32 0
|
|
%22 = OpConstant %21 10
|
|
%23 = OpTypeArray %6 %22
|
|
%24 = OpTypePointer Function %23
|
|
%32 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%10 = OpVariable %7 Function
|
|
%11 = OpVariable %7 Function
|
|
%25 = OpVariable %24 Function
|
|
%34 = OpVariable %7 Function
|
|
%42 = OpVariable %24 Function
|
|
%50 = OpVariable %7 Function
|
|
OpStore %8 %9
|
|
OpStore %10 %9
|
|
OpStore %11 %9
|
|
OpBranch %12
|
|
%12 = OpLabel
|
|
%57 = OpPhi %6 %9 %5 %30 %15
|
|
%54 = OpPhi %6 %9 %5 %33 %15
|
|
OpLoopMerge %14 %15 None
|
|
OpBranch %16
|
|
%16 = OpLabel
|
|
%20 = OpSLessThan %19 %54 %18
|
|
OpBranchConditional %20 %13 %14
|
|
%13 = OpLabel
|
|
%27 = OpAccessChain %7 %25 %54
|
|
%28 = OpLoad %6 %27
|
|
%30 = OpIAdd %6 %57 %28
|
|
OpStore %8 %30
|
|
OpBranch %15
|
|
%15 = OpLabel
|
|
%33 = OpIAdd %6 %54 %32
|
|
OpStore %11 %33
|
|
OpBranch %12
|
|
%14 = OpLabel
|
|
OpStore %34 %9
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%58 = OpPhi %6 %9 %14 %47 %38
|
|
%55 = OpPhi %6 %9 %14 %49 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %19 %55 %18
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%44 = OpAccessChain %7 %42 %55
|
|
%45 = OpLoad %6 %44
|
|
%47 = OpIAdd %6 %58 %45
|
|
OpStore %10 %47
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%49 = OpIAdd %6 %55 %32
|
|
OpStore %34 %49
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
%53 = OpIAdd %6 %57 %58
|
|
OpStore %50 %53
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopUtils utils_0(context.get(), loops[0]);
|
|
utils_0.MakeLoopClosedSSA();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[SUM_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: [[SUM_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: [[LOAD_RES_0:%\w+]] = OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK-NEXT: [[ADD_RES_0:%\w+]] = OpIAdd {{%\w+}} [[SUM_0]] [[LOAD_RES_0]]
|
|
CHECK-NEXT: OpStore {{%\w+}} [[ADD_RES_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: [[LOAD_RES_1:%\w+]] = OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK-NEXT: [[ADD_RES_1:%\w+]] = OpIAdd {{%\w+}} [[SUM_1]] [[LOAD_RES_1]]
|
|
CHECK-NEXT: OpStore {{%\w+}} [[ADD_RES_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
|
|
int sum_0 = 0;
|
|
int sum_1 = 0;
|
|
|
|
// No loop-carried dependences, legal
|
|
for (int i = 0; i < 10; i++) {
|
|
sum_0 += a[i];
|
|
}
|
|
for (int j = 0; j < 10; j++) {
|
|
sum_1 += b[j];
|
|
}
|
|
|
|
int total = sum_0 + sum_1;
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, IndependentReductionsBothLCSSA) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "sum_0"
|
|
OpName %10 "sum_1"
|
|
OpName %11 "i"
|
|
OpName %25 "a"
|
|
OpName %34 "j"
|
|
OpName %42 "b"
|
|
OpName %50 "total"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%18 = OpConstant %6 10
|
|
%19 = OpTypeBool
|
|
%21 = OpTypeInt 32 0
|
|
%22 = OpConstant %21 10
|
|
%23 = OpTypeArray %6 %22
|
|
%24 = OpTypePointer Function %23
|
|
%32 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%10 = OpVariable %7 Function
|
|
%11 = OpVariable %7 Function
|
|
%25 = OpVariable %24 Function
|
|
%34 = OpVariable %7 Function
|
|
%42 = OpVariable %24 Function
|
|
%50 = OpVariable %7 Function
|
|
OpStore %8 %9
|
|
OpStore %10 %9
|
|
OpStore %11 %9
|
|
OpBranch %12
|
|
%12 = OpLabel
|
|
%57 = OpPhi %6 %9 %5 %30 %15
|
|
%54 = OpPhi %6 %9 %5 %33 %15
|
|
OpLoopMerge %14 %15 None
|
|
OpBranch %16
|
|
%16 = OpLabel
|
|
%20 = OpSLessThan %19 %54 %18
|
|
OpBranchConditional %20 %13 %14
|
|
%13 = OpLabel
|
|
%27 = OpAccessChain %7 %25 %54
|
|
%28 = OpLoad %6 %27
|
|
%30 = OpIAdd %6 %57 %28
|
|
OpStore %8 %30
|
|
OpBranch %15
|
|
%15 = OpLabel
|
|
%33 = OpIAdd %6 %54 %32
|
|
OpStore %11 %33
|
|
OpBranch %12
|
|
%14 = OpLabel
|
|
OpStore %34 %9
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%58 = OpPhi %6 %9 %14 %47 %38
|
|
%55 = OpPhi %6 %9 %14 %49 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %19 %55 %18
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%44 = OpAccessChain %7 %42 %55
|
|
%45 = OpLoad %6 %44
|
|
%47 = OpIAdd %6 %58 %45
|
|
OpStore %10 %47
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%49 = OpIAdd %6 %55 %32
|
|
OpStore %34 %49
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
%53 = OpIAdd %6 %57 %58
|
|
OpStore %50 %53
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopUtils utils_0(context.get(), loops[0]);
|
|
utils_0.MakeLoopClosedSSA();
|
|
opt::LoopUtils utils_1(context.get(), loops[1]);
|
|
utils_1.MakeLoopClosedSSA();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: [[SUM_0:%\w+]] = OpPhi
|
|
CHECK-NEXT: [[SUM_1:%\w+]] = OpPhi
|
|
CHECK-NEXT: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: [[LOAD_RES_0:%\w+]] = OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK-NEXT: [[ADD_RES_0:%\w+]] = OpIAdd {{%\w+}} [[SUM_0]] [[LOAD_RES_0]]
|
|
CHECK-NEXT: OpStore {{%\w+}} [[ADD_RES_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: [[LOAD_RES_1:%\w+]] = OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK-NEXT: [[ADD_RES_1:%\w+]] = OpIAdd {{%\w+}} [[SUM_1]] [[LOAD_RES_1]]
|
|
CHECK-NEXT: OpStore {{%\w+}} [[ADD_RES_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
|
|
int sum_0 = 0;
|
|
|
|
// No loop-carried dependences, legal
|
|
for (int i = 0; i < 10; i++) {
|
|
sum_0 += a[i];
|
|
}
|
|
for (int j = 0; j < 10; j++) {
|
|
a[j] = b[j];
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, LoadStoreReductionAndNonLoopCarriedDependence) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "sum_0"
|
|
OpName %10 "i"
|
|
OpName %24 "a"
|
|
OpName %33 "j"
|
|
OpName %42 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%17 = OpConstant %6 10
|
|
%18 = OpTypeBool
|
|
%20 = OpTypeInt 32 0
|
|
%21 = OpConstant %20 10
|
|
%22 = OpTypeArray %6 %21
|
|
%23 = OpTypePointer Function %22
|
|
%31 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%10 = OpVariable %7 Function
|
|
%24 = OpVariable %23 Function
|
|
%33 = OpVariable %7 Function
|
|
%42 = OpVariable %23 Function
|
|
OpStore %8 %9
|
|
OpStore %10 %9
|
|
OpBranch %11
|
|
%11 = OpLabel
|
|
%51 = OpPhi %6 %9 %5 %29 %14
|
|
%49 = OpPhi %6 %9 %5 %32 %14
|
|
OpLoopMerge %13 %14 None
|
|
OpBranch %15
|
|
%15 = OpLabel
|
|
%19 = OpSLessThan %18 %49 %17
|
|
OpBranchConditional %19 %12 %13
|
|
%12 = OpLabel
|
|
%26 = OpAccessChain %7 %24 %49
|
|
%27 = OpLoad %6 %26
|
|
%29 = OpIAdd %6 %51 %27
|
|
OpStore %8 %29
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%32 = OpIAdd %6 %49 %31
|
|
OpStore %10 %32
|
|
OpBranch %11
|
|
%13 = OpLabel
|
|
OpStore %33 %9
|
|
OpBranch %34
|
|
%34 = OpLabel
|
|
%50 = OpPhi %6 %9 %13 %48 %37
|
|
OpLoopMerge %36 %37 None
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%40 = OpSLessThan %18 %50 %17
|
|
OpBranchConditional %40 %35 %36
|
|
%35 = OpLabel
|
|
%44 = OpAccessChain %7 %42 %50
|
|
%45 = OpLoad %6 %44
|
|
%46 = OpAccessChain %7 %24 %50
|
|
OpStore %46 %45
|
|
OpBranch %37
|
|
%37 = OpLabel
|
|
%48 = OpIAdd %6 %50 %31
|
|
OpStore %33 %48
|
|
OpBranch %34
|
|
%36 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
// TODO: Loop descriptor doesn't return induction variables but all OpPhi
|
|
// in the header and LoopDependenceAnalysis falls over.
|
|
// EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
// fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
// ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
// EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
// std::string checks = R"(
|
|
// CHECK: [[SUM_0:%\w+]] = OpPhi
|
|
// CHECK-NEXT: [[PHI:%\w+]] = OpPhi
|
|
// CHECK-NEXT: OpLoopMerge
|
|
// CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
// CHECK-NEXT: [[LOAD_RES_0:%\w+]] = OpLoad {{%\w+}} [[LOAD_0]]
|
|
// CHECK-NEXT: [[ADD_RES_0:%\w+]] = OpIAdd {{%\w+}} [[SUM_0]] [[LOAD_RES_0]]
|
|
// CHECK-NEXT: OpStore {{%\w+}} [[ADD_RES_0]]
|
|
// CHECK-NOT: OpPhi
|
|
// CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
// CHECK-NEXT: [[LOAD_RES_1:%\w+]] = OpLoad {{%\w+}} [[LOAD_1]]
|
|
// CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
// CHECK-NEXT: OpStore [[STORE_1]] [[LOAD_RES_1]]
|
|
// )";
|
|
|
|
// Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
int x;
|
|
void main() {
|
|
int[10] a;
|
|
int[10] b;
|
|
|
|
// Legal.
|
|
for (int i = 0; i < 10; i++) {
|
|
x += a[i];
|
|
}
|
|
for (int j = 0; j < 10; j++) {
|
|
b[j] = b[j]+1;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, ReductionAndNonLoopCarriedDependence) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %8 "i"
|
|
OpName %20 "x"
|
|
OpName %25 "a"
|
|
OpName %34 "j"
|
|
OpName %42 "b"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypePointer Function %6
|
|
%9 = OpConstant %6 0
|
|
%16 = OpConstant %6 10
|
|
%17 = OpTypeBool
|
|
%19 = OpTypePointer Private %6
|
|
%20 = OpVariable %19 Private
|
|
%21 = OpTypeInt 32 0
|
|
%22 = OpConstant %21 10
|
|
%23 = OpTypeArray %6 %22
|
|
%24 = OpTypePointer Function %23
|
|
%32 = OpConstant %6 1
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%8 = OpVariable %7 Function
|
|
%25 = OpVariable %24 Function
|
|
%34 = OpVariable %7 Function
|
|
%42 = OpVariable %24 Function
|
|
OpStore %8 %9
|
|
OpBranch %10
|
|
%10 = OpLabel
|
|
%51 = OpPhi %6 %9 %5 %33 %13
|
|
OpLoopMerge %12 %13 None
|
|
OpBranch %14
|
|
%14 = OpLabel
|
|
%18 = OpSLessThan %17 %51 %16
|
|
OpBranchConditional %18 %11 %12
|
|
%11 = OpLabel
|
|
%27 = OpAccessChain %7 %25 %51
|
|
%28 = OpLoad %6 %27
|
|
%29 = OpLoad %6 %20
|
|
%30 = OpIAdd %6 %29 %28
|
|
OpStore %20 %30
|
|
OpBranch %13
|
|
%13 = OpLabel
|
|
%33 = OpIAdd %6 %51 %32
|
|
OpStore %8 %33
|
|
OpBranch %10
|
|
%12 = OpLabel
|
|
OpStore %34 %9
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%52 = OpPhi %6 %9 %12 %50 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %17 %52 %16
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%45 = OpAccessChain %7 %42 %52
|
|
%46 = OpLoad %6 %45
|
|
%47 = OpIAdd %6 %46 %32
|
|
%48 = OpAccessChain %7 %42 %52
|
|
OpStore %48 %47
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%50 = OpIAdd %6 %52 %32
|
|
OpStore %34 %50
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
std::string checks = R"(
|
|
CHECK: OpName [[X:%\w+]] "x"
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[LOAD_0:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: [[LOAD_RES_0:%\w+]] = OpLoad {{%\w+}} [[LOAD_0]]
|
|
CHECK-NEXT: [[X_LOAD:%\w+]] = OpLoad {{%\w+}} [[X]]
|
|
CHECK-NEXT: [[ADD_RES_0:%\w+]] = OpIAdd {{%\w+}} [[X_LOAD]] [[LOAD_RES_0]]
|
|
CHECK-NEXT: OpStore [[X]] [[ADD_RES_0]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[LOAD_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: {{%\w+}} = OpLoad {{%\w+}} [[LOAD_1]]
|
|
CHECK: [[STORE_1:%\w+]] = OpAccessChain {{%\w+}} {{%\w+}} [[PHI]]
|
|
CHECK-NEXT: OpStore [[STORE_1]]
|
|
)";
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
/*
|
|
Generated from the following GLSL + --eliminate-local-multi-store
|
|
|
|
#version 440 core
|
|
struct TestStruct {
|
|
int[10] a;
|
|
int b;
|
|
};
|
|
|
|
void main() {
|
|
TestStruct test_0;
|
|
TestStruct test_1;
|
|
TestStruct test_2;
|
|
|
|
test_1.b = 2;
|
|
|
|
for (int i = 0; i < 10; i++) {
|
|
test_0.a[i] = i;
|
|
}
|
|
for (int j = 0; j < 10; j++) {
|
|
test_2 = test_1;
|
|
}
|
|
}
|
|
|
|
*/
|
|
TEST_F(FusionLegalTest, ArrayInStruct) {
|
|
std::string text = R"(
|
|
OpCapability Shader
|
|
%1 = OpExtInstImport "GLSL.std.450"
|
|
OpMemoryModel Logical GLSL450
|
|
OpEntryPoint Fragment %4 "main"
|
|
OpExecutionMode %4 OriginUpperLeft
|
|
OpSource GLSL 440
|
|
OpName %4 "main"
|
|
OpName %10 "TestStruct"
|
|
OpMemberName %10 0 "a"
|
|
OpMemberName %10 1 "b"
|
|
OpName %12 "test_1"
|
|
OpName %17 "i"
|
|
OpName %28 "test_0"
|
|
OpName %34 "j"
|
|
OpName %42 "test_2"
|
|
%2 = OpTypeVoid
|
|
%3 = OpTypeFunction %2
|
|
%6 = OpTypeInt 32 1
|
|
%7 = OpTypeInt 32 0
|
|
%8 = OpConstant %7 10
|
|
%9 = OpTypeArray %6 %8
|
|
%10 = OpTypeStruct %9 %6
|
|
%11 = OpTypePointer Function %10
|
|
%13 = OpConstant %6 1
|
|
%14 = OpConstant %6 2
|
|
%15 = OpTypePointer Function %6
|
|
%18 = OpConstant %6 0
|
|
%25 = OpConstant %6 10
|
|
%26 = OpTypeBool
|
|
%4 = OpFunction %2 None %3
|
|
%5 = OpLabel
|
|
%12 = OpVariable %11 Function
|
|
%17 = OpVariable %15 Function
|
|
%28 = OpVariable %11 Function
|
|
%34 = OpVariable %15 Function
|
|
%42 = OpVariable %11 Function
|
|
%16 = OpAccessChain %15 %12 %13
|
|
OpStore %16 %14
|
|
OpStore %17 %18
|
|
OpBranch %19
|
|
%19 = OpLabel
|
|
%46 = OpPhi %6 %18 %5 %33 %22
|
|
OpLoopMerge %21 %22 None
|
|
OpBranch %23
|
|
%23 = OpLabel
|
|
%27 = OpSLessThan %26 %46 %25
|
|
OpBranchConditional %27 %20 %21
|
|
%20 = OpLabel
|
|
%31 = OpAccessChain %15 %28 %18 %46
|
|
OpStore %31 %46
|
|
OpBranch %22
|
|
%22 = OpLabel
|
|
%33 = OpIAdd %6 %46 %13
|
|
OpStore %17 %33
|
|
OpBranch %19
|
|
%21 = OpLabel
|
|
OpStore %34 %18
|
|
OpBranch %35
|
|
%35 = OpLabel
|
|
%47 = OpPhi %6 %18 %21 %45 %38
|
|
OpLoopMerge %37 %38 None
|
|
OpBranch %39
|
|
%39 = OpLabel
|
|
%41 = OpSLessThan %26 %47 %25
|
|
OpBranchConditional %41 %36 %37
|
|
%36 = OpLabel
|
|
%43 = OpLoad %10 %12
|
|
OpStore %42 %43
|
|
OpBranch %38
|
|
%38 = OpLabel
|
|
%45 = OpIAdd %6 %47 %13
|
|
OpStore %34 %45
|
|
OpBranch %35
|
|
%37 = OpLabel
|
|
OpReturn
|
|
OpFunctionEnd
|
|
)";
|
|
|
|
std::unique_ptr<ir::IRContext> context =
|
|
BuildModule(SPV_ENV_UNIVERSAL_1_1, nullptr, text,
|
|
SPV_TEXT_TO_BINARY_OPTION_PRESERVE_NUMERIC_IDS);
|
|
ir::Module* module = context->module();
|
|
EXPECT_NE(nullptr, module) << "Assembling failed for shader:\n"
|
|
<< text << std::endl;
|
|
ir::Function& f = *module->begin();
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 2u);
|
|
|
|
auto loops = ld.GetLoopsInBinaryLayoutOrder();
|
|
|
|
opt::LoopFusion fusion(context.get(), loops[0], loops[1]);
|
|
EXPECT_TRUE(fusion.AreCompatible());
|
|
EXPECT_TRUE(fusion.IsLegal());
|
|
|
|
fusion.Fuse();
|
|
}
|
|
|
|
{
|
|
ir::LoopDescriptor& ld = *context->GetLoopDescriptor(&f);
|
|
EXPECT_EQ(ld.NumLoops(), 1u);
|
|
|
|
// clang-format off
|
|
std::string checks = R"(
|
|
CHECK: OpName [[TEST_1:%\w+]] "test_1"
|
|
CHECK: OpName [[TEST_0:%\w+]] "test_0"
|
|
CHECK: OpName [[TEST_2:%\w+]] "test_2"
|
|
CHECK: [[PHI:%\w+]] = OpPhi
|
|
CHECK-NEXT: OpLoopMerge
|
|
CHECK: [[TEST_0_STORE:%\w+]] = OpAccessChain {{%\w+}} [[TEST_0]] {{%\w+}} {{%\w+}}
|
|
CHECK-NEXT: OpStore [[TEST_0_STORE]] [[PHI]]
|
|
CHECK-NOT: OpPhi
|
|
CHECK: [[TEST_1_LOAD:%\w+]] = OpLoad {{%\w+}} [[TEST_1]]
|
|
CHECK: OpStore [[TEST_2]] [[TEST_1_LOAD]]
|
|
)";
|
|
// clang-format on
|
|
|
|
Match(checks, context.get());
|
|
}
|
|
}
|
|
|
|
} // namespace
|