Merge pull request #164 from EthicalML/160_op_memory

Amend memory hierarchy to enable for push constants and functional interface for more flexible operations
2021-02-28 17:52:58 +00:00 · 2021-02-28 17:52:58 +00:00 · 672cf22bc1
commit 672cf22bc1
parent 2834519307 4fddf74ca7
61 changed files with 3128 additions and 4852 deletions
--- a/test/TestAsyncOperations.cpp
+++ b/test/TestAsyncOperations.cpp
@ -37,25 +37,32 @@ TEST(TestAsyncOperations, TestManagerParallelExecution)
        }
    )");

+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);
+
    std::vector<float> data(size, 0.0);
    std::vector<float> resultSync(size, 100000000);
    std::vector<float> resultAsync(size, 100000000);

    kp::Manager mgr;

+    std::shared_ptr<kp::Sequence> sq = mgr.sequence();
+
    std::vector<std::shared_ptr<kp::Tensor>> inputsSyncB;
+    std::vector<std::shared_ptr<kp::Algorithm>> algorithms;

    for (uint32_t i = 0; i < numParallel; i++) {
-        inputsSyncB.push_back(std::make_shared<kp::Tensor>(kp::Tensor(data)));
+        inputsSyncB.push_back(mgr.tensor(data));
+        algorithms.push_back(mgr.algorithm({ inputsSyncB[i] }, spirv));
    }

-    mgr.rebuild(inputsSyncB);
+    sq->eval<kp::OpTensorSyncDevice>(inputsSyncB);
+
+    mgr.sequence()->eval<kp::OpTensorSyncDevice>(inputsSyncB);

    auto startSync = std::chrono::high_resolution_clock::now();

    for (uint32_t i = 0; i < numParallel; i++) {
-        mgr.evalOpDefault<kp::OpAlgoBase>(
-          { inputsSyncB[i] }, kp::Shader::compile_source(shader));
+        sq->eval<kp::OpAlgoDispatch>(algorithms[i]);
    }

    auto endSync = std::chrono::high_resolution_clock::now();
@ -63,7 +70,7 @@ TEST(TestAsyncOperations, TestManagerParallelExecution)
      std::chrono::duration_cast<std::chrono::microseconds>(endSync - startSync)
        .count();

-    mgr.evalOpDefault<kp::OpTensorSyncLocal>(inputsSyncB);
+    sq->eval<kp::OpTensorSyncLocal>(inputsSyncB);

    for (uint32_t i = 0; i < numParallel; i++) {
        EXPECT_EQ(inputsSyncB[i]->data(), resultSync);
@ -73,27 +80,27 @@ TEST(TestAsyncOperations, TestManagerParallelExecution)

    std::vector<std::shared_ptr<kp::Tensor>> inputsAsyncB;

+    std::vector<std::shared_ptr<kp::Algorithm>> algosAsync;
+
    for (uint32_t i = 0; i < numParallel; i++) {
-        inputsAsyncB.push_back(std::make_shared<kp::Tensor>(kp::Tensor(data)));
+        inputsAsyncB.push_back(mgr.tensor(data));
+        algosAsync.push_back(mgr.algorithm({ inputsAsyncB[i] }, spirv));
    }

-    mgrAsync.rebuild(inputsAsyncB);
+    std::vector<std::shared_ptr<kp::Sequence>> sqs;

    for (uint32_t i = 0; i < numParallel; i++) {
-        mgrAsync.sequence("async" + std::to_string(i), i);
+        sqs.push_back(mgrAsync.sequence(i));
    }

    auto startAsync = std::chrono::high_resolution_clock::now();

    for (uint32_t i = 0; i < numParallel; i++) {
-        mgrAsync.evalOpAsync<kp::OpAlgoBase>(
-          { inputsAsyncB[i] },
-          "async" + std::to_string(i),
-          kp::Shader::compile_source(shader));
+        sqs[i]->evalAsync<kp::OpAlgoDispatch>(algosAsync[i]);
    }

    for (uint32_t i = 0; i < numParallel; i++) {
-        mgrAsync.evalOpAwait("async" + std::to_string(i));
+        sqs[i]->evalAwait();
    }

    auto endAsync = std::chrono::high_resolution_clock::now();
@ -101,7 +108,7 @@ TEST(TestAsyncOperations, TestManagerParallelExecution)
                           endAsync - startAsync)
                           .count();

-    mgrAsync.evalOpDefault<kp::OpTensorSyncLocal>({ inputsAsyncB });
+    sq->eval<kp::OpTensorSyncLocal>({ inputsAsyncB });

    for (uint32_t i = 0; i < numParallel; i++) {
        EXPECT_EQ(inputsAsyncB[i]->data(), resultAsync);
@ -138,32 +145,32 @@ TEST(TestAsyncOperations, TestManagerAsyncExecution)
        }
    )");

+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);
+
    std::vector<float> data(size, 0.0);
    std::vector<float> resultAsync(size, 100000000);

    kp::Manager mgr;

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(data) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(data) };
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor(data);
+    std::shared_ptr<kp::Tensor> tensorB = mgr.tensor(data);

-    mgr.sequence("asyncOne");
-    mgr.sequence("asyncTwo");
+    std::shared_ptr<kp::Sequence> sq1 = mgr.sequence();
+    std::shared_ptr<kp::Sequence> sq2 = mgr.sequence();

-    mgr.rebuild({ tensorA, tensorB });
+    sq1->eval<kp::OpTensorSyncLocal>({ tensorA, tensorB });

-    std::vector<uint32_t> result = kp::Shader::compile_source(shader);
+    std::shared_ptr<kp::Algorithm> algo1 = mgr.algorithm({ tensorA }, spirv);
+    std::shared_ptr<kp::Algorithm> algo2 = mgr.algorithm({ tensorB }, spirv);

-    mgr.evalOpAsync<kp::OpAlgoBase>(
-      { tensorA }, "asyncOne", kp::Shader::compile_source(shader));
+    sq1->evalAsync<kp::OpAlgoDispatch>(algo1);
+    sq2->evalAsync<kp::OpAlgoDispatch>(algo2);

-    mgr.evalOpAsync<kp::OpAlgoBase>(
-      { tensorB }, "asyncTwo", kp::Shader::compile_source(shader));
+    sq1->evalAwait();
+    sq2->evalAwait();

-    mgr.evalOpAwait("asyncOne");
-    mgr.evalOpAwait("asyncTwo");
-
-    mgr.evalOpAsyncDefault<kp::OpTensorSyncLocal>({ tensorA, tensorB });
-    mgr.evalOpAwaitDefault();
+    sq1->evalAsync<kp::OpTensorSyncLocal>({ tensorA, tensorB });
+    sq1->evalAwait();

    EXPECT_EQ(tensorA->data(), resultAsync);
    EXPECT_EQ(tensorB->data(), resultAsync);
--- a/test/TestDestroy.cpp
+++ b/test/TestDestroy.cpp
@ -5,7 +5,7 @@

 TEST(TestDestroy, TestDestroyTensorSingle)
 {
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
+    std::shared_ptr<kp::Tensor> tensorA = nullptr;

    std::string shader(R"(
      #version 450
@ -16,37 +16,36 @@ TEST(TestDestroy, TestDestroyTensorSingle)
          pa[index] = pa[index] + 1;
      })");

+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);
+
    {
        std::shared_ptr<kp::Sequence> sq = nullptr;

        {
            kp::Manager mgr;

-            mgr.rebuild({ tensorA });
+            tensorA = mgr.tensor({ 0, 0, 0 });

-            sq = mgr.sequence();
+            std::shared_ptr<kp::Algorithm> algo =
+              mgr.algorithm({ tensorA }, spirv);

-            sq->begin();
-            sq->record<kp::OpAlgoBase>(
-              { tensorA }, kp::Shader::compile_source(shader));
-            sq->end();
-
-            sq->eval();
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
-
-            mgr.destroy(tensorA);
+            mgr.sequence()
+              ->record<kp::OpAlgoDispatch>(algo)
+              ->eval()
+              ->eval<kp::OpTensorSyncLocal>(algo->getTensors());

+            tensorA->destroy();
            EXPECT_FALSE(tensorA->isInit());
        }
+        EXPECT_FALSE(tensorA->isInit());
    }
    EXPECT_EQ(tensorA->data(), std::vector<float>({ 1, 1, 1 }));
 }

 TEST(TestDestroy, TestDestroyTensorVector)
 {
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 1, 1, 1 }) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor({ 1, 1, 1 }) };
+    std::shared_ptr<kp::Tensor> tensorA = nullptr;
+    std::shared_ptr<kp::Tensor> tensorB = nullptr;

    std::string shader(R"(
      #version 450
@ -58,6 +57,7 @@ TEST(TestDestroy, TestDestroyTensorVector)
          pa[index] = pa[index] + 1;
          pb[index] = pb[index] + 2;
      })");
+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);

    {
        std::shared_ptr<kp::Sequence> sq = nullptr;
@ -65,20 +65,20 @@ TEST(TestDestroy, TestDestroyTensorVector)
        {
            kp::Manager mgr;

-            mgr.rebuild({ tensorA, tensorB });
+            tensorA = mgr.tensor({ 1, 1, 1 });
+            tensorB = mgr.tensor({ 1, 1, 1 });

-            sq = mgr.sequence();
+            std::shared_ptr<kp::Algorithm> algo =
+              mgr.algorithm({ tensorA, tensorB }, spirv);

-            sq->begin();
-            sq->record<kp::OpAlgoBase>(
-              { tensorA, tensorB }, kp::Shader::compile_source(shader));
-            sq->end();
+            mgr.sequence()
+              ->record<kp::OpTensorSyncDevice>(algo->getTensors())
+              ->record<kp::OpAlgoDispatch>(algo)
+              ->record<kp::OpTensorSyncLocal>(algo->getTensors())
+              ->eval();

-            sq->eval();
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA, tensorB });
-
-            mgr.destroy({ tensorA, tensorB });
+            tensorA->destroy();
+            tensorB->destroy();

            EXPECT_FALSE(tensorA->isInit());
            EXPECT_FALSE(tensorB->isInit());
@ -88,32 +88,9 @@ TEST(TestDestroy, TestDestroyTensorVector)
    EXPECT_EQ(tensorB->data(), std::vector<float>({ 3, 3, 3 }));
 }

-TEST(TestDestroy, TestDestroyTensorVectorUninitialised)
-{
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 1, 1, 1 }) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor({ 1, 1, 1 }) };
-
-    {
-        std::shared_ptr<kp::Sequence> sq = nullptr;
-
-        {
-            kp::Manager mgr;
-
-            mgr.rebuild({ tensorA, tensorB });
-
-            mgr.destroy({ tensorA, tensorB });
-
-            EXPECT_FALSE(tensorA->isInit());
-            EXPECT_FALSE(tensorB->isInit());
-        }
-    }
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 1, 1, 1 }));
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 1, 1, 1 }));
-}
-
 TEST(TestDestroy, TestDestroySequenceSingle)
 {
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
+    std::shared_ptr<kp::Tensor> tensorA = nullptr;

    std::string shader(R"(
      #version 450
@ -124,247 +101,27 @@ TEST(TestDestroy, TestDestroySequenceSingle)
          pa[index] = pa[index] + 1;
      })");

+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);
+
    {
        std::shared_ptr<kp::Sequence> sq = nullptr;

        {
            kp::Manager mgr;

-            mgr.rebuild({ tensorA });
+            tensorA = mgr.tensor({ 0, 0, 0 });

-            sq = mgr.sequence();
+            sq =
+              mgr.sequence()
+                ->record<kp::OpTensorSyncDevice>({ tensorA })
+                ->record<kp::OpAlgoDispatch>(mgr.algorithm({ tensorA }, spirv))
+                ->record<kp::OpTensorSyncLocal>({ tensorA })
+                ->eval();

-            sq->begin();
-            sq->record<kp::OpAlgoBase>(
-              { tensorA }, kp::Shader::compile_source(shader));
-            sq->end();
-
-            sq->eval();
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
-
-            mgr.destroy(sq);
+            sq->destroy();

            EXPECT_FALSE(sq->isInit());
        }
    }
    EXPECT_EQ(tensorA->data(), std::vector<float>({ 1, 1, 1 }));
 }
-
-TEST(TestDestroy, TestDestroySequenceVector)
-{
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-
-    std::string shader(R"(
-      #version 450
-      layout (local_size_x = 1) in;
-      layout(set = 0, binding = 0) buffer a { float pa[]; };
-      void main() {
-          uint index = gl_GlobalInvocationID.x;
-          pa[index] = pa[index] + 1;
-      })");
-
-    {
-        std::shared_ptr<kp::Sequence> sq1 = nullptr;
-        std::shared_ptr<kp::Sequence> sq2 = nullptr;
-
-        {
-            kp::Manager mgr;
-
-            mgr.rebuild({ tensorA });
-
-            sq1 = mgr.sequence("One");
-            sq1->begin();
-            sq1->record<kp::OpAlgoBase>(
-              { tensorA }, kp::Shader::compile_source(shader));
-            sq1->end();
-            sq1->eval();
-
-            sq2 = mgr.sequence("Two");
-            sq2->begin();
-            sq2->record<kp::OpAlgoBase>(
-              { tensorA }, kp::Shader::compile_source(shader));
-            sq2->end();
-            sq2->eval();
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
-
-            mgr.destroy({ sq1, sq2 });
-
-            EXPECT_FALSE(sq1->isInit());
-            EXPECT_FALSE(sq2->isInit());
-        }
-    }
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 2, 2, 2 }));
-}
-
-TEST(TestDestroy, TestDestroySequenceNameSingleInsideManager)
-{
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-
-    std::string shader(R"(
-      #version 450
-      layout (local_size_x = 1) in;
-      layout(set = 0, binding = 0) buffer a { float pa[]; };
-      void main() {
-          uint index = gl_GlobalInvocationID.x;
-          pa[index] = pa[index] + 1;
-      })");
-
-    {
-        kp::Manager mgr;
-        {
-            mgr.rebuild({ tensorA });
-
-            mgr.evalOp<kp::OpAlgoBase>(
-              { tensorA }, "one",
-              kp::Shader::compile_source(shader));
-
-            mgr.evalOp<kp::OpAlgoBase>(
-              { tensorA }, "two",
-              kp::Shader::compile_source(shader));
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
-
-            mgr.destroy("one");
-            mgr.destroy("two");
-        }
-    }
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 2, 2, 2 }));
-}
-
-TEST(TestDestroy, TestDestroySequenceNameSingleOutsideManager)
-{
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-
-    std::string shader(R"(
-      #version 450
-      layout (local_size_x = 1) in;
-      layout(set = 0, binding = 0) buffer a { float pa[]; };
-      void main() {
-          uint index = gl_GlobalInvocationID.x;
-          pa[index] = pa[index] + 1;
-      })");
-
-    {
-        std::shared_ptr<kp::Sequence> sq1 = nullptr;
-
-        {
-            kp::Manager mgr;
-
-            mgr.rebuild({ tensorA });
-
-            sq1 = mgr.sequence("One");
-            sq1->begin();
-            sq1->record<kp::OpAlgoBase>(
-              { tensorA }, kp::Shader::compile_source(shader));
-            sq1->end();
-            sq1->eval();
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
-
-            mgr.destroy("One");
-
-            EXPECT_FALSE(sq1->isInit());
-        }
-    }
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 1, 1, 1 }));
-}
-
-TEST(TestDestroy, TestDestroySequenceNameVectorInsideManager)
-{
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-
-    std::string shader(R"(
-      #version 450
-      layout (local_size_x = 1) in;
-      layout(set = 0, binding = 0) buffer a { float pa[]; };
-      void main() {
-          uint index = gl_GlobalInvocationID.x;
-          pa[index] = pa[index] + 1;
-      })");
-
-    {
-        kp::Manager mgr;
-        {
-            mgr.rebuild({ tensorA });
-
-            mgr.evalOp<kp::OpAlgoBase>(
-              { tensorA }, "one",
-              kp::Shader::compile_source(shader));
-
-            mgr.evalOp<kp::OpAlgoBase>(
-              { tensorA }, "two",
-              kp::Shader::compile_source(shader));
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
-
-            mgr.destroy(std::vector<std::string>({"one", "two"}));
-        }
-    }
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 2, 2, 2 }));
-}
-
-TEST(TestDestroy, TestDestroySequenceNameVectorOutsideManager)
-{
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-
-    std::string shader(R"(
-      #version 450
-      layout (local_size_x = 1) in;
-      layout(set = 0, binding = 0) buffer a { float pa[]; };
-      void main() {
-          uint index = gl_GlobalInvocationID.x;
-          pa[index] = pa[index] + 1;
-      })");
-
-    {
-        kp::Manager mgr;
-        {
-            mgr.rebuild({ tensorA });
-
-            mgr.evalOp<kp::OpAlgoBase>(
-              { tensorA }, "one",
-              kp::Shader::compile_source(shader));
-
-            mgr.evalOp<kp::OpAlgoBase>(
-              { tensorA }, "two",
-              kp::Shader::compile_source(shader));
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
-
-            mgr.destroy(std::vector<std::string>({"one", "two"}));
-        }
-    }
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 2, 2, 2 }));
-}
-
-TEST(TestDestroy, TestDestroySequenceNameDefaultOutsideManager)
-{
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-
-    std::string shader(R"(
-      #version 450
-      layout (local_size_x = 1) in;
-      layout(set = 0, binding = 0) buffer a { float pa[]; };
-      void main() {
-          uint index = gl_GlobalInvocationID.x;
-          pa[index] = pa[index] + 1;
-      })");
-
-    {
-        kp::Manager mgr;
-        {
-            mgr.rebuild({ tensorA });
-
-            mgr.evalOpDefault<kp::OpAlgoBase>(
-              { tensorA },
-              kp::Shader::compile_source(shader));
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
-
-            mgr.destroy(KP_DEFAULT_SESSION);
-        }
-    }
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 1, 1, 1 }));
-}
--- a/test/TestLogisticRegression.cpp
+++ b/test/TestLogisticRegression.cpp
@ -11,47 +11,45 @@ TEST(TestLogisticRegression, TestMainLogisticRegression)
    uint32_t ITERATIONS = 100;
    float learningRate = 0.1;

-    std::shared_ptr<kp::Tensor> xI{ new kp::Tensor({ 0, 1, 1, 1, 1 }) };
-    std::shared_ptr<kp::Tensor> xJ{ new kp::Tensor({ 0, 0, 0, 1, 1 }) };
-
-    std::shared_ptr<kp::Tensor> y{ new kp::Tensor({ 0, 0, 0, 1, 1 }) };
-
-    std::shared_ptr<kp::Tensor> wIn{ new kp::Tensor({ 0.001, 0.001 }) };
-    std::shared_ptr<kp::Tensor> wOutI{ new kp::Tensor({ 0, 0, 0, 0, 0 }) };
-    std::shared_ptr<kp::Tensor> wOutJ{ new kp::Tensor({ 0, 0, 0, 0, 0 }) };
-
-    std::shared_ptr<kp::Tensor> bIn{ new kp::Tensor({ 0 }) };
-    std::shared_ptr<kp::Tensor> bOut{ new kp::Tensor({ 0, 0, 0, 0, 0 }) };
-
-    std::shared_ptr<kp::Tensor> lOut{ new kp::Tensor({ 0, 0, 0, 0, 0 }) };
-
-    std::vector<std::shared_ptr<kp::Tensor>> params = { xI,  xJ,    y,
-                                                        wIn, wOutI, wOutJ,
-                                                        bIn, bOut,  lOut };
-
    {
        kp::Manager mgr;

-        mgr.rebuild(params);
+        std::shared_ptr<kp::Tensor> xI = mgr.tensor({ 0, 1, 1, 1, 1 });
+        std::shared_ptr<kp::Tensor> xJ = mgr.tensor({ 0, 0, 0, 1, 1 });

-        std::shared_ptr<kp::Sequence> sq = mgr.sequence();
+        std::shared_ptr<kp::Tensor> y = mgr.tensor({ 0, 0, 0, 1, 1 });

-        // Record op algo base
-        sq->begin();
+        std::shared_ptr<kp::Tensor> wIn = mgr.tensor({ 0.001, 0.001 });
+        std::shared_ptr<kp::Tensor> wOutI = mgr.tensor({ 0, 0, 0, 0, 0 });
+        std::shared_ptr<kp::Tensor> wOutJ = mgr.tensor({ 0, 0, 0, 0, 0 });

-        sq->record<kp::OpTensorSyncDevice>({ wIn, bIn });
+        std::shared_ptr<kp::Tensor> bIn = mgr.tensor({ 0 });
+        std::shared_ptr<kp::Tensor> bOut = mgr.tensor({ 0, 0, 0, 0, 0 });

-        sq->record<kp::OpAlgoBase>(
-          params,
-          std::vector<uint32_t>(
-            (uint32_t*)kp::shader_data::shaders_glsl_logisticregression_comp_spv,
-            (uint32_t*)(kp::shader_data::shaders_glsl_logisticregression_comp_spv +
-              kp::shader_data::shaders_glsl_logisticregression_comp_spv_len)),
-          kp::Workgroup(), kp::Constants({5.0}));
+        std::shared_ptr<kp::Tensor> lOut = mgr.tensor({ 0, 0, 0, 0, 0 });

-        sq->record<kp::OpTensorSyncLocal>({ wOutI, wOutJ, bOut, lOut });
+        std::vector<std::shared_ptr<kp::Tensor>> params = { xI,  xJ,    y,
+                                                            wIn, wOutI, wOutJ,
+                                                            bIn, bOut,  lOut };

-        sq->end();
+        mgr.sequence()->eval<kp::OpTensorSyncDevice>(params);
+
+        std::vector<uint32_t> spirv = std::vector<uint32_t>(
+          (uint32_t*)kp::shader_data::
+            test_shaders_glsl_test_logistic_regression_comp_spv,
+          (uint32_t*)(kp::shader_data::
+                        test_shaders_glsl_test_logistic_regression_comp_spv +
+                      kp::shader_data::
+                        test_shaders_glsl_test_logistic_regression_comp_spv_len));
+
+        std::shared_ptr<kp::Algorithm> algorithm = mgr.algorithm(
+          params, spirv, kp::Workgroup({ 5 }), kp::Constants({ 5.0 }));
+
+        std::shared_ptr<kp::Sequence> sq =
+          mgr.sequence()
+            ->record<kp::OpTensorSyncDevice>({ wIn, bIn })
+            ->record<kp::OpAlgoDispatch>(algorithm)
+            ->record<kp::OpTensorSyncLocal>({ wOutI, wOutJ, bOut, lOut });

        // Iterate across all expected iterations
        for (size_t i = 0; i < ITERATIONS; i++) {
@ -64,21 +62,21 @@ TEST(TestLogisticRegression, TestMainLogisticRegression)
                bIn->data()[0] -= learningRate * bOut->data()[j];
            }
        }
+
+        // Based on the inputs the outputs should be at least:
+        // * wi < 0.01
+        // * wj > 1.0
+        // * b < 0
+        // TODO: Add EXPECT_DOUBLE_EQ instead
+        EXPECT_LT(wIn->data()[0], 0.01);
+        EXPECT_GT(wIn->data()[1], 1.0);
+        EXPECT_LT(bIn->data()[0], 0.0);
+
+        KP_LOG_WARN("Result wIn i: {}, wIn j: {}, bIn: {}",
+                    wIn->data()[0],
+                    wIn->data()[1],
+                    bIn->data()[0]);
    }
-
-    // Based on the inputs the outputs should be at least:
-    // * wi < 0.01
-    // * wj > 1.0
-    // * b < 0
-    // TODO: Add EXPECT_DOUBLE_EQ instead
-    EXPECT_LT(wIn->data()[0], 0.01);
-    EXPECT_GT(wIn->data()[1], 1.0);
-    EXPECT_LT(bIn->data()[0], 0.0);
-
-    KP_LOG_WARN("Result wIn i: {}, wIn j: {}, bIn: {}",
-                wIn->data()[0],
-                wIn->data()[1],
-                bIn->data()[0]);
 }

 TEST(TestLogisticRegression, TestMainLogisticRegressionManualCopy)
@ -87,50 +85,46 @@ TEST(TestLogisticRegression, TestMainLogisticRegressionManualCopy)
    uint32_t ITERATIONS = 100;
    float learningRate = 0.1;

-    kp::Constants wInVec = { 0.001, 0.001 };
-    std::vector<float> bInVec = { 0 };
-
-    std::shared_ptr<kp::Tensor> xI{ new kp::Tensor({ 0, 1, 1, 1, 1 }) };
-    std::shared_ptr<kp::Tensor> xJ{ new kp::Tensor({ 0, 0, 0, 1, 1 }) };
-
-    std::shared_ptr<kp::Tensor> y{ new kp::Tensor({ 0, 0, 0, 1, 1 }) };
-
-    std::shared_ptr<kp::Tensor> wIn{ new kp::Tensor(
-      wInVec, kp::Tensor::TensorTypes::eHost) };
-    std::shared_ptr<kp::Tensor> wOutI{ new kp::Tensor({ 0, 0, 0, 0, 0 }) };
-    std::shared_ptr<kp::Tensor> wOutJ{ new kp::Tensor({ 0, 0, 0, 0, 0 }) };
-
-    std::shared_ptr<kp::Tensor> bIn{ new kp::Tensor(
-      bInVec, kp::Tensor::TensorTypes::eHost) };
-    std::shared_ptr<kp::Tensor> bOut{ new kp::Tensor({ 0, 0, 0, 0, 0 }) };
-
-    std::shared_ptr<kp::Tensor> lOut{ new kp::Tensor({ 0, 0, 0, 0, 0 }) };
-
-    std::vector<std::shared_ptr<kp::Tensor>> params = { xI,  xJ,    y,
-                                                        wIn, wOutI, wOutJ,
-                                                        bIn, bOut,  lOut };
-
    {
        kp::Manager mgr;

-        mgr.rebuild(params);
+        std::shared_ptr<kp::Tensor> xI = mgr.tensor({ 0, 1, 1, 1, 1 });
+        std::shared_ptr<kp::Tensor> xJ = mgr.tensor({ 0, 0, 0, 1, 1 });

-        std::shared_ptr<kp::Sequence> sq = mgr.sequence();
+        std::shared_ptr<kp::Tensor> y = mgr.tensor({ 0, 0, 0, 1, 1 });

-        // Record op algo base
-        sq->begin();
+        std::shared_ptr<kp::Tensor> wIn =
+          mgr.tensor({ 0.001, 0.001 }, kp::Tensor::TensorTypes::eHost);
+        std::shared_ptr<kp::Tensor> wOutI = mgr.tensor({ 0, 0, 0, 0, 0 });
+        std::shared_ptr<kp::Tensor> wOutJ = mgr.tensor({ 0, 0, 0, 0, 0 });

-        sq->record<kp::OpAlgoBase>(
-          params,
-          std::vector<uint32_t>(
-            (uint32_t*)kp::shader_data::shaders_glsl_logisticregression_comp_spv,
-            (uint32_t*)(kp::shader_data::shaders_glsl_logisticregression_comp_spv +
-              kp::shader_data::shaders_glsl_logisticregression_comp_spv_len)),
-          kp::Workgroup(), kp::Constants({5.0}));
+        std::shared_ptr<kp::Tensor> bIn =
+          mgr.tensor({ 0 }, kp::Tensor::TensorTypes::eHost);
+        std::shared_ptr<kp::Tensor> bOut = mgr.tensor({ 0, 0, 0, 0, 0 });

-        sq->record<kp::OpTensorSyncLocal>({ wOutI, wOutJ, bOut, lOut });
+        std::shared_ptr<kp::Tensor> lOut = mgr.tensor({ 0, 0, 0, 0, 0 });

-        sq->end();
+        std::vector<std::shared_ptr<kp::Tensor>> params = { xI,  xJ,    y,
+                                                            wIn, wOutI, wOutJ,
+                                                            bIn, bOut,  lOut };
+
+        mgr.sequence()->record<kp::OpTensorSyncDevice>(params)->eval();
+
+        std::vector<uint32_t> spirv = std::vector<uint32_t>(
+          (uint32_t*)kp::shader_data::shaders_glsl_logisticregression_comp_spv,
+          (uint32_t*)(kp::shader_data::
+                        shaders_glsl_logisticregression_comp_spv +
+                      kp::shader_data::
+                        shaders_glsl_logisticregression_comp_spv_len));
+
+        std::shared_ptr<kp::Algorithm> algorithm =
+          mgr.algorithm(params, spirv, kp::Workgroup(), kp::Constants({ 5.0 }));
+
+        std::shared_ptr<kp::Sequence> sq =
+          mgr.sequence()
+            ->record<kp::OpTensorSyncDevice>({ wIn, bIn })
+            ->record<kp::OpAlgoDispatch>(algorithm)
+            ->record<kp::OpTensorSyncLocal>({ wOutI, wOutJ, bOut, lOut });

        // Iterate across all expected iterations
        for (size_t i = 0; i < ITERATIONS; i++) {
@ -145,19 +139,19 @@ TEST(TestLogisticRegression, TestMainLogisticRegressionManualCopy)
            wIn->mapDataIntoHostMemory();
            bIn->mapDataIntoHostMemory();
        }
+
+        // Based on the inputs the outputs should be at least:
+        // * wi < 0.01
+        // * wj > 1.0
+        // * b < 0
+        // TODO: Add EXPECT_DOUBLE_EQ instead
+        EXPECT_LT(wIn->data()[0], 0.01);
+        EXPECT_GT(wIn->data()[1], 1.0);
+        EXPECT_LT(bIn->data()[0], 0.0);
+
+        KP_LOG_WARN("Result wIn i: {}, wIn j: {}, bIn: {}",
+                    wIn->data()[0],
+                    wIn->data()[1],
+                    bIn->data()[0]);
    }
-
-    // Based on the inputs the outputs should be at least:
-    // * wi < 0.01
-    // * wj > 1.0
-    // * b < 0
-    // TODO: Add EXPECT_DOUBLE_EQ instead
-    EXPECT_LT(wIn->data()[0], 0.01);
-    EXPECT_GT(wIn->data()[1], 1.0);
-    EXPECT_LT(bIn->data()[0], 0.0);
-
-    KP_LOG_WARN("Result wIn i: {}, wIn j: {}, bIn: {}",
-                wIn->data()[0],
-                wIn->data()[1],
-                bIn->data()[0]);
 }
--- a/test/TestManager.cpp
+++ b/test/TestManager.cpp
@ -3,53 +3,43 @@

 #include "kompute/Kompute.hpp"

-TEST(TestManager, EndToEndOpMultFlow)
+TEST(TestManager, EndToEndOpMultEvalFlow)
 {
    kp::Manager mgr;

-    std::shared_ptr<kp::Tensor> tensorLHS{ new kp::Tensor({ 0, 1, 2 }) };
-    mgr.rebuild({ tensorLHS });
+    std::shared_ptr<kp::Tensor> tensorLHS = mgr.tensor({ 0, 1, 2 });
+    std::shared_ptr<kp::Tensor> tensorRHS = mgr.tensor({ 2, 4, 6 });
+    std::shared_ptr<kp::Tensor> tensorOutput = mgr.tensor({ 0, 0, 0 });

-    std::shared_ptr<kp::Tensor> tensorRHS{ new kp::Tensor({ 2, 4, 6 }) };
-    mgr.rebuild({ tensorRHS });
+    std::vector<std::shared_ptr<kp::Tensor>> params = { tensorLHS,
+                                                        tensorRHS,
+                                                        tensorOutput };

-    std::shared_ptr<kp::Tensor> tensorOutput{ new kp::Tensor({ 0, 0, 0 }) };
-
-    mgr.rebuild({ tensorOutput });
-
-    mgr.evalOpDefault<kp::OpMult>({ tensorLHS, tensorRHS, tensorOutput });
-
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorOutput });
+    mgr.sequence()
+      ->eval<kp::OpTensorSyncDevice>(params)
+      ->eval<kp::OpMult>(params, mgr.algorithm())
+      ->eval<kp::OpTensorSyncLocal>(params);

    EXPECT_EQ(tensorOutput->data(), std::vector<float>({ 0, 4, 12 }));
 }

-TEST(TestManager, OpMultSequenceFlow)
+TEST(TestManager, EndToEndOpMultSeqFlow)
 {
-
-    std::shared_ptr<kp::Tensor> tensorLHS{ new kp::Tensor({ 0, 1, 2 }) };
-
-    std::shared_ptr<kp::Tensor> tensorRHS{ new kp::Tensor({ 2, 4, 6 }) };
-
-    std::shared_ptr<kp::Tensor> tensorOutput{ new kp::Tensor({ 0, 0, 0 }) };
-
    kp::Manager mgr;

-    {
-        mgr.rebuild({ tensorLHS, tensorRHS, tensorOutput });
+    std::shared_ptr<kp::Tensor> tensorLHS = mgr.tensor({ 0, 1, 2 });
+    std::shared_ptr<kp::Tensor> tensorRHS = mgr.tensor({ 2, 4, 6 });
+    std::shared_ptr<kp::Tensor> tensorOutput = mgr.tensor({ 0, 0, 0 });

-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("newSequence");
+    std::vector<std::shared_ptr<kp::Tensor>> params = { tensorLHS,
+                                                        tensorRHS,
+                                                        tensorOutput };

-        sq->begin();
-
-        sq->record<kp::OpMult>({ tensorLHS, tensorRHS, tensorOutput });
-
-        sq->record<kp::OpTensorSyncLocal>({ tensorOutput });
-
-        sq->end();
-        sq->eval();
-    }
+    mgr.sequence()
+      ->record<kp::OpTensorSyncDevice>(params)
+      ->record<kp::OpMult>(params, mgr.algorithm())
+      ->record<kp::OpTensorSyncLocal>(params)
+      ->eval();

    EXPECT_EQ(tensorOutput->data(), std::vector<float>({ 0, 4, 12 }));
 }
@ -58,75 +48,17 @@ TEST(TestManager, TestMultipleSequences)
 {
    kp::Manager mgr;

-    std::shared_ptr<kp::Sequence> sqOne =
-      mgr.sequence("sqOne");
+    std::shared_ptr<kp::Tensor> tensorLHS = mgr.tensor({ 0, 1, 2 });
+    std::shared_ptr<kp::Tensor> tensorRHS = mgr.tensor({ 2, 4, 6 });
+    std::shared_ptr<kp::Tensor> tensorOutput = mgr.tensor({ 0, 0, 0 });

-    std::shared_ptr<kp::Sequence> sqTwo =
-      mgr.sequence("sqTwo");
+    std::vector<std::shared_ptr<kp::Tensor>> params = { tensorLHS,
+                                                        tensorRHS,
+                                                        tensorOutput };

-    std::shared_ptr<kp::Sequence> sqOneRef =
-      mgr.sequence("sqOne");
-
-    std::shared_ptr<kp::Sequence> sqTwoRef =
-      mgr.sequence("sqTwo");
-
-    EXPECT_EQ(sqOne, sqOneRef);
-    EXPECT_NE(sqTwo, sqOneRef);
-    EXPECT_EQ(sqTwo, sqTwoRef);
-    EXPECT_NE(sqOneRef, sqTwoRef);
-}
-
-TEST(TestManager, TestMultipleTensorsAtOnce)
-{
-
-    std::shared_ptr<kp::Tensor> tensorLHS{ new kp::Tensor({ 0, 1, 2 }) };
-
-    std::shared_ptr<kp::Tensor> tensorRHS{ new kp::Tensor({ 2, 4, 6 }) };
-
-    std::shared_ptr<kp::Tensor> tensorOutput{ new kp::Tensor({ 0, 0, 0 }) };
-
-    kp::Manager mgr;
-
-    std::shared_ptr<kp::Sequence> sq =
-      mgr.sequence("newSequence");
-
-    {
-        mgr.rebuild({ tensorLHS, tensorRHS, tensorOutput });
-
-        EXPECT_TRUE(tensorLHS->isInit());
-        EXPECT_TRUE(tensorRHS->isInit());
-        EXPECT_TRUE(tensorOutput->isInit());
-
-        sq->begin();
-
-        sq->record<kp::OpMult>({ tensorLHS, tensorRHS, tensorOutput });
-
-        sq->record<kp::OpTensorSyncLocal>({ tensorOutput });
-
-        sq->end();
-        sq->eval();
-    }
+    mgr.sequence()->eval<kp::OpTensorSyncDevice>(params);
+    mgr.sequence()->eval<kp::OpMult>(params, mgr.algorithm());
+    mgr.sequence()->eval<kp::OpTensorSyncLocal>(params);

    EXPECT_EQ(tensorOutput->data(), std::vector<float>({ 0, 4, 12 }));
 }
-
-TEST(TestManager, TestCreateInitTensor)
-{
-    kp::Manager mgr;
-
-    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor({ 0, 1, 2 });
-    std::shared_ptr<kp::Tensor> tensorB = mgr.tensor({ 0, 0, 0 });
-
-    mgr.evalOpDefault<kp::OpTensorCopy>({ tensorA, tensorB });
-
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorB });
-
-    EXPECT_EQ(tensorB->data(), std::vector<float>({ 0, 1, 2 }));
-
-    std::shared_ptr<kp::Tensor> tensorC =
-      mgr.tensor({ 0, 0, 0 }, kp::Tensor::TensorTypes::eHost);
-
-    mgr.evalOpDefault<kp::OpTensorCopy>({ tensorA, tensorC });
-
-    EXPECT_EQ(tensorC->data(), std::vector<float>({ 0, 1, 2 }));
-}
--- a/test/TestMultipleAlgoExecutions.cpp
+++ b/test/TestMultipleAlgoExecutions.cpp
@ -3,12 +3,76 @@

 #include "kompute/Kompute.hpp"

+TEST(TestMultipleAlgoExecutions, TestEndToEndFunctionality)
+{
+
+    kp::Manager mgr;
+
+    auto tensorInA = mgr.tensor({ 2., 2., 2. });
+    auto tensorInB = mgr.tensor({ 1., 2., 3. });
+    auto tensorOutA = mgr.tensor({ 0., 0., 0. });
+    auto tensorOutB = mgr.tensor({ 0., 0., 0. });
+
+    std::string shader = (R"(
+        #version 450
+
+        layout (local_size_x = 1) in;
+
+        // The input tensors bind index is relative to index in parameter passed
+        layout(set = 0, binding = 0) buffer buf_in_a { float in_a[]; };
+        layout(set = 0, binding = 1) buffer buf_in_b { float in_b[]; };
+        layout(set = 0, binding = 2) buffer buf_out_a { float out_a[]; };
+        layout(set = 0, binding = 3) buffer buf_out_b { float out_b[]; };
+
+        // Kompute supports push constants updated on dispatch
+        layout(push_constant) uniform PushConstants {
+            float val;
+        } push_const;
+
+        // Kompute also supports spec constants on initalization
+        layout(constant_id = 0) const float const_one = 0;
+
+        void main() {
+            uint index = gl_GlobalInvocationID.x;
+            out_a[index] += in_a[index] * in_b[index];
+            out_b[index] += const_one * push_const.val;
+        }
+    )");
+
+    std::vector<std::shared_ptr<kp::Tensor>> params = {
+        tensorInA, tensorInB, tensorOutA, tensorOutB
+    };
+
+    kp::Workgroup workgroup({ 3, 1, 1 });
+    kp::Constants specConsts({ 2 });
+    kp::Constants pushConstsA({ 2.0 });
+    kp::Constants pushConstsB({ 3.0 });
+
+    auto algorithm = mgr.algorithm(
+      params, kp::Shader::compile_source(shader), workgroup, specConsts);
+
+    // 3. Run operation with string shader synchronously
+    mgr.sequence()
+      ->record<kp::OpTensorSyncDevice>(params)
+      ->record<kp::OpAlgoDispatch>(algorithm, pushConstsA)
+      ->record<kp::OpAlgoDispatch>(algorithm, pushConstsB)
+      ->eval();
+
+    auto sq = mgr.sequence();
+    sq->evalAsync<kp::OpTensorSyncLocal>(params);
+
+    sq->evalAwait();
+
+    EXPECT_EQ(tensorOutA->data(), std::vector<float>({ 4, 8, 12 }));
+    EXPECT_EQ(tensorOutB->data(), std::vector<float>({ 10, 10, 10 }));
+}
+
 TEST(TestMultipleAlgoExecutions, SingleSequenceRecord)
 {

    kp::Manager mgr;

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor({ 0, 0, 0 });

    std::string shader(R"(
      #version 450
@ -19,25 +83,16 @@ TEST(TestMultipleAlgoExecutions, SingleSequenceRecord)
          pa[index] = pa[index] + 1;
      })");

-    mgr.rebuild({ tensorA });
-
-    std::shared_ptr<kp::Sequence> sq =
-      mgr.sequence("newSequence");
+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);

    {
-        sq->begin();
-
-        sq->record<kp::OpAlgoBase>(
-          { tensorA }, kp::Shader::compile_source(shader));
-        sq->record<kp::OpAlgoBase>(
-          { tensorA }, kp::Shader::compile_source(shader));
-        sq->record<kp::OpAlgoBase>(
-          { tensorA }, kp::Shader::compile_source(shader));
-
-        sq->record<kp::OpTensorSyncLocal>({ tensorA });
-
-        sq->end();
-        sq->eval();
+        mgr.sequence()
+          ->record<kp::OpTensorSyncDevice>({ tensorA })
+          ->record<kp::OpAlgoDispatch>(mgr.algorithm({ tensorA }, spirv))
+          ->record<kp::OpAlgoDispatch>(mgr.algorithm({ tensorA }, spirv))
+          ->record<kp::OpAlgoDispatch>(mgr.algorithm({ tensorA }, spirv))
+          ->record<kp::OpTensorSyncLocal>({ tensorA })
+          ->eval();
    }

    EXPECT_EQ(tensorA->data(), std::vector<float>({ 3, 3, 3 }));
@ -47,7 +102,7 @@ TEST(TestMultipleAlgoExecutions, MultipleCmdBufRecords)
 {
    kp::Manager mgr;

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor({ 0, 0, 0 });

    std::string shader(R"(
      #version 450
@ -58,41 +113,22 @@ TEST(TestMultipleAlgoExecutions, MultipleCmdBufRecords)
          pa[index] = pa[index] + 1;
      })");

-    mgr.rebuild({ tensorA }, false);
+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);

-    std::shared_ptr<kp::Sequence> sqTensor = mgr.sequence();
+    std::shared_ptr<kp::Algorithm> algorithm =
+      mgr.algorithm({ tensorA }, spirv);

    std::shared_ptr<kp::Sequence> sq = mgr.sequence();

-    // First create the tensor in a separate sequence
-    sqTensor->begin();
-    sqTensor->record<kp::OpTensorSyncDevice>({ tensorA });
-    sqTensor->end();
-    sqTensor->eval();
+    mgr.sequence()->record<kp::OpTensorSyncDevice>({ tensorA })->eval();

-    // Then perform the computations
-    sq->begin();
-    sq->record<kp::OpAlgoBase>({ tensorA },
-                               kp::Shader::compile_source(shader));
-    sq->end();
-    sq->eval();
+    mgr.sequence()->record<kp::OpAlgoDispatch>(algorithm)->eval();

-    sq->begin();
-    sq->record<kp::OpAlgoBase>({ tensorA },
-                               kp::Shader::compile_source(shader));
-    sq->end();
-    sq->eval();
+    mgr.sequence()->record<kp::OpAlgoDispatch>(algorithm)->eval();

-    sq->begin();
-    sq->record<kp::OpAlgoBase>({ tensorA },
-                               kp::Shader::compile_source(shader));
-    sq->end();
-    sq->eval();
+    mgr.sequence()->record<kp::OpAlgoDispatch>(algorithm)->eval();

-    sq->begin();
-    sq->record<kp::OpTensorSyncLocal>({ tensorA });
-    sq->end();
-    sq->eval();
+    mgr.sequence()->record<kp::OpTensorSyncLocal>({ tensorA })->eval();

    EXPECT_EQ(tensorA->data(), std::vector<float>({ 3, 3, 3 }));
 }
@ -102,7 +138,7 @@ TEST(TestMultipleAlgoExecutions, MultipleSequences)

    kp::Manager mgr;

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor({ 0, 0, 0 });

    std::string shader(R"(
      #version 450
@ -113,68 +149,31 @@ TEST(TestMultipleAlgoExecutions, MultipleSequences)
          pa[index] = pa[index] + 1;
      })");

-    mgr.rebuild({ tensorA });
+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);

-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("newSequence");
+    std::shared_ptr<kp::Algorithm> algorithm =
+      mgr.algorithm({ tensorA }, spirv);

-        sq->begin();
+    std::shared_ptr<kp::Sequence> sq = mgr.sequence();

-        sq->record<kp::OpAlgoBase>(
-          { tensorA }, kp::Shader::compile_source(shader));
+    sq->record<kp::OpTensorSyncDevice>({ tensorA })->eval();

-        sq->end();
-        sq->eval();
-    }
+    sq->record<kp::OpAlgoDispatch>(algorithm)->eval();

-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("newSequence2");
+    sq->record<kp::OpAlgoDispatch>(algorithm)->eval();

-        sq->begin();
+    sq->record<kp::OpAlgoDispatch>(algorithm)->eval();

-        sq->record<kp::OpAlgoBase>(
-          { tensorA }, kp::Shader::compile_source(shader));
-
-        sq->end();
-        sq->eval();
-    }
-
-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("newSequence3");
-
-        sq->begin();
-
-        sq->record<kp::OpAlgoBase>(
-          { tensorA }, kp::Shader::compile_source(shader));
-
-        sq->end();
-        sq->eval();
-    }
-
-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("newSequence5");
-
-        sq->begin();
-
-        sq->record<kp::OpTensorSyncLocal>({ tensorA });
-
-        sq->end();
-        sq->eval();
-    }
+    sq->record<kp::OpTensorSyncLocal>({ tensorA })->eval();

    EXPECT_EQ(tensorA->data(), std::vector<float>({ 3, 3, 3 }));
 }

 TEST(TestMultipleAlgoExecutions, SingleRecordMultipleEval)
 {
-
    kp::Manager mgr;

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor({ 0, 0, 0 });

    std::string shader(R"(
      #version 450
@ -185,169 +184,56 @@ TEST(TestMultipleAlgoExecutions, SingleRecordMultipleEval)
          pa[index] = pa[index] + 1;
      })");

-    mgr.rebuild({ tensorA }, false);
+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);

-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("newSequence");
+    std::shared_ptr<kp::Algorithm> algorithm =
+      mgr.algorithm({ tensorA }, spirv);

-        sq->begin();
+    std::shared_ptr<kp::Sequence> sq = mgr.sequence();

-        sq->record<kp::OpTensorSyncDevice>({ tensorA });
+    sq->record<kp::OpTensorSyncDevice>({ tensorA })->eval();

-        sq->end();
-        sq->eval();
-    }
+    sq->record<kp::OpAlgoDispatch>(algorithm)->eval()->eval()->eval();

-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("newSequence2");
-
-        sq->begin();
-
-        sq->record<kp::OpAlgoBase>(
-          { tensorA }, kp::Shader::compile_source(shader));
-
-        sq->end();
-
-        sq->eval();
-        sq->eval();
-        sq->eval();
-    }
-
-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("newSequence3");
-
-        sq->begin();
-
-        sq->record<kp::OpTensorSyncLocal>({ tensorA });
-
-        sq->end();
-
-        sq->eval();
-        sq->eval();
-        sq->eval();
-    }
+    sq->record<kp::OpTensorSyncLocal>({ tensorA })->eval();

    EXPECT_EQ(tensorA->data(), std::vector<float>({ 3, 3, 3 }));
 }

-TEST(TestMultipleAlgoExecutions, ManagerEvalMultSourceStrOpCreate)
-{
-
-    kp::Manager mgr;
-
-    std::shared_ptr<kp::Tensor> tensorInA{ new kp::Tensor({ 2.0, 4.0, 6.0 }) };
-    std::shared_ptr<kp::Tensor> tensorInB{ new kp::Tensor({ 0.0, 1.0, 2.0 }) };
-    std::shared_ptr<kp::Tensor> tensorOut{ new kp::Tensor({ 0.0, 0.0, 0.0 }) };
-
-    mgr.rebuild({ tensorInA, tensorInB, tensorOut });
-
-    std::string shader(R"(
-        // The version to use 
-        #version 450
-
-        // The execution structure
-        layout (local_size_x = 1) in;
-
-        // The buffers are provided via the tensors
-        layout(binding = 0) buffer bufA { float a[]; };
-        layout(binding = 1) buffer bufB { float b[]; };
-        layout(binding = 2) buffer bufOut { float o[]; };
-
-        void main() {
-            uint index = gl_GlobalInvocationID.x;
-
-            o[index] = a[index] * b[index];
-        }
-      )");
-
-    mgr.evalOpDefault<kp::OpAlgoBase>(
-      { tensorInA, tensorInB, tensorOut },
-      kp::Shader::compile_source(shader));
-
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorOut });
-
-    EXPECT_EQ(tensorOut->data(), std::vector<float>({ 0.0, 4.0, 12.0 }));
-}
-
-TEST(TestMultipleAlgoExecutions, ManagerEvalMultSourceStrMgrCreate)
-{
-
-    kp::Manager mgr;
-
-    auto tensorInA = mgr.tensor(
-      { 2.0, 4.0, 6.0 }, kp::Tensor::TensorTypes::eDevice, false);
-    auto tensorInB = mgr.tensor(
-      { 0.0, 1.0, 2.0 }, kp::Tensor::TensorTypes::eDevice, false);
-    auto tensorOut = mgr.tensor(
-      { 0.0, 0.0, 0.0 }, kp::Tensor::TensorTypes::eDevice, false);
-
-    std::string shader(R"(
-        // The version to use 
-        #version 450
-
-        // The execution structure
-        layout (local_size_x = 1) in;
-
-        // The buffers are provided via the tensors
-        layout(binding = 0) buffer bufA { float a[]; };
-        layout(binding = 1) buffer bufB { float b[]; };
-        layout(binding = 2) buffer bufOut { float o[]; };
-
-        void main() {
-            uint index = gl_GlobalInvocationID.x;
-
-            o[index] = a[index] * b[index];
-        }
-      )");
-
-    mgr.evalOpDefault<kp::OpTensorSyncDevice>(
-      { tensorInA, tensorInB, tensorOut });
-
-    mgr.evalOpDefault<kp::OpAlgoBase>(
-      { tensorInA, tensorInB, tensorOut },
-      kp::Shader::compile_source(shader));
-
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorOut });
-
-    EXPECT_EQ(tensorOut->data(), std::vector<float>({ 0.0, 4.0, 12.0 }));
-}
-
 TEST(TestMultipleAlgoExecutions, SequenceAlgoDestroyOutsideManagerScope)
 {
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-
-    std::string shader(R"(
-      #version 450
-      layout (local_size_x = 1) in;
-      layout(set = 0, binding = 0) buffer a { float pa[]; };
-      void main() {
-          uint index = gl_GlobalInvocationID.x;
-          pa[index] = pa[index] + 1;
-      })");
+    std::shared_ptr<kp::Tensor> tensorA = nullptr;

    {
        std::shared_ptr<kp::Sequence> sq = nullptr;
-
        {
            kp::Manager mgr;

-            mgr.rebuild({ tensorA });
+            tensorA = mgr.tensor({ 0, 0, 0 });
+
+            std::string shader(R"(
+              #version 450
+              layout (local_size_x = 1) in;
+              layout(set = 0, binding = 0) buffer a { float pa[]; };
+              void main() {
+                  uint index = gl_GlobalInvocationID.x;
+                  pa[index] = pa[index] + 1;
+              })");
+
+            std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);
+
+            std::shared_ptr<kp::Algorithm> algorithm =
+              mgr.algorithm({ tensorA }, spirv);

            sq = mgr.sequence();

-            sq->begin();
-            sq->record<kp::OpAlgoBase>(
-              { tensorA }, kp::Shader::compile_source(shader));
-            sq->end();
+            sq->record<kp::OpTensorSyncDevice>({ tensorA })->eval();

-            sq->eval();
+            sq->record<kp::OpAlgoDispatch>(algorithm)->eval()->eval()->eval();

-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
+            sq->record<kp::OpTensorSyncLocal>({ tensorA })->eval();
        }
    }
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 1, 1, 1 }));
-}

+    EXPECT_EQ(tensorA->data(), std::vector<float>({ 3, 3, 3 }));
+}
--- a/test/TestOpAlgoLoopsPassingData.cpp
+++ b/test/TestOpAlgoLoopsPassingData.cpp
@ -1,80 +0,0 @@
-
-#include "gtest/gtest.h"
-
-#include "kompute/Kompute.hpp"
-
-TEST(TestProcessingIterations, IterateThroughMultipleSumAndCopies)
-{
-    kp::Manager mgr;
-
-    float TOTAL_ITER = 10;
-
-    std::vector<float> testExpectedOutVec = { TOTAL_ITER,
-                                              TOTAL_ITER,
-                                              TOTAL_ITER };
-
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor({ 0, 0, 0 }) };
-
-    std::string shader(R"(
-        #version 450
-
-        layout (local_size_x = 1) in;
-
-        layout(set = 0, binding = 0) buffer a { float pa[]; };
-        layout(set = 0, binding = 1) buffer b { float pb[]; };
-
-        void main() {
-            uint index = gl_GlobalInvocationID.x;
-            pb[index] = pa[index] + 1;
-        }
-    )");
-
-    mgr.rebuild({ tensorA, tensorB }, false);
-
-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("default");
-
-        sq->begin();
-
-        sq->record<kp::OpTensorSyncDevice>({ tensorA, tensorB });
-
-        sq->end();
-
-        sq->eval();
-    }
-
-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("run");
-
-        sq->begin();
-
-        sq->record<kp::OpAlgoBase>(
-          { tensorA, tensorB },
-          kp::Shader::compile_source(shader));
-
-        sq->record<kp::OpTensorCopy>({ tensorB, tensorA });
-        sq->end();
-
-        for (size_t i = 0; i < TOTAL_ITER; i++) {
-            sq->eval();
-        }
-    }
-
-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("export");
-
-        sq->begin();
-
-        sq->record<kp::OpTensorSyncLocal>({ tensorA, tensorB });
-
-        sq->end();
-
-        sq->eval();
-    }
-
-    EXPECT_EQ(tensorA->data(), testExpectedOutVec);
-}
--- a/test/TestOpShadersFromStringAndFile.cpp
+++ b/test/TestOpShadersFromStringAndFile.cpp
@ -5,13 +5,12 @@

 #include "kompute_test/shaders/shadertest_op_custom_shader.hpp"

-TEST(TestOpAlgoBase, ShaderRawDataFromConstructor)
+TEST(TestOpAlgoCreate, ShaderRawDataFromConstructor)
 {
    kp::Manager mgr;

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 3, 4, 5 }) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor({ 0, 0, 0 }) };
-    mgr.rebuild({ tensorA, tensorB });
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor({ 3, 4, 5 });
+    std::shared_ptr<kp::Tensor> tensorB = mgr.tensor({ 0, 0, 0 });

    std::string shader(R"(
        #version 450
@ -28,50 +27,60 @@ TEST(TestOpAlgoBase, ShaderRawDataFromConstructor)
        }
    )");

-    mgr.evalOpDefault<kp::OpAlgoBase>(
-      { tensorA, tensorB }, kp::Shader::compile_source(shader));
+    std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);

-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA, tensorB });
+    std::vector<std::shared_ptr<kp::Tensor>> params = { tensorA, tensorB };
+
+    mgr.sequence()
+      ->eval<kp::OpTensorSyncDevice>(params)
+      ->eval<kp::OpAlgoDispatch>(mgr.algorithm(params, spirv))
+      ->eval<kp::OpTensorSyncLocal>(params);

    EXPECT_EQ(tensorA->data(), std::vector<float>({ 0, 1, 2 }));
    EXPECT_EQ(tensorB->data(), std::vector<float>({ 3, 4, 5 }));
 }

-TEST(TestOpAlgoBase, ShaderCompiledDataFromConstructor)
+TEST(TestOpAlgoCreate, ShaderCompiledDataFromConstructor)
 {
    kp::Manager mgr;

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 3, 4, 5 }) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor({ 0, 0, 0 }) };
-    mgr.rebuild({ tensorA, tensorB });
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor({ 3, 4, 5 });
+    std::shared_ptr<kp::Tensor> tensorB = mgr.tensor({ 0, 0, 0 });

-    mgr.evalOpDefault<kp::OpAlgoBase>(
-      { tensorA, tensorB },
-      std::vector<uint32_t>(
-        (uint32_t*)kp::shader_data::test_shaders_glsl_test_op_custom_shader_comp_spv,
-        (uint32_t*)(kp::shader_data::test_shaders_glsl_test_op_custom_shader_comp_spv +
-          kp::shader_data::
-            test_shaders_glsl_test_op_custom_shader_comp_spv_len)));
+    std::vector<uint32_t> spirv = std::vector<uint32_t>(
+      (uint32_t*)
+        kp::shader_data::test_shaders_glsl_test_op_custom_shader_comp_spv,
+      (uint32_t*)(kp::shader_data::
+                    test_shaders_glsl_test_op_custom_shader_comp_spv +
+                  kp::shader_data::
+                    test_shaders_glsl_test_op_custom_shader_comp_spv_len));

-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA, tensorB });
+    std::vector<std::shared_ptr<kp::Tensor>> params = { tensorA, tensorB };
+
+    mgr.sequence()
+      ->eval<kp::OpTensorSyncDevice>(params)
+      ->eval<kp::OpAlgoDispatch>(mgr.algorithm(params, spirv))
+      ->eval<kp::OpTensorSyncLocal>(params);

    EXPECT_EQ(tensorA->data(), std::vector<float>({ 0, 1, 2 }));
    EXPECT_EQ(tensorB->data(), std::vector<float>({ 3, 4, 5 }));
 }

-TEST(TestOpAlgoBase, ShaderCompiledDataFromFile)
-{
-    kp::Manager mgr;
-
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 3, 4, 5 }) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor({ 0, 0, 0 }) };
-    mgr.rebuild({ tensorA, tensorB });
-
-    mgr.evalOpDefault<kp::OpAlgoBase>(
-      { tensorA, tensorB }, "test/shaders/glsl/test_op_custom_shader.comp.spv");
-
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA, tensorB });
-
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 0, 1, 2 }));
-    EXPECT_EQ(tensorB->data(), std::vector<float>({ 3, 4, 5 }));
-}
+// TODO: Add support to read from file for shader
+// TEST(TestOpAlgoCreate, ShaderCompiledDataFromFile)
+//{
+//    kp::Manager mgr;
+//
+//    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 3, 4, 5 }) };
+//    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor({ 0, 0, 0 }) };
+//    mgr.rebuild({ tensorA, tensorB });
+//
+//    mgr.evalOpDefault<kp::OpAlgoCreate>(
+//      { tensorA, tensorB },
+//      "test/shaders/glsl/test_op_custom_shader.comp.spv");
+//
+//    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA, tensorB });
+//
+//    EXPECT_EQ(tensorA->data(), std::vector<float>({ 0, 1, 2 }));
+//    EXPECT_EQ(tensorB->data(), std::vector<float>({ 3, 4, 5 }));
+//}
--- a/test/TestOpTensorCopy.cpp
+++ b/test/TestOpTensorCopy.cpp
@ -11,20 +11,18 @@ TEST(TestOpTensorCopy, CopyDeviceToDeviceTensor)
    std::vector<float> testVecA{ 1, 2, 3 };
    std::vector<float> testVecB{ 0, 0, 0 };

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(testVecB) };
-
-    mgr.rebuild({ tensorA, tensorB });
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor(testVecA);
+    std::shared_ptr<kp::Tensor> tensorB = mgr.tensor(testVecB);

    EXPECT_TRUE(tensorA->isInit());
    EXPECT_TRUE(tensorB->isInit());

-    mgr.evalOpDefault<kp::OpTensorCopy>({ tensorA, tensorB });
-
-    EXPECT_EQ(tensorA->data(), tensorB->data());
+    mgr.sequence()
+      ->eval<kp::OpTensorSyncDevice>({ tensorA, tensorB })
+      ->eval<kp::OpTensorCopy>({ tensorA, tensorB })
+      ->eval<kp::OpTensorSyncLocal>({ tensorA, tensorB });

    // Making sure the GPU holds the same data
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorB });
    EXPECT_EQ(tensorA->data(), tensorB->data());
 }

@ -37,23 +35,24 @@ TEST(TestOpTensorCopy, CopyDeviceToDeviceTensorMulti)
    std::vector<float> testVecB{ 0, 0, 0 };
    std::vector<float> testVecC{ 0, 0, 0 };

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(testVecB) };
-    std::shared_ptr<kp::Tensor> tensorC{ new kp::Tensor(testVecC) };
-
-    mgr.rebuild({ tensorA, tensorB, tensorC });
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor(testVecA);
+    std::shared_ptr<kp::Tensor> tensorB = mgr.tensor(testVecB);
+    std::shared_ptr<kp::Tensor> tensorC = mgr.tensor(testVecC);

    EXPECT_TRUE(tensorA->isInit());
    EXPECT_TRUE(tensorB->isInit());
    EXPECT_TRUE(tensorC->isInit());

-    mgr.evalOpDefault<kp::OpTensorCopy>({ tensorA, tensorB, tensorC });
+    mgr.sequence()
+      ->eval<kp::OpTensorSyncLocal>({ tensorA, tensorB, tensorC })
+      ->eval<kp::OpTensorCopy>({ tensorA, tensorB, tensorC });

    EXPECT_EQ(tensorA->data(), tensorB->data());
    EXPECT_EQ(tensorA->data(), tensorC->data());

    // Making sure the GPU holds the same data
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorB, tensorC });
+    mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorB, tensorC });
+
    EXPECT_EQ(tensorA->data(), tensorB->data());
    EXPECT_EQ(tensorA->data(), tensorC->data());
 }
@ -66,24 +65,22 @@ TEST(TestOpTensorCopy, CopyDeviceToHostTensor)
    std::vector<float> testVecA{ 3, 4, 5 };
    std::vector<float> testVecB{ 0, 0, 0 };

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(
-      testVecB, kp::Tensor::TensorTypes::eHost) };
-
-    mgr.rebuild({ tensorA, tensorB }, false);
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor(testVecA);
+    std::shared_ptr<kp::Tensor> tensorB =
+      mgr.tensor(testVecB, kp::Tensor::TensorTypes::eHost);

    //  Only calling sync on device type tensor
-    mgr.evalOpDefault<kp::OpTensorSyncDevice>({ tensorA });
+    mgr.sequence()->eval<kp::OpTensorSyncDevice>({ tensorA });

    EXPECT_TRUE(tensorA->isInit());
    EXPECT_TRUE(tensorB->isInit());

-    mgr.evalOpDefault<kp::OpTensorCopy>({ tensorA, tensorB });
+    mgr.sequence()->eval<kp::OpTensorCopy>({ tensorA, tensorB });

    EXPECT_EQ(tensorA->data(), tensorB->data());

    // Making sure the GPU holds the same data
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorB });
+    mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorB });
    EXPECT_EQ(tensorA->data(), tensorB->data());
 }

@ -95,27 +92,22 @@ TEST(TestOpTensorCopy, CopyHostToDeviceTensor)
    std::vector<float> testVecA{ 4, 5, 6 };
    std::vector<float> testVecB{ 0, 0, 0 };

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(
-      testVecA, kp::Tensor::TensorTypes::eHost) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(testVecB) };
-
-    mgr.rebuild({ tensorA, tensorB }, false);
-
-    // Manually copy data into host memory of Tensor
-    tensorA->mapDataIntoHostMemory();
+    std::shared_ptr<kp::Tensor> tensorA =
+      mgr.tensor(testVecA, kp::Tensor::TensorTypes::eHost);
+    std::shared_ptr<kp::Tensor> tensorB = mgr.tensor(testVecB);

    //  Only calling sync on device type tensor
-    mgr.evalOpDefault<kp::OpTensorSyncDevice>({ tensorB });
+    mgr.sequence()->eval<kp::OpTensorSyncDevice>({ tensorA, tensorB });

    EXPECT_TRUE(tensorA->isInit());
    EXPECT_TRUE(tensorB->isInit());

-    mgr.evalOpDefault<kp::OpTensorCopy>({ tensorA, tensorB });
+    mgr.sequence()->eval<kp::OpTensorCopy>({ tensorA, tensorB });

    EXPECT_EQ(tensorA->data(), tensorB->data());

    // Making sure the GPU holds the same data
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorB });
+    mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorB });
    EXPECT_EQ(tensorA->data(), tensorB->data());
 }

@ -127,22 +119,22 @@ TEST(TestOpTensorCopy, CopyHostToHostTensor)
    std::vector<float> testVecA{ 5, 6, 7 };
    std::vector<float> testVecB{ 0, 0, 0 };

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(
-      testVecA, kp::Tensor::TensorTypes::eHost) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(
-      testVecB, kp::Tensor::TensorTypes::eHost) };
-
-    mgr.rebuild({ tensorA, tensorB });
+    std::shared_ptr<kp::Tensor> tensorA =
+      mgr.tensor(testVecA, kp::Tensor::TensorTypes::eHost);
+    std::shared_ptr<kp::Tensor> tensorB =
+      mgr.tensor(testVecB, kp::Tensor::TensorTypes::eHost);

    EXPECT_TRUE(tensorA->isInit());
    EXPECT_TRUE(tensorB->isInit());

-    mgr.evalOpDefault<kp::OpTensorCopy>({ tensorA, tensorB });
+    mgr.sequence()
+      ->eval<kp::OpTensorSyncDevice>({ tensorA })
+      ->eval<kp::OpTensorCopy>({ tensorA, tensorB });

    EXPECT_EQ(tensorA->data(), tensorB->data());

    // Making sure the GPU holds the same data
-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorB });
+    mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorB });
    EXPECT_EQ(tensorA->data(), tensorB->data());
 }

@ -153,13 +145,11 @@ TEST(TestOpTensorCopy, SingleTensorShouldFail)

    std::vector<float> testVecA{ 6, 7, 8 };

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(
-      testVecA, kp::Tensor::TensorTypes::eHost) };
-
-    mgr.rebuild({ tensorA }, false);
+    std::shared_ptr<kp::Tensor> tensorA =
+      mgr.tensor(testVecA, kp::Tensor::TensorTypes::eHost);

    EXPECT_TRUE(tensorA->isInit());

-    EXPECT_THROW(mgr.evalOpDefault<kp::OpTensorCopy>({ tensorA }),
+    EXPECT_THROW(mgr.sequence()->eval<kp::OpTensorCopy>({ tensorA }),
                 std::runtime_error);
 }
--- a/test/TestOpTensorCreate.cpp
+++ b/test/TestOpTensorCreate.cpp
@ -6,12 +6,12 @@
 TEST(TestOpTensorCreate, CreateSingleTensorSingleOp)
 {
    std::vector<float> testVecA{ 9, 8, 7 };
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
+    std::shared_ptr<kp::Tensor> tensorA = nullptr;

    {
        kp::Manager mgr;

-        mgr.rebuild({ tensorA });
+        tensorA = mgr.tensor(testVecA);

        EXPECT_TRUE(tensorA->isInit());

@ -21,120 +21,23 @@ TEST(TestOpTensorCreate, CreateSingleTensorSingleOp)
    EXPECT_FALSE(tensorA->isInit());
 }

-TEST(TestOpTensorCreate, CreateMultipleTensorSingleOp)
-{
-
-    kp::Manager mgr;
-
-    std::vector<float> testVecA{ 9, 8, 7 };
-    std::vector<float> testVecB{ 6, 5, 4 };
-
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(testVecB) };
-
-    mgr.rebuild({ tensorA, tensorB });
-
-    EXPECT_TRUE(tensorA->isInit());
-    EXPECT_TRUE(tensorB->isInit());
-
-    EXPECT_EQ(tensorA->data(), testVecA);
-    EXPECT_EQ(tensorB->data(), testVecB);
-}
-
-TEST(TestOpTensorCreate, CreateMultipleTensorMultipleOp)
-{
-
-    kp::Manager mgr;
-
-    std::vector<float> testVecA{ 9, 8, 7 };
-    std::vector<float> testVecB{ 6, 5, 4 };
-
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(testVecB) };
-
-    mgr.rebuild({ tensorA });
-    mgr.rebuild({ tensorB });
-
-    EXPECT_TRUE(tensorA->isInit());
-    EXPECT_TRUE(tensorB->isInit());
-
-    EXPECT_EQ(tensorA->data(), testVecA);
-    EXPECT_EQ(tensorB->data(), testVecB);
-}
-
-TEST(TestOpTensorCreate, TestTensorMemoryManagedByManagerDestroyed)
-{
-
-    std::vector<float> testVecA{ 9, 8, 7 };
-    std::vector<float> testVecB{ 6, 5, 4 };
-
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(testVecB) };
-
-    {
-        kp::Manager mgr;
-        mgr.rebuild({ tensorA });
-        mgr.rebuild({ tensorB });
-
-        EXPECT_TRUE(tensorA->isInit());
-        EXPECT_TRUE(tensorB->isInit());
-
-        EXPECT_EQ(tensorA->data(), testVecA);
-        EXPECT_EQ(tensorB->data(), testVecB);
-    }
-
-    EXPECT_FALSE(tensorA->isInit());
-    EXPECT_FALSE(tensorB->isInit());
-}
-
-TEST(TestOpTensorCreate, TestTensorMemoryManagedByManagerNOTDestroyed)
-{
-
-    std::vector<float> testVecA{ 9, 8, 7 };
-    std::vector<float> testVecB{ 6, 5, 4 };
-
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(testVecB) };
-
-    kp::Manager mgr;
-
-    {
-        mgr.rebuild({ tensorA });
-        mgr.rebuild({ tensorB });
-
-        EXPECT_TRUE(tensorA->isInit());
-        EXPECT_TRUE(tensorB->isInit());
-
-        EXPECT_EQ(tensorA->data(), testVecA);
-        EXPECT_EQ(tensorB->data(), testVecB);
-    }
-
-    EXPECT_TRUE(tensorA->isInit());
-    EXPECT_TRUE(tensorB->isInit());
-}
-
 TEST(TestOpTensorCreate, NoErrorIfTensorFreedBefore)
 {

    std::vector<float> testVecA{ 9, 8, 7 };
    std::vector<float> testVecB{ 6, 5, 4 };

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(testVecB) };
-
    kp::Manager mgr;

-    mgr.rebuild({ tensorA });
-    mgr.rebuild({ tensorB });
-
-    EXPECT_TRUE(tensorA->isInit());
-    EXPECT_TRUE(tensorB->isInit());
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor(testVecA);
+    std::shared_ptr<kp::Tensor> tensorB = mgr.tensor(testVecB);

    EXPECT_EQ(tensorA->data(), testVecA);
    EXPECT_EQ(tensorB->data(), testVecB);

-    tensorA->freeMemoryDestroyGPUResources();
-    tensorB->freeMemoryDestroyGPUResources();
+    tensorA->destroy();
+    tensorB->destroy();
+
    EXPECT_FALSE(tensorA->isInit());
    EXPECT_FALSE(tensorB->isInit());
 }
@ -143,12 +46,10 @@ TEST(TestOpTensorCreate, ExceptionOnZeroSizeTensor)
 {
    std::vector<float> testVecA;

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecA) };
-
    kp::Manager mgr;

    try {
-        mgr.rebuild({ tensorA });
+        std::shared_ptr<kp::Tensor> tensorA = mgr.tensor(testVecA);
    } catch (const std::runtime_error& err) {
        // check exception
        ASSERT_TRUE(std::string(err.what()).find("zero-sized") !=
--- a/test/TestOpTensorSync.cpp
+++ b/test/TestOpTensorSync.cpp
@ -11,17 +11,15 @@ TEST(TestOpTensorSync, SyncToDeviceMemorySingleTensor)
    std::vector<float> testVecPreA{ 0, 0, 0 };
    std::vector<float> testVecPostA{ 9, 8, 7 };

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(testVecPreA) };
-
-    mgr.rebuild({ tensorA }, false);
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor(testVecPreA);

    EXPECT_TRUE(tensorA->isInit());

    tensorA->setData(testVecPostA);

-    mgr.evalOpDefault<kp::OpTensorSyncDevice>({ tensorA });
+    mgr.sequence()->eval<kp::OpTensorSyncDevice>({ tensorA });

-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA });
+    mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorA });

    EXPECT_EQ(tensorA->data(), testVecPostA);
 }
@ -33,11 +31,9 @@ TEST(TestOpTensorSync, SyncToDeviceMemoryMultiTensor)

    std::vector<float> testVec{ 9, 8, 7 };

-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor({ 0, 0, 0 }) };
-    std::shared_ptr<kp::Tensor> tensorC{ new kp::Tensor({ 0, 0, 0 }) };
-
-    mgr.rebuild({ tensorA, tensorB, tensorC }, false);
+    std::shared_ptr<kp::Tensor> tensorA = mgr.tensor({ 0, 0, 0 });
+    std::shared_ptr<kp::Tensor> tensorB = mgr.tensor({ 0, 0, 0 });
+    std::shared_ptr<kp::Tensor> tensorC = mgr.tensor({ 0, 0, 0 });

    EXPECT_TRUE(tensorA->isInit());
    EXPECT_TRUE(tensorB->isInit());
@ -45,11 +41,11 @@ TEST(TestOpTensorSync, SyncToDeviceMemoryMultiTensor)

    tensorA->setData(testVec);

-    mgr.evalOpDefault<kp::OpTensorSyncDevice>({ tensorA });
+    mgr.sequence()->eval<kp::OpTensorSyncDevice>({ tensorA });

-    mgr.evalOpDefault<kp::OpTensorCopy>({ tensorA, tensorB, tensorC });
+    mgr.sequence()->eval<kp::OpTensorCopy>({ tensorA, tensorB, tensorC });

-    mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA, tensorB, tensorC });
+    mgr.sequence()->eval<kp::OpTensorSyncLocal>({ tensorA, tensorB, tensorC });

    EXPECT_EQ(tensorA->data(), testVec);
    EXPECT_EQ(tensorB->data(), testVec);
--- a/test/TestPushConstant.cpp
+++ b/test/TestPushConstant.cpp
@ -0,0 +1,49 @@
+#include "gtest/gtest.h"
+
+#include "kompute/Kompute.hpp"
+
+#include "fmt/ranges.h"
+
+TEST(TestPushConstants, TestTwoConstants)
+{
+    {
+        std::string shader(R"(
+          #version 450
+          layout(push_constant) uniform PushConstants {
+            float x;
+            float y;
+            float z;
+          } pcs;
+          layout (local_size_x = 1) in;
+          layout(set = 0, binding = 0) buffer a { float pa[]; };
+          void main() {
+              pa[0] += pcs.x;
+              pa[1] += pcs.y;
+              pa[2] += pcs.z;
+          })");
+
+        std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);
+
+        std::shared_ptr<kp::Sequence> sq = nullptr;
+
+        {
+            kp::Manager mgr;
+
+            std::shared_ptr<kp::Tensor> tensor = mgr.tensor({ 0, 0, 0 });
+
+            std::shared_ptr<kp::Algorithm> algo =
+              mgr.algorithm({ tensor }, spirv, kp::Workgroup({ 1 }));
+
+            sq = mgr.sequence()
+                   ->record<kp::OpTensorSyncDevice>({ tensor })
+                   ->record<kp::OpAlgoDispatch>(algo,
+                                                kp::Constants{ 0.1, 0.2, 0.3 })
+                   ->record<kp::OpAlgoDispatch>(algo,
+                                                kp::Constants{ 0.3, 0.2, 0.1 })
+                   ->record<kp::OpTensorSyncLocal>({ tensor })
+                   ->eval();
+
+            EXPECT_EQ(tensor->data(), kp::Constants({ 0.4, 0.4, 0.4 }));
+        }
+    }
+}
--- a/test/TestSequence.cpp
+++ b/test/TestSequence.cpp
@ -3,28 +3,6 @@

 #include "kompute/Kompute.hpp"

-TEST(TestSequence, CmdBufSequenceBeginEnd)
-{
-    kp::Manager mgr;
-
-    {
-        std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("newSequence");
-
-        EXPECT_TRUE(sq->eval());
-        EXPECT_TRUE(!sq->isRecording());
-        EXPECT_TRUE(sq->begin());
-        EXPECT_TRUE(sq->isRecording());
-        EXPECT_TRUE(!sq->begin());
-        EXPECT_TRUE(sq->isRecording());
-        EXPECT_TRUE(sq->end());
-        EXPECT_TRUE(!sq->isRecording());
-        EXPECT_TRUE(!sq->end());
-        EXPECT_TRUE(!sq->isRecording());
-        EXPECT_TRUE(sq->eval());
-    }
-}
-
 TEST(TestSequence, SequenceDestructorViaManager)
 {
    std::shared_ptr<kp::Sequence> sq = nullptr;
@ -32,11 +10,10 @@ TEST(TestSequence, SequenceDestructorViaManager)
    {
        kp::Manager mgr;

-        sq = mgr.sequence("newSequence");
+        sq = mgr.sequence();

        EXPECT_TRUE(sq->isInit());
    }

    EXPECT_FALSE(sq->isInit());
 }
-
--- a/test/TestSpecializationConstant.cpp
+++ b/test/TestSpecializationConstant.cpp
@ -4,46 +4,46 @@

 TEST(TestSpecializationConstants, TestTwoConstants)
 {
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor({ 0, 0, 0 }) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor({ 0, 0, 0 }) };
-
-    std::string shader(R"(
-      #version 450
-      layout (constant_id = 0) const float cOne = 1;
-      layout (constant_id = 1) const float cTwo = 1;
-      layout (local_size_x = 1) in;
-      layout(set = 0, binding = 0) buffer a { float pa[]; };
-      layout(set = 0, binding = 1) buffer b { float pb[]; };
-      void main() {
-          uint index = gl_GlobalInvocationID.x;
-          pa[index] = cOne;
-          pb[index] = cTwo;
-      })");
-
    {
+        std::string shader(R"(
+          #version 450
+          layout (constant_id = 0) const float cOne = 1;
+          layout (constant_id = 1) const float cTwo = 1;
+          layout (local_size_x = 1) in;
+          layout(set = 0, binding = 0) buffer a { float pa[]; };
+          layout(set = 0, binding = 1) buffer b { float pb[]; };
+          void main() {
+              uint index = gl_GlobalInvocationID.x;
+              pa[index] = cOne;
+              pb[index] = cTwo;
+          })");
+
+        std::vector<uint32_t> spirv = kp::Shader::compile_source(shader);
+
        std::shared_ptr<kp::Sequence> sq = nullptr;

        {
            kp::Manager mgr;

-            mgr.rebuild({ tensorA, tensorB });
+            std::shared_ptr<kp::Tensor> tensorA = mgr.tensor({ 0, 0, 0 });
+            std::shared_ptr<kp::Tensor> tensorB = mgr.tensor({ 0, 0, 0 });

-            sq = mgr.sequence();
+            std::vector<std::shared_ptr<kp::Tensor>> params = { tensorA,
+                                                                tensorB };

-            auto spec = kp::Constants({5.0, 0.3});
+            kp::Constants spec = kp::Constants({ 5.0, 0.3 });

-            sq->begin();
-            sq->record<kp::OpAlgoBase>(
-              { tensorA, tensorB },
-              kp::Shader::compile_source(shader),
-              kp::Workgroup(), spec);
-            sq->end();
+            std::shared_ptr<kp::Algorithm> algo =
+              mgr.algorithm(params, spirv, {}, spec);

-            sq->eval();
+            sq = mgr.sequence()
+                   ->record<kp::OpTensorSyncDevice>(params)
+                   ->record<kp::OpAlgoDispatch>(algo)
+                   ->record<kp::OpTensorSyncLocal>(params)
+                   ->eval();

-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA, tensorB });
+            EXPECT_EQ(tensorA->data(), std::vector<float>({ 5, 5, 5 }));
+            EXPECT_EQ(tensorB->data(), std::vector<float>({ 0.3, 0.3, 0.3 }));
        }
    }
-    EXPECT_EQ(tensorA->data(), std::vector<float>({ 5, 5, 5 }));
-    EXPECT_EQ(tensorB->data(), std::vector<float>({ 0.3, 0.3, 0.3 }));
 }
--- a/test/TestTensor.cpp
+++ b/test/TestTensor.cpp
@ -5,36 +5,9 @@

 TEST(TestTensor, ConstructorData)
 {
-    std::vector<float> vec{ 0, 1, 2 };
-    kp::Tensor tensor(vec);
-    EXPECT_EQ(tensor.size(), vec.size());
-    EXPECT_EQ(tensor.data(), vec);
-}
-
-TEST(TestTensor, CopyFromHostData)
-{
-    std::vector<float> vecA{ 0, 1, 2 };
-    std::vector<float> vecB{ 0, 0, 0 };
-
-    std::shared_ptr<kp::Tensor> tensorA =
-      std::make_shared<kp::Tensor>(vecA, kp::Tensor::TensorTypes::eHost);
-    std::shared_ptr<kp::Tensor> tensorB =
-      std::make_shared<kp::Tensor>(vecB, kp::Tensor::TensorTypes::eHost);
-
    kp::Manager mgr;
-
-    mgr.rebuild({ tensorA, tensorB });
-
-    if (std::shared_ptr<kp::Sequence> sq =
-          mgr.sequence("new")) {
-        sq->begin();
-
-        sq->record<kp::OpTensorCopy>({ tensorA, tensorB });
-
-        sq->end();
-
-        sq->eval();
-    }
-
-    EXPECT_EQ(tensorA->data(), tensorB->data());
+    std::vector<float> vec{ 0, 1, 2 };
+    std::shared_ptr<kp::Tensor> tensor = mgr.tensor(vec);
+    EXPECT_EQ(tensor->size(), vec.size());
+    EXPECT_EQ(tensor->data(), vec);
 }
--- a/test/TestWorkgroup.cpp
+++ b/test/TestWorkgroup.cpp
@ -5,44 +5,63 @@

 #include "kompute_test/shaders/shadertest_workgroup.hpp"

-
 TEST(TestWorkgroup, TestSimpleWorkgroup)
 {
-    std::shared_ptr<kp::Tensor> tensorA{ new kp::Tensor(std::vector<float>(16 * 8)) };
-    std::shared_ptr<kp::Tensor> tensorB{ new kp::Tensor(std::vector<float>(16 * 8)) };
-
+    std::shared_ptr<kp::Tensor> tensorA = nullptr;
+    std::shared_ptr<kp::Tensor> tensorB = nullptr;
    {
        std::shared_ptr<kp::Sequence> sq = nullptr;

        {
            kp::Manager mgr;

-            mgr.rebuild({ tensorA, tensorB });
+            tensorA = mgr.tensor(std::vector<float>(16 * 8));
+            tensorB = mgr.tensor(std::vector<float>(16 * 8));

-            kp::Workgroup workgroup = {16, 8, 1};
+            std::vector<std::shared_ptr<kp::Tensor>> params = { tensorA,
+                                                                tensorB };
+
+            std::vector<uint32_t> spirv(
+              (uint32_t*)
+                kp::shader_data::test_shaders_glsl_test_workgroup_comp_spv,
+              (uint32_t*)(kp::shader_data::
+                            test_shaders_glsl_test_workgroup_comp_spv +
+                          kp::shader_data::
+                            test_shaders_glsl_test_workgroup_comp_spv_len));
+
+            kp::Workgroup workgroup = { 16, 8, 1 };
+
+            std::shared_ptr<kp::Algorithm> algorithm =
+              mgr.algorithm(params, spirv, workgroup);

            sq = mgr.sequence();
-            sq->begin();
-            sq->record<kp::OpAlgoBase>(
-              { tensorA, tensorB },
-              std::vector<uint32_t>(
-                (uint32_t*)kp::shader_data::test_shaders_glsl_test_workgroup_comp_spv,
-                (uint32_t*)(kp::shader_data::test_shaders_glsl_test_workgroup_comp_spv +
-                  kp::shader_data::test_shaders_glsl_test_workgroup_comp_spv_len)),
-                workgroup);
-            sq->end();
-
+            sq->record<kp::OpTensorSyncDevice>(params);
+            sq->record<kp::OpAlgoDispatch>(algorithm);
+            sq->record<kp::OpTensorSyncLocal>(params);
            sq->eval();
-
-            mgr.evalOpDefault<kp::OpTensorSyncLocal>({ tensorA, tensorB });
        }
    }

-    std::vector<float> expectedA = { 0,  0,  0,  0,  0,  0,  0,  0,  1,  1,  1,  1,  1,  1,  1,  1,  2,  2,  2,  2,  2,  2,  2,  2,  3,  3,  3,  3,  3,  3,  3,  3,  4,  4,  4,  4,  4,  4,  4,  4,  5,  5,  5,  5,  5,  5,  5,  5,  6,  6,  6,  6,  6,  6,  6,  6,  7,  7,  7,  7,  7,  7,  7,  7,  8,  8,  8,  8,  8,  8,  8,  8,  9,  9,  9,  9,  9,  9,  9,  9, 10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 11, 11, 11, 11, 11, 12, 12, 12, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 13, 13, 14, 14, 14, 14, 14, 14, 14, 14, 15, 15, 15, 15, 15, 15, 15, 15};
+    std::vector<float> expectedA = {
+        0,  0,  0,  0,  0,  0,  0,  0,  1,  1,  1,  1,  1,  1,  1,  1,
+        2,  2,  2,  2,  2,  2,  2,  2,  3,  3,  3,  3,  3,  3,  3,  3,
+        4,  4,  4,  4,  4,  4,  4,  4,  5,  5,  5,  5,  5,  5,  5,  5,
+        6,  6,  6,  6,  6,  6,  6,  6,  7,  7,  7,  7,  7,  7,  7,  7,
+        8,  8,  8,  8,  8,  8,  8,  8,  9,  9,  9,  9,  9,  9,  9,  9,
+        10, 10, 10, 10, 10, 10, 10, 10, 11, 11, 11, 11, 11, 11, 11, 11,
+        12, 12, 12, 12, 12, 12, 12, 12, 13, 13, 13, 13, 13, 13, 13, 13,
+        14, 14, 14, 14, 14, 14, 14, 14, 15, 15, 15, 15, 15, 15, 15, 15
+    };

-    std::vector<float> expectedB = { 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7 };
+    std::vector<float> expectedB = {
+        0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5,
+        6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3,
+        4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1,
+        2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7,
+        0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5,
+        6, 7, 0, 1, 2, 3, 4, 5, 6, 7, 0, 1, 2, 3, 4, 5, 6, 7
+    };

    EXPECT_EQ(tensorA->data(), expectedA);
    EXPECT_EQ(tensorB->data(), expectedB);
 }
-