doc/html/matrix__solve_8hpp_source.html

 #ifndef VIENNACL_LINALG_OPENCL_KERNELS_MATRIX_SOLVE_HPP

 #define VIENNACL_LINALG_OPENCL_KERNELS_MATRIX_SOLVE_HPP


 /* =========================================================================

    Copyright (c) 2010-2015, Institute for Microelectronics,

                             Institute for Analysis and Scientific Computing,

                             TU Wien.

    Portions of this software are copyright by UChicago Argonne, LLC.


                             -----------------

                   ViennaCL - The Vienna Computing Library

                             -----------------


    Project Head:    Karl Rupp                   rupp@iue.tuwien.ac.at


    (A list of authors and contributors can be found in the manual)


    License:         MIT (X11), see file LICENSE in the base directory

 ============================================================================= */


 #include "viennacl/tools/tools.hpp"

 #include "viennacl/ocl/kernel.hpp"

 #include "viennacl/ocl/platform.hpp"

 #include "viennacl/ocl/utils.hpp"


 #include "viennacl/linalg/opencl/kernels/matrix.hpp"


 namespace viennacl

 {

 namespace linalg

 {

 namespace opencl

 {

 namespace kernels

 {


 template<typename StringT>

 void generate_matrix_solve_blas3(StringT & source, std::string const & numeric_string,

                                  bool row_major_A, bool row_major_B,

                                  bool upper_solve, bool unit_diagonal)

 {

   //start OpenCL code:

   source.append("__kernel void ");

   if (unit_diagonal)

     source.append("unit_");

   if (upper_solve)

     source.append("upper_");

   else

     source.append("lower_");

   source.append("solve");


   source.append("( \n");

   source.append("  __global const "); source.append(numeric_string); source.append(" * A, \n");

   source.append("  unsigned int A_start1, unsigned int A_start2, \n");

   source.append("  unsigned int A_inc1,   unsigned int A_inc2, \n");

   source.append("  unsigned int A_size1,  unsigned int A_size2, \n");

   source.append("  unsigned int A_internal_size1, unsigned int A_internal_size2, \n");

   source.append("  __global "); source.append(numeric_string); source.append(" * B, \n");

   source.append("  unsigned int B_start1, unsigned int B_start2, \n");

   source.append("  unsigned int B_inc1,   unsigned int B_inc2, \n");

   source.append("  unsigned int B_size1,  unsigned int B_size2, \n");

   source.append("  unsigned int B_internal_size1, unsigned int B_internal_size2) { \n");

   source.append("  "); source.append(numeric_string); source.append(" temp;  \n");

   if (upper_solve)

   {

     //Note: A is square, thus A_rows == A_cols and no dispatch for transposedness needed

     source.append("  for (unsigned int row_cnt = 0; row_cnt < A_size1; ++row_cnt)  \n");

     source.append("  {  \n");

     source.append("    unsigned int row = A_size1 - 1 - row_cnt; \n");

   }

   else //lower triangular solve

   {

     source.append("  for (unsigned int row = 0; row < A_size1; ++row) \n");

     source.append("  { \n");

   }


   if (!unit_diagonal)

   {

     source.append("    barrier(CLK_GLOBAL_MEM_FENCE); \n");

     source.append("    if (get_local_id(0) == 0)  \n");

     //Note: A is square, thus A_internal_rows == A_internal_cols and no dispatch for transposedness needed

     if (row_major_B)

       source.append("      B[(row * B_inc1 + B_start1) * B_internal_size2 + (get_group_id(0) * B_inc2 + B_start2)] /= ");

     else

       source.append("      B[(row * B_inc1 + B_start1) + (get_group_id(0) * B_inc2 + B_start2) * B_internal_size1] /= ");


     if (row_major_A)

       source.append("A[(row * A_inc1 + A_start1) * A_internal_size2 + (row * A_inc2 + A_start2)]; \n");

     else

       source.append("A[(row * A_inc1 + A_start1) + (row * A_inc2 + A_start2)*A_internal_size1]; \n");

   }


   source.append("    barrier(CLK_GLOBAL_MEM_FENCE); \n");


   if (row_major_B)

     source.append("    temp = B[(row * B_inc1 + B_start1) * B_internal_size2 + (get_group_id(0) * B_inc2 + B_start2)]; \n");

   else

     source.append("    temp = B[(row * B_inc1 + B_start1) + (get_group_id(0) * B_inc2 + B_start2) * B_internal_size1]; \n");


   source.append("    //eliminate column of op(A) with index 'row' in parallel: \n");

   if (upper_solve)

     source.append("    for  (unsigned int elim = get_local_id(0); elim < row; elim += get_local_size(0)) \n");

   else

     source.append("    for  (unsigned int elim = row + get_local_id(0) + 1; elim < A_size1; elim += get_local_size(0)) \n");


   if (row_major_B)

     source.append("      B[(elim * B_inc1 + B_start1) * B_internal_size2 + (get_group_id(0) * B_inc2 + B_start2)] -= temp * ");

   else

     source.append("      B[(elim * B_inc1 + B_start1) + (get_group_id(0) * B_inc2 + B_start2) * B_internal_size1] -= temp * ");


   if (row_major_A)

     source.append("A[(elim * A_inc1 + A_start1) * A_internal_size2 + (row * A_inc2 + A_start2)]; \n");

   else

     source.append("A[(elim * A_inc1 + A_start1) + (row * A_inc2 + A_start2) * A_internal_size1]; \n");


   source.append("   } \n");

   source.append("} \n");

 }


 // main kernel class

 template<typename NumericT, typename LayoutT1, typename LayoutT2>

 struct matrix_solve

 {

   static std::string program_name()

   {

     return viennacl::ocl::type_to_string<NumericT>::apply() + "_matrix_solve_" + detail::type_to_string(LayoutT1()) + detail::type_to_string(LayoutT2());

   }


   static void init(viennacl::ocl::context & ctx)

   {

     static std::map<cl_context, bool> init_done;

     if (!init_done[ctx.handle().get()])

     {

       viennacl::ocl::DOUBLE_PRECISION_CHECKER<NumericT>::apply(ctx);

       std::string numeric_string = viennacl::ocl::type_to_string<NumericT>::apply();

       bool matrix_row_major = viennacl::is_row_major<LayoutT1>::value;

       bool rhs_row_major    = viennacl::is_row_major<LayoutT2>::value;


       std::string source;

       source.reserve(8192);


       viennacl::ocl::append_double_precision_pragma<NumericT>(ctx, source);


       // only generate for floating points (forces error for integers)

       if (numeric_string == "float" || numeric_string == "double")

       {

         generate_matrix_solve_blas3(source, numeric_string, matrix_row_major, rhs_row_major,

                                     false, false);

         generate_matrix_solve_blas3(source, numeric_string, matrix_row_major, rhs_row_major,

                                     false, true);

         generate_matrix_solve_blas3(source, numeric_string, matrix_row_major, rhs_row_major,

                                     true, false);

         generate_matrix_solve_blas3(source, numeric_string, matrix_row_major, rhs_row_major,

                                     true, true);

       }


       std::string prog_name = program_name();

       #ifdef VIENNACL_BUILD_INFO

       std::cout << "Creating program " << prog_name << std::endl;

       #endif

       ctx.add_program(source, prog_name);

       init_done[ctx.handle().get()] = true;

     } //if

   } //init

 };


 }  // namespace kernels

 }  // namespace opencl

 }  // namespace linalg

 }  // namespace viennacl

 #endif


platform.hpp
Implements a OpenCL platform within ViennaCL.

viennacl::is_row_major
Helper class for checking whether a matrix has a row-major layout.
Definition: forwards.h:484

tools.hpp
Various little tools used here and there in ViennaCL.

viennacl::ocl::context
Manages an OpenCL context and provides the respective convenience functions for creating buffers...
Definition: context.hpp:55

utils.hpp
Provides OpenCL-related utilities.

viennacl::linalg::opencl::kernels::matrix_solve::program_name
static std::string program_name()
Definition: matrix_solve.hpp:132

viennacl::ocl::context::handle
const viennacl::ocl::handle< cl_context > & handle() const
Returns the context handle.
Definition: context.hpp:611

viennacl
Main namespace in ViennaCL. Holds all the basic types such as vector, matrix, etc. and defines operations upon them.
Definition: cpu_ram.hpp:34

viennacl::ocl::DOUBLE_PRECISION_CHECKER::apply
static void apply(viennacl::ocl::context const &)
Definition: utils.hpp:40

viennacl::ocl::handle::get
const OCL_TYPE & get() const
Definition: handle.hpp:189

viennacl::linalg::opencl::kernels::generate_matrix_solve_blas3
void generate_matrix_solve_blas3(StringT &source, std::string const &numeric_string, bool row_major_A, bool row_major_B, bool upper_solve, bool unit_diagonal)
Definition: matrix_solve.hpp:40

viennacl::linalg::opencl::kernels::matrix_solve
Main kernel class for the generation of matrix solve kernels.
Definition: matrix_solve.hpp:130

kernel.hpp
Representation of an OpenCL kernel in ViennaCL.

viennacl::linalg::opencl::kernels::detail::type_to_string
std::string type_to_string(viennacl::row_major)
Definition: matrix.hpp:481

viennacl::linalg::opencl::kernels::matrix_solve::init
static void init(viennacl::ocl::context &ctx)
Definition: matrix_solve.hpp:137

viennacl::ocl::type_to_string
Helper class for converting a type to its string representation.
Definition: utils.hpp:57

matrix.hpp
Runtime generation of OpenCL kernels for matrix operations.