doc/html/custom-context_8cpp_source.html

 /* =========================================================================

    Copyright (c) 2010-2015, Institute for Microelectronics,

                             Institute for Analysis and Scientific Computing,

                             TU Wien.

    Portions of this software are copyright by UChicago Argonne, LLC.


                             -----------------

                   ViennaCL - The Vienna Computing Library

                             -----------------


    Project Head:    Karl Rupp                   rupp@iue.tuwien.ac.at


    (A list of authors and contributors can be found in the PDF manual)


    License:         MIT (X11), see file LICENSE in the base directory

 ============================================================================= */


 // System headers

 #include <iostream>

 #include <string>


 #ifndef VIENNACL_WITH_OPENCL

   #define VIENNACL_WITH_OPENCL

 #endif


 // ViennaCL headers

 #include "viennacl/ocl/backend.hpp"

 #include "viennacl/vector.hpp"

 #include "viennacl/matrix.hpp"

 #include "viennacl/linalg/matrix_operations.hpp"

 #include "viennacl/linalg/norm_2.hpp"

 #include "viennacl/linalg/prod.hpp"


 static const char * my_compute_program =

 "__kernel void elementwise_prod(\n"

 "          __global const float * vec1,\n"

 "          __global const float * vec2, \n"

 "          __global float * result,\n"

 "          unsigned int size) \n"

 "{ \n"

 "  for (unsigned int i = get_global_id(0); i < size; i += get_global_size(0))\n"

 "    result[i] = vec1[i] * vec2[i];\n"

 "};\n";


 int main()

 {

   typedef float       ScalarType;


   //manually set up a custom OpenCL context:

   std::vector<cl_device_id> device_id_array;


   //get all available devices

   viennacl::ocl::platform pf;

   std::cout << "Platform info: " << pf.info() << std::endl;

   std::vector<viennacl::ocl::device> devices = pf.devices(CL_DEVICE_TYPE_DEFAULT);

   std::cout << devices[0].name() << std::endl;

   std::cout << "Number of devices for custom context: " << devices.size() << std::endl;


   //set up context using all found devices:

   for (std::size_t i=0; i<devices.size(); ++i)

   {

       device_id_array.push_back(devices[i].id());

   }


   std::cout << "Creating context..." << std::endl;

   cl_int err;

   cl_context my_context = clCreateContext(0, cl_uint(device_id_array.size()), &(device_id_array[0]), NULL, NULL, &err);

   VIENNACL_ERR_CHECK(err);


   //create two Vectors:

   unsigned int vector_size = 10;

   std::vector<ScalarType> vec1(vector_size);

   std::vector<ScalarType> vec2(vector_size);

   std::vector<ScalarType> result(vector_size);


   //

   // fill the operands vec1 and vec2:

   //

   for (unsigned int i=0; i<vector_size; ++i)

   {

     vec1[i] = static_cast<ScalarType>(i);

     vec2[i] = static_cast<ScalarType>(vector_size-i);

   }


   //

   // create memory in OpenCL context:

   //

   cl_mem mem_vec1 = clCreateBuffer(my_context, CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR, vector_size * sizeof(ScalarType), &(vec1[0]), &err);

   VIENNACL_ERR_CHECK(err);

   cl_mem mem_vec2 = clCreateBuffer(my_context, CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR, vector_size * sizeof(ScalarType), &(vec2[0]), &err);

   VIENNACL_ERR_CHECK(err);

   cl_mem mem_result = clCreateBuffer(my_context, CL_MEM_READ_WRITE | CL_MEM_COPY_HOST_PTR, vector_size * sizeof(ScalarType), &(result[0]), &err);

   VIENNACL_ERR_CHECK(err);


   //

   // create a command queue for each device:

   //


   std::vector<cl_command_queue> queues(devices.size());

   for (std::size_t i=0; i<devices.size(); ++i)

   {

     queues[i] = clCreateCommandQueue(my_context, devices[i].id(), 0, &err);

     VIENNACL_ERR_CHECK(err);

   }


   //

   // create and build a program in the context:

   //

   std::size_t source_len = std::string(my_compute_program).length();

   cl_program my_prog = clCreateProgramWithSource(my_context, 1, &my_compute_program, &source_len, &err);

   err = clBuildProgram(my_prog, 0, NULL, NULL, NULL, NULL);


 /*            char buffer[1024];

             cl_build_status status;

             clGetProgramBuildInfo(my_prog, devices[1].id(), CL_PROGRAM_BUILD_STATUS, sizeof(cl_build_status), &status, NULL);

             clGetProgramBuildInfo(my_prog, devices[1].id(), CL_PROGRAM_BUILD_LOG, sizeof(char)*1024, &buffer, NULL);

             std::cout << "Build Scalar: Err = " << err << " Status = " << status << std::endl;

             std::cout << "Log: " << buffer << std::endl;*/


   VIENNACL_ERR_CHECK(err);


   //

   // create a kernel from the program:

   //

   const char * kernel_name = "elementwise_prod";

   cl_kernel my_kernel = clCreateKernel(my_prog, kernel_name, &err);

   VIENNACL_ERR_CHECK(err);


   //

   // Execute elementwise_prod kernel on first queue: result = vec1 .* vec2;

   //

   err = clSetKernelArg(my_kernel, 0, sizeof(cl_mem), (void*)&mem_vec1);

   VIENNACL_ERR_CHECK(err);

   err = clSetKernelArg(my_kernel, 1, sizeof(cl_mem), (void*)&mem_vec2);

   VIENNACL_ERR_CHECK(err);

   err = clSetKernelArg(my_kernel, 2, sizeof(cl_mem), (void*)&mem_result);

   VIENNACL_ERR_CHECK(err);

   err = clSetKernelArg(my_kernel, 3, sizeof(unsigned int), (void*)&vector_size);

   VIENNACL_ERR_CHECK(err);

   std::size_t global_size = vector_size;

   std::size_t local_size = vector_size;

   err = clEnqueueNDRangeKernel(queues[0], my_kernel, 1, NULL, &global_size, &local_size, 0, NULL, NULL);

   VIENNACL_ERR_CHECK(err);


   //

   // Read and output result:

   //

   err = clEnqueueReadBuffer(queues[0], mem_vec1, CL_TRUE, 0, sizeof(ScalarType)*vector_size, &(vec1[0]), 0, NULL, NULL);

   VIENNACL_ERR_CHECK(err);

   err = clEnqueueReadBuffer(queues[0], mem_result, CL_TRUE, 0, sizeof(ScalarType)*vector_size, &(result[0]), 0, NULL, NULL);

   VIENNACL_ERR_CHECK(err);


   std::cout << "vec1  : ";

   for (std::size_t i=0; i<vec1.size(); ++i)

     std::cout << vec1[i] << " ";

   std::cout << std::endl;


   std::cout << "vec2  : ";

   for (std::size_t i=0; i<vec2.size(); ++i)

     std::cout << vec2[i] << " ";

   std::cout << std::endl;


   std::cout << "result: ";

   for (std::size_t i=0; i<result.size(); ++i)

     std::cout << result[i] << " ";

   std::cout << std::endl;


   viennacl::ocl::setup_context(0, my_context, device_id_array, queues);

   viennacl::ocl::switch_context(0); //activate the new context (only mandatory with context-id not equal to zero)


   std::cout << "Existing context: " << my_context << std::endl;

   std::cout << "ViennaCL uses context: " << viennacl::ocl::current_context().handle().get() << std::endl;


   viennacl::vector<ScalarType> vcl_vec1(mem_vec1, vector_size);

   viennacl::vector<ScalarType> vcl_vec2(mem_vec2, vector_size);

   viennacl::vector<ScalarType> vcl_result(mem_result, vector_size);

   viennacl::scalar<ScalarType> vcl_s = 2.0;


   std::cout << "Standard vector operations within ViennaCL:" << std::endl;

   vcl_result = vcl_s * vcl_vec1 + vcl_vec2;


   std::cout << "vec1  : ";

   std::cout << vcl_vec1 << std::endl;


   std::cout << "vec2  : ";

   std::cout << vcl_vec2 << std::endl;


   std::cout << "result: ";

   std::cout << vcl_result << std::endl;


   std::cout << "Using existing kernel within the OpenCL backend of ViennaCL:" << std::endl;

   viennacl::ocl::program & my_vcl_prog = viennacl::ocl::current_context().add_program(my_prog, "my_compute_program");

   viennacl::ocl::kernel & my_vcl_kernel = my_vcl_prog.add_kernel(my_kernel, "elementwise_prod");

   viennacl::ocl::enqueue(my_vcl_kernel(vcl_vec1, vcl_vec2, vcl_result, static_cast<cl_uint>(vcl_vec1.size())));  //Note that std::size_t might differ between host and device. Thus, a cast to cl_uint is necessary here.


   std::cout << "vec1  : ";

   std::cout << vcl_vec1 << std::endl;


   std::cout << "vec2  : ";

   std::cout << vcl_vec2 << std::endl;


   std::cout << "result: ";

   std::cout << vcl_result << std::endl;


   viennacl::matrix<ScalarType> vcl_matrix(mem_vec1, 3, 3);


   vcl_vec2.resize(3);   //note that the resize operation leads to new memory, thus vcl_vec2 is now at a different memory location (values are copied)

   vcl_result.resize(3); //note that the resize operation leads to new memory, thus vcl_vec2 is now at a different memory location (values are copied)

   vcl_result = viennacl::linalg::prod(vcl_matrix, vcl_vec2);


   std::cout << "result of matrix-vector product: ";

   std::cout << vcl_result << std::endl;


   std::cout << "!!!! TUTORIAL COMPLETED SUCCESSFULLY !!!!" << std::endl;


   return EXIT_SUCCESS;

 }


viennacl::ocl::program::add_kernel
viennacl::ocl::kernel & add_kernel(cl_kernel kernel_handle, std::string const &kernel_name)
Adds a kernel to the program.
Definition: context.hpp:765

viennacl::scalar
This class represents a single scalar value on the GPU and behaves mostly like a built-in scalar type...
Definition: forwards.h:227

norm_2.hpp
Generic interface for the l^2-norm. See viennacl/linalg/vector_operations.hpp for implementations...

matrix_operations.hpp
Implementations of dense matrix related operations including matrix-vector products.

viennacl::ocl::platform
Wrapper class for an OpenCL platform.
Definition: platform.hpp:45

prod.hpp
Generic interface for matrix-vector and matrix-matrix products. See viennacl/linalg/vector_operations...

viennacl::ocl::kernel
Represents an OpenCL kernel within ViennaCL.
Definition: kernel.hpp:58

matrix.hpp
Implementation of the dense matrix class.

main
int main()
Definition: bisect.cpp:91

viennacl::ocl::platform::devices
std::vector< device > devices(cl_device_type dtype=CL_DEVICE_TYPE_DEFAULT)
Returns the available devices of the supplied device type.
Definition: platform.hpp:91

viennacl::ocl::current_context
viennacl::ocl::context & current_context()
Convenience function for returning the current context.
Definition: backend.hpp:213

viennacl::matrix
A dense matrix class.
Definition: forwards.h:375

viennacl::ocl::context::handle
const viennacl::ocl::handle< cl_context > & handle() const
Returns the context handle.
Definition: context.hpp:611

VIENNACL_ERR_CHECK
#define VIENNACL_ERR_CHECK(err)
Definition: error.hpp:681

viennacl::linalg::prod
VectorT prod(std::vector< std::vector< T, A1 >, A2 > const &matrix, VectorT const &vector)
Definition: prod.hpp:102

viennacl::ocl::context::add_program
viennacl::ocl::program & add_program(cl_program p, std::string const &prog_name)
Adds a program to the context.
Definition: context.hpp:368

viennacl::ocl::handle::get
const OCL_TYPE & get() const
Definition: handle.hpp:189

viennacl::vector< ScalarType >

viennacl::ocl::program
Wrapper class for an OpenCL program.
Definition: program.hpp:42

backend.hpp
Implementations of the OpenCL backend, where all contexts are stored in.

viennacl::ocl::switch_context
void switch_context(long i)
Convenience function for switching the current context.
Definition: backend.hpp:219

viennacl::ocl::enqueue
void enqueue(KernelType &k, viennacl::ocl::command_queue const &queue)
Enqueues a kernel in the provided queue.
Definition: enqueue.hpp:50

vector.hpp
The vector type with operator-overloads and proxy classes is defined here. Linear algebra operations ...

ScalarType
float ScalarType
Definition: fft_1d.cpp:42

viennacl::ocl::platform::info
std::string info() const
Returns an information string.
Definition: platform.hpp:71

viennacl::ocl::setup_context
void setup_context(long i, std::vector< cl_device_id > const &devices)
Convenience function for setting devices for a context.
Definition: backend.hpp:231