doc/html/vector__int_8cpp_source.html

 /* =========================================================================

    Copyright (c) 2010-2015, Institute for Microelectronics,

                             Institute for Analysis and Scientific Computing,

                             TU Wien.

    Portions of this software are copyright by UChicago Argonne, LLC.


                             -----------------

                   ViennaCL - The Vienna Computing Library

                             -----------------


    Project Head:    Karl Rupp                   rupp@iue.tuwien.ac.at


    (A list of authors and contributors can be found in the PDF manual)


    License:         MIT (X11), see file LICENSE in the base directory

 ============================================================================= */


 //

 // *** System

 //

 #include <iostream>

 #include <iomanip>


 //

 // *** Boost

 //

 #include <boost/numeric/ublas/io.hpp>

 #include <boost/numeric/ublas/vector.hpp>

 #include <boost/numeric/ublas/vector_proxy.hpp>


 //

 // *** ViennaCL

 //

 //#define VIENNACL_DEBUG_ALL

 #define VIENNACL_WITH_UBLAS 1

 #include "viennacl/vector.hpp"

 #include "viennacl/vector_proxy.hpp"

 #include "viennacl/linalg/inner_prod.hpp"

 #include "viennacl/linalg/norm_1.hpp"

 #include "viennacl/linalg/norm_2.hpp"

 #include "viennacl/linalg/norm_inf.hpp"

 #include "viennacl/linalg/maxmin.hpp"

 #include "viennacl/linalg/sum.hpp"


 using namespace boost::numeric;


 //

 // -------------------------------------------------------------

 //

 template<typename ScalarType>

 ScalarType diff(ScalarType const & s1, ScalarType const & s2)

 {

   viennacl::backend::finish();

   return s1 - s2;

 }

 //

 // -------------------------------------------------------------

 //

 template<typename ScalarType>

 ScalarType diff(ScalarType const & s1, viennacl::scalar<ScalarType> const & s2)

 {

   viennacl::backend::finish();

   return s1 - s2;

 }

 //

 // -------------------------------------------------------------

 //

 template<typename ScalarType>

 ScalarType diff(ScalarType const & s1, viennacl::entry_proxy<ScalarType> const & s2)

 {

   viennacl::backend::finish();

   return s1 - s2;

 }

 //

 // -------------------------------------------------------------

 //

 template<typename ScalarType, typename VCLVectorType>

 ScalarType diff(ublas::vector<ScalarType> const & v1, VCLVectorType const & v2)

 {

    ublas::vector<ScalarType> v2_cpu(v2.size());

    viennacl::backend::finish();  //workaround for a bug in APP SDK 2.7 on Trinity APUs (with Catalyst 12.8)

    viennacl::copy(v2.begin(), v2.end(), v2_cpu.begin());


    for (unsigned int i=0;i<v1.size(); ++i)

    {

       if (v2_cpu[i] != v1[i])

         return 1;

    }


    return 0;

 }


 template<typename T1, typename T2>

 int check(T1 const & t1, T2 const & t2)

 {

   int retval = EXIT_SUCCESS;


   if (diff(t1, t2) != 0)

   {

     std::cout << "# Error! Difference: " << std::abs(diff(t1, t2)) << std::endl;

     retval = EXIT_FAILURE;

   }

   return retval;

 }


 //

 // -------------------------------------------------------------

 //

 template< typename NumericT, typename UblasVectorType, typename ViennaCLVectorType1, typename ViennaCLVectorType2 >

 int test(UblasVectorType     & ublas_v1, UblasVectorType     & ublas_v2,

          ViennaCLVectorType1 &   vcl_v1, ViennaCLVectorType2 &   vcl_v2)

 {

   int retval = EXIT_SUCCESS;


   NumericT                    cpu_result = 42;

   viennacl::scalar<NumericT>  gpu_result = 43;


   //

   // Initializer:

   //

   std::cout << "Checking for zero_vector initializer..." << std::endl;

   //ublas_v1 = ublas::zero_vector<NumericT>(ublas_v1.size());

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     ublas_v1[i] = 0;

   vcl_v1 = viennacl::zero_vector<NumericT>(vcl_v1.size());

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Checking for scalar_vector initializer..." << std::endl;

   //ublas_v1 = ublas::scalar_vector<NumericT>(ublas_v1.size(), cpu_result);

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     ublas_v1[i] = cpu_result;

   vcl_v1 = viennacl::scalar_vector<NumericT>(vcl_v1.size(), cpu_result);

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //ublas_v1 = ublas::scalar_vector<NumericT>(ublas_v1.size(), gpu_result);

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     ublas_v1[i] = cpu_result + 1;

   vcl_v1 = viennacl::scalar_vector<NumericT>(vcl_v1.size(), gpu_result);

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Checking for unit_vector initializer..." << std::endl;

   //ublas_v1 = ublas::unit_vector<NumericT>(ublas_v1.size(), 5);

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     ublas_v1[i] = (i == 5) ? 1 : 0;

   vcl_v1 = viennacl::unit_vector<NumericT>(vcl_v1.size(), 5);

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   for (std::size_t i=0; i<ublas_v1.size(); ++i)

   {

     ublas_v1[i] = NumericT(i);

     ublas_v2[i] = NumericT(i+42);

   }


   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());  //resync

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   std::cout << "Checking for successful copy..." << std::endl;

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(ublas_v2, vcl_v2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // Part 1: Norms and inner product

   //


   // --------------------------------------------------------------------------

   std::cout << "Testing inner_prod..." << std::endl;

   cpu_result = viennacl::linalg::inner_prod(ublas_v1, ublas_v2);

   NumericT cpu_result2 = viennacl::linalg::inner_prod(vcl_v1, vcl_v2);

   gpu_result = viennacl::linalg::inner_prod(vcl_v1, vcl_v2);


   if (check(cpu_result, cpu_result2) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = inner_prod(ublas_v1 + ublas_v2, ublas_v2 - ublas_v1);

   NumericT cpu_result3 = viennacl::linalg::inner_prod(vcl_v1 + vcl_v2, vcl_v2 - vcl_v1);

   gpu_result = viennacl::linalg::inner_prod(vcl_v1 + vcl_v2, vcl_v2 - vcl_v1);


   if (check(cpu_result, cpu_result3) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing norm_1..." << std::endl;

   cpu_result = ublas::norm_1(ublas_v1);

   gpu_result = viennacl::linalg::norm_1(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   gpu_result = 2 * cpu_result; //reset

   gpu_result = ublas::norm_1(ublas_v1);

   cpu_result = viennacl::linalg::norm_1(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   gpu_result = ublas::norm_1(ublas_v1 + ublas_v2);

   cpu_result = viennacl::linalg::norm_1(vcl_v1 + vcl_v2);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing norm_inf..." << std::endl;

   cpu_result = ublas::norm_inf(ublas_v1);

   gpu_result = viennacl::linalg::norm_inf(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   gpu_result = 2 * cpu_result; //reset

   gpu_result = ublas::norm_inf(ublas_v1);

   cpu_result = viennacl::linalg::norm_inf(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   gpu_result = ublas::norm_inf(ublas_v1 + ublas_v2);

   cpu_result = viennacl::linalg::norm_inf(vcl_v1 + vcl_v2);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing index_norm_inf..." << std::endl;

   std::size_t cpu_index = ublas::index_norm_inf(ublas_v1);

   std::size_t gpu_index = viennacl::linalg::index_norm_inf(vcl_v1);


   if (check(static_cast<NumericT>(cpu_index), static_cast<NumericT>(gpu_index)) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   // --------------------------------------------------------------------------

   cpu_result = ublas_v1[index_norm_inf(ublas_v1)];

   gpu_result = vcl_v1[viennacl::linalg::index_norm_inf(vcl_v1)];


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = ublas_v1[index_norm_inf(ublas_v1 + ublas_v2)];

   gpu_result = vcl_v1[viennacl::linalg::index_norm_inf(vcl_v1 + vcl_v2)];


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing max..." << std::endl;

   cpu_result = ublas_v1[0];

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     cpu_result = std::max<NumericT>(cpu_result, ublas_v1[i]);

   gpu_result = viennacl::linalg::max(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = ublas_v1[0];

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     cpu_result = std::max<NumericT>(cpu_result, ublas_v1[i]);

   gpu_result = cpu_result;

   cpu_result *= 2; //reset

   cpu_result = viennacl::linalg::max(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = ublas_v1[0] + ublas_v2[0];

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     cpu_result = std::max<NumericT>(cpu_result, ublas_v1[i] + ublas_v2[i]);

   gpu_result = cpu_result;

   cpu_result *= 2; //reset

   cpu_result = viennacl::linalg::max(vcl_v1 + vcl_v2);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing min..." << std::endl;

   cpu_result = ublas_v1[0];

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     cpu_result = std::min<NumericT>(cpu_result, ublas_v1[i]);

   gpu_result = viennacl::linalg::min(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = ublas_v1[0];

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     cpu_result = std::min<NumericT>(cpu_result, ublas_v1[i]);

   gpu_result = cpu_result;

   cpu_result *= 2; //reset

   cpu_result = viennacl::linalg::min(vcl_v1);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = ublas_v1[0] + ublas_v2[0];

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     cpu_result = std::min<NumericT>(cpu_result, ublas_v1[i] + ublas_v2[i]);

   gpu_result = cpu_result;

   cpu_result *= 2; //reset

   cpu_result = viennacl::linalg::min(vcl_v1 + vcl_v2);


   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   std::cout << "Testing sum..." << std::endl;

   cpu_result = 0;

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     cpu_result += ublas_v1[i];

   cpu_result2 = viennacl::linalg::sum(vcl_v1);

   gpu_result = viennacl::linalg::sum(vcl_v1);


   if (check(cpu_result, cpu_result2) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   cpu_result = 0;

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

     cpu_result += ublas_v1[i] + ublas_v2[i];

   cpu_result3 = viennacl::linalg::sum(vcl_v1 + vcl_v2);

   gpu_result = viennacl::linalg::sum(vcl_v1 + vcl_v2);


   if (check(cpu_result, cpu_result3) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(cpu_result, gpu_result) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // Plane rotation and assignments

   //


   // --------------------------------------------------------------------------


   ublas::vector<NumericT> x = ublas_v1;

   ublas::vector<NumericT> y = ublas_v2;

   ublas::vector<NumericT> t = ublas_v1;

   t.assign (  NumericT(1) * x + NumericT(2) * y),

   y.assign (- NumericT(2) * x + NumericT(1) * y),

   x.assign (t);


   viennacl::linalg::plane_rotation(vcl_v1, vcl_v2, NumericT(1), NumericT(2));


   if (check(x, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(y, vcl_v2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------


   std::cout << "Testing assignments..." << std::endl;

   NumericT val = static_cast<NumericT>(1);

   for (size_t i=0; i < ublas_v1.size(); ++i)

     ublas_v1(i) = val;


   for (size_t i=0; i < vcl_v1.size(); ++i)

     vcl_v1(i) = val;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // multiplication and division of vectors by scalars

   //

   std::cout << "Testing scaling with CPU scalar..." << std::endl;

   NumericT alpha = static_cast<NumericT>(3);

   viennacl::scalar<NumericT> gpu_alpha = alpha;


   ublas_v1  *= alpha;

   vcl_v1    *= alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing scaling with GPU scalar..." << std::endl;

   ublas_v1  *= alpha;

   vcl_v1    *= gpu_alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   NumericT beta  = static_cast<NumericT>(2);

   viennacl::scalar<NumericT> gpu_beta = beta;


   std::cout << "Testing shrinking with CPU scalar..." << std::endl;

   ublas_v1 /= beta;

   vcl_v1   /= beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing shrinking with GPU scalar..." << std::endl;

   ublas_v1 /= beta;

   vcl_v1   /= gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // add and inplace_add of vectors

   //

   for (size_t i=0; i < ublas_v1.size(); ++i)

     ublas_v1(i) = NumericT(i);

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());  //resync

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   std::cout << "Testing add on vector..." << std::endl;


   std::cout << "Checking for successful copy..." << std::endl;

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(ublas_v2, vcl_v2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1     = ublas_v1 + ublas_v2;

   vcl_v1       =   vcl_v1 +   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing add on vector with flipsign..." << std::endl;

   ublas_v1     = - ublas_v1 + ublas_v2;

   vcl_v1       = -   vcl_v1 +   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace-add on vector..." << std::endl;

   ublas_v1 += ublas_v2;

   vcl_v1   +=   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // subtract and inplace_subtract of vectors

   //

   std::cout << "Testing sub on vector..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1     = ublas_v1 - ublas_v2;

   vcl_v1       =   vcl_v1 -   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace-sub on vector..." << std::endl;

   ublas_v1 -= ublas_v2;

   vcl_v1   -= vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // multiply-add

   //

   std::cout << "Testing multiply-add on vector with CPU scalar (right)..." << std::endl;

   for (size_t i=0; i < ublas_v1.size(); ++i)

     ublas_v1(i) = NumericT(i);

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 + alpha * ublas_v2;

   vcl_v1   = vcl_v1   + alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with CPU scalar (left)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = alpha * ublas_v1 + ublas_v2;

   vcl_v1   = alpha *   vcl_v1 +   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with CPU scalar (both)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = alpha * ublas_v1 + beta * ublas_v2;

   vcl_v1   = alpha *   vcl_v1 + beta *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-add on vector with CPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 += alpha * ublas_v2;

   vcl_v1   += alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with GPU scalar (right)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 +     alpha * ublas_v2;

   vcl_v1   = vcl_v1   + gpu_alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with GPU scalar (left)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 +     alpha * ublas_v2;

   vcl_v1   = vcl_v1   + gpu_alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-add on vector with GPU scalar (both)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 =     alpha * ublas_v1 +     beta * ublas_v2;

   vcl_v1   = gpu_alpha *   vcl_v1 + gpu_beta *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-add on vector with GPU scalar (both, adding)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 +=     alpha * ublas_v1 +     beta * ublas_v2;

   vcl_v1   += gpu_alpha *   vcl_v1 + gpu_beta *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-add on vector with GPU scalar (both, subtracting)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 +=     alpha * ublas_v1 -     beta * ublas_v2;

   vcl_v1   += gpu_alpha *   vcl_v1 - gpu_beta *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-add on vector with GPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 +=     alpha * ublas_v2;

   vcl_v1   += gpu_alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // division-add

   //

   std::cout << "Testing division-add on vector with CPU scalar (right)..." << std::endl;

   for (size_t i=0; i < ublas_v1.size(); ++i)

     ublas_v1(i) = NumericT(i);

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 + ublas_v2 / alpha;

   vcl_v1   = vcl_v1   + vcl_v2 / alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with CPU scalar (left)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 / alpha + ublas_v2;

   vcl_v1   =   vcl_v1 / alpha +   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with CPU scalar (both)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 / alpha + ublas_v2 / beta;

   vcl_v1   =   vcl_v1 / alpha +   vcl_v2 / beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-multiply-add on vector with CPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 / alpha + ublas_v2 * beta;

   vcl_v1   =   vcl_v1 / alpha +   vcl_v2 * beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-division-add on vector with CPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 * alpha + ublas_v2 / beta;

   vcl_v1   =   vcl_v1 * alpha +   vcl_v2 / beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-add on vector with CPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 += ublas_v2 / alpha;

   vcl_v1   += vcl_v2 / alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with GPU scalar (right)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 + ublas_v2 / alpha;

   vcl_v1   = vcl_v1   +   vcl_v2 / gpu_alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with GPU scalar (left)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 + ublas_v2 / alpha;

   vcl_v1   = vcl_v1   +   vcl_v2 / gpu_alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-add on vector with GPU scalar (both)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 / alpha     + ublas_v2 / beta;

   vcl_v1   =   vcl_v1 / gpu_alpha +   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-add on vector with GPU scalar (both, adding)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 += ublas_v1 / alpha     + ublas_v2 / beta;

   vcl_v1   +=   vcl_v1 / gpu_alpha +   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-add on vector with GPU scalar (both, subtracting)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 += ublas_v1 / alpha     - ublas_v2 / beta;

   vcl_v1   +=   vcl_v1 / gpu_alpha -   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-multiply-add on vector with GPU scalar (adding)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 += ublas_v1 / alpha     + ublas_v2 * beta;

   vcl_v1   +=   vcl_v1 / gpu_alpha +   vcl_v2 * gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-division-add on vector with GPU scalar (subtracting)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 += ublas_v1 * alpha     - ublas_v2 / beta;

   vcl_v1   +=   vcl_v1 * gpu_alpha -   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-add on vector with GPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 += ublas_v2 * alpha;

   vcl_v1   +=   vcl_v2 * gpu_alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // multiply-subtract

   //

   std::cout << "Testing multiply-subtract on vector with CPU scalar (right)..." << std::endl;

   for (size_t i=0; i < ublas_v1.size(); ++i)

     ublas_v1(i) = NumericT(i);

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 - alpha * ublas_v2;

   vcl_v1   = vcl_v1   - alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-subtract on vector with CPU scalar (left)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = alpha * ublas_v1 - ublas_v2;

   vcl_v1   = alpha * vcl_v1   -   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-subtract on vector with CPU scalar (both)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = alpha * ublas_v1 - beta * ublas_v2;

   vcl_v1   = alpha * vcl_v1   - beta *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-subtract on vector with CPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -= alpha * ublas_v2;

   vcl_v1   -= alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-subtract on vector with GPU scalar (right)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 -     alpha * ublas_v2;

   vcl_v1   = vcl_v1   - gpu_alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-subtract on vector with GPU scalar (left)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 -     alpha * ublas_v2;

   vcl_v1   = vcl_v1   - gpu_alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-subtract on vector with GPU scalar (both)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 =     alpha * ublas_v1 -     beta * ublas_v2;

   vcl_v1   = gpu_alpha * vcl_v1   - gpu_beta *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-subtract on vector with GPU scalar (both, adding)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -=     alpha * ublas_v1 +     beta * ublas_v2;

   vcl_v1   -= gpu_alpha * vcl_v1   + gpu_beta *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-subtract on vector with GPU scalar (both, subtracting)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -=     alpha * ublas_v1 -     beta * ublas_v2;

   vcl_v1   -= gpu_alpha * vcl_v1   - gpu_beta *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-subtract on vector with GPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -=     alpha * ublas_v2;

   vcl_v1   -= gpu_alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // division-subtract

   //

   std::cout << "Testing division-subtract on vector with CPU scalar (right)..." << std::endl;

   for (size_t i=0; i < ublas_v1.size(); ++i)

     ublas_v1(i) = NumericT(i);

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 - ublas_v2 / alpha;

   vcl_v1   = vcl_v1   -   vcl_v2 / alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-subtract on vector with CPU scalar (left)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 / alpha - ublas_v2;

   vcl_v1   =   vcl_v1 / alpha -   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-subtract on vector with CPU scalar (both)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 / alpha - ublas_v2 / alpha;

   vcl_v1   =   vcl_v1 / alpha -   vcl_v2 / alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-subtract on vector with CPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -= ublas_v2 / alpha;

   vcl_v1   -=   vcl_v2 / alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-subtract on vector with GPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -= ublas_v2 / alpha;

   vcl_v1   -=   vcl_v2 / gpu_alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-subtract on vector with GPU scalar (right)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 - ublas_v2 / alpha;

   vcl_v1   = vcl_v1   -   vcl_v2 / gpu_alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-subtract on vector with GPU scalar (left)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 - ublas_v2 / alpha;

   vcl_v1   = vcl_v1   -   vcl_v2 / gpu_alpha;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-subtract on vector with GPU scalar (both)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 / alpha     - ublas_v2 / beta;

   vcl_v1   =   vcl_v1 / gpu_alpha -   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-subtract on vector with GPU scalar (both, adding)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -= ublas_v1 / alpha     + ublas_v2 / beta;

   vcl_v1   -=   vcl_v1 / gpu_alpha +   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-subtract on vector with GPU scalar (both, subtracting)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -= ublas_v1 / alpha     - ublas_v2 / beta;

   vcl_v1   -=   vcl_v1 / gpu_alpha -   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing multiply-division-subtract on vector with GPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 * alpha     - ublas_v2 / beta;

   vcl_v1   =   vcl_v1 * gpu_alpha -   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing division-multiply-subtract on vector with GPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v1 / alpha     - ublas_v2 * beta;

   vcl_v1   =   vcl_v1 / gpu_alpha -   vcl_v2 * gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-division-subtract on vector with GPU scalar (adding)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -= ublas_v1 * alpha     + ublas_v2 / beta;

   vcl_v1   -=   vcl_v1 * gpu_alpha +   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-multiply-subtract on vector with GPU scalar (adding)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -= ublas_v1 / alpha     + ublas_v2 * beta;

   vcl_v1   -=   vcl_v1 / gpu_alpha +   vcl_v2 * gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace multiply-division-subtract on vector with GPU scalar (subtracting)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -= ublas_v1 * alpha     - ublas_v2 / beta;

   vcl_v1   -=   vcl_v1 * gpu_alpha -   vcl_v2 / gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-multiply-subtract on vector with GPU scalar (subtracting)..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -= ublas_v1 / alpha     - ublas_v2 * beta;

   vcl_v1   -=   vcl_v1 / gpu_alpha -   vcl_v2 * gpu_beta;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing inplace division-subtract on vector with GPU scalar..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 -=     alpha * ublas_v2;

   vcl_v1   -= gpu_alpha *   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // More complicated expressions (for ensuring the operator overloads work correctly)

   //

   for (size_t i=0; i < ublas_v1.size(); ++i)

     ublas_v1(i) = NumericT(i);

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   std::cout << "Testing three vector additions..." << std::endl;

   ublas_v1 = ublas_v2 + ublas_v1 + ublas_v2;

   vcl_v1   =   vcl_v2 +   vcl_v1 +   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   std::cout << "Testing complicated vector expression with CPU scalar..." << std::endl;

   ublas_v1 = beta * (ublas_v1 - alpha * ublas_v2);

   vcl_v1   = beta * (vcl_v1   - alpha * vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing complicated vector expression with GPU scalar..." << std::endl;

   ublas_v1 =     beta * (ublas_v1 -     alpha * ublas_v2);

   vcl_v1   = gpu_beta * (vcl_v1   - gpu_alpha * vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   std::cout << "Testing swap..." << std::endl;

   swap(ublas_v1, ublas_v2);

   swap(vcl_v1, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

   {

     ublas_v1[i] = NumericT(1.0) + NumericT(i);

     ublas_v2[i] = NumericT(5.0) + NumericT(i);

   }


   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   std::cout << "Testing unary operator-..." << std::endl;

   ublas_v1 = - ublas_v2;

   vcl_v1   = -   vcl_v2;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing elementwise multiplication..." << std::endl;

   std::cout << " v1 = element_prod(v1, v2);" << std::endl;

   ublas_v1 = ublas::element_prod(ublas_v1, ublas_v2);

   vcl_v1 = viennacl::linalg::element_prod(vcl_v1, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 += element_prod(v1, v2);" << std::endl;

   ublas_v1 += ublas::element_prod(ublas_v1, ublas_v2);

   vcl_v1 += viennacl::linalg::element_prod(vcl_v1, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 -= element_prod(v1, v2);" << std::endl;

   ublas_v1 -= ublas::element_prod(ublas_v1, ublas_v2);

   vcl_v1 -= viennacl::linalg::element_prod(vcl_v1, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 = element_prod(v1 + v2, v2);" << std::endl;

   ublas_v1 = ublas::element_prod(ublas_v1 + ublas_v2, ublas_v2);

   vcl_v1 = viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 += element_prod(v1 + v2, v2);" << std::endl;

   ublas_v1 += ublas::element_prod(ublas_v1 + ublas_v2, ublas_v2);

   vcl_v1 += viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 -= element_prod(v1 + v2, v2);" << std::endl;

   ublas_v1 -= ublas::element_prod(ublas_v1 + ublas_v2, ublas_v2);

   vcl_v1 -= viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 = element_prod(v1, v2 + v1);" << std::endl;

   ublas_v1 = ublas::element_prod(ublas_v1, ublas_v2 + ublas_v1);

   vcl_v1 = viennacl::linalg::element_prod(vcl_v1, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 += element_prod(v1, v2 + v1);" << std::endl;

   ublas_v1 += ublas::element_prod(ublas_v1, ublas_v2 + ublas_v1);

   vcl_v1 += viennacl::linalg::element_prod(vcl_v1, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 -= element_prod(v1, v2 + v1);" << std::endl;

   ublas_v1 -= ublas::element_prod(ublas_v1, ublas_v2 + ublas_v1);

   vcl_v1 -= viennacl::linalg::element_prod(vcl_v1, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 = element_prod(v1 + v2, v2 + v1);" << std::endl;

   ublas_v1 = ublas::element_prod(ublas_v1 + ublas_v2, ublas_v2 + ublas_v1);

   vcl_v1 = viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 += element_prod(v1 + v2, v2 + v1);" << std::endl;

   ublas_v1 += ublas::element_prod(ublas_v1 + ublas_v2, ublas_v2 + ublas_v1);

   vcl_v1 += viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " v1 -= element_prod(v1 + v2, v2 + v1);" << std::endl;

   ublas_v1 -= ublas::element_prod(ublas_v1 + ublas_v2, ublas_v2 + ublas_v1);

   vcl_v1 -= viennacl::linalg::element_prod(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing elementwise division..." << std::endl;

   for (std::size_t i=0; i<ublas_v1.size(); ++i)

   {

     ublas_v1[i] = NumericT(1 + i);

     ublas_v2[i] = NumericT(5 + i);

   }


   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas::element_div(ublas_v1, ublas_v2);

   vcl_v1 = viennacl::linalg::element_div(vcl_v1, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 += ublas::element_div(ublas_v1, ublas_v2);

   vcl_v1 += viennacl::linalg::element_div(vcl_v1, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 -= ublas::element_div(ublas_v1, ublas_v2);

   vcl_v1 -= viennacl::linalg::element_div(vcl_v1, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 = ublas::element_div(ublas_v1 + ublas_v2, ublas_v2);

   vcl_v1 = viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 += ublas::element_div(ublas_v1 + ublas_v2, ublas_v2);

   vcl_v1 += viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 -= ublas::element_div(ublas_v1 + ublas_v2, ublas_v2);

   vcl_v1 -= viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 = ublas::element_div(ublas_v1, ublas_v2 + ublas_v1);

   vcl_v1 = viennacl::linalg::element_div(vcl_v1, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 += ublas::element_div(ublas_v1, ublas_v2 + ublas_v1);

   vcl_v1 += viennacl::linalg::element_div(vcl_v1, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 -= ublas::element_div(ublas_v1, ublas_v2 + ublas_v1);

   vcl_v1 -= viennacl::linalg::element_div(vcl_v1, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 = ublas::element_div(ublas_v1 + ublas_v2, ublas_v2 + ublas_v1);

   vcl_v1 = viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 += ublas::element_div(ublas_v1 + ublas_v2, ublas_v2 + ublas_v1);

   vcl_v1 += viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   ublas_v1 -= ublas::element_div(ublas_v1 + ublas_v2, ublas_v2 + ublas_v1);

   vcl_v1 -= viennacl::linalg::element_div(vcl_v1 + vcl_v2, vcl_v2 + vcl_v1);


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << "Testing unary elementwise operations..." << std::endl;


 #define GENERATE_UNARY_OP_TEST(FUNCNAME) \

   ublas_v2 = 3 * ublas_v1; \

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin()); \

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin()); \

   \

   for (std::size_t i=0; i<ublas_v1.size(); ++i) \

     ublas_v1[i] = std::FUNCNAME(ublas_v2[i]); \

   vcl_v1 = viennacl::linalg::element_##FUNCNAME(vcl_v2); \

  \

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS) \

   { \

     std::cout << "Failure at v1 = " << #FUNCNAME << "(v2)" << std::endl; \

     return EXIT_FAILURE; \

   } \

  \

   for (std::size_t i=0; i<ublas_v1.size(); ++i) \

     ublas_v1[i] = std::FUNCNAME(ublas_v1[i] + ublas_v2[i]); \

   vcl_v1 = viennacl::linalg::element_##FUNCNAME(vcl_v1 + vcl_v2); \

  \

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS) \

   { \

     std::cout << "Failure at v1 = " << #FUNCNAME << "(v1 + v2)" << std::endl; \

     return EXIT_FAILURE; \

   } \

  \

   for (std::size_t i=0; i<ublas_v1.size(); ++i) \

     ublas_v1[i] += std::FUNCNAME(ublas_v1[i]); \

   vcl_v1 += viennacl::linalg::element_##FUNCNAME(vcl_v1); \

  \

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS) \

   { \

     std::cout << "Failure at v1 += " << #FUNCNAME << "(v2)" << std::endl; \

     return EXIT_FAILURE; \

   } \

  \

   for (std::size_t i=0; i<ublas_v1.size(); ++i) \

     ublas_v1[i] += std::FUNCNAME(ublas_v1[i] + ublas_v2[i]); \

   vcl_v1 += viennacl::linalg::element_##FUNCNAME(vcl_v1 + vcl_v2); \

  \

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS) \

   { \

     std::cout << "Failure at v1 += " << #FUNCNAME << "(v1 + v2)" << std::endl; \

     return EXIT_FAILURE; \

   } \

  \

   for (std::size_t i=0; i<ublas_v1.size(); ++i) \

     ublas_v1[i] -= std::FUNCNAME(ublas_v2[i]); \

   vcl_v1 -= viennacl::linalg::element_##FUNCNAME(vcl_v2); \

  \

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS) \

   { \

     std::cout << "Failure at v1 -= " << #FUNCNAME << "(v2)" << std::endl; \

     return EXIT_FAILURE; \

   } \

  \

   for (std::size_t i=0; i<ublas_v1.size(); ++i) \

     ublas_v1[i] -= std::FUNCNAME(ublas_v1[i] + ublas_v2[i]); \

   vcl_v1 -= viennacl::linalg::element_##FUNCNAME(vcl_v1 + vcl_v2); \

  \

   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS) \

   { \

     std::cout << "Failure at v1 -= " << #FUNCNAME << "(v1 + v2)" << std::endl; \

     return EXIT_FAILURE; \

   } \


   //GENERATE_UNARY_OP_TEST(cos);

   //GENERATE_UNARY_OP_TEST(cosh);

   //GENERATE_UNARY_OP_TEST(exp);

   //GENERATE_UNARY_OP_TEST(floor);

   //GENERATE_UNARY_OP_TEST(fabs);

   //GENERATE_UNARY_OP_TEST(log);

   //GENERATE_UNARY_OP_TEST(log10);

   //GENERATE_UNARY_OP_TEST(sin);

   //GENERATE_UNARY_OP_TEST(sinh);

   //GENERATE_UNARY_OP_TEST(fabs);

   GENERATE_UNARY_OP_TEST(abs);

   //GENERATE_UNARY_OP_TEST(sqrt);

   //GENERATE_UNARY_OP_TEST(tan);

   //GENERATE_UNARY_OP_TEST(tanh);


   std::cout << "Testing lenghty sum of scaled vectors..." << std::endl;

   ublas_v2 = 3 * ublas_v1;

   viennacl::copy(ublas_v1.begin(), ublas_v1.end(), vcl_v1.begin());

   viennacl::copy(ublas_v2.begin(), ublas_v2.end(), vcl_v2.begin());


   ublas_v1 = ublas_v2 / alpha   +     beta * ublas_v1 - alpha * ublas_v2 + beta * ublas_v1 - alpha * ublas_v1;

   vcl_v1   = vcl_v2 / gpu_alpha + gpu_beta *   vcl_v1 - alpha *   vcl_v2 + beta *   vcl_v1 - alpha *   vcl_v1;


   if (check(ublas_v1, vcl_v1) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   // --------------------------------------------------------------------------

   return retval;

 }


 template< typename NumericT >

 int test()

 {

   int retval = EXIT_SUCCESS;

   std::size_t size = 12345;


   std::cout << "Running tests for vector of size " << size << std::endl;


   //

   // Set up UBLAS objects

   //

   ublas::vector<NumericT> ublas_full_vec(size);

   ublas::vector<NumericT> ublas_full_vec2(ublas_full_vec.size());


   for (std::size_t i=0; i<ublas_full_vec.size(); ++i)

   {

     ublas_full_vec[i]  = NumericT(1.0) + NumericT(i);

     ublas_full_vec2[i] = NumericT(2.0) + NumericT(i) / NumericT(2);

   }


   ublas::range r1(    ublas_full_vec.size() / 4, 2 * ublas_full_vec.size() / 4);

   ublas::range r2(2 * ublas_full_vec2.size() / 4, 3 * ublas_full_vec2.size() / 4);

   ublas::vector_range< ublas::vector<NumericT> > ublas_range_vec(ublas_full_vec, r1);

   ublas::vector_range< ublas::vector<NumericT> > ublas_range_vec2(ublas_full_vec2, r2);


   ublas::slice s1(    ublas_full_vec.size() / 4, 3, ublas_full_vec.size() / 4);

   ublas::slice s2(2 * ublas_full_vec2.size() / 4, 2, ublas_full_vec2.size() / 4);

   ublas::vector_slice< ublas::vector<NumericT> > ublas_slice_vec(ublas_full_vec, s1);

   ublas::vector_slice< ublas::vector<NumericT> > ublas_slice_vec2(ublas_full_vec2, s2);


   //

   // Set up ViennaCL objects

   //

   viennacl::vector<NumericT> vcl_full_vec(ublas_full_vec.size());

   viennacl::vector<NumericT> vcl_full_vec2(ublas_full_vec2.size());


   viennacl::fast_copy(ublas_full_vec.begin(), ublas_full_vec.end(), vcl_full_vec.begin());

   viennacl::copy(ublas_full_vec2.begin(), ublas_full_vec2.end(), vcl_full_vec2.begin());


   viennacl::range vcl_r1(    vcl_full_vec.size() / 4, 2 * vcl_full_vec.size() / 4);

   viennacl::range vcl_r2(2 * vcl_full_vec2.size() / 4, 3 * vcl_full_vec2.size() / 4);

   viennacl::vector_range< viennacl::vector<NumericT> > vcl_range_vec(vcl_full_vec, vcl_r1);

   viennacl::vector_range< viennacl::vector<NumericT> > vcl_range_vec2(vcl_full_vec2, vcl_r2);


   {

     viennacl::vector<NumericT> vcl_short_vec(vcl_range_vec);

     viennacl::vector<NumericT> vcl_short_vec2 = vcl_range_vec2;


     ublas::vector<NumericT> ublas_short_vec(ublas_range_vec);

     ublas::vector<NumericT> ublas_short_vec2(ublas_range_vec2);


     std::cout << "Testing creation of vectors from range..." << std::endl;

     if (check(ublas_short_vec, vcl_short_vec) != EXIT_SUCCESS)

       return EXIT_FAILURE;

     if (check(ublas_short_vec2, vcl_short_vec2) != EXIT_SUCCESS)

       return EXIT_FAILURE;

   }


   viennacl::slice vcl_s1(    vcl_full_vec.size() / 4, 3, vcl_full_vec.size() / 4);

   viennacl::slice vcl_s2(2 * vcl_full_vec2.size() / 4, 2, vcl_full_vec2.size() / 4);

   viennacl::vector_slice< viennacl::vector<NumericT> > vcl_slice_vec(vcl_full_vec, vcl_s1);

   viennacl::vector_slice< viennacl::vector<NumericT> > vcl_slice_vec2(vcl_full_vec2, vcl_s2);


   viennacl::vector<NumericT> vcl_short_vec(vcl_slice_vec);

   viennacl::vector<NumericT> vcl_short_vec2 = vcl_slice_vec2;


   ublas::vector<NumericT> ublas_short_vec(ublas_slice_vec);

   ublas::vector<NumericT> ublas_short_vec2(ublas_slice_vec2);


   std::cout << "Testing creation of vectors from slice..." << std::endl;

   if (check(ublas_short_vec, vcl_short_vec) != EXIT_SUCCESS)

     return EXIT_FAILURE;

   if (check(ublas_short_vec2, vcl_short_vec2) != EXIT_SUCCESS)

     return EXIT_FAILURE;


   //

   // Now start running tests for vectors, ranges and slices:

   //


   std::cout << " ** vcl_v1 = vector, vcl_v2 = vector **" << std::endl;

   retval = test<NumericT>(ublas_short_vec, ublas_short_vec2,

                           vcl_short_vec, vcl_short_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = vector, vcl_v2 = range **" << std::endl;

   retval = test<NumericT>(ublas_short_vec, ublas_short_vec2,

                           vcl_short_vec, vcl_range_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = vector, vcl_v2 = slice **" << std::endl;

   retval = test<NumericT>(ublas_short_vec, ublas_short_vec2,

                           vcl_short_vec, vcl_slice_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = range, vcl_v2 = vector **" << std::endl;

   retval = test<NumericT>(ublas_short_vec, ublas_short_vec2,

                           vcl_range_vec, vcl_short_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = range, vcl_v2 = range **" << std::endl;

   retval = test<NumericT>(ublas_short_vec, ublas_short_vec2,

                           vcl_range_vec, vcl_range_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = range, vcl_v2 = slice **" << std::endl;

   retval = test<NumericT>(ublas_short_vec, ublas_short_vec2,

                           vcl_range_vec, vcl_slice_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = slice, vcl_v2 = vector **" << std::endl;

   retval = test<NumericT>(ublas_short_vec, ublas_short_vec2,

                           vcl_slice_vec, vcl_short_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = slice, vcl_v2 = range **" << std::endl;

   retval = test<NumericT>(ublas_short_vec, ublas_short_vec2,

                           vcl_slice_vec, vcl_range_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   std::cout << " ** vcl_v1 = slice, vcl_v2 = slice **" << std::endl;

   retval = test<NumericT>(ublas_short_vec, ublas_short_vec2,

                           vcl_slice_vec, vcl_slice_vec2);

   if (retval != EXIT_SUCCESS)

     return EXIT_FAILURE;


   return EXIT_SUCCESS;

 }


 //

 // -------------------------------------------------------------

 //

 int main()

 {

   std::cout << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << "## Test :: Vector with Integer types" << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << std::endl;


   int retval = EXIT_SUCCESS;


   std::cout << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << std::endl;

   {

     std::cout << "# Testing setup:" << std::endl;

     std::cout << "  numeric: int" << std::endl;

     retval = test<int>();

     if ( retval == EXIT_SUCCESS )

       std::cout << "# Test passed" << std::endl;

     else

       return retval;

   }

   std::cout << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << std::endl;

   {

     std::cout << "# Testing setup:" << std::endl;

     std::cout << "  numeric: long" << std::endl;

     retval = test<long>();

     if ( retval == EXIT_SUCCESS )

       std::cout << "# Test passed" << std::endl;

     else

       return retval;

   }

   std::cout << std::endl;

   std::cout << "----------------------------------------------" << std::endl;

   std::cout << std::endl;


   std::cout << std::endl;

   std::cout << "------- Test completed --------" << std::endl;

   std::cout << std::endl;


   return retval;

 }

test
int test(UblasVectorType &ublas_v1, UblasVectorType &ublas_v2, ViennaCLVectorType1 &vcl_v1, ViennaCLVectorType2 &vcl_v2)
Definition: vector_int.cpp:117

viennacl::linalg::element_div
viennacl::vector_expression< const vector_base< T >, const vector_base< T >, op_element_binary< op_div > > element_div(vector_base< T > const &v1, vector_base< T > const &v2)

viennacl::linalg::index_norm_inf
vcl_size_t index_norm_inf(vector_base< T > const &vec)
Computes the index of the first entry that is equal to the supremum-norm in modulus.
Definition: vector_operations.hpp:845

viennacl::scalar
This class represents a single scalar value on the GPU and behaves mostly like a built-in scalar type...
Definition: forwards.h:227

norm_2.hpp
Generic interface for the l^2-norm. See viennacl/linalg/vector_operations.hpp for implementations...

viennacl::linalg::sum
viennacl::scalar_expression< const viennacl::vector_base< NumericT >, const viennacl::vector_base< NumericT >, viennacl::op_sum > sum(viennacl::vector_base< NumericT > const &x)
User interface function for computing the sum of all elements of a vector.
Definition: sum.hpp:45

viennacl::linalg::plane_rotation
void plane_rotation(vector_base< T > &vec1, vector_base< T > &vec2, T alpha, T beta)
Computes a plane rotation of two vectors.
Definition: vector_operations.hpp:1152

viennacl::backend::finish
void finish()
Synchronizes the execution. finish() will only return after all compute kernels (CUDA, OpenCL) have completed.
Definition: memory.hpp:54

viennacl::zero_vector
Definition: vector_def.hpp:93

viennacl::linalg::inner_prod
viennacl::enable_if< viennacl::is_stl< typename viennacl::traits::tag_of< VectorT1 >::type >::value, typename VectorT1::value_type >::type inner_prod(VectorT1 const &v1, VectorT2 const &v2)
Definition: inner_prod.hpp:100

s2
viennacl::scalar< int > s2
Definition: global_variables.cpp:58

s1
viennacl::scalar< float > s1
Definition: global_variables.cpp:57

inner_prod.hpp
Generic interface for the computation of inner products. See viennacl/linalg/vector_operations.hpp for implementations.

norm_1.hpp
Generic interface for the l^1-norm. See viennacl/linalg/vector_operations.hpp for implementations...

GENERATE_UNARY_OP_TEST
#define GENERATE_UNARY_OP_TEST(FUNCNAME)

NumericT
float NumericT
Definition: bisect.cpp:40

viennacl::range
basic_range range
Definition: forwards.h:424

check
int check(T1 const &t1, T2 const &t2)
Definition: vector_int.cpp:100

v1
viennacl::vector< float > v1
Definition: global_variables.cpp:60

maxmin.hpp

viennacl::traits::size
vcl_size_t size(VectorType const &vec)
Generic routine for obtaining the size of a vector (ViennaCL, uBLAS, etc.)
Definition: size.hpp:235

viennacl::vector_range
Class for representing non-strided subvectors of a bigger vector x.
Definition: forwards.h:434

main
int main()
Definition: vector_int.cpp:1568

viennacl::vector_slice
Class for representing strided subvectors of a bigger vector x.
Definition: forwards.h:437

numeric

viennacl::vector< NumericT >

diff
ScalarType diff(ScalarType const &s1, ScalarType const &s2)
Definition: vector_int.cpp:57

vector_proxy.hpp
Proxy classes for vectors.

viennacl::linalg::cuda::swap
viennacl::enable_if< viennacl::is_scalar< ScalarT1 >::value &&viennacl::is_scalar< ScalarT2 >::value >::type swap(ScalarT1 &s1, ScalarT2 &s2)
Swaps the contents of two scalars, data is copied.
Definition: scalar_operations.hpp:361

viennacl::unit_vector
Represents a vector consisting of 1 at a given index and zeros otherwise.
Definition: vector_def.hpp:76

sum.hpp
Stub routines for the summation of elements in a vector, or all elements in either a row or column of...

v2
viennacl::vector< int > v2
Definition: global_variables.cpp:61

viennacl::slice
basic_slice slice
Definition: forwards.h:429

vector.hpp
The vector type with operator-overloads and proxy classes is defined here. Linear algebra operations ...

viennacl::scalar_vector
Represents a vector consisting of scalars 's' only, i.e. v[i] = s for all i. To be used as an initial...
Definition: vector_def.hpp:87

viennacl::linalg::max
NumericT max(std::vector< NumericT > const &v1)
Definition: maxmin.hpp:47

viennacl::linalg::norm_inf
T norm_inf(std::vector< T, A > const &v1)
Definition: norm_inf.hpp:60

viennacl::copy
void copy(std::vector< NumericT > &cpu_vec, circulant_matrix< NumericT, AlignmentV > &gpu_mat)
Copies a circulant matrix from the std::vector to the OpenCL device (either GPU or multi-core CPU) ...
Definition: circulant_matrix.hpp:150

viennacl::linalg::norm_1
T norm_1(std::vector< T, A > const &v1)
Definition: norm_1.hpp:61

viennacl::basic_range
A range class that refers to an interval [start, stop), where 'start' is included, and 'stop' is excluded.
Definition: forwards.h:424

ScalarType
float ScalarType
Definition: fft_1d.cpp:42

viennacl::linalg::element_prod
viennacl::vector_expression< const vector_base< T >, const vector_base< T >, op_element_binary< op_prod > > element_prod(vector_base< T > const &v1, vector_base< T > const &v2)

viennacl::basic_slice
A slice class that refers to an interval [start, stop), where 'start' is included, and 'stop' is excluded.
Definition: forwards.h:429

viennacl::entry_proxy
A proxy class for a single element of a vector or matrix. This proxy should not be noticed by end-use...
Definition: forwards.h:233

norm_inf.hpp
Generic interface for the l^infty-norm. See viennacl/linalg/vector_operations.hpp for implementations...

viennacl::linalg::min
NumericT min(std::vector< NumericT > const &v1)
Definition: maxmin.hpp:91

viennacl::fast_copy
void fast_copy(const const_vector_iterator< SCALARTYPE, ALIGNMENT > &gpu_begin, const const_vector_iterator< SCALARTYPE, ALIGNMENT > &gpu_end, CPU_ITERATOR cpu_begin)