tenncor_docs/grader_8hpp_source.html

 #include <list>

 #include "teq/grad_def.hpp"

 #include "eteq/generated/api.hpp"

 #include "eteq/constant.hpp"

 #ifndef ETEQ_GRADER_HPP
 #define ETEQ_GRADER_HPP

 namespace eteq
 {

 template <typename T>
 NodeptrT<T> reduce_grad (const teq::FuncArg& child,
     NodeptrT<T> bwd, size_t idx)
 {
     const teq::Shape& shape = child.get_tensor()->shape();
     teq::CoordptrT revshaper(child.get_shaper()->reverse());
     CoordptrT revcoord;
     {
         auto coorder = child.get_coorder();
         assert(nullptr != coorder);
         teq::CoordT dims;
         coorder->forward(dims.begin(), dims.begin());
         teq::CoordT bcast;
         std::fill(bcast.begin(), bcast.end(), 1);
         for (teq::RankT d : dims)
         {
             if (d < teq::rank_cap)
             {
                 bcast[d] = shape.at(d);
             }
         }
         revcoord = std::make_shared<CoordMap>(bcast, false);
     }
     return make_functor<T>(teq::Opcode{"EXTEND",egen::EXTEND}, {
         FuncArg<T>(bwd, revshaper, revcoord)
     });
 }

 template <typename T>
 NodeptrT<T> permute_grad (teq::iFunctor* fwd,
     NodeptrT<T> bwd, size_t idx)
 {
     const auto& child = fwd->get_children()[0];
     teq::CoordptrT revshaper(child.get_shaper()->reverse());
     CoordptrT revcoord;
     {
         auto coorder = child.get_coorder();
         assert(nullptr != coorder);
         teq::CoordT dims;
         coorder->forward(dims.begin(), dims.begin());

         teq::CoordT order;
         for (teq::RankT i = 0; i < teq::rank_cap; ++i)
         {
             order[dims[i]] = i;
         }
         revcoord = std::make_shared<CoordMap>(order, true);
     }
     return make_functor<T>(teq::Opcode{"PERMUTE",egen::PERMUTE},{
         FuncArg<T>(bwd, revshaper, revcoord)
     });
 }

 template <typename T>
 NodeptrT<T> extend_grad (teq::iFunctor* fwd,
     NodeptrT<T> bwd, size_t idx)
 {
     const auto& child = fwd->get_children()[0];
     teq::CoordptrT revshaper(child.get_shaper()->reverse());
     CoordptrT revcoord;
     {
         auto coorder = child.get_coorder();
         assert(nullptr != coorder);
         teq::CoordT dims;
         coorder->forward(dims.begin(), dims.begin());
         std::vector<teq::RankT> red_dims;
         for (teq::RankT i = 0; i < teq::rank_cap; ++i)
         {
             if (dims[i] > 1)
             {
                 red_dims.push_back(i);
             }
         }
         revcoord = reduce(red_dims);
     }
     return make_functor<T>(teq::Opcode{"REDUCE_SUM",egen::REDUCE_SUM},{
         FuncArg<T>(bwd, revshaper, revcoord)
     });
 }

 template <typename T>
 struct GradientBuilder final : public teq::iGradientBuilder
 {
     teq::TensptrT local_derivative (teq::FuncptrT op,
         size_t arg_idx) const override
     {
         const teq::ArgsT& args = op->get_children();
         NodeptrT<T> out = nullptr;
         teq::Opcode opcode = op->get_opcode();
         switch ((egen::_GENERATED_OPCODE) opcode.code_)
         {
             case egen::ABS:
                 out = TO_NODE(args[0].get_tensor()) / TO_NODE(op);
                 break;
             case egen::NEG:
                 out = make_constant_scalar<T>(
                     -1, args[0].get_tensor()->shape());
                 break;
             case egen::SIN:
                 out = tenncor::cos(TO_NODE(args[0].get_tensor()));
                 break;
             case egen::COS:
                 out = -tenncor::sin(TO_NODE(args[0].get_tensor()));
                 break;
             case egen::TAN:
                 out = (T) 1 / tenncor::pow(
                     tenncor::cos(TO_NODE(args[0].get_tensor())), (T) 2);
                 break;
             case egen::EXP:
                 out = TO_NODE(op);
                 break;
             case egen::LOG:
                 out = (T) 1 / TO_NODE(args[0].get_tensor());
                 break;
             case egen::SQRT:
                 out = (T) 1 / ((T) 2 * TO_NODE(op));
                 break;
             case egen::SQUARE:
                 out = (T) 2 * TO_NODE(args[0].get_tensor());
                 break;
             case egen::CUBE:
                 out = (T) 3 * tenncor::square(TO_NODE(args[0].get_tensor()));
                 break;
             case egen::SIGMOID:
                 out = tenncor::sigmoid_grad(
                     TO_NODE(args[0].get_tensor()));
                 break;
             case egen::SIGMOID_GRAD:
                 out = TO_NODE(op) * ((T) 1 - (T) 2 *
                     tenncor::sigmoid(TO_NODE(args[0].get_tensor())));
                 break;
             case egen::TANH:
                 out = (T) 1 - tenncor::square(TO_NODE(op));
                 break;
             case egen::ROUND:
             case egen::REDUCE_SUM:
             case egen::EXTEND:
             case egen::PERMUTE:
             case egen::ADD:
             case egen::SLICE:
             case egen::PAD:
             case egen::STRIDE: // todo: figure out if this belongs here
                 out = make_constant_scalar<T>(1, args[0].get_tensor()->shape());
                 break;
             case egen::MUL:
             case egen::CONV:
                 out = TO_NODE(args[(size_t)(arg_idx==0)].get_tensor());
                 break;
             case egen::MAX:
             case egen::MIN:
                 out = TO_NODE(op) == TO_NODE(args[arg_idx].get_tensor());
                 break;
             case egen::POW:
                 out = arg_idx==0 ?
                     TO_NODE(args[1].get_tensor()) *
                     tenncor::pow(
                         TO_NODE(args[0].get_tensor()),
                         TO_NODE(args[1].get_tensor()) - (T) 1
                     ) :
                     tenncor::log(TO_NODE(args[0].get_tensor())) *
                         TO_NODE(op);
                 break;
             case egen::SUB:
                 out = make_constant_scalar<T>(arg_idx == 0 ?
                     1 : -1, args[0].get_tensor()->shape());
                 break;
             case egen::DIV:
             {
                 auto denom = TO_NODE(args[1].get_tensor());
                 out = arg_idx==0 ?
                     (T) 1 / denom :
                     -TO_NODE(args[0].get_tensor()) / denom / denom;
             }
                 break;
             case egen::EQ:
             case egen::NEQ:
             case egen::GT:
             case egen::LT:
             case egen::RAND_UNIF:
             case egen::SELECT:
                 out = make_constant_scalar<T>(0, args[0].get_tensor()->shape());
                 break;
             case egen::REDUCE_PROD: // todo: prevent divide by zero
                 out =
                     reduce_grad(args[0], TO_NODE(op), arg_idx) /
                     TO_NODE(args[0].get_tensor());
                 break;
             case egen::REDUCE_MAX:
             case egen::REDUCE_MIN:
                 out =
                     reduce_grad(args[0], TO_NODE(op), arg_idx) ==
                     TO_NODE(args[0].get_tensor());
                 break;
             case egen::MATMUL:
             {
                 NodeptrT<T> lhs = TO_NODE(args[0].get_tensor());
                 NodeptrT<T> rhs = TO_NODE(args[1].get_tensor());
                 out = 0 == arg_idx ?
                     // ext_rhs
                     tenncor::permute(tenncor::extend(rhs, 2, {
                         lhs->shape().at(1)}), {0,2,1}) :
                     // ext_lhs
                     tenncor::permute(tenncor::extend(lhs, 2, {
                         rhs->shape().at(0)}), {2,1,0});
             }
                 break;
             case egen::CONV_IMG_GRAD:
                 logs::fatal("cannot derive CONV_IMG_GRAD");
                 break;
             case egen::CONV_KRN_GRAD:
                 logs::fatal("cannot derive CONV_KRN_GRAD");
                 break;
             default:
                 logs::fatalf("Unknown op %s", opcode.name_.c_str());
         }
         return out->get_tensor();
     }

     teq::TensptrT chain_rule (teq::FuncptrT op, const teq::TensptrT& local_der,
         teq::TensptrT supcomp_grad, size_t arg_idx) const override
     {
         NodeptrT<T> out = nullptr;
         teq::Opcode opcode = op->get_opcode();
         switch (opcode.code_)
         {
             case egen::ABS:
             case egen::NEG:
             case egen::SIN:
             case egen::COS:
             case egen::TAN:
             case egen::EXP:
             case egen::LOG:
             case egen::SQRT:
             case egen::SQUARE:
             case egen::CUBE:
             case egen::ROUND:
             case egen::SIGMOID:
             case egen::SIGMOID_GRAD:
             case egen::TANH:
             case egen::ADD:
             case egen::MUL:
             case egen::MAX:
             case egen::MIN:
             case egen::POW:
             case egen::SUB:
             case egen::DIV:
             case egen::EQ:
             case egen::NEQ:
             case egen::GT:
             case egen::LT:
             case egen::RAND_UNIF:
                 out = TO_NODE(local_der) *
                     TO_NODE(supcomp_grad);
                 break;
             case egen::REDUCE_MAX:
             case egen::REDUCE_MIN:
             case egen::REDUCE_PROD:
             case egen::REDUCE_SUM:
                 out = TO_NODE(local_der) * reduce_grad(
                     op->get_children()[0], TO_NODE(supcomp_grad), arg_idx);
                 break;
             case egen::EXTEND:
                 out = TO_NODE(local_der) * extend_grad(
                     op.get(), TO_NODE(supcomp_grad), arg_idx);
                 break;
             case egen::PERMUTE:
                 out = TO_NODE(local_der) * permute_grad(
                     op.get(), TO_NODE(supcomp_grad), arg_idx);
                 break;
             case egen::MATMUL:
                 out = tenncor::reduce_sum(
                     tenncor::permute(
                         TO_NODE(local_der) *
                             tenncor::extend(TO_NODE(supcomp_grad), 2, {
                                 op->get_children()[0].
                                     get_tensor()->shape().at(0)
                             }),
                         0 == arg_idx ?
                             std::vector<teq::RankT>{2, 1, 0} :
                             std::vector<teq::RankT>{0, 2, 1}), 2, 1);
                 break;
             case egen::CONV:
             {
                 teq::Opcode opcode;
                 auto args = op->get_children();
                 teq::CoordptrT fwd_shaper =
                     args[(size_t)(0 == arg_idx)].get_shaper();
                 teq::CoordptrT rev_shaper(
                     args[arg_idx].get_shaper()->reverse());
                 if (arg_idx == 0)
                 {
                     opcode = teq::Opcode{"CONV_IMG_GRAD",
                         egen::CONV_IMG_GRAD};
                 }
                 else
                 {
                     opcode = teq::Opcode{"CONV_KRN_GRAD",
                         egen::CONV_KRN_GRAD};
                 }
                 teq::CoordptrT full_shaper(
                     fwd_shaper->connect(*rev_shaper));
                 out = make_functor<T>(opcode, {
                     FuncArg<T>(TO_NODE(local_der), full_shaper, nullptr),
                     FuncArg<T>(TO_NODE(supcomp_grad), rev_shaper, nullptr),
                 });
             }
                 break;
             case egen::SLICE:
             {
                 teq::CoordT slicings;
                 auto& child = op->get_children()[0];
                 child.get_coorder()->forward(
                     slicings.begin(), slicings.begin());
                 teq::DimT dimension = slicings[2];
                 teq::DimT dim = child.get_tensor()->shape().at(dimension);
                 teq::DimT left_pad = slicings[0];
                 teq::DimT right_pad = dim - (left_pad + slicings[1]);
                 out = TO_NODE(local_der) *
                     tenncor::pad(TO_NODE(supcomp_grad),
                         std::pair<teq::DimT,teq::DimT>{
                             left_pad, right_pad}, dimension);
             }
                 break;
             case egen::PAD:
             {
                 teq::CoordT paddings;
                 auto& child = op->get_children()[0];
                 child.get_coorder()->forward(
                     paddings.begin(), paddings.begin());
                 teq::DimT dimension = paddings[2];
                 teq::DimT dim = op->shape().at(dimension);
                 teq::DimT offset = paddings[0];
                 teq::DimT extent = dim - paddings[1] - offset;
                 out = TO_NODE(local_der) *
                     tenncor::slice(TO_NODE(supcomp_grad),
                         offset, extent, dimension);
             }
                 break;
             case egen::SELECT:
             {
                 if (0 == arg_idx)
                 {
                     out = TO_NODE(local_der);
                     break;
                 }
                 auto condition = TO_NODE(
                     op->get_children()[0].get_tensor());
                 auto then = TO_NODE(supcomp_grad);
                 auto otherwise = make_constant_scalar<T>(0, op->shape());
                 if (1 < arg_idx)
                 {
                     std::swap(then, otherwise);
                 }
                 out = tenncor::if_then_else(condition, then, otherwise);
             }
                 break;
             case egen::CONV_IMG_GRAD:
                 logs::fatal("cannot derive CONV_IMG_GRAD");
                 break;
             case egen::CONV_KRN_GRAD:
                 logs::fatal("cannot derive CONV_KRN_GRAD");
                 break;
             case egen::STRIDE: // todo: implement
             default:
                 logs::fatalf("Unknown op %s", opcode.name_.c_str());
         }
         return out->get_tensor();
     }

     teq::TensptrT get_const_one (teq::Shape shape) const override
     {
         return make_constant_scalar<T>(1, shape)->get_tensor();
     }

     teq::TensptrT get_const_zero (teq::Shape shape) const override
     {
         return make_constant_scalar<T>(0, shape)->get_tensor();
     }

     teq::TensptrT add (teq::TensptrT& lhs, teq::TensptrT& rhs) const override
     {
         return teq::TensptrT(Functor<T>::get(teq::Opcode{"ADD", egen::ADD}, {
             identity_map(TO_NODE(lhs)),
             identity_map(TO_NODE(rhs))
         }));
     }
 };

 template <typename T>
 NodeptrT<T> derive (NodeptrT<T> root, NodeptrT<T> target)
 {
     GradientBuilder<T> builder;
     teq::TensptrT derivative = builder.derive(
         root->get_tensor(), target->get_tensor());
     return TO_NODE(derivative);
 }

 }

 #endif // ETEQ_GRADER_HPP
teq::CoordT
std::array< CDimT, rank_cap > CoordT
Definition: shape.hpp:56

teq::rank_cap
const RankT rank_cap
Number of dimsensions in a shape/coordinate.
Definition: shape.hpp:47

eteq::derive
NodeptrT< T > derive(NodeptrT< T > root, NodeptrT< T > target)
Derive root with respect to target and optimized.
Definition: grader.hpp:422

csv_to_png.args
args
Definition: csv_to_png.py:105

eteq::sin
EigenptrT< T > sin(teq::Shape &outshape, const OpArg< T > &in)
Definition: operator.hpp:280

teq::iFunctor::get_children
virtual const ArgsT & get_children(void) const =0
Return children nodes as a vector of raw pointers.

eteq::reduce_grad
NodeptrT< T > reduce_grad(const teq::FuncArg &child, NodeptrT< T > bwd, size_t idx)
Return reduction operator gradient of reduced functor node (bwd)
Definition: grader.hpp:25

teq::Opcode
Encoding of operation.
Definition: ifunctor.hpp:18

eteq::extend
CoordptrT extend(teq::RankT rank, std::vector< teq::DimT > ext)
Return CoordMap wrapper of extension parameters.

teq::FuncArg::get_shaper
CoordptrT get_shaper(void) const
Return shaper coord map.
Definition: funcarg.hpp:67

teq::iFunctor
Interface of iOperation-defined operation node.
Definition: ifunctor.hpp:28

eteq::square
EigenptrT< T > square(teq::Shape &outshape, const OpArg< T > &in)
Definition: operator.hpp:559

eteq
Definition: constant.hpp:17

teq::ArgsT
std::vector< FuncArg > ArgsT
Type of functor arguments.
Definition: funcarg.hpp:101

eteq::reduce
CoordptrT reduce(std::vector< teq::RankT > red_dims)
Return CoordMap wrapper of reduction dimensions.

teq::RankT
uint8_t RankT
Type used for shape rank.
Definition: shape.hpp:23

teq::Shape
Definition: shape.hpp:62

eteq::FuncArg
Eigen node version of teq::FuncArg.
Definition: funcarg.hpp:22

teq::FuncArg::get_tensor
TensptrT get_tensor(void) const
Return tensor being mapped.
Definition: funcarg.hpp:61

teq::CoordptrT
std::shared_ptr< iCoordMap > CoordptrT
Type of iCoordMap smartpointer.
Definition: coord.hpp:106

eteq::extend_grad
NodeptrT< T > extend_grad(teq::iFunctor *fwd, NodeptrT< T > bwd, size_t idx)
Return extension gradient of extended functor node (bwd)
Definition: grader.hpp:80

eteq::GradientBuilder::chain_rule
teq::TensptrT chain_rule(teq::FuncptrT op, const teq::TensptrT &local_der, teq::TensptrT supcomp_grad, size_t arg_idx) const override
Implementation of iGradientBuilder.
Definition: grader.hpp:247

teq::Opcode::name_
std::string name_
String representation of operation.
Definition: ifunctor.hpp:21

constant.hpp

eteq::GradientBuilder::get_const_one
teq::TensptrT get_const_one(teq::Shape shape) const override
Implementation of iGradientBuilder.
Definition: grader.hpp:399

eteq::GradientBuilder::add
teq::TensptrT add(teq::TensptrT &lhs, teq::TensptrT &rhs) const override
Implementation of iGradientBuilder.
Definition: grader.hpp:411

teq::FuncArg::get_coorder
CoordptrT get_coorder(void) const
Return coord map for coordinates.
Definition: funcarg.hpp:80

eteq::CoordptrT
std::shared_ptr< CoordMap > CoordptrT
Type of iCoordMap smartpointer.
Definition: coord.hpp:64

teq::FuncArg
Coordinate mapper and tensor pair.
Definition: funcarg.hpp:21

eteq::permute_grad
NodeptrT< T > permute_grad(teq::iFunctor *fwd, NodeptrT< T > bwd, size_t idx)
Return permutation gradient of permuted functor node (bwd)
Definition: grader.hpp:54

eteq::GradientBuilder::get_const_zero
teq::TensptrT get_const_zero(teq::Shape shape) const override
Implementation of iGradientBuilder.
Definition: grader.hpp:405

teq::iGradientBuilder
Definition: grad_def.hpp:28

eteq::sigmoid_grad
EigenptrT< T > sigmoid_grad(teq::Shape &outshape, const OpArg< T > &in)
Definition: operator.hpp:498

eteq::sigmoid
EigenptrT< T > sigmoid(teq::Shape &outshape, const OpArg< T > &in)
Definition: operator.hpp:475

grad_def.hpp

teq::Opcode::code_
size_t code_
Numerical encoding of operation.
Definition: ifunctor.hpp:24

eteq::permute
CoordptrT permute(std::vector< teq::RankT > dims)
Return CoordMap wrapper of permute indices.

eteq::slice
EigenptrT< T > slice(teq::Shape &outshape, const OpArg< T > &in)
Return Eigen data object representing data slicing of dimensions.
Definition: operator.hpp:157

teq::TensptrT
std::shared_ptr< iTensor > TensptrT
Tensor smart pointer.
Definition: itensor.hpp:51

teq::DimT
uint16_t DimT
Type used for shape dimension.
Definition: shape.hpp:31

eteq::pad
EigenptrT< T > pad(teq::Shape &outshape, const OpArg< T > &in)
Return Eigen data object representing data zero padding.
Definition: operator.hpp:183

eteq::cos
EigenptrT< T > cos(teq::Shape &outshape, const OpArg< T > &in)
Definition: operator.hpp:314

eteq::GradientBuilder
ETEQ implementation of TEQ&#39;s Backward Propagation Builder.
Definition: grader.hpp:108

eteq::GradientBuilder::local_derivative
teq::TensptrT local_derivative(teq::FuncptrT op, size_t arg_idx) const override
Implementation of iGradientBuilder.
Definition: grader.hpp:111

eteq::log
EigenptrT< T > log(teq::Shape &outshape, const OpArg< T > &in)
Definition: operator.hpp:402

eteq::reduce_sum
EigenptrT< T > reduce_sum(teq::Shape &outshape, const OpArg< T > &in) template< typename T > EigenptrT< T > reduce_prod(teq
Return Eigen data object representing reduction where aggregation is sum.
Definition: operator.hpp:94

eteq::Functor
Functor implementation of operable functor of Eigen operators.
Definition: functor.hpp:25

eteq::NodeptrT
std::shared_ptr< iNode< T > > NodeptrT
Smart pointer of node.
Definition: inode.hpp:63

teq::FuncptrT
std::shared_ptr< iFunctor > FuncptrT
Functor smart pointer.
Definition: ifunctor.hpp:49

eteq::identity_map
FuncArg< T > identity_map(NodeptrT< T > node)
Return FuncArg<T> that identity maps input tensor.
Definition: funcarg.hpp:88

teq::Shape::at
DimT at(RankT idx) const
Return DimT element at idx for any index in range [0:rank_cap)
Definition: shape.hpp:108

teq::iGradientBuilder::derive
TensptrT derive(TensptrT root, TensptrT target) const
Return derivative of root with respect to target.
Definition: grad_def.hpp:54

TO_NODE
#define TO_NODE(tens)
Macro for converting tensor to node.
Definition: inode.hpp:106

eteq::pow
EigenptrT< T > pow(teq::Shape &outshape, const OpArg< T > &a, const OpArg< T > &b)
Definition: operator.hpp:608