cupy · okuta · Apr 8, 2019 · Oct 29, 2018 · Nov 2, 2018 · Nov 2, 2018
diff --git a/cupy/cuda/cudnn.pxd b/cupy/cuda/cudnn.pxd
@@ -115,6 +115,9 @@ cpdef enum:
     CUDNN_BATCHNORM_SPATIAL = 1
     CUDNN_BATCHNORM_SPATIAL_PERSISTENT = 2
 
+    CUDNN_CTC_LOSS_ALGO_DETERMINISTIC = 0
+    CUDNN_CTC_LOSS_ALGO_NON_DETERMINISTIC = 1
+
     CUDNN_RNN_RELU = 0
     CUDNN_RNN_TANH = 1
     CUDNN_LSTM = 2
@@ -445,6 +448,26 @@ cpdef dropoutBackward(
     size_t reserveSpace, size_t reserveSpaceSizeInBytes)
 
 
+###############################################################################
+# CTC
+###############################################################################
+
+cpdef size_t createCTCLossDescriptor() except? 0
+cpdef destroyCTCLossDescriptor(size_t ctcLossDesc)
+cpdef setCTCLossDescriptor(size_t ctcLossDesc, int dataType)
+cpdef getCTCLossDescriptor(size_t ctcLossDesc)
+cpdef getCTCLossWorkspaceSize(
+    size_t handle, size_t probsDesc, size_t gradientsDesc,
+    size_t labels, size_t labelLengths, size_t inputLengths,
+    int algo, size_t ctcLossDesc)
+cpdef CTCLoss(
+    size_t handle, size_t probsDesc,
+    size_t probs, size_t labels, size_t labelLengths, size_t inputLengths,
+    size_t costs, size_t gradientsDesc, size_t gradients,
+    int algo, size_t ctcLossDesc,
+    size_t workspace, size_t workSpaceSizeInBytes)
+
+
 ###############################################################################
 # RNN
 ###############################################################################

diff --git a/cupy/cuda/cudnn.pyx b/cupy/cuda/cudnn.pyx
@@ -73,6 +73,7 @@ cdef extern from "cupy_cudnn.h" nogil:
     ctypedef int NanPropagation 'cudnnNanPropagation_t'
     ctypedef int PoolingMode 'cudnnPoolingMode_t'
     ctypedef int RNNInputMode 'cudnnRNNInputMode_t'
+    ctypedef int CTCLossAlgo 'cudnnCTCLossAlgo_t'
     ctypedef int RNNMode 'cudnnRNNMode_t'
     ctypedef int RNNAlgo 'cudnnRNNAlgo_t'
     ctypedef int RNNDataLayout 'cudnnRNNDataLayout_t'
@@ -94,6 +95,7 @@ cdef extern from "cupy_cudnn.h" nogil:
     ctypedef void* FilterDescriptor 'cudnnFilterDescriptor_t'
     ctypedef void* Handle 'cudnnHandle_t'
     ctypedef void* PoolingDescriptor 'cudnnPoolingDescriptor_t'
+    ctypedef void* CTCLossDescriptor 'cudnnCTCLossDescriptor_t'
     ctypedef void* RNNDescriptor 'cudnnRNNDescriptor_t'
     ctypedef void* RNNDataDescriptor 'cudnnRNNDataDescriptor_t'
     ctypedef void* PersistentRNNPlan 'cudnnPersistentRNNPlan_t'
@@ -445,6 +447,24 @@ cdef extern from "cupy_cudnn.h" nogil:
         TensorDescriptor dydesc, void* dy, TensorDescriptor dxdesc,
         void* dx, void* reserveSpace, size_t reserveSpaceSizeInBytes)
 
+    # CTC
+    int cudnnCreateCTCLossDescriptor(CTCLossDescriptor* ctcLossDesc)
+    int cudnnDestroyCTCLossDescriptor(CTCLossDescriptor ctcLossDesc)
+    int cudnnSetCTCLossDescriptor(CTCLossDescriptor ctcLossDesc,
+        DataType dataType)
+    int cudnnGetCTCLossDescriptor(CTCLossDescriptor ctcLossDesc,
+        DataType* dataType)
+    int cudnnGetCTCLossWorkspaceSize(
+        Handle handle, TensorDescriptor probsDesc,
+        TensorDescriptor gradientsDesc, int* labels,
+        int* labelLengths, int* inputLengths, CTCLossAlgo algo,
+        CTCLossDescriptor ctcLossDesc, size_t* sizeInBytes)
+    int cudnnCTCLoss(
+        Handle handle, TensorDescriptor probsDesc,
+        void* probs, int* labels, int* labelLengths, int* inputLengths,
+        void* costs, TensorDescriptor gradientsDesc, void* gradients,
+        CTCLossAlgo algo, CTCLossDescriptor ctcLossDesc,
+        void* workspace, size_t workSpaceSizeInBytes)
     # RNN
     int cudnnCreateRNNDescriptor(RNNDescriptor* rnnDesc)
     int cudnnDestroyRNNDescriptor(RNNDescriptor rnnDesc)
@@ -1684,6 +1704,59 @@ cpdef dropoutBackward(
     check_status(status)
 
 
+###############################################################################
+# CTC
+###############################################################################
+cpdef size_t createCTCLossDescriptor() except? 0:
+    cdef CTCLossDescriptor desc
+    status = cudnnCreateCTCLossDescriptor(&desc)
+    check_status(status)
+    return <size_t>desc
+
+cpdef destroyCTCLossDescriptor(size_t ctcLossDesc):
+    status = cudnnDestroyCTCLossDescriptor(<CTCLossDescriptor>ctcLossDesc)
+    check_status(status)
+
+cpdef setCTCLossDescriptor(size_t ctcLossDesc, int dataType):
+    status = cudnnSetCTCLossDescriptor(
+        <CTCLossDescriptor>ctcLossDesc, <DataType>dataType)
+    check_status(status)
+
+cpdef getCTCLossDescriptor(size_t ctcLossDesc):
+    cdef DataType compType
+    status = cudnnGetCTCLossDescriptor(<CTCLossDescriptor>ctcLossDesc,
+        &compType)
+    check_status(status)
+    return compType
+
+cpdef getCTCLossWorkspaceSize(
+        size_t handle, size_t probsDesc, size_t gradientsDesc,
+        size_t labels, size_t labelLengths, size_t inputLengths,
+        int algo, size_t ctcLossDesc):
+    cdef size_t sizeInBytes
+    status = cudnnGetCTCLossWorkspaceSize(
+        <Handle>handle, <TensorDescriptor>probsDesc,
+        <TensorDescriptor>gradientsDesc,
+        <int*>labels, <int*>labelLengths, <int*>inputLengths,
+        <CTCLossAlgo>algo, <CTCLossDescriptor>ctcLossDesc, &sizeInBytes)
+    check_status(status)
+    return sizeInBytes
+
+cpdef CTCLoss(
+        size_t handle, size_t probsDesc,
+        size_t probs, size_t labels, size_t labelLengths, size_t inputLengths,
+        size_t costs, size_t gradientsDesc, size_t gradients,
+        int algo, size_t ctcLossDesc,
+        size_t workspace, size_t workSpaceSizeInBytes):
+    status = cudnnCTCLoss(
+        <Handle>handle, <TensorDescriptor>probsDesc, <void*>probs,
+        <int*>labels, <int*>labelLengths, <int*>inputLengths,
+        <void*>costs, <TensorDescriptor>gradientsDesc, <void*>gradients,
+        <CTCLossAlgo>algo, <CTCLossDescriptor>ctcLossDesc,
+        <void*>workspace, <size_t>workSpaceSizeInBytes)
+    check_status(status)
+
+
 ###############################################################################
 # RNN
 ###############################################################################

diff --git a/cupy/cuda/cupy_cudnn.h b/cupy/cuda/cupy_cudnn.h
@@ -660,6 +660,28 @@ cudnnStatus_t cudnnReduceTensor(...) {
 
 
 typedef enum {} cudnnMathType_t;
+typedef enum {} cudnnCTCLossAlgo_t;
+typedef void* cudnnCTCLossDescriptor_t;
+
+// CTC
+cudnnStatus_t cudnnCreateCTCLossDescriptor(...) {
+    return CUDNN_STATUS_NOT_SUPPORTED;
+}
+cudnnStatus_t cudnnDestroyCTCLossDescriptor(...) {
+    return CUDNN_STATUS_NOT_SUPPORTED;
+}
+cudnnStatus_t cudnnSetCTCLossDescriptor(...) {
+    return CUDNN_STATUS_NOT_SUPPORTED;
+}
+cudnnStatus_t cudnnGetCTCLossDescriptor(...) {
+    return CUDNN_STATUS_NOT_SUPPORTED;
+}
+cudnnStatus_t cudnnGetCTCLossWorkspaceSize(...) {
+    return CUDNN_STATUS_NOT_SUPPORTED;
+}
+cudnnStatus_t cudnnCTCLoss(...) {
+    return CUDNN_STATUS_NOT_SUPPORTED;
+}
 
 cudnnStatus_t cudnnSetConvolutionMathType(...) {
     return CUDNN_STATUS_NOT_SUPPORTED;
@@ -775,7 +797,7 @@ typedef void* cudnnRNNDataDescriptor_t;
 
 typedef enum {} cudnnRNNDataLayout_t;
 typedef enum {} cudnnRNNPaddingMode_t;
-  
+
 cudnnStatus_t cudnnSetRNNPaddingMode(...) {
     return CUDNN_STATUS_NOT_SUPPORTED;
 }

diff --git a/cupy/cudnn.pyx b/cupy/cudnn.pyx
@@ -382,6 +382,13 @@ def set_dropout_descriptor(desc, handle, dropout):
     cudnn.setDropoutDescriptor(desc.value, handle, dropout, 0, 0, 0)
 
 
+def create_ctc_loss_descriptor(data_type):
 def activation_forward(core.ndarray x, int mode, double coef=0.0): 
-def create_ctc_loss_descriptor(data_type):
+def _create_ctc_loss_descriptor(data_type):
 def activation_forward(core.ndarray x, int mode, double coef=0.0): 
-def create_ctc_loss_descriptor(data_type):
+def _create_ctc_loss_descriptor(data_type):
+  desc = Descriptor(cudnn.createCTCLossDescriptor(),
+                    py_cudnn.destroyCTCLossDescriptor)
+  cudnn.setCTCLossDescriptor(desc.value, data_type)
+  return desc
+
+
 def create_rnn_descriptor(hidden_size, num_layers, dropout_desc,
                           input_mode, direction, mode, data_type, algo=None):
     desc = Descriptor(cudnn.createRNNDescriptor(),