diff --git a/docs/html/block__discontinuity_8cuh_source.html b/docs/html/block__discontinuity_8cuh_source.html
new file mode 100644
index 0000000000..d9423b274f
--- /dev/null
+++ b/docs/html/block__discontinuity_8cuh_source.html
@@ -0,0 +1,407 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: block_discontinuity.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_011e1c944d88f71be72e1e24a5fda7cf.html">block</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">block_discontinuity.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="block__discontinuity_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    <span class="keywordtype">int</span>         BLOCK_THREADS&gt;</div>
+<div class="line"><a name="l00097"></a><span class="lineno"><a class="code" href="classcub_1_1_block_discontinuity.html">   97</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_block_discontinuity.html" title="The BlockDiscontinuity class provides collective methods for flagging discontinuities within an order...">BlockDiscontinuity</a></div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;{</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="comment">     * Type definitions</span></div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keyword">typedef</span> T _TempStorage[BLOCK_THREADS];</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    {</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;        __shared__ _TempStorage private_storage;</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    }</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    template &lt;typename FlagOp, bool HAS_PARAM = BinaryOpHasIdxParam&lt;T, FlagOp&gt;::HAS_PARAM&gt;</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <span class="keyword">struct </span>ApplyOp</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    {</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;        <span class="comment">// Apply flag operator</span></div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;        <span class="keyword">static</span> __device__ __forceinline__ <span class="keywordtype">bool</span> Flag(FlagOp flag_op, <span class="keyword">const</span> T &amp;a, <span class="keyword">const</span> T &amp;b, <span class="keywordtype">int</span> idx)</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;        {</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;            <span class="keywordflow">return</span> flag_op(a, b, idx);</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;        }</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    };</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> FlagOp&gt;</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <span class="keyword">struct </span>ApplyOp&lt;FlagOp, false&gt;</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    {</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;        <span class="comment">// Apply flag operator</span></div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;        <span class="keyword">static</span> __device__ __forceinline__ <span class="keywordtype">bool</span> Flag(FlagOp flag_op, <span class="keyword">const</span> T &amp;a, <span class="keyword">const</span> T &amp;b, <span class="keywordtype">int</span> idx)</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;        {</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;            <span class="keywordflow">return</span> flag_op(a, b);</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;        }</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;    };</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div>
+<div class="line"><a name="l00158"></a><span class="lineno"><a class="code" href="structcub_1_1_block_discontinuity_1_1_temp_storage.html">  158</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_discontinuity_1_1_temp_storage.html" title="The operations exposed by BlockDiscontinuity require a temporary memory allocation of this nested typ...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div>
+<div class="line"><a name="l00169"></a><span class="lineno"><a class="code" href="classcub_1_1_block_discontinuity.html#a5bee18d5e423a26fd3fefa741832ad8c">  169</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_discontinuity.html#a5bee18d5e423a26fd3fefa741832ad8c" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">BlockDiscontinuity</a>()</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    :</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;    {}</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div>
+<div class="line"><a name="l00179"></a><span class="lineno"><a class="code" href="classcub_1_1_block_discontinuity.html#a3f5c69462af0c9609f845e474842cfb2">  179</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_discontinuity.html#a3f5c69462af0c9609f845e474842cfb2" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">BlockDiscontinuity</a>(</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;        <a class="code" href="structcub_1_1_block_discontinuity_1_1_temp_storage.html" title="The operations exposed by BlockDiscontinuity require a temporary memory allocation of this nested typ...">TempStorage</a> &amp;temp_storage)  </div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    :</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    {}</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div>
+<div class="line"><a name="l00190"></a><span class="lineno"><a class="code" href="classcub_1_1_block_discontinuity.html#a4c99f418ce99535494ae1c309f58f0ac">  190</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_discontinuity.html#a4c99f418ce99535494ae1c309f58f0ac" title="Collective constructor using a private static allocation of shared memory as temporary storage...">BlockDiscontinuity</a>(</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;        <span class="keywordtype">int</span> linear_tid)             </div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    :</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    {}</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div>
+<div class="line"><a name="l00201"></a><span class="lineno"><a class="code" href="classcub_1_1_block_discontinuity.html#a0edc454bf6d30810b3b086ec77ed4e11">  201</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_discontinuity.html#a0edc454bf6d30810b3b086ec77ed4e11" title="Collective constructor using the specified memory allocation as temporary storage. Each thread is identified using the supplied linear thread identifier. ">BlockDiscontinuity</a>(</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;        <a class="code" href="structcub_1_1_block_discontinuity_1_1_temp_storage.html" title="The operations exposed by BlockDiscontinuity require a temporary memory allocation of this nested typ...">TempStorage</a> &amp;temp_storage,  </div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;        <span class="keywordtype">int</span> linear_tid)             </div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;    :</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    {}</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;        <span class="keyword">typename</span>        FlagT,</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;        <span class="keyword">typename</span>        FlagOp&gt;</div>
+<div class="line"><a name="l00271"></a><span class="lineno"><a class="code" href="classcub_1_1_block_discontinuity.html#afabe7f18d7098e7d0f149696bec17186">  271</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_discontinuity.html#afabe7f18d7098e7d0f149696bec17186" title="Sets head flags indicating discontinuities between items partitioned across the thread block...">FlagHeads</a>(</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;        FlagT           (&amp;head_flags)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],         </div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;        FlagOp          flag_op)                            </div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    {</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;        <span class="comment">// Share last item</span></div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;        temp_storage[linear_tid] = input[ITEMS_PER_THREAD - 1];</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;        __syncthreads();</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;        <span class="comment">// Set flag for first item</span></div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;        head_flags[0] = (linear_tid == 0) ?</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;            1 :                                 <span class="comment">// First thread</span></div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;            ApplyOp&lt;FlagOp&gt;::Flag(</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;                flag_op,</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;                temp_storage[linear_tid - 1],</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;                input[0],</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;                linear_tid * ITEMS_PER_THREAD);</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;        <span class="comment">// Set head_flags for remaining items</span></div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 1; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;        {</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;            head_flags[ITEM] = ApplyOp&lt;FlagOp&gt;::Flag(</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;                flag_op,</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;                input[ITEM - 1],</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;                input[ITEM],</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;                (linear_tid * ITEMS_PER_THREAD) + ITEM);</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;        }</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;    }</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;        <span class="keyword">typename</span>        FlagT,</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;        <span class="keyword">typename</span>        FlagOp&gt;</div>
+<div class="line"><a name="l00361"></a><span class="lineno"><a class="code" href="classcub_1_1_block_discontinuity.html#ac1d38030af4f9228613f78207e64a314">  361</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_discontinuity.html#ac1d38030af4f9228613f78207e64a314" title="Sets head flags indicating discontinuities between items partitioned across the thread block...">FlagHeads</a>(</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;        FlagT           (&amp;head_flags)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],         </div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;        FlagOp          flag_op,                            </div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;        T               tile_predecessor_item)                   </div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;    {</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;        <span class="comment">// Share last item</span></div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;        temp_storage[linear_tid] = input[ITEMS_PER_THREAD - 1];</div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;        __syncthreads();</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;        <span class="comment">// Set flag for first item</span></div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;        <span class="keywordtype">int</span> predecessor = (linear_tid == 0) ?</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;            tile_predecessor_item :              <span class="comment">// First thread</span></div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;            temp_storage[linear_tid - 1];</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;        head_flags[0] = ApplyOp&lt;FlagOp&gt;::Flag(</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;            flag_op,</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;            predecessor,</div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;            input[0],</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;            linear_tid * ITEMS_PER_THREAD);</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;        <span class="comment">// Set flag for remaining items</span></div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 1; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;        {</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;            head_flags[ITEM] = ApplyOp&lt;FlagOp&gt;::Flag(</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;                flag_op,</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;                input[ITEM - 1],</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;                input[ITEM],</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;                (linear_tid * ITEMS_PER_THREAD) + ITEM);</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;        }</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;    }</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;        <span class="keyword">typename</span>        FlagT,</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;        <span class="keyword">typename</span>        FlagOp&gt;</div>
+<div class="line"><a name="l00456"></a><span class="lineno"><a class="code" href="classcub_1_1_block_discontinuity.html#acf705e15934ba04c556e5860a2853652">  456</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_discontinuity.html#acf705e15934ba04c556e5860a2853652" title="Sets tail flags indicating discontinuities between items partitioned across the thread block...">FlagTails</a>(</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;        FlagT           (&amp;tail_flags)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],         </div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;        FlagOp          flag_op)                            </div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;    {</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;        <span class="comment">// Share first item</span></div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;        temp_storage[linear_tid] = input[0];</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;        __syncthreads();</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;        <span class="comment">// Set flag for last item</span></div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;        tail_flags[ITEMS_PER_THREAD - 1] = (linear_tid == BLOCK_THREADS - 1) ?</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;            1 :                             <span class="comment">// Last thread</span></div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;            ApplyOp&lt;FlagOp&gt;::Flag(</div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;                flag_op,</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;                input[ITEMS_PER_THREAD - 1],</div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;                temp_storage[linear_tid + 1],</div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;                (linear_tid * ITEMS_PER_THREAD) + (ITEMS_PER_THREAD - 1));</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;</div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;        <span class="comment">// Set flags for remaining items</span></div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD - 1; ITEM++)</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;        {</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;            tail_flags[ITEM] = ApplyOp&lt;FlagOp&gt;::Flag(</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;                flag_op,</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;                input[ITEM],</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;                input[ITEM + 1],</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;                (linear_tid * ITEMS_PER_THREAD) + ITEM);</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;        }</div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;    }</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;</div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;</div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;        <span class="keyword">typename</span>        FlagT,</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;        <span class="keyword">typename</span>        FlagOp&gt;</div>
+<div class="line"><a name="l00547"></a><span class="lineno"><a class="code" href="classcub_1_1_block_discontinuity.html#ad80f6195b0366d7f88180dc349043179">  547</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_discontinuity.html#ad80f6195b0366d7f88180dc349043179" title="Sets tail flags indicating discontinuities between items partitioned across the thread block...">FlagTails</a>(</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;        FlagT           (&amp;tail_flags)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],         </div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;        FlagOp          flag_op,                            </div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;        T               tile_successor_item)                   </div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;    {</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;        <span class="comment">// Share first item</span></div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;        temp_storage[linear_tid] = input[0];</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;        __syncthreads();</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;        <span class="comment">// Set flag for last item</span></div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;        <span class="keywordtype">int</span> successor_item = (linear_tid == BLOCK_THREADS - 1) ?</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;            tile_successor_item :              <span class="comment">// Last thread</span></div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;            temp_storage[linear_tid + 1];</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;        tail_flags[ITEMS_PER_THREAD - 1] = ApplyOp&lt;FlagOp&gt;::Flag(</div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;            flag_op,</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;            input[ITEMS_PER_THREAD - 1],</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;            successor_item,</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;            (linear_tid * ITEMS_PER_THREAD) + (ITEMS_PER_THREAD - 1));</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;</div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;        <span class="comment">// Set flags for remaining items</span></div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD - 1; ITEM++)</div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;        {</div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;            tail_flags[ITEM] = ApplyOp&lt;FlagOp&gt;::Flag(</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;                flag_op,</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;                input[ITEM],</div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;                input[ITEM + 1],</div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;                (linear_tid * ITEMS_PER_THREAD) + ITEM);</div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;        }</div>
+<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;    }</div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;</div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;};</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/block__exchange_8cuh_source.html b/docs/html/block__exchange_8cuh_source.html
new file mode 100644
index 0000000000..6612c803d7
--- /dev/null
+++ b/docs/html/block__exchange_8cuh_source.html
@@ -0,0 +1,745 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: block_exchange.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_011e1c944d88f71be72e1e24a5fda7cf.html">block</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">block_exchange.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="block__exchange_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;../util_arch.cuh&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;../util_macro.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="keywordtype">int</span>             BLOCK_THREADS,</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keywordtype">bool</span>            WARP_TIME_SLICING = <span class="keyword">false</span>&gt;</div>
+<div class="line"><a name="l00110"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html">  110</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a></div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;{</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="comment">     * Constants</span></div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    {</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;        LOG_WARP_THREADS            = PtxArchProps::LOG_WARP_THREADS,</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;        WARP_THREADS                = 1 &lt;&lt; LOG_WARP_THREADS,</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;        WARPS                       = (BLOCK_THREADS + <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> - 1) / <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>,</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;        LOG_SMEM_BANKS              = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5" title="Number of threads per warp. ">PtxArchProps::LOG_SMEM_BANKS</a>,</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;        SMEM_BANKS                  = 1 &lt;&lt; LOG_SMEM_BANKS,</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;        TILE_ITEMS                  = BLOCK_THREADS * ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;        TIME_SLICES                 = (WARP_TIME_SLICING) ? WARPS : 1,</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;        TIME_SLICED_THREADS         = (WARP_TIME_SLICING) ? CUB_MIN(BLOCK_THREADS, WARP_THREADS) : BLOCK_THREADS,</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;        TIME_SLICED_ITEMS           = TIME_SLICED_THREADS * ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;        WARP_TIME_SLICED_THREADS    = CUB_MIN(BLOCK_THREADS, WARP_THREADS),</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;        WARP_TIME_SLICED_ITEMS      = WARP_TIME_SLICED_THREADS * ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;        <span class="comment">// Insert padding if the number of items per thread is a power of two</span></div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;        INSERT_PADDING              = ((ITEMS_PER_THREAD &amp; (ITEMS_PER_THREAD - 1)) == 0),</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;        PADDING_ITEMS               = (INSERT_PADDING) ? (TIME_SLICED_ITEMS &gt;&gt; LOG_SMEM_BANKS) : 0,</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    };</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="comment">     * Type definitions</span></div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    <span class="keyword">typedef</span> T _TempStorage[TIME_SLICED_ITEMS + PADDING_ITEMS];</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;</div>
+<div class="line"><a name="l00152"></a><span class="lineno"><a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html">  152</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;    <span class="keywordtype">int</span> warp_lane;</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    <span class="keywordtype">int</span> warp_id;</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    <span class="keywordtype">int</span> warp_offset;</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    {</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;        __shared__ _TempStorage private_storage;</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    }</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> BlockedToStriped(</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;        T               items[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;        <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type&lt;false&gt;</a> time_slicing)</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    {</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;        {</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;            <span class="keywordtype">int</span> item_offset = (linear_tid * ITEMS_PER_THREAD) + ITEM;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;            temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;        }</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;        __syncthreads();</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;        {</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;            <span class="keywordtype">int</span> item_offset = int(ITEM * BLOCK_THREADS) + linear_tid;</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;            items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;        }</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    }</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> BlockedToStriped(</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;        T               items[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;        Int2Type&lt;true&gt;  time_slicing)</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    {</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;        T temp_items[ITEMS_PER_THREAD];</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> SLICE = 0; SLICE &lt; TIME_SLICES; SLICE++)</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;        {</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">int</span> SLICE_OFFSET  = SLICE * TIME_SLICED_ITEMS;</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">int</span> SLICE_OOB     = SLICE_OFFSET + TIME_SLICED_ITEMS;</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;            <span class="keywordflow">if</span> (warp_id == SLICE)</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;            {</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;<span class="preprocessor">                #pragma unroll</span></div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;<span class="preprocessor"></span>                <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;                {</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;                    <span class="keywordtype">int</span> item_offset = (warp_lane * ITEMS_PER_THREAD) + ITEM;</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;                    <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;                    temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;                }</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;            }</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;<span class="preprocessor">            #pragma unroll</span></div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;<span class="preprocessor"></span>            <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;            {</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;                <span class="comment">// Read a strip of items</span></div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;                <span class="keyword">const</span> <span class="keywordtype">int</span> STRIP_OFFSET  = ITEM * BLOCK_THREADS;</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;                <span class="keyword">const</span> <span class="keywordtype">int</span> STRIP_OOB     = STRIP_OFFSET + BLOCK_THREADS;</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;                <span class="keywordflow">if</span> ((SLICE_OFFSET &lt; STRIP_OOB) &amp;&amp; (SLICE_OOB &gt; STRIP_OFFSET))</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;                {</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;                    <span class="keywordtype">int</span> item_offset = STRIP_OFFSET + linear_tid - SLICE_OFFSET;</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;                    <span class="keywordflow">if</span> ((item_offset &gt;= 0) &amp;&amp; (item_offset &lt; TIME_SLICED_ITEMS))</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;                    {</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;                        <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;                        temp_items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;                    }</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;                }</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;            }</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;        }</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;        <span class="comment">// Copy</span></div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;        {</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;            items[ITEM] = temp_items[ITEM];</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;        }</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;    }</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> BlockedToWarpStriped(</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;        T               items[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;        Int2Type&lt;false&gt; time_slicing)</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;    {</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;        {</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;            <span class="keywordtype">int</span> item_offset = warp_offset + ITEM + (warp_lane * ITEMS_PER_THREAD);</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;            temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;        }</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;        {</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;            <span class="keywordtype">int</span> item_offset = warp_offset + (ITEM * WARP_TIME_SLICED_THREADS) + warp_lane;</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;            items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;        }</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;    }</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> BlockedToWarpStriped(</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;        T               items[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;        Int2Type&lt;true&gt;  time_slicing)</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;    {</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> SLICE = 0; SLICE &lt; TIME_SLICES; ++SLICE)</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;        {</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;            <span class="keywordflow">if</span> (warp_id == SLICE)</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;            {</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;<span class="preprocessor">                #pragma unroll</span></div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;<span class="preprocessor"></span>                <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;                {</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;                    <span class="keywordtype">int</span> item_offset = ITEM + (warp_lane * ITEMS_PER_THREAD);</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;                    <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;                    temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;                }</div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;<span class="preprocessor">                #pragma unroll</span></div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;<span class="preprocessor"></span>                <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;                {</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;                    <span class="keywordtype">int</span> item_offset = (ITEM * WARP_TIME_SLICED_THREADS) + warp_lane;</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                    <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;                    items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;                }</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;            }</div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;        }</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;    }</div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> StripedToBlocked(</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;        T               items[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;        Int2Type&lt;false&gt; time_slicing)</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;    {</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;        {</div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;            <span class="keywordtype">int</span> item_offset = int(ITEM * BLOCK_THREADS) + linear_tid;</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;            temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;        }</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;        __syncthreads();</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;        <span class="comment">// No timeslicing</span></div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;        {</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;            <span class="keywordtype">int</span> item_offset = (linear_tid * ITEMS_PER_THREAD) + ITEM;</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;            items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;        }</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    }</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> StripedToBlocked(</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;        T               items[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;        Int2Type&lt;true&gt;  time_slicing)</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;    {</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;        <span class="comment">// Warp time-slicing</span></div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;        T temp_items[ITEMS_PER_THREAD];</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> SLICE = 0; SLICE &lt; TIME_SLICES; SLICE++)</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;        {</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">int</span> SLICE_OFFSET  = SLICE * TIME_SLICED_ITEMS;</div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">int</span> SLICE_OOB     = SLICE_OFFSET + TIME_SLICED_ITEMS;</div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;<span class="preprocessor">            #pragma unroll</span></div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;<span class="preprocessor"></span>            <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;            {</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;                <span class="comment">// Write a strip of items</span></div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;                <span class="keyword">const</span> <span class="keywordtype">int</span> STRIP_OFFSET  = ITEM * BLOCK_THREADS;</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;                <span class="keyword">const</span> <span class="keywordtype">int</span> STRIP_OOB     = STRIP_OFFSET + BLOCK_THREADS;</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;                <span class="keywordflow">if</span> ((SLICE_OFFSET &lt; STRIP_OOB) &amp;&amp; (SLICE_OOB &gt; STRIP_OFFSET))</div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;                {</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;                    <span class="keywordtype">int</span> item_offset = STRIP_OFFSET + linear_tid - SLICE_OFFSET;</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;                    <span class="keywordflow">if</span> ((item_offset &gt;= 0) &amp;&amp; (item_offset &lt; TIME_SLICED_ITEMS))</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;                    {</div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;                        <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;                        temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;                    }</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;                }</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;            }</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;            <span class="keywordflow">if</span> (warp_id == SLICE)</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;            {</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;<span class="preprocessor">                #pragma unroll</span></div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;<span class="preprocessor"></span>                <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;                {</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;                    <span class="keywordtype">int</span> item_offset = (warp_lane * ITEMS_PER_THREAD) + ITEM;</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;                    <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;                    temp_items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;                }</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;            }</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;        }</div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;        <span class="comment">// Copy</span></div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;        {</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;            items[ITEM] = temp_items[ITEM];</div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;        }</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;    }</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> WarpStripedToBlocked(</div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;        T               items[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;        Int2Type&lt;false&gt; time_slicing)</div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;    {</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;        {</div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;            <span class="keywordtype">int</span> item_offset = warp_offset + (ITEM * WARP_TIME_SLICED_THREADS) + warp_lane;</div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;            temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;        }</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;</div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;        {</div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;            <span class="keywordtype">int</span> item_offset = warp_offset + ITEM + (warp_lane * ITEMS_PER_THREAD);</div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;            items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;        }</div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;    }</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;</div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;</div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> WarpStripedToBlocked(</div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;        T               items[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;        Int2Type&lt;true&gt;  time_slicing)</div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;    {</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> SLICE = 0; SLICE &lt; TIME_SLICES; ++SLICE)</div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;        {</div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;            <span class="keywordflow">if</span> (warp_id == SLICE)</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;            {</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;<span class="preprocessor">                #pragma unroll</span></div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;<span class="preprocessor"></span>                <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;                {</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;                    <span class="keywordtype">int</span> item_offset = (ITEM * WARP_TIME_SLICED_THREADS) + warp_lane;</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;                    <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;                    temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;                }</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;<span class="preprocessor">                #pragma unroll</span></div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;<span class="preprocessor"></span>                <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;                {</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;                    <span class="keywordtype">int</span> item_offset = ITEM + (warp_lane * ITEMS_PER_THREAD);</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;                    <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;                    items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;                }</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;            }</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;        }</div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;    }</div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;</div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ScatterToBlocked(</div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;        T               items[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;        <span class="keywordtype">int</span>             ranks[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;        Int2Type&lt;false&gt; time_slicing)</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;    {</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;        {</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;            <span class="keywordtype">int</span> item_offset = ranks[ITEM];</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset = SHR_ADD(item_offset, LOG_SMEM_BANKS, item_offset);</div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;            temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;        }</div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;        __syncthreads();</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;</div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;        {</div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;            <span class="keywordtype">int</span> item_offset = (linear_tid * ITEMS_PER_THREAD) + ITEM;</div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset = SHR_ADD(item_offset, LOG_SMEM_BANKS, item_offset);</div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;            items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;        }</div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;    }</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;</div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ScatterToBlocked(</div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;        T               items[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;        <span class="keywordtype">int</span>             ranks[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;        Int2Type&lt;true&gt;  time_slicing)</div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;    {</div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;        T temp_items[ITEMS_PER_THREAD];</div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;</div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> SLICE = 0; SLICE &lt; TIME_SLICES; SLICE++)</div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;        {</div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;</div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">int</span> SLICE_OFFSET = TIME_SLICED_ITEMS * SLICE;</div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;</div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;<span class="preprocessor">            #pragma unroll</span></div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;<span class="preprocessor"></span>            <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;            {</div>
+<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;                <span class="keywordtype">int</span> item_offset = ranks[ITEM] - SLICE_OFFSET;</div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;                <span class="keywordflow">if</span> ((item_offset &gt;= 0) &amp;&amp; (item_offset &lt; WARP_TIME_SLICED_ITEMS))</div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;                {</div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;                    <span class="keywordflow">if</span> (INSERT_PADDING) item_offset = SHR_ADD(item_offset, LOG_SMEM_BANKS, item_offset);</div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;                    temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;                }</div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;            }</div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;</div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;</div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;            <span class="keywordflow">if</span> (warp_id == SLICE)</div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;            {</div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;<span class="preprocessor">                #pragma unroll</span></div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;<span class="preprocessor"></span>                <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;                {</div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;                    <span class="keywordtype">int</span> item_offset = (warp_lane * ITEMS_PER_THREAD) + ITEM;</div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;                    <span class="keywordflow">if</span> (INSERT_PADDING) item_offset = SHR_ADD(item_offset, LOG_SMEM_BANKS, item_offset);</div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;                    temp_items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;                }</div>
+<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;            }</div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;        }</div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;</div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;        <span class="comment">// Copy</span></div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;        {</div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;            items[ITEM] = temp_items[ITEM];</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;        }</div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;    }</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ScatterToStriped(</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;        T               items[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        <span class="keywordtype">int</span>             ranks[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;        Int2Type&lt;false&gt; time_slicing)</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;    {</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;        {</div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;            <span class="keywordtype">int</span> item_offset = ranks[ITEM];</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset = SHR_ADD(item_offset, LOG_SMEM_BANKS, item_offset);</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;            temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;        }</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;        __syncthreads();</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;        {</div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;            <span class="keywordtype">int</span> item_offset = int(ITEM * BLOCK_THREADS) + linear_tid;</div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;            <span class="keywordflow">if</span> (INSERT_PADDING) item_offset = SHR_ADD(item_offset, LOG_SMEM_BANKS, item_offset);</div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;            items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;        }</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;    }</div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;</div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ScatterToStriped(</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;        T               items[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;        <span class="keywordtype">int</span>             ranks[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;        Int2Type&lt;true&gt; time_slicing)</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;    {</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;        T temp_items[ITEMS_PER_THREAD];</div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> SLICE = 0; SLICE &lt; TIME_SLICES; SLICE++)</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;        {</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">int</span> SLICE_OFFSET  = SLICE * TIME_SLICED_ITEMS;</div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;            <span class="keyword">const</span> <span class="keywordtype">int</span> SLICE_OOB     = SLICE_OFFSET + TIME_SLICED_ITEMS;</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;<span class="preprocessor">            #pragma unroll</span></div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;<span class="preprocessor"></span>            <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;            {</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;                <span class="keywordtype">int</span> item_offset = ranks[ITEM] - SLICE_OFFSET;</div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;                <span class="keywordflow">if</span> ((item_offset &gt;= 0) &amp;&amp; (item_offset &lt; WARP_TIME_SLICED_ITEMS))</div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;                {</div>
+<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;                    <span class="keywordflow">if</span> (INSERT_PADDING) item_offset = SHR_ADD(item_offset, LOG_SMEM_BANKS, item_offset);</div>
+<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;                    temp_storage[item_offset] = items[ITEM];</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;                }</div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;            }</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;</div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;</div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;<span class="preprocessor">            #pragma unroll</span></div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;<span class="preprocessor"></span>            <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;            {</div>
+<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;                <span class="comment">// Read a strip of items</span></div>
+<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;                <span class="keyword">const</span> <span class="keywordtype">int</span> STRIP_OFFSET  = ITEM * BLOCK_THREADS;</div>
+<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;                <span class="keyword">const</span> <span class="keywordtype">int</span> STRIP_OOB     = STRIP_OFFSET + BLOCK_THREADS;</div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;</div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;                <span class="keywordflow">if</span> ((SLICE_OFFSET &lt; STRIP_OOB) &amp;&amp; (SLICE_OOB &gt; STRIP_OFFSET))</div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;                {</div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;                    <span class="keywordtype">int</span> item_offset = STRIP_OFFSET + linear_tid - SLICE_OFFSET;</div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;                    <span class="keywordflow">if</span> ((item_offset &gt;= 0) &amp;&amp; (item_offset &lt; TIME_SLICED_ITEMS))</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;                    {</div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;                        <span class="keywordflow">if</span> (INSERT_PADDING) item_offset += item_offset &gt;&gt; LOG_SMEM_BANKS;</div>
+<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;                        temp_items[ITEM] = temp_storage[item_offset];</div>
+<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;                    }</div>
+<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;                }</div>
+<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;            }</div>
+<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;        }</div>
+<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;</div>
+<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;        <span class="comment">// Copy</span></div>
+<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;        {</div>
+<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;            items[ITEM] = temp_items[ITEM];</div>
+<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;        }</div>
+<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;    }</div>
+<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;</div>
+<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;</div>
+<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;</div>
+<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;</div>
+<div class="line"><a name="l00647"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#a31f5a889713220dfe21669a4865f3f4e">  647</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_exchange.html#a31f5a889713220dfe21669a4865f3f4e" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">BlockExchange</a>()</div>
+<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;    :</div>
+<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;        linear_tid(threadIdx.x),</div>
+<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;        warp_lane(linear_tid &amp; (WARP_THREADS - 1)),</div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;        warp_id(linear_tid &gt;&gt; LOG_WARP_THREADS),</div>
+<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;        warp_offset(warp_id * WARP_TIME_SLICED_ITEMS)</div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;    {}</div>
+<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;</div>
+<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;</div>
+<div class="line"><a name="l00660"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#aff7137dd257eeec8d7628b4f9f4e1457">  660</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_exchange.html#aff7137dd257eeec8d7628b4f9f4e1457" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">BlockExchange</a>(</div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;        <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">TempStorage</a> &amp;temp_storage)             </div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;    :</div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;        linear_tid(threadIdx.x),</div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;        warp_lane(linear_tid &amp; (WARP_THREADS - 1)),</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;        warp_id(linear_tid &gt;&gt; LOG_WARP_THREADS),</div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;        warp_offset(warp_id * WARP_TIME_SLICED_ITEMS)</div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;    {}</div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;</div>
+<div class="line"><a name="l00674"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#aa0689007bc51632404a1893e52a0e6e9">  674</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_exchange.html#aa0689007bc51632404a1893e52a0e6e9" title="Collective constructor using a private static allocation of shared memory as temporary storage...">BlockExchange</a>(</div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;    :</div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;        linear_tid(linear_tid),</div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;        warp_lane(linear_tid &amp; (WARP_THREADS - 1)),</div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;        warp_id(linear_tid &gt;&gt; LOG_WARP_THREADS),</div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;        warp_offset(warp_id * WARP_TIME_SLICED_ITEMS)</div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;    {}</div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;</div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;</div>
+<div class="line"><a name="l00688"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#a166150541730a842f1af039e34131ea9">  688</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_exchange.html#a166150541730a842f1af039e34131ea9" title="Collective constructor using the specified memory allocation as temporary storage. Each thread is identified using the supplied linear thread identifier. ">BlockExchange</a>(</div>
+<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;        <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">TempStorage</a> &amp;temp_storage,              </div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;        <span class="keywordtype">int</span>         linear_tid)                 </div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;    :</div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;        linear_tid(linear_tid),</div>
+<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;        warp_lane(linear_tid &amp; (WARP_THREADS - 1)),</div>
+<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;        warp_id(linear_tid &gt;&gt; LOG_WARP_THREADS),</div>
+<div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;        warp_offset(warp_id * WARP_TIME_SLICED_ITEMS)</div>
+<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;    {}</div>
+<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;</div>
+<div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160;</div>
+<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;</div>
+<div class="line"><a name="l00740"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#a063505380e68bb5744d12fa7e1f16145">  740</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_exchange.html#a063505380e68bb5744d12fa7e1f16145" title="Transposes data items from striped arrangement to blocked arrangement. ">StripedToBlocked</a>(</div>
+<div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;        T                items[ITEMS_PER_THREAD])   </div>
+<div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;    {</div>
+<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;        StripedToBlocked(items, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type&lt;WARP_TIME_SLICING&gt;</a>());</div>
+<div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;    }</div>
+<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;</div>
+<div class="line"><a name="l00784"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#a5e487b2f594fa0ae466bf1c7b6b9c06d">  784</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_exchange.html#a5e487b2f594fa0ae466bf1c7b6b9c06d" title="Transposes data items from blocked arrangement to striped arrangement. ">BlockedToStriped</a>(</div>
+<div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160;        T               items[ITEMS_PER_THREAD])    </div>
+<div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;    {</div>
+<div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;        BlockedToStriped(items, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type&lt;WARP_TIME_SLICING&gt;</a>());</div>
+<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;    }</div>
+<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;</div>
+<div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;</div>
+<div class="line"><a name="l00827"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#a09969c12793c1876a2e6328c97c0330a">  827</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_exchange.html#a09969c12793c1876a2e6328c97c0330a" title="Transposes data items from warp-striped arrangement to blocked arrangement. ">WarpStripedToBlocked</a>(</div>
+<div class="line"><a name="l00828"></a><span class="lineno">  828</span>&#160;        T                items[ITEMS_PER_THREAD])   </div>
+<div class="line"><a name="l00829"></a><span class="lineno">  829</span>&#160;    {</div>
+<div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160;        WarpStripedToBlocked(items, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type&lt;WARP_TIME_SLICING&gt;</a>());</div>
+<div class="line"><a name="l00831"></a><span class="lineno">  831</span>&#160;    }</div>
+<div class="line"><a name="l00832"></a><span class="lineno">  832</span>&#160;</div>
+<div class="line"><a name="l00872"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#a74fc1a62cac21f54289bb7092250a868">  872</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_exchange.html#a74fc1a62cac21f54289bb7092250a868" title="Transposes data items from blocked arrangement to warp-striped arrangement. ">BlockedToWarpStriped</a>(</div>
+<div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;        T                items[ITEMS_PER_THREAD])   </div>
+<div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;    {</div>
+<div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;        BlockedToWarpStriped(items, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type&lt;WARP_TIME_SLICING&gt;</a>());</div>
+<div class="line"><a name="l00876"></a><span class="lineno">  876</span>&#160;    }</div>
+<div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160;</div>
+<div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;</div>
+<div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;</div>
+<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;</div>
+<div class="line"><a name="l00891"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#ac8dd22c90a28e54a8c1d6b0637054661">  891</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_exchange.html#ac8dd22c90a28e54a8c1d6b0637054661" title="Exchanges data items annotated by rank into blocked arrangement. ">ScatterToBlocked</a>(</div>
+<div class="line"><a name="l00892"></a><span class="lineno">  892</span>&#160;        T               items[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00893"></a><span class="lineno">  893</span>&#160;        <span class="keywordtype">int</span>             ranks[ITEMS_PER_THREAD])    </div>
+<div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160;    {</div>
+<div class="line"><a name="l00895"></a><span class="lineno">  895</span>&#160;        ScatterToBlocked(items, ranks, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type&lt;WARP_TIME_SLICING&gt;</a>());</div>
+<div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;    }</div>
+<div class="line"><a name="l00897"></a><span class="lineno">  897</span>&#160;</div>
+<div class="line"><a name="l00898"></a><span class="lineno">  898</span>&#160;</div>
+<div class="line"><a name="l00904"></a><span class="lineno"><a class="code" href="classcub_1_1_block_exchange.html#a53516886ba6750060819581b1bb23d68">  904</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_exchange.html#a53516886ba6750060819581b1bb23d68" title="Exchanges data items annotated by rank into striped arrangement. ">ScatterToStriped</a>(</div>
+<div class="line"><a name="l00905"></a><span class="lineno">  905</span>&#160;        T               items[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00906"></a><span class="lineno">  906</span>&#160;        <span class="keywordtype">int</span>             ranks[ITEMS_PER_THREAD])    </div>
+<div class="line"><a name="l00907"></a><span class="lineno">  907</span>&#160;    {</div>
+<div class="line"><a name="l00908"></a><span class="lineno">  908</span>&#160;        ScatterToStriped(items, ranks, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type&lt;WARP_TIME_SLICING&gt;</a>());</div>
+<div class="line"><a name="l00909"></a><span class="lineno">  909</span>&#160;    }</div>
+<div class="line"><a name="l00910"></a><span class="lineno">  910</span>&#160;</div>
+<div class="line"><a name="l00912"></a><span class="lineno">  912</span>&#160;</div>
+<div class="line"><a name="l00913"></a><span class="lineno">  913</span>&#160;</div>
+<div class="line"><a name="l00914"></a><span class="lineno">  914</span>&#160;};</div>
+<div class="line"><a name="l00915"></a><span class="lineno">  915</span>&#160;</div>
+<div class="line"><a name="l00916"></a><span class="lineno">  916</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00917"></a><span class="lineno">  917</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l00918"></a><span class="lineno">  918</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/block__histogram_8cuh_source.html b/docs/html/block__histogram_8cuh_source.html
new file mode 100644
index 0000000000..c5a79d1882
--- /dev/null
+++ b/docs/html/block__histogram_8cuh_source.html
@@ -0,0 +1,310 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: block_histogram.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_011e1c944d88f71be72e1e24a5fda7cf.html">block</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">block_histogram.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="block__histogram_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;specializations/block_histogram_sort.cuh&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;specializations/block_histogram_atomic.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../util_arch.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="comment"> * Algorithmic variants</span></div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div>
+<div class="line"><a name="l00055"></a><span class="lineno"><a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2">   55</a></span>&#160;<span class="keyword">enum</span> <a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2" title="BlockHistogramAlgorithm enumerates alternative algorithms for the parallel construction of block-wide...">BlockHistogramAlgorithm</a></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;{</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div>
+<div class="line"><a name="l00067"></a><span class="lineno"><a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2ac14962247ae5693de2de53a8db40ca54">   67</a></span>&#160;    <a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2ac14962247ae5693de2de53a8db40ca54">BLOCK_HISTO_SORT</a>,</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div>
+<div class="line"><a name="l00080"></a><span class="lineno"><a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2abfc89fce43fcda396d18a4b2801025aa">   80</a></span>&#160;    <a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2abfc89fce43fcda396d18a4b2801025aa">BLOCK_HISTO_ATOMIC</a>,</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;};</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;<span class="comment"> * Block histogram</span></div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="keyword">typename</span>                T,</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="keywordtype">int</span>                     BLOCK_THREADS,</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keywordtype">int</span>                     ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    <span class="keywordtype">int</span>                     BINS,</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2" title="BlockHistogramAlgorithm enumerates alternative algorithms for the parallel construction of block-wide...">BlockHistogramAlgorithm</a> ALGORITHM = <a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2ac14962247ae5693de2de53a8db40ca54">BLOCK_HISTO_SORT</a>&gt;</div>
+<div class="line"><a name="l00149"></a><span class="lineno"><a class="code" href="classcub_1_1_block_histogram.html">  149</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_block_histogram.html" title="The BlockHistogram class provides collective methods for constructing block-wide histograms from data...">BlockHistogram</a></div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;{</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="comment">     * Constants and type definitions</span></div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> <a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2" title="BlockHistogramAlgorithm enumerates alternative algorithms for the parallel construction of block-wide...">BlockHistogramAlgorithm</a> SAFE_ALGORITHM =</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;        ((ALGORITHM == <a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2abfc89fce43fcda396d18a4b2801025aa">BLOCK_HISTO_ATOMIC</a>) &amp;&amp; (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &lt; 120)) ?</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;            <a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2ac14962247ae5693de2de53a8db40ca54">BLOCK_HISTO_SORT</a> :</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;            ALGORITHM;</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html" title="Type selection (IF ? ThenType : ElseType) ">If</a>&lt;(SAFE_ALGORITHM == <a class="code" href="namespacecub.html#a845ca81ef9b346ef7429a35d4fdc80d2ac14962247ae5693de2de53a8db40ca54">BLOCK_HISTO_SORT</a>),</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;        BlockHistogramSort&lt;T, BLOCK_THREADS, ITEMS_PER_THREAD, BINS&gt;,</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;        BlockHistogramAtomic&lt;T, BLOCK_THREADS, ITEMS_PER_THREAD, BINS&gt; &gt;::Type InternalBlockHistogram;</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> InternalBlockHistogram::TempStorage _TempStorage;</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    {</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;        __shared__ _TempStorage private_storage;</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    }</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div>
+<div class="line"><a name="l00203"></a><span class="lineno"><a class="code" href="structcub_1_1_block_histogram_1_1_temp_storage.html">  203</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_histogram_1_1_temp_storage.html" title="The operations exposed by BlockHistogram require a temporary memory allocation of this nested type fo...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div>
+<div class="line"><a name="l00214"></a><span class="lineno"><a class="code" href="classcub_1_1_block_histogram.html#a60061b56700655655b83a1c5921ae026">  214</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_histogram.html#a60061b56700655655b83a1c5921ae026" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">BlockHistogram</a>()</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    :</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    {}</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div>
+<div class="line"><a name="l00224"></a><span class="lineno"><a class="code" href="classcub_1_1_block_histogram.html#aceed4d42c6ed10e14a707ab9a35a10c6">  224</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_histogram.html#aceed4d42c6ed10e14a707ab9a35a10c6" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">BlockHistogram</a>(</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;        <a class="code" href="structcub_1_1_block_histogram_1_1_temp_storage.html" title="The operations exposed by BlockHistogram require a temporary memory allocation of this nested type fo...">TempStorage</a> &amp;temp_storage)             </div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    :</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    {}</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;</div>
+<div class="line"><a name="l00235"></a><span class="lineno"><a class="code" href="classcub_1_1_block_histogram.html#a7ba4e9f53945968ed47227376ea3caa1">  235</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_histogram.html#a7ba4e9f53945968ed47227376ea3caa1" title="Collective constructor using a private static allocation of shared memory as temporary storage...">BlockHistogram</a>(</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;    :</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;    {}</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div>
+<div class="line"><a name="l00246"></a><span class="lineno"><a class="code" href="classcub_1_1_block_histogram.html#ae87c89f1175ce34f0c60f1cf9719d5f0">  246</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_histogram.html#ae87c89f1175ce34f0c60f1cf9719d5f0" title="Collective constructor using the specified memory allocation as temporary storage. Each thread is identified using the supplied linear thread identifier. ">BlockHistogram</a>(</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;        <a class="code" href="structcub_1_1_block_histogram_1_1_temp_storage.html" title="The operations exposed by BlockHistogram require a temporary memory allocation of this nested type fo...">TempStorage</a> &amp;temp_storage,             </div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;    :</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    {}</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> HistoCounter&gt;</div>
+<div class="line"><a name="l00298"></a><span class="lineno"><a class="code" href="classcub_1_1_block_histogram.html#a3cae3cfe2ca8388fb2e3a18c0822db3a">  298</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_histogram.html#a3cae3cfe2ca8388fb2e3a18c0822db3a" title="Initialize the shared histogram counters to zero. ">InitHistogram</a>(HistoCounter histogram[BINS])</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;    {</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;        <span class="comment">// Initialize histogram bin counts to zeros</span></div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;        <span class="keywordtype">int</span> histo_offset = 0;</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span>(; histo_offset + BLOCK_THREADS &lt;= BINS; histo_offset += BLOCK_THREADS)</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;        {</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;            histogram[histo_offset + linear_tid] = 0;</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;        }</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;        <span class="comment">// Finish up with guarded initialization if necessary</span></div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;        <span class="keywordflow">if</span> ((BINS % BLOCK_THREADS != 0) &amp;&amp; (histo_offset + linear_tid &lt; BINS))</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        {</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;            histogram[histo_offset + linear_tid] = 0;</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;        }</div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;    }</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;        <span class="keyword">typename</span>            HistoCounter&gt;</div>
+<div class="line"><a name="l00351"></a><span class="lineno"><a class="code" href="classcub_1_1_block_histogram.html#a53ca73d018639c89b4e0b1ed3e0f67f0">  351</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_histogram.html#a53ca73d018639c89b4e0b1ed3e0f67f0" title="Constructs a block-wide histogram in shared/global memory. Each thread contributes an array of input ...">Histogram</a>(</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;        T                   (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;        HistoCounter        histogram[BINS])                </div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;    {</div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;        <span class="comment">// Initialize histogram bin counts to zeros</span></div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;        <a class="code" href="classcub_1_1_block_histogram.html#a3cae3cfe2ca8388fb2e3a18c0822db3a" title="Initialize the shared histogram counters to zero. ">InitHistogram</a>(histogram);</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;        <span class="comment">// Composite the histogram</span></div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;        InternalBlockHistogram(temp_storage, linear_tid).Composite(items, histogram);</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;    }</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;        <span class="keyword">typename</span>            HistoCounter&gt;</div>
+<div class="line"><a name="l00403"></a><span class="lineno"><a class="code" href="classcub_1_1_block_histogram.html#a86aca800e8a8e886b5d328e7aa3c5582">  403</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_histogram.html#a86aca800e8a8e886b5d328e7aa3c5582" title="Updates an existing block-wide histogram in shared/global memory. Each thread composites an array of ...">Composite</a>(</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;        T                   (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;        HistoCounter        histogram[BINS])                 </div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;    {</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;        InternalBlockHistogram(temp_storage, linear_tid).Composite(items, histogram);</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;    }</div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;};</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/block__load_8cuh_source.html b/docs/html/block__load_8cuh_source.html
new file mode 100644
index 0000000000..a9f4a12498
--- /dev/null
+++ b/docs/html/block__load_8cuh_source.html
@@ -0,0 +1,787 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: block_load.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_011e1c944d88f71be72e1e24a5fda7cf.html">block</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">block_load.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="block__load_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;iterator&gt;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../util_macro.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;../util_vector.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;../thread/thread_load.cuh&quot;</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__exchange_8cuh.html">block_exchange.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="keyword">typename</span>        InputIteratorRA&gt;</div>
+<div class="line"><a name="l00078"></a><span class="lineno"><a class="code" href="group___io_module.html#ga0f245535ce8c023d6d85bcfc0bf9907e">   78</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga0f245535ce8c023d6d85bcfc0bf9907e" title="Load a linear segment of items into a blocked arrangement across the thread block using the specified...">LoadBlocked</a>(</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;{</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    <span class="comment">// Load directly in thread-blocked order</span></div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    {</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;        items[ITEM] = ThreadLoad&lt;MODIFIER&gt;(block_itr + (linear_tid * ITEMS_PER_THREAD) + ITEM);</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    }</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;}</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keyword">typename</span>        InputIteratorRA&gt;</div>
+<div class="line"><a name="l00107"></a><span class="lineno"><a class="code" href="group___io_module.html#gae694d6fa9abb0ef67802d12d2c19516c">  107</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga0f245535ce8c023d6d85bcfc0bf9907e" title="Load a linear segment of items into a blocked arrangement across the thread block using the specified...">LoadBlocked</a>(</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    <span class="keywordtype">int</span>             valid_items)                </div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;{</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keywordtype">int</span> bounds = valid_items - (linear_tid * ITEMS_PER_THREAD);</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    {</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;        <span class="keywordflow">if</span> (ITEM &lt; bounds)</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;        {</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;            items[ITEM] = ThreadLoad&lt;MODIFIER&gt;(block_itr + (linear_tid * ITEMS_PER_THREAD) + ITEM);</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;        }</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    }</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;}</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <span class="keyword">typename</span>        InputIteratorRA&gt;</div>
+<div class="line"><a name="l00141"></a><span class="lineno"><a class="code" href="group___io_module.html#ga4aa27e3c558ba1ba7c306c834ad67b0f">  141</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga0f245535ce8c023d6d85bcfc0bf9907e" title="Load a linear segment of items into a blocked arrangement across the thread block using the specified...">LoadBlocked</a>(</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="keywordtype">int</span>             valid_items,                </div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    T               oob_default)                </div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;{</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <span class="keywordtype">int</span> bounds = valid_items - (linear_tid * ITEMS_PER_THREAD);</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    {</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;        items[ITEM] = (ITEM &lt; bounds) ?</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;            ThreadLoad&lt;MODIFIER&gt;(block_itr + (linear_tid * ITEMS_PER_THREAD) + ITEM) :</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;            oob_default;</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    }</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;}</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <span class="keywordtype">int</span>             BLOCK_THREADS,</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    <span class="keyword">typename</span>        InputIteratorRA&gt;</div>
+<div class="line"><a name="l00185"></a><span class="lineno"><a class="code" href="group___io_module.html#gaa32b5c960e511b67901f4a5ba423048e">  185</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gaa32b5c960e511b67901f4a5ba423048e" title="Load a linear segment of items into a striped arrangement across the thread block using the specified...">LoadStriped</a>(</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;{</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    {</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        items[ITEM] = ThreadLoad&lt;MODIFIER&gt;(block_itr + (ITEM * BLOCK_THREADS) + linear_tid);</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    }</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;}</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;    <span class="keywordtype">int</span>             BLOCK_THREADS,</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;    <span class="keyword">typename</span>        InputIteratorRA&gt;</div>
+<div class="line"><a name="l00215"></a><span class="lineno"><a class="code" href="group___io_module.html#ga5a9c12543d3c373375c0bf03e9385a1f">  215</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gaa32b5c960e511b67901f4a5ba423048e" title="Load a linear segment of items into a striped arrangement across the thread block using the specified...">LoadStriped</a>(</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;    InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <span class="keywordtype">int</span>             valid_items)                </div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;{</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <span class="keywordtype">int</span> bounds = valid_items - linear_tid;</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    {</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;        <span class="keywordflow">if</span> (ITEM * BLOCK_THREADS &lt; bounds)</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;        {</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;            items[ITEM] = ThreadLoad&lt;MODIFIER&gt;(block_itr + linear_tid + (ITEM * BLOCK_THREADS));</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;        }</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    }</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;}</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;    <span class="keywordtype">int</span>             BLOCK_THREADS,</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;    <span class="keyword">typename</span>        InputIteratorRA&gt;</div>
+<div class="line"><a name="l00251"></a><span class="lineno"><a class="code" href="group___io_module.html#ga020063c6e3b8ffb09a87a00fe6823381">  251</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gaa32b5c960e511b67901f4a5ba423048e" title="Load a linear segment of items into a striped arrangement across the thread block using the specified...">LoadStriped</a>(</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;    <span class="keywordtype">int</span>             valid_items,                </div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    T               oob_default)                </div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;{</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    <span class="keywordtype">int</span> bounds = valid_items - linear_tid;</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    {</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;        items[ITEM] = (ITEM * BLOCK_THREADS &lt; bounds) ?</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;             ThreadLoad&lt;MODIFIER&gt;(block_itr + linear_tid + (ITEM * BLOCK_THREADS)) :</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;             oob_default;</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    }</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;}</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;<span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;    <span class="keyword">typename</span>        InputIteratorRA&gt;</div>
+<div class="line"><a name="l00296"></a><span class="lineno"><a class="code" href="group___io_module.html#gaea39c52d05d5f8d078ff76b154fad26d">  296</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gaea39c52d05d5f8d078ff76b154fad26d" title="Load a linear segment of items into a warp-striped arrangement across the thread block using the spec...">LoadWarpStriped</a>(</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;    InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;{</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;    <span class="keywordtype">int</span> tid         = linear_tid &amp; (<a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> - 1);</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;    <span class="keywordtype">int</span> wid         = linear_tid &gt;&gt; PtxArchProps::LOG_WARP_THREADS;</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;    <span class="keywordtype">int</span> warp_offset = wid * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> * ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;    <span class="comment">// Load directly in warp-striped order</span></div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;    {</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;        items[ITEM] = ThreadLoad&lt;MODIFIER&gt;(block_itr + warp_offset + tid + (ITEM * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>));</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;    }</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;}</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;</div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;    <span class="keyword">typename</span>        InputIteratorRA&gt;</div>
+<div class="line"><a name="l00332"></a><span class="lineno"><a class="code" href="group___io_module.html#ga4486da2d836785d42f48ae379e8dd85a">  332</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gaea39c52d05d5f8d078ff76b154fad26d" title="Load a linear segment of items into a warp-striped arrangement across the thread block using the spec...">LoadWarpStriped</a>(</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;    InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;    <span class="keywordtype">int</span>             valid_items)               </div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;{</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    <span class="keywordtype">int</span> tid                 = linear_tid &amp; (<a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> - 1);</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;    <span class="keywordtype">int</span> wid                 = linear_tid &gt;&gt; PtxArchProps::LOG_WARP_THREADS;</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;    <span class="keywordtype">int</span> warp_offset         = wid * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> * ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <span class="keywordtype">int</span> bounds              = valid_items - warp_offset - tid;</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;    <span class="comment">// Load directly in warp-striped order</span></div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    {</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;        <span class="keywordflow">if</span> ((ITEM * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>) &lt; bounds)</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;        {</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;            items[ITEM] = ThreadLoad&lt;MODIFIER&gt;(block_itr + warp_offset + tid + (ITEM * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>));</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;        }</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    }</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;}</div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;</div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;    <span class="keyword">typename</span>        InputIteratorRA&gt;</div>
+<div class="line"><a name="l00373"></a><span class="lineno"><a class="code" href="group___io_module.html#ga92a5618a110d7963bbc6f54637b904b1">  373</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gaea39c52d05d5f8d078ff76b154fad26d" title="Load a linear segment of items into a warp-striped arrangement across the thread block using the spec...">LoadWarpStriped</a>(</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;    InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;    <span class="keywordtype">int</span>             valid_items,               </div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;    T               oob_default)                </div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;{</div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;    <span class="keywordtype">int</span> tid         = linear_tid &amp; (<a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> - 1);</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;    <span class="keywordtype">int</span> wid         = linear_tid &gt;&gt; PtxArchProps::LOG_WARP_THREADS;</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;    <span class="keywordtype">int</span> warp_offset = wid * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> * ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;    <span class="keywordtype">int</span> bounds      = valid_items - warp_offset - tid;</div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;    <span class="comment">// Load directly in warp-striped order</span></div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;    {</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;        items[ITEM] = ((ITEM * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>) &lt; bounds) ?</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;            ThreadLoad&lt;MODIFIER&gt;(block_itr + warp_offset + tid + (ITEM * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>)) :</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;            oob_default;</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;    }</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;}</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;<span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;</div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;    <span class="keyword">typename</span>        T,</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;    <span class="keywordtype">int</span>             ITEMS_PER_THREAD&gt;</div>
+<div class="line"><a name="l00422"></a><span class="lineno"><a class="code" href="group___io_module.html#gadeb7216e9de14b5bd22f952cd1775eda">  422</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gadeb7216e9de14b5bd22f952cd1775eda" title="Load a linear segment of items into a blocked arrangement across the thread block using the specified...">LoadBlockedVectorized</a>(</div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;    <span class="keywordtype">int</span>             linear_tid,                 </div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;    T               *block_ptr,                 </div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;    T               (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;{</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;    {</div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;        <span class="comment">// Maximum CUDA vector size is 4 elements</span></div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;        MAX_VEC_SIZE = CUB_MIN(4, ITEMS_PER_THREAD),</div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;</div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;        <span class="comment">// Vector size must be a power of two and an even divisor of the items per thread</span></div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;        VEC_SIZE = ((((MAX_VEC_SIZE - 1) &amp; MAX_VEC_SIZE) == 0) &amp;&amp; ((ITEMS_PER_THREAD % MAX_VEC_SIZE) == 0)) ?</div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;            MAX_VEC_SIZE :</div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;            1,</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;</div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;        VECTORS_PER_THREAD = ITEMS_PER_THREAD / VEC_SIZE,</div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;    };</div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;</div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;    <span class="comment">// Vector type</span></div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> VectorHelper&lt;T, VEC_SIZE&gt;::Type Vector;</div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;</div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;    <span class="comment">// Alias local data (use raw_items array here which should get optimized away to prevent conservative PTXAS lmem spilling)</span></div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;    T raw_items[ITEMS_PER_THREAD];</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;</div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;    <span class="comment">// Direct-load using vector types</span></div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;    LoadBlocked&lt;MODIFIER&gt;(</div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;        linear_tid,</div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;        <span class="keyword">reinterpret_cast&lt;</span>Vector *<span class="keyword">&gt;</span>(block_ptr),</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;        <span class="keyword">reinterpret_cast&lt;</span>Vector (&amp;)[VECTORS_PER_THREAD]<span class="keyword">&gt;</span>(raw_items));</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;    <span class="comment">// Copy</span></div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;    {</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;        items[ITEM] = raw_items[ITEM];</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;    }</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;}</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;       <span class="comment">// end group IoModule</span></div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;<span class="comment">// Generic BlockLoad abstraction</span></div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;</div>
+<div class="line"><a name="l00474"></a><span class="lineno"><a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401">  474</a></span>&#160;<span class="keyword">enum</span> <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401" title="cub::BlockLoadAlgorithm enumerates alternative algorithms for cub::BlockLoad to read a linear segment...">BlockLoadAlgorithm</a></div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;{</div>
+<div class="line"><a name="l00487"></a><span class="lineno"><a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401a2d4d8900d7e697e9dac4062e97d3d835">  487</a></span>&#160;    <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401a2d4d8900d7e697e9dac4062e97d3d835">BLOCK_LOAD_DIRECT</a>,</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;</div>
+<div class="line"><a name="l00509"></a><span class="lineno"><a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401a826be9d4df1c44c0e5c00a9c9c136965">  509</a></span>&#160;    <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401a826be9d4df1c44c0e5c00a9c9c136965">BLOCK_LOAD_VECTORIZE</a>,</div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;</div>
+<div class="line"><a name="l00528"></a><span class="lineno"><a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401acd94f285472e8f7c883a7407f6f4efc4">  528</a></span>&#160;    <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401acd94f285472e8f7c883a7407f6f4efc4">BLOCK_LOAD_TRANSPOSE</a>,</div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;</div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;</div>
+<div class="line"><a name="l00551"></a><span class="lineno"><a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401aba21066c09e6c6ebcf08c7e86216eb1f">  551</a></span>&#160;    <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401aba21066c09e6c6ebcf08c7e86216eb1f">BLOCK_LOAD_WARP_TRANSPOSE</a>,</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;};</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;</div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;    <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;    <span class="keywordtype">int</span>                 BLOCK_THREADS,</div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;    <span class="keywordtype">int</span>                 ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;    <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401" title="cub::BlockLoadAlgorithm enumerates alternative algorithms for cub::BlockLoad to read a linear segment...">BlockLoadAlgorithm</a>  ALGORITHM = <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401a2d4d8900d7e697e9dac4062e97d3d835">BLOCK_LOAD_DIRECT</a>,</div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a>     MODIFIER = <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55daee682a9988eceaefd9a53a7ef92fe6e2" title="Default (no modifier) ">LOAD_DEFAULT</a>,</div>
+<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;    <span class="keywordtype">bool</span>                WARP_TIME_SLICING = <span class="keyword">false</span>&gt;</div>
+<div class="line"><a name="l00623"></a><span class="lineno"><a class="code" href="classcub_1_1_block_load.html">  623</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_block_load.html" title="The BlockLoad class provides collective data movement methods for loading a linear segment of items f...">BlockLoad</a></div>
+<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;{</div>
+<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;</div>
+<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;<span class="comment">     * Constants and typed definitions</span></div>
+<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;</div>
+<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;    <span class="comment">// Data type of input iterator</span></div>
+<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type T;</div>
+<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;</div>
+<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;</div>
+<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;<span class="comment">     * Algorithmic variants</span></div>
+<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;</div>
+<div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;    <span class="keyword">template</span> &lt;BlockLoadAlgorithm _POLICY, <span class="keywordtype">int</span> DUMMY = 0&gt;</div>
+<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;    <span class="keyword">struct </span>LoadInternal;</div>
+<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;</div>
+<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;</div>
+<div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> DUMMY&gt;</div>
+<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;    <span class="keyword">struct </span>LoadInternal&lt;BLOCK_LOAD_DIRECT, DUMMY&gt;</div>
+<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;    {</div>
+<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;        <span class="keyword">typedef</span> <a class="code" href="structcub_1_1_null_type.html" title="A simple &quot;NULL&quot; marker type. ">NullType</a> <a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a>;</div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;</div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;        <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;</div>
+<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;        __device__ __forceinline__ LoadInternal(</div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;            <a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage,</div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;            <span class="keywordtype">int</span> linear_tid)</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;        :</div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;            linear_tid(linear_tid)</div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;        {}</div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;</div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD])     </div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;        {</div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;            LoadBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items);</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;        }</div>
+<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;</div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;            <span class="keywordtype">int</span>             valid_items)                    </div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;        {</div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;            LoadBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items, valid_items);</div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;        }</div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;</div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;            <span class="keywordtype">int</span>             valid_items,                    </div>
+<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;            T               oob_default)                    </div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;        {</div>
+<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;            LoadBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items, valid_items, oob_default);</div>
+<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;        }</div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;</div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;    };</div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;</div>
+<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;</div>
+<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> DUMMY&gt;</div>
+<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;    <span class="keyword">struct </span>LoadInternal&lt;BLOCK_LOAD_VECTORIZE, DUMMY&gt;</div>
+<div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160;    {</div>
+<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;        <span class="keyword">typedef</span> <a class="code" href="structcub_1_1_null_type.html" title="A simple &quot;NULL&quot; marker type. ">NullType</a> <a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a>;</div>
+<div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;</div>
+<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;        <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;</div>
+<div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;        __device__ __forceinline__ LoadInternal(</div>
+<div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;            <a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage,</div>
+<div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;            <span class="keywordtype">int</span> linear_tid)</div>
+<div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;        :</div>
+<div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;            linear_tid(linear_tid)</div>
+<div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;        {}</div>
+<div class="line"><a name="l00713"></a><span class="lineno">  713</span>&#160;</div>
+<div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;            T               *block_ptr,                     </div>
+<div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD])     </div>
+<div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;        {</div>
+<div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;            LoadBlockedVectorized&lt;MODIFIER&gt;(linear_tid, block_ptr, items);</div>
+<div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;        }</div>
+<div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;</div>
+<div class="line"><a name="l00723"></a><span class="lineno">  723</span>&#160;        <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;            <span class="keyword">typename</span> T,</div>
+<div class="line"><a name="l00725"></a><span class="lineno">  725</span>&#160;            <span class="keyword">typename</span> _InputIteratorRA&gt;</div>
+<div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;            _InputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;        {</div>
+<div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;            LoadBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items);</div>
+<div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;        }</div>
+<div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;</div>
+<div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;            <span class="keywordtype">int</span>             valid_items)                    </div>
+<div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;        {</div>
+<div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;            LoadBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items, valid_items);</div>
+<div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;        }</div>
+<div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;</div>
+<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;            <span class="keywordtype">int</span>             valid_items,                    </div>
+<div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160;            T               oob_default)                    </div>
+<div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160;        {</div>
+<div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;            LoadBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items, valid_items, oob_default);</div>
+<div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160;        }</div>
+<div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;</div>
+<div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;    };</div>
+<div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;</div>
+<div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;</div>
+<div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> DUMMY&gt;</div>
+<div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;    <span class="keyword">struct </span>LoadInternal&lt;BLOCK_LOAD_TRANSPOSE, DUMMY&gt;</div>
+<div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;    {</div>
+<div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;        <span class="comment">// BlockExchange utility type for keys</span></div>
+<div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;        <span class="keyword">typedef</span> <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange&lt;T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING&gt;</a> <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>;</div>
+<div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160;</div>
+<div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">BlockExchange::TempStorage</a> _TempStorage;</div>
+<div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;</div>
+<div class="line"><a name="l00768"></a><span class="lineno"><a class="code" href="structcub_1_1_block_load_1_1_load_internal_3_01_b_l_o_c_k___l_o_a_d___t_r_a_n_s_p_o_s_e_00_01_d_u_m_m_y_01_4_1_1_temp_storage.html">  768</a></span>&#160;        <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;</div>
+<div class="line"><a name="l00771"></a><span class="lineno">  771</span>&#160;        <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">_TempStorage</a> &amp;temp_storage;</div>
+<div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;</div>
+<div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;        <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;</div>
+<div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160;        __device__ __forceinline__ LoadInternal(</div>
+<div class="line"><a name="l00778"></a><span class="lineno">  778</span>&#160;            <a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage,</div>
+<div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;            <span class="keywordtype">int</span> linear_tid)</div>
+<div class="line"><a name="l00780"></a><span class="lineno">  780</span>&#160;        :</div>
+<div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;            temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160;            linear_tid(linear_tid)</div>
+<div class="line"><a name="l00783"></a><span class="lineno">  783</span>&#160;        {}</div>
+<div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;</div>
+<div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD])     </div>
+<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;        {</div>
+<div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;            LoadStriped&lt;MODIFIER, BLOCK_THREADS&gt;(linear_tid, block_itr, items);</div>
+<div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160;            <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>(temp_storage, linear_tid).StripedToBlocked(items);</div>
+<div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;        }</div>
+<div class="line"><a name="l00793"></a><span class="lineno">  793</span>&#160;</div>
+<div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;            <span class="keywordtype">int</span>             valid_items)                    </div>
+<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;        {</div>
+<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;            LoadStriped&lt;MODIFIER, BLOCK_THREADS&gt;(linear_tid, block_itr, items, valid_items);</div>
+<div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;            <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>(temp_storage, linear_tid).StripedToBlocked(items);</div>
+<div class="line"><a name="l00802"></a><span class="lineno">  802</span>&#160;        }</div>
+<div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;</div>
+<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;            <span class="keywordtype">int</span>             valid_items,                    </div>
+<div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;            T               oob_default)                    </div>
+<div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;        {</div>
+<div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;            LoadStriped&lt;MODIFIER, BLOCK_THREADS&gt;(linear_tid, block_itr, items, valid_items, oob_default);</div>
+<div class="line"><a name="l00812"></a><span class="lineno">  812</span>&#160;            BlockExchange(temp_storage, linear_tid).StripedToBlocked(items);</div>
+<div class="line"><a name="l00813"></a><span class="lineno">  813</span>&#160;        }</div>
+<div class="line"><a name="l00814"></a><span class="lineno">  814</span>&#160;</div>
+<div class="line"><a name="l00815"></a><span class="lineno">  815</span>&#160;    };</div>
+<div class="line"><a name="l00816"></a><span class="lineno">  816</span>&#160;</div>
+<div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;</div>
+<div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> DUMMY&gt;</div>
+<div class="line"><a name="l00822"></a><span class="lineno">  822</span>&#160;    <span class="keyword">struct </span>LoadInternal&lt;<a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401aba21066c09e6c6ebcf08c7e86216eb1f">BLOCK_LOAD_WARP_TRANSPOSE</a>, DUMMY&gt;</div>
+<div class="line"><a name="l00823"></a><span class="lineno">  823</span>&#160;    {</div>
+<div class="line"><a name="l00824"></a><span class="lineno">  824</span>&#160;        <span class="keyword">enum</span></div>
+<div class="line"><a name="l00825"></a><span class="lineno">  825</span>&#160;        {</div>
+<div class="line"><a name="l00826"></a><span class="lineno">  826</span>&#160;            WARP_THREADS = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a></div>
+<div class="line"><a name="l00827"></a><span class="lineno">  827</span>&#160;        };</div>
+<div class="line"><a name="l00828"></a><span class="lineno">  828</span>&#160;</div>
+<div class="line"><a name="l00829"></a><span class="lineno">  829</span>&#160;        <span class="comment">// Assert BLOCK_THREADS must be a multiple of WARP_THREADS</span></div>
+<div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160;        CUB_STATIC_ASSERT((BLOCK_THREADS % WARP_THREADS == 0), <span class="stringliteral">&quot;BLOCK_THREADS must be a multiple of WARP_THREADS&quot;</span>);</div>
+<div class="line"><a name="l00831"></a><span class="lineno">  831</span>&#160;</div>
+<div class="line"><a name="l00832"></a><span class="lineno">  832</span>&#160;        <span class="comment">// BlockExchange utility type for keys</span></div>
+<div class="line"><a name="l00833"></a><span class="lineno">  833</span>&#160;        <span class="keyword">typedef</span> BlockExchange&lt;T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING&gt; BlockExchange;</div>
+<div class="line"><a name="l00834"></a><span class="lineno">  834</span>&#160;</div>
+<div class="line"><a name="l00836"></a><span class="lineno">  836</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> BlockExchange::TempStorage _TempStorage;</div>
+<div class="line"><a name="l00837"></a><span class="lineno">  837</span>&#160;</div>
+<div class="line"><a name="l00839"></a><span class="lineno"><a class="code" href="structcub_1_1_block_load_1_1_load_internal_3_01_b_l_o_c_k___l_o_a_d___w_a_r_p___t_r_a_n_s_p_o_s_402c3164d23f1ec647db5dad06a54584.html">  839</a></span>&#160;        <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00840"></a><span class="lineno">  840</span>&#160;</div>
+<div class="line"><a name="l00842"></a><span class="lineno">  842</span>&#160;        <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">_TempStorage</a> &amp;temp_storage;</div>
+<div class="line"><a name="l00843"></a><span class="lineno">  843</span>&#160;</div>
+<div class="line"><a name="l00845"></a><span class="lineno">  845</span>&#160;        <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00846"></a><span class="lineno">  846</span>&#160;</div>
+<div class="line"><a name="l00848"></a><span class="lineno">  848</span>&#160;        __device__ __forceinline__ LoadInternal(</div>
+<div class="line"><a name="l00849"></a><span class="lineno">  849</span>&#160;            <a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage,</div>
+<div class="line"><a name="l00850"></a><span class="lineno">  850</span>&#160;            <span class="keywordtype">int</span> linear_tid)</div>
+<div class="line"><a name="l00851"></a><span class="lineno">  851</span>&#160;        :</div>
+<div class="line"><a name="l00852"></a><span class="lineno">  852</span>&#160;            temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00853"></a><span class="lineno">  853</span>&#160;            linear_tid(linear_tid)</div>
+<div class="line"><a name="l00854"></a><span class="lineno">  854</span>&#160;        {}</div>
+<div class="line"><a name="l00855"></a><span class="lineno">  855</span>&#160;</div>
+<div class="line"><a name="l00857"></a><span class="lineno">  857</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00858"></a><span class="lineno">  858</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00859"></a><span class="lineno">  859</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD])     </div>
+<div class="line"><a name="l00860"></a><span class="lineno">  860</span>&#160;        {</div>
+<div class="line"><a name="l00861"></a><span class="lineno">  861</span>&#160;            LoadWarpStriped&lt;MODIFIER&gt;(linear_tid, block_itr, items);</div>
+<div class="line"><a name="l00862"></a><span class="lineno">  862</span>&#160;            <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>(temp_storage, linear_tid).WarpStripedToBlocked(items);</div>
+<div class="line"><a name="l00863"></a><span class="lineno">  863</span>&#160;        }</div>
+<div class="line"><a name="l00864"></a><span class="lineno">  864</span>&#160;</div>
+<div class="line"><a name="l00866"></a><span class="lineno">  866</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00867"></a><span class="lineno">  867</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00868"></a><span class="lineno">  868</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00869"></a><span class="lineno">  869</span>&#160;            <span class="keywordtype">int</span>             valid_items)                    </div>
+<div class="line"><a name="l00870"></a><span class="lineno">  870</span>&#160;        {</div>
+<div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160;            LoadWarpStriped&lt;MODIFIER&gt;(linear_tid, block_itr, items, valid_items);</div>
+<div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160;            <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>(temp_storage, linear_tid).WarpStripedToBlocked(items);</div>
+<div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;        }</div>
+<div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;</div>
+<div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;</div>
+<div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;            InputIteratorRA block_itr,                      </div>
+<div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160;            T               (&amp;items)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160;            <span class="keywordtype">int</span>             valid_items,                    </div>
+<div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;            T               oob_default)                    </div>
+<div class="line"><a name="l00882"></a><span class="lineno">  882</span>&#160;        {</div>
+<div class="line"><a name="l00883"></a><span class="lineno">  883</span>&#160;            LoadWarpStriped&lt;MODIFIER&gt;(linear_tid, block_itr, items, valid_items, oob_default);</div>
+<div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;            BlockExchange(temp_storage, linear_tid).WarpStripedToBlocked(items);</div>
+<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;        }</div>
+<div class="line"><a name="l00886"></a><span class="lineno">  886</span>&#160;    };</div>
+<div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160;</div>
+<div class="line"><a name="l00888"></a><span class="lineno">  888</span>&#160;</div>
+<div class="line"><a name="l00889"></a><span class="lineno">  889</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;<span class="comment">     * Type definitions</span></div>
+<div class="line"><a name="l00891"></a><span class="lineno">  891</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00892"></a><span class="lineno">  892</span>&#160;</div>
+<div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160;    <span class="keyword">typedef</span> LoadInternal&lt;ALGORITHM&gt; InternalLoad;</div>
+<div class="line"><a name="l00895"></a><span class="lineno">  895</span>&#160;</div>
+<div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;</div>
+<div class="line"><a name="l00898"></a><span class="lineno">  898</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> InternalLoad::TempStorage _TempStorage;</div>
+<div class="line"><a name="l00899"></a><span class="lineno">  899</span>&#160;</div>
+<div class="line"><a name="l00900"></a><span class="lineno">  900</span>&#160;</div>
+<div class="line"><a name="l00901"></a><span class="lineno">  901</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00902"></a><span class="lineno">  902</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00903"></a><span class="lineno">  903</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00904"></a><span class="lineno">  904</span>&#160;</div>
+<div class="line"><a name="l00906"></a><span class="lineno">  906</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00907"></a><span class="lineno">  907</span>&#160;    {</div>
+<div class="line"><a name="l00908"></a><span class="lineno">  908</span>&#160;        __shared__ _TempStorage private_storage;</div>
+<div class="line"><a name="l00909"></a><span class="lineno">  909</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00910"></a><span class="lineno">  910</span>&#160;    }</div>
+<div class="line"><a name="l00911"></a><span class="lineno">  911</span>&#160;</div>
+<div class="line"><a name="l00912"></a><span class="lineno">  912</span>&#160;</div>
+<div class="line"><a name="l00913"></a><span class="lineno">  913</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00914"></a><span class="lineno">  914</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00915"></a><span class="lineno">  915</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00916"></a><span class="lineno">  916</span>&#160;</div>
+<div class="line"><a name="l00918"></a><span class="lineno">  918</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00919"></a><span class="lineno">  919</span>&#160;</div>
+<div class="line"><a name="l00921"></a><span class="lineno">  921</span>&#160;    <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00922"></a><span class="lineno">  922</span>&#160;</div>
+<div class="line"><a name="l00923"></a><span class="lineno">  923</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00924"></a><span class="lineno">  924</span>&#160;</div>
+<div class="line"><a name="l00926"></a><span class="lineno"><a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html">  926</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00927"></a><span class="lineno">  927</span>&#160;</div>
+<div class="line"><a name="l00928"></a><span class="lineno">  928</span>&#160;</div>
+<div class="line"><a name="l00929"></a><span class="lineno">  929</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00933"></a><span class="lineno">  933</span>&#160;</div>
+<div class="line"><a name="l00937"></a><span class="lineno"><a class="code" href="classcub_1_1_block_load.html#a5d282946b5009f81cb8eb030f0c88db3">  937</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_load.html#a5d282946b5009f81cb8eb030f0c88db3" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">BlockLoad</a>()</div>
+<div class="line"><a name="l00938"></a><span class="lineno">  938</span>&#160;    :</div>
+<div class="line"><a name="l00939"></a><span class="lineno">  939</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00940"></a><span class="lineno">  940</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00941"></a><span class="lineno">  941</span>&#160;    {}</div>
+<div class="line"><a name="l00942"></a><span class="lineno">  942</span>&#160;</div>
+<div class="line"><a name="l00943"></a><span class="lineno">  943</span>&#160;</div>
+<div class="line"><a name="l00947"></a><span class="lineno"><a class="code" href="classcub_1_1_block_load.html#a6375b8826e555da16d39ab15343f05a5">  947</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_load.html#a6375b8826e555da16d39ab15343f05a5" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">BlockLoad</a>(</div>
+<div class="line"><a name="l00948"></a><span class="lineno">  948</span>&#160;        <a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage)             </div>
+<div class="line"><a name="l00949"></a><span class="lineno">  949</span>&#160;    :</div>
+<div class="line"><a name="l00950"></a><span class="lineno">  950</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00951"></a><span class="lineno">  951</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00952"></a><span class="lineno">  952</span>&#160;    {}</div>
+<div class="line"><a name="l00953"></a><span class="lineno">  953</span>&#160;</div>
+<div class="line"><a name="l00954"></a><span class="lineno">  954</span>&#160;</div>
+<div class="line"><a name="l00958"></a><span class="lineno"><a class="code" href="classcub_1_1_block_load.html#ac14a9dd87b2ca252a4fb319f2d616d71">  958</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_load.html#ac14a9dd87b2ca252a4fb319f2d616d71" title="Collective constructor using a private static allocation of shared memory as temporary storage...">BlockLoad</a>(</div>
+<div class="line"><a name="l00959"></a><span class="lineno">  959</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00960"></a><span class="lineno">  960</span>&#160;    :</div>
+<div class="line"><a name="l00961"></a><span class="lineno">  961</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00962"></a><span class="lineno">  962</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00963"></a><span class="lineno">  963</span>&#160;    {}</div>
+<div class="line"><a name="l00964"></a><span class="lineno">  964</span>&#160;</div>
+<div class="line"><a name="l00965"></a><span class="lineno">  965</span>&#160;</div>
+<div class="line"><a name="l00969"></a><span class="lineno"><a class="code" href="classcub_1_1_block_load.html#a05b5615fbcb8453d663248700e3b17c3">  969</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_load.html#a05b5615fbcb8453d663248700e3b17c3" title="Collective constructor using the specified memory allocation as temporary storage. Each thread is identified using the supplied linear thread identifier. ">BlockLoad</a>(</div>
+<div class="line"><a name="l00970"></a><span class="lineno">  970</span>&#160;        <a class="code" href="structcub_1_1_block_load_1_1_temp_storage.html" title="The operations exposed by BlockLoad require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage,             </div>
+<div class="line"><a name="l00971"></a><span class="lineno">  971</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00972"></a><span class="lineno">  972</span>&#160;    :</div>
+<div class="line"><a name="l00973"></a><span class="lineno">  973</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00974"></a><span class="lineno">  974</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00975"></a><span class="lineno">  975</span>&#160;    {}</div>
+<div class="line"><a name="l00976"></a><span class="lineno">  976</span>&#160;</div>
+<div class="line"><a name="l00977"></a><span class="lineno">  977</span>&#160;</div>
+<div class="line"><a name="l00978"></a><span class="lineno">  978</span>&#160;</div>
+<div class="line"><a name="l00980"></a><span class="lineno">  980</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00984"></a><span class="lineno">  984</span>&#160;</div>
+<div class="line"><a name="l00985"></a><span class="lineno">  985</span>&#160;</div>
+<div class="line"><a name="l01019"></a><span class="lineno"><a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f"> 1019</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f" title="Load a linear segment of items from memory. ">Load</a>(</div>
+<div class="line"><a name="l01020"></a><span class="lineno"> 1020</span>&#160;        InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l01021"></a><span class="lineno"> 1021</span>&#160;        T               (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l01022"></a><span class="lineno"> 1022</span>&#160;    {</div>
+<div class="line"><a name="l01023"></a><span class="lineno"> 1023</span>&#160;        InternalLoad(temp_storage, linear_tid).Load(block_itr, items);</div>
+<div class="line"><a name="l01024"></a><span class="lineno"> 1024</span>&#160;    }</div>
+<div class="line"><a name="l01025"></a><span class="lineno"> 1025</span>&#160;</div>
+<div class="line"><a name="l01026"></a><span class="lineno"> 1026</span>&#160;</div>
+<div class="line"><a name="l01061"></a><span class="lineno"><a class="code" href="classcub_1_1_block_load.html#aaf62f01f6d19f89ca6987ecece66df19"> 1061</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#aaf62f01f6d19f89ca6987ecece66df19" title="Load a linear segment of items from memory, guarded by range. ">Load</a>(</div>
+<div class="line"><a name="l01062"></a><span class="lineno"> 1062</span>&#160;        InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l01063"></a><span class="lineno"> 1063</span>&#160;        T               (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l01064"></a><span class="lineno"> 1064</span>&#160;        <span class="keywordtype">int</span>             valid_items)                </div>
+<div class="line"><a name="l01065"></a><span class="lineno"> 1065</span>&#160;    {</div>
+<div class="line"><a name="l01066"></a><span class="lineno"> 1066</span>&#160;        InternalLoad(temp_storage, linear_tid).Load(block_itr, items, valid_items);</div>
+<div class="line"><a name="l01067"></a><span class="lineno"> 1067</span>&#160;    }</div>
+<div class="line"><a name="l01068"></a><span class="lineno"> 1068</span>&#160;</div>
+<div class="line"><a name="l01069"></a><span class="lineno"> 1069</span>&#160;</div>
+<div class="line"><a name="l01105"></a><span class="lineno"><a class="code" href="classcub_1_1_block_load.html#a0e90a159401f709597d4b43939613901"> 1105</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_load.html#a0e90a159401f709597d4b43939613901" title="Load a linear segment of items from memory, guarded by range, with a fall-back assignment of out-of-b...">Load</a>(</div>
+<div class="line"><a name="l01106"></a><span class="lineno"> 1106</span>&#160;        InputIteratorRA block_itr,                  </div>
+<div class="line"><a name="l01107"></a><span class="lineno"> 1107</span>&#160;        T               (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l01108"></a><span class="lineno"> 1108</span>&#160;        <span class="keywordtype">int</span>             valid_items,                </div>
+<div class="line"><a name="l01109"></a><span class="lineno"> 1109</span>&#160;        T               oob_default)                </div>
+<div class="line"><a name="l01110"></a><span class="lineno"> 1110</span>&#160;    {</div>
+<div class="line"><a name="l01111"></a><span class="lineno"> 1111</span>&#160;        InternalLoad(temp_storage, linear_tid).Load(block_itr, items, valid_items, oob_default);</div>
+<div class="line"><a name="l01112"></a><span class="lineno"> 1112</span>&#160;    }</div>
+<div class="line"><a name="l01113"></a><span class="lineno"> 1113</span>&#160;</div>
+<div class="line"><a name="l01114"></a><span class="lineno"> 1114</span>&#160;</div>
+<div class="line"><a name="l01116"></a><span class="lineno"> 1116</span>&#160;</div>
+<div class="line"><a name="l01117"></a><span class="lineno"> 1117</span>&#160;};</div>
+<div class="line"><a name="l01118"></a><span class="lineno"> 1118</span>&#160;</div>
+<div class="line"><a name="l01119"></a><span class="lineno"> 1119</span>&#160;</div>
+<div class="line"><a name="l01120"></a><span class="lineno"> 1120</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l01121"></a><span class="lineno"> 1121</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l01122"></a><span class="lineno"> 1122</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/block__radix__sort_8cuh_source.html b/docs/html/block__radix__sort_8cuh_source.html
new file mode 100644
index 0000000000..c168b03cd5
--- /dev/null
+++ b/docs/html/block__radix__sort_8cuh_source.html
@@ -0,0 +1,465 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: block_radix_sort.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_011e1c944d88f71be72e1e24a5fda7cf.html">block</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">block_radix_sort.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="block__radix__sort_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../util_arch.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__exchange_8cuh.html">block_exchange.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;block_radix_rank.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="keyword">typename</span>                Key,</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <span class="keywordtype">int</span>                     BLOCK_THREADS,</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keywordtype">int</span>                     ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keyword">typename</span>                Value                   = NullType,</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    <span class="keywordtype">int</span>                     RADIX_BITS              = 4,</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    <span class="keywordtype">bool</span>                    MEMOIZE_OUTER_SCAN      = (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 350) ? <span class="keyword">true</span> : <span class="keyword">false</span>,</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23ab" title="BlockScanAlgorithm enumerates alternative algorithms for cub::BlockScan to compute a parallel prefix ...">BlockScanAlgorithm</a>      INNER_SCAN_ALGORITHM    = <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba7f51e58246eb53f1a97bd1bc8c0f400f">BLOCK_SCAN_WARP_SCANS</a>,</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    cudaSharedMemConfig     SMEM_CONFIG             = cudaSharedMemBankSizeFourByte&gt;</div>
+<div class="line"><a name="l00122"></a><span class="lineno"><a class="code" href="classcub_1_1_block_radix_sort.html">  122</a></span>&#160;<span class="keyword">class</span> <a class="code" href="classcub_1_1_block_radix_sort.html" title="The cub::BlockRadixSort class provides collective methods for sorting items partitioned across a CUDA...">BlockRadixSort</a></div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;{</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="comment">     * Constants and type definitions</span></div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <span class="comment">// Key traits and unsigned bits type</span></div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    <span class="keyword">typedef</span> <a class="code" href="structcub_1_1_numeric_traits.html" title="Numeric type traits. ">NumericTraits&lt;Key&gt;</a>                  <a class="code" href="structcub_1_1_numeric_traits.html" title="Numeric type traits. ">KeyTraits</a>;</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> KeyTraits::UnsignedBits    UnsignedBits;</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    <span class="keyword">typedef</span> BlockRadixRank&lt;BLOCK_THREADS, RADIX_BITS, MEMOIZE_OUTER_SCAN, INNER_SCAN_ALGORITHM, SMEM_CONFIG&gt; BlockRadixRank;</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    <span class="keyword">typedef</span> <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange&lt;Key, BLOCK_THREADS, ITEMS_PER_THREAD&gt;</a> <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchangeKeys</a>;</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;    <span class="keyword">typedef</span> <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange&lt;Value, BLOCK_THREADS, ITEMS_PER_THREAD&gt;</a> <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchangeValues</a>;</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="keyword">struct </span>_TempStorage</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    {</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;        <span class="keyword">union</span></div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;        {</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;            <span class="keyword">typename</span> BlockRadixRank::TempStorage          ranking_storage;</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;            <span class="keyword">typename</span> <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">BlockExchangeKeys::TempStorage</a>        exchange_keys;</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;            <span class="keyword">typename</span> <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">BlockExchangeValues::TempStorage</a>      exchange_values;</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;        };</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    };</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    {</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;        __shared__ _TempStorage private_storage;</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    }</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div>
+<div class="line"><a name="l00180"></a><span class="lineno"><a class="code" href="structcub_1_1_block_radix_sort_1_1_temp_storage.html">  180</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_radix_sort_1_1_temp_storage.html" title="The operations exposed by BlockScan require a temporary memory allocation of this nested type for thr...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div>
+<div class="line"><a name="l00191"></a><span class="lineno"><a class="code" href="classcub_1_1_block_radix_sort.html#ac7c896d6549960400b7710a262532e0e">  191</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_radix_sort.html#ac7c896d6549960400b7710a262532e0e" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">BlockRadixSort</a>()</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    :</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    {}</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div>
+<div class="line"><a name="l00201"></a><span class="lineno"><a class="code" href="classcub_1_1_block_radix_sort.html#af6840b09ce6bb530fffa56ed75e4529c">  201</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_radix_sort.html#af6840b09ce6bb530fffa56ed75e4529c" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">BlockRadixSort</a>(</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;        <a class="code" href="structcub_1_1_block_radix_sort_1_1_temp_storage.html" title="The operations exposed by BlockScan require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage)             </div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;    :</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;    {}</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div>
+<div class="line"><a name="l00212"></a><span class="lineno"><a class="code" href="classcub_1_1_block_radix_sort.html#a311b6e5932dfea96e1844abaf428bfc3">  212</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_radix_sort.html#a311b6e5932dfea96e1844abaf428bfc3" title="Collective constructor using a private static allocation of shared memory as temporary storage...">BlockRadixSort</a>(</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;    :</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;    {}</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div>
+<div class="line"><a name="l00223"></a><span class="lineno"><a class="code" href="classcub_1_1_block_radix_sort.html#a34b8e018887026786b02e8ac6556bd3a">  223</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_radix_sort.html#a34b8e018887026786b02e8ac6556bd3a" title="Collective constructor using the specified memory allocation as temporary storage. Each thread is identified using the supplied linear thread identifier. ">BlockRadixSort</a>(</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;        <a class="code" href="structcub_1_1_block_radix_sort_1_1_temp_storage.html" title="The operations exposed by BlockScan require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage,             </div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    :</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    {}</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;</div>
+<div class="line"><a name="l00273"></a><span class="lineno"><a class="code" href="classcub_1_1_block_radix_sort.html#ad04651e04e555350bd250c4681a97644">  273</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_radix_sort.html#ad04651e04e555350bd250c4681a97644" title="Performs a block-wide radix sort over a blocked arrangement of keys. ">Sort</a>(</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;        Key     (&amp;keys)[ITEMS_PER_THREAD],          </div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;        <span class="keywordtype">int</span>     begin_bit   = 0,                    </div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;        <span class="keywordtype">int</span>     end_bit     = <span class="keyword">sizeof</span>(Key) * 8)      </div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;    {</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;        UnsignedBits (&amp;unsigned_keys)[ITEMS_PER_THREAD] =</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;            <span class="keyword">reinterpret_cast&lt;</span>UnsignedBits (&amp;)[ITEMS_PER_THREAD]<span class="keyword">&gt;</span>(keys);</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;        <span class="comment">// Twiddle bits if necessary</span></div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> KEY = 0; KEY &lt; ITEMS_PER_THREAD; KEY++)</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;        {</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;            unsigned_keys[KEY] = KeyTraits::TwiddleIn(unsigned_keys[KEY]);</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;        }</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;        <span class="comment">// Radix sorting passes</span></div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;        <span class="keywordflow">while</span> (<span class="keyword">true</span>)</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;        {</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;            <span class="comment">// Rank the blocked keys</span></div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;            <span class="keywordtype">int</span> ranks[ITEMS_PER_THREAD];</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;            BlockRadixRank(temp_storage.ranking_storage, linear_tid).RankKeys(unsigned_keys, ranks, begin_bit);</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;            begin_bit += RADIX_BITS;</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;            <span class="comment">// Exchange keys through shared memory in blocked arrangement</span></div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;            BlockExchangeKeys(temp_storage.exchange_keys, linear_tid).ScatterToBlocked(keys, ranks);</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;            <span class="comment">// Quit if done</span></div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;            <span class="keywordflow">if</span> (begin_bit &gt;= end_bit) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;        }</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;        <span class="comment">// Untwiddle bits if necessary</span></div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> KEY = 0; KEY &lt; ITEMS_PER_THREAD; KEY++)</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        {</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;            unsigned_keys[KEY] = KeyTraits::TwiddleOut(unsigned_keys[KEY]);</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;        }</div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;    }</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div>
+<div class="line"><a name="l00358"></a><span class="lineno"><a class="code" href="classcub_1_1_block_radix_sort.html#aac3d9424388b0cb6da360624e627b61e">  358</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_radix_sort.html#aac3d9424388b0cb6da360624e627b61e" title="Performs a block-wide radix sort across a blocked arrangement of keys and values. ...">Sort</a>(</div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;        Key     (&amp;keys)[ITEMS_PER_THREAD],          </div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;        Value   (&amp;values)[ITEMS_PER_THREAD],        </div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;        <span class="keywordtype">int</span>     begin_bit   = 0,                    </div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;        <span class="keywordtype">int</span>     end_bit     = <span class="keyword">sizeof</span>(Key) * 8)      </div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;    {</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;        UnsignedBits (&amp;unsigned_keys)[ITEMS_PER_THREAD] =</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;            <span class="keyword">reinterpret_cast&lt;</span>UnsignedBits (&amp;)[ITEMS_PER_THREAD]<span class="keyword">&gt;</span>(keys);</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;        <span class="comment">// Twiddle bits if necessary</span></div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> KEY = 0; KEY &lt; ITEMS_PER_THREAD; KEY++)</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;        {</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;            unsigned_keys[KEY] = KeyTraits::TwiddleIn(unsigned_keys[KEY]);</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;        }</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;        <span class="comment">// Radix sorting passes</span></div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;        <span class="keywordflow">while</span> (<span class="keyword">true</span>)</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;        {</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;            <span class="comment">// Rank the blocked keys</span></div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;            <span class="keywordtype">int</span> ranks[ITEMS_PER_THREAD];</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;            BlockRadixRank(temp_storage.ranking_storage, linear_tid).RankKeys(unsigned_keys, ranks, begin_bit);</div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;            begin_bit += RADIX_BITS;</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;</div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;            <span class="comment">// Exchange keys through shared memory in blocked arrangement</span></div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;            BlockExchangeKeys(temp_storage.exchange_keys, linear_tid).ScatterToBlocked(keys, ranks);</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;            <span class="comment">// Exchange values through shared memory in blocked arrangement</span></div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;            BlockExchangeValues(temp_storage.exchange_values, linear_tid).ScatterToBlocked(values, ranks);</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;            <span class="comment">// Quit if done</span></div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;            <span class="keywordflow">if</span> (begin_bit &gt;= end_bit) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;        }</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;        <span class="comment">// Untwiddle bits if necessary</span></div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> KEY = 0; KEY &lt; ITEMS_PER_THREAD; KEY++)</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;        {</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;            unsigned_keys[KEY] = KeyTraits::TwiddleOut(unsigned_keys[KEY]);</div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;        }</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;    }</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;</div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;</div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;</div>
+<div class="line"><a name="l00449"></a><span class="lineno"><a class="code" href="classcub_1_1_block_radix_sort.html#a4be0c8d355a7fc75f8b405a776d884d3">  449</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_radix_sort.html#a4be0c8d355a7fc75f8b405a776d884d3" title="Performs a radix sort across a blocked arrangement of keys, leaving them in a striped arrangement...">SortBlockedToStriped</a>(</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;        Key     (&amp;keys)[ITEMS_PER_THREAD],          </div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;        <span class="keywordtype">int</span>     begin_bit   = 0,                    </div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;        <span class="keywordtype">int</span>     end_bit     = <span class="keyword">sizeof</span>(Key) * 8)      </div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;    {</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;        UnsignedBits (&amp;unsigned_keys)[ITEMS_PER_THREAD] =</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;            <span class="keyword">reinterpret_cast&lt;</span>UnsignedBits (&amp;)[ITEMS_PER_THREAD]<span class="keyword">&gt;</span>(keys);</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;        <span class="comment">// Twiddle bits if necessary</span></div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> KEY = 0; KEY &lt; ITEMS_PER_THREAD; KEY++)</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;        {</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;            unsigned_keys[KEY] = KeyTraits::TwiddleIn(unsigned_keys[KEY]);</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;        }</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;        <span class="comment">// Radix sorting passes</span></div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;        <span class="keywordflow">while</span> (<span class="keyword">true</span>)</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;        {</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;            <span class="comment">// Rank the blocked keys</span></div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;            <span class="keywordtype">int</span> ranks[ITEMS_PER_THREAD];</div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;            BlockRadixRank(temp_storage.ranking_storage, linear_tid).RankKeys(unsigned_keys, ranks, begin_bit);</div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;            begin_bit += RADIX_BITS;</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;</div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;            <span class="comment">// Check if this is the last pass</span></div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;            <span class="keywordflow">if</span> (begin_bit &gt;= end_bit)</div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;            {</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;                <span class="comment">// Last pass exchanges keys through shared memory in striped arrangement</span></div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;                BlockExchangeKeys(temp_storage.exchange_keys, linear_tid).ScatterToStriped(keys, ranks);</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;                <span class="comment">// Quit</span></div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;                <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;            }</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;            <span class="comment">// Exchange keys through shared memory in blocked arrangement</span></div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;            BlockExchangeKeys(temp_storage.exchange_keys, linear_tid).ScatterToBlocked(keys, ranks);</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;</div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;        }</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;</div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;        <span class="comment">// Untwiddle bits if necessary</span></div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> KEY = 0; KEY &lt; ITEMS_PER_THREAD; KEY++)</div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;        {</div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;            unsigned_keys[KEY] = KeyTraits::TwiddleOut(unsigned_keys[KEY]);</div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;        }</div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;    }</div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;</div>
+<div class="line"><a name="l00541"></a><span class="lineno"><a class="code" href="classcub_1_1_block_radix_sort.html#a9f707b1592f7354db0fba76a42afbc84">  541</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_radix_sort.html#a9f707b1592f7354db0fba76a42afbc84" title="Performs a radix sort across a blocked arrangement of keys and values, leaving them in a striped arra...">SortBlockedToStriped</a>(</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;        Key     (&amp;keys)[ITEMS_PER_THREAD],          </div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;        Value   (&amp;values)[ITEMS_PER_THREAD],        </div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;        <span class="keywordtype">int</span>     begin_bit   = 0,                    </div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;        <span class="keywordtype">int</span>     end_bit     = <span class="keyword">sizeof</span>(Key) * 8)      </div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;    {</div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;        UnsignedBits (&amp;unsigned_keys)[ITEMS_PER_THREAD] =</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;            <span class="keyword">reinterpret_cast&lt;</span>UnsignedBits (&amp;)[ITEMS_PER_THREAD]<span class="keyword">&gt;</span>(keys);</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;</div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;        <span class="comment">// Twiddle bits if necessary</span></div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> KEY = 0; KEY &lt; ITEMS_PER_THREAD; KEY++)</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;        {</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;            unsigned_keys[KEY] = KeyTraits::TwiddleIn(unsigned_keys[KEY]);</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        }</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;        <span class="comment">// Radix sorting passes</span></div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;        <span class="keywordflow">while</span> (<span class="keyword">true</span>)</div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;        {</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;            <span class="comment">// Rank the blocked keys</span></div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;            <span class="keywordtype">int</span> ranks[ITEMS_PER_THREAD];</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;            BlockRadixRank(temp_storage.ranking_storage, linear_tid).RankKeys(unsigned_keys, ranks, begin_bit);</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;            begin_bit += RADIX_BITS;</div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;            <span class="comment">// Check if this is the last pass</span></div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;            <span class="keywordflow">if</span> (begin_bit &gt;= end_bit)</div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;            {</div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;                <span class="comment">// Last pass exchanges keys through shared memory in striped arrangement</span></div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;                BlockExchangeKeys(temp_storage.exchange_keys, linear_tid).ScatterToStriped(keys, ranks);</div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;</div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;                __syncthreads();</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;                <span class="comment">// Last pass exchanges through shared memory in striped arrangement</span></div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;                BlockExchangeValues(temp_storage.exchange_values, linear_tid).ScatterToStriped(values, ranks);</div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;</div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;                <span class="comment">// Quit</span></div>
+<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;                <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;            }</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;            <span class="comment">// Exchange keys through shared memory in blocked arrangement</span></div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;            BlockExchangeKeys(temp_storage.exchange_keys, linear_tid).ScatterToBlocked(keys, ranks);</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;</div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;            <span class="comment">// Exchange values through shared memory in blocked arrangement</span></div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;            BlockExchangeValues(temp_storage.exchange_values, linear_tid).ScatterToBlocked(values, ranks);</div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;            __syncthreads();</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;        }</div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;        <span class="comment">// Untwiddle bits if necessary</span></div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;<span class="preprocessor">        #pragma unroll</span></div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;<span class="preprocessor"></span>        <span class="keywordflow">for</span> (<span class="keywordtype">int</span> KEY = 0; KEY &lt; ITEMS_PER_THREAD; KEY++)</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;        {</div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;            unsigned_keys[KEY] = KeyTraits::TwiddleOut(unsigned_keys[KEY]);</div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;        }</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;    }</div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;</div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;</div>
+<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;};</div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/block__reduce_8cuh_source.html b/docs/html/block__reduce_8cuh_source.html
new file mode 100644
index 0000000000..ce3b1be64f
--- /dev/null
+++ b/docs/html/block__reduce_8cuh_source.html
@@ -0,0 +1,336 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: block_reduce.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_011e1c944d88f71be72e1e24a5fda7cf.html">block</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">block_reduce.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="block__reduce_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;specializations/block_reduce_raking.cuh&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;specializations/block_reduce_warp_reductions.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../thread/thread_operators.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="comment"> * Algorithmic variants</span></div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div>
+<div class="line"><a name="l00058"></a><span class="lineno"><a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10a">   58</a></span>&#160;<span class="keyword">enum</span> <a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10a">BlockReduceAlgorithm</a></div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;{</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div>
+<div class="line"><a name="l00081"></a><span class="lineno"><a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10aab32651e17a8a42207e74b7ed8d1aa4d2">   81</a></span>&#160;    <a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10aab32651e17a8a42207e74b7ed8d1aa4d2">BLOCK_REDUCE_RAKING</a>,</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div>
+<div class="line"><a name="l00106"></a><span class="lineno"><a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10aa993903176f938273fa1ff5d4daa808e5">  106</a></span>&#160;    <a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10aa993903176f938273fa1ff5d4daa808e5">BLOCK_REDUCE_WARP_REDUCTIONS</a>,</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;};</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="comment"> * Block reduce</span></div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    <span class="keyword">typename</span>                T,</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    <span class="keywordtype">int</span>                     BLOCK_THREADS,</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    <a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10a">BlockReduceAlgorithm</a>    ALGORITHM = <a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10aab32651e17a8a42207e74b7ed8d1aa4d2">BLOCK_REDUCE_RAKING</a>&gt;</div>
+<div class="line"><a name="l00172"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html">  172</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_block_reduce.html" title="The BlockReduce class provides collective methods for computing a parallel reduction of items partiti...">BlockReduce</a></div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;{</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="comment">     * Constants and typedefs</span></div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html" title="Type selection (IF ? ThenType : ElseType) ">If</a>&lt;(ALGORITHM == <a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10aa993903176f938273fa1ff5d4daa808e5">BLOCK_REDUCE_WARP_REDUCTIONS</a>),</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;        BlockReduceWarpReductions&lt;T, BLOCK_THREADS&gt;,</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;        BlockReduceRaking&lt;T, BLOCK_THREADS&gt; &gt;::Type InternalBlockReduce;</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> InternalBlockReduce::TempStorage _TempStorage;</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    {</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;        __shared__ _TempStorage private_storage;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    }</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;    <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;</div>
+<div class="line"><a name="l00215"></a><span class="lineno"><a class="code" href="structcub_1_1_block_reduce_1_1_temp_storage.html">  215</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_reduce_1_1_temp_storage.html" title="The operations exposed by BlockReduce require a temporary memory allocation of this nested type for t...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div>
+<div class="line"><a name="l00226"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#a3d1fab4feec5bcca9c058c98dcc2e169">  226</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_reduce.html#a3d1fab4feec5bcca9c058c98dcc2e169" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">BlockReduce</a>()</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    :</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    {}</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div>
+<div class="line"><a name="l00236"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#a9687391e0384a76271c9b25410f5d377">  236</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_reduce.html#a9687391e0384a76271c9b25410f5d377" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">BlockReduce</a>(</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;        <a class="code" href="structcub_1_1_block_reduce_1_1_temp_storage.html" title="The operations exposed by BlockReduce require a temporary memory allocation of this nested type for t...">TempStorage</a> &amp;temp_storage)             </div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    :</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;    {}</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div>
+<div class="line"><a name="l00247"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#a126757e3d17a046190ed6e4383d8f615">  247</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_reduce.html#a126757e3d17a046190ed6e4383d8f615" title="Collective constructor using a private static allocation of shared memory as temporary storage...">BlockReduce</a>(</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;    :</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    {}</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;</div>
+<div class="line"><a name="l00258"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#a1def8cd84b121828acbdf41a307efa46">  258</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_reduce.html#a1def8cd84b121828acbdf41a307efa46" title="Collective constructor using the specified memory allocation as temporary storage. Each thread is identified using the supplied linear thread identifier. ">BlockReduce</a>(</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;        <a class="code" href="structcub_1_1_block_reduce_1_1_temp_storage.html" title="The operations exposed by BlockReduce require a temporary memory allocation of this nested type for t...">TempStorage</a> &amp;temp_storage,             </div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    :</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    {}</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ReductionOp&gt;</div>
+<div class="line"><a name="l00310"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#a77dac72eafb56f394762b8d3b937de79">  310</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_block_reduce.html#a77dac72eafb56f394762b8d3b937de79" title="Computes a block-wide reduction for thread0 using the specified binary reduction functor. Each thread contributes one input element. ">Reduce</a>(</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;        T               input,                      </div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;        ReductionOp     reduction_op)               </div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;    {</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;        <span class="keywordflow">return</span> InternalBlockReduce(temp_storage, linear_tid).template Reduce&lt;true&gt;(input, BLOCK_THREADS, reduction_op);</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;    }</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;        <span class="keywordtype">int</span> ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;        <span class="keyword">typename</span> ReductionOp&gt;</div>
+<div class="line"><a name="l00359"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#a40ea5f85fa38ac1ac9ec98db9b085ed0">  359</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_block_reduce.html#a40ea5f85fa38ac1ac9ec98db9b085ed0" title="Computes a block-wide reduction for thread0 using the specified binary reduction functor. Each thread contributes an array of consecutive input elements. ">Reduce</a>(</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;        T               (&amp;inputs)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;        ReductionOp     reduction_op)                   </div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;    {</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;        <span class="comment">// Reduce partials</span></div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;        T partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(inputs, reduction_op);</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="classcub_1_1_block_reduce.html#a77dac72eafb56f394762b8d3b937de79" title="Computes a block-wide reduction for thread0 using the specified binary reduction functor. Each thread contributes one input element. ">Reduce</a>(partial, reduction_op);</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;    }</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;</div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ReductionOp&gt;</div>
+<div class="line"><a name="l00406"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#a0c9d086cb37f41a74d1a4c02fae741c4">  406</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_block_reduce.html#a0c9d086cb37f41a74d1a4c02fae741c4" title="Computes a block-wide reduction for thread0 using the specified binary reduction functor. The first num_valid threads each contribute one input element. ">Reduce</a>(</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;        T                   input,                  </div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;        ReductionOp         reduction_op,           </div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;        <span class="keywordtype">int</span>                 num_valid)              </div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;    {</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;        <span class="comment">// Determine if we scan skip bounds checking</span></div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;        <span class="keywordflow">if</span> (num_valid &gt;= BLOCK_THREADS)</div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;        {</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;            <span class="keywordflow">return</span> InternalBlockReduce(temp_storage, linear_tid).template Reduce&lt;true&gt;(input, num_valid, reduction_op);</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;        }</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;        {</div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;            <span class="keywordflow">return</span> InternalBlockReduce(temp_storage, linear_tid).template Reduce&lt;false&gt;(input, num_valid, reduction_op);</div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;        }</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;    }</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;</div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;</div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;</div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;</div>
+<div class="line"><a name="l00461"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#a7565f00c47dc7dfb286668bea15dad05">  461</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_block_reduce.html#a7565f00c47dc7dfb286668bea15dad05" title="Computes a block-wide reduction for thread0 using addition (+) as the reduction operator. Each thread contributes one input element. ">Sum</a>(</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;        T   input)                      </div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;    {</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;        <span class="keywordflow">return</span> InternalBlockReduce(temp_storage, linear_tid).template <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum&lt;true&gt;</a>(input, BLOCK_THREADS);</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;    }</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;</div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> ITEMS_PER_THREAD&gt;</div>
+<div class="line"><a name="l00501"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#a2611610d09bb8daca91e414a77c1e937">  501</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_block_reduce.html#a2611610d09bb8daca91e414a77c1e937" title="Computes a block-wide reduction for thread0 using addition (+) as the reduction operator. Each thread contributes an array of consecutive input elements. ">Sum</a>(</div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;        T   (&amp;inputs)[ITEMS_PER_THREAD])    </div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;    {</div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;        <span class="comment">// Reduce partials</span></div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;        T partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(inputs, <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">cub::Sum</a>());</div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="classcub_1_1_block_reduce.html#a7565f00c47dc7dfb286668bea15dad05" title="Computes a block-wide reduction for thread0 using addition (+) as the reduction operator. Each thread contributes one input element. ">Sum</a>(partial);</div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;    }</div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;</div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;</div>
+<div class="line"><a name="l00542"></a><span class="lineno"><a class="code" href="classcub_1_1_block_reduce.html#aa52adf836e96dee812f456283cac13f7">  542</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_block_reduce.html#aa52adf836e96dee812f456283cac13f7" title="Computes a block-wide reduction for thread0 using addition (+) as the reduction operator. The first num_valid threads each contribute one input element. ">Sum</a>(</div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;        T   input,                  </div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;        <span class="keywordtype">int</span> num_valid)              </div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;    {</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;        <span class="comment">// Determine if we scan skip bounds checking</span></div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;        <span class="keywordflow">if</span> (num_valid &gt;= BLOCK_THREADS)</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;        {</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;            <span class="keywordflow">return</span> InternalBlockReduce(temp_storage, linear_tid).template <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum&lt;true&gt;</a>(input, num_valid);</div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;        }</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;        {</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;            <span class="keywordflow">return</span> InternalBlockReduce(temp_storage, linear_tid).template <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum&lt;false&gt;</a>(input, num_valid);</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;        }</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;    }</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;</div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;};</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;</div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/block__scan_8cuh_source.html b/docs/html/block__scan_8cuh_source.html
new file mode 100644
index 0000000000..01cc2bd765
--- /dev/null
+++ b/docs/html/block__scan_8cuh_source.html
@@ -0,0 +1,814 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: block_scan.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_011e1c944d88f71be72e1e24a5fda7cf.html">block</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">block_scan.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="block__scan_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;specializations/block_scan_raking.cuh&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;specializations/block_scan_warp_scans.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../util_arch.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="comment"> * Algorithmic variants</span></div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div>
+<div class="line"><a name="l00056"></a><span class="lineno"><a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23ab">   56</a></span>&#160;<span class="keyword">enum</span> <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23ab" title="BlockScanAlgorithm enumerates alternative algorithms for cub::BlockScan to compute a parallel prefix ...">BlockScanAlgorithm</a></div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;{</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div>
+<div class="line"><a name="l00077"></a><span class="lineno"><a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba0fa6cac57b7df2f475a67af053b9371c">   77</a></span>&#160;    <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba0fa6cac57b7df2f475a67af053b9371c">BLOCK_SCAN_RAKING</a>,</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div>
+<div class="line"><a name="l00087"></a><span class="lineno"><a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23abadc8dfe7760ac97ddde467ecf1070674f">   87</a></span>&#160;    <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23abadc8dfe7760ac97ddde467ecf1070674f">BLOCK_SCAN_RAKING_MEMOIZE</a>,</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div>
+<div class="line"><a name="l00107"></a><span class="lineno"><a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba7f51e58246eb53f1a97bd1bc8c0f400f">  107</a></span>&#160;    <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba7f51e58246eb53f1a97bd1bc8c0f400f">BLOCK_SCAN_WARP_SCANS</a>,</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;};</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="comment"> * Block scan</span></div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keyword">typename</span>            T,</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    <span class="keywordtype">int</span>                 BLOCK_THREADS,</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23ab" title="BlockScanAlgorithm enumerates alternative algorithms for cub::BlockScan to compute a parallel prefix ...">BlockScanAlgorithm</a>  ALGORITHM = <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba0fa6cac57b7df2f475a67af053b9371c">BLOCK_SCAN_RAKING</a>&gt;</div>
+<div class="line"><a name="l00186"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html">  186</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_block_scan.html" title="The BlockScan class provides collective methods for computing a parallel prefix sum/scan of items par...">BlockScan</a></div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;{</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;<span class="comment">     * Constants and typedefs</span></div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23ab" title="BlockScanAlgorithm enumerates alternative algorithms for cub::BlockScan to compute a parallel prefix ...">BlockScanAlgorithm</a> SAFE_ALGORITHM =</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;        ((ALGORITHM == <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba7f51e58246eb53f1a97bd1bc8c0f400f">BLOCK_SCAN_WARP_SCANS</a>) &amp;&amp; (BLOCK_THREADS % <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> != 0)) ?</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;            <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba0fa6cac57b7df2f475a67af053b9371c">BLOCK_SCAN_RAKING</a> :</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;            ALGORITHM;</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html" title="Type selection (IF ? ThenType : ElseType) ">If</a>&lt;(SAFE_ALGORITHM == <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba7f51e58246eb53f1a97bd1bc8c0f400f">BLOCK_SCAN_WARP_SCANS</a>),</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;        BlockScanWarpScans&lt;T, BLOCK_THREADS&gt;,</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;        BlockScanRaking&lt;T, BLOCK_THREADS, (SAFE_ALGORITHM == <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23abadc8dfe7760ac97ddde467ecf1070674f">BLOCK_SCAN_RAKING_MEMOIZE</a>)&gt; &gt;::Type InternalBlockScan;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> InternalBlockScan::TempStorage _TempStorage;</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    {</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;        __shared__ _TempStorage private_storage;</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;    }</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;</div>
+<div class="line"><a name="l00241"></a><span class="lineno"><a class="code" href="structcub_1_1_block_scan_1_1_temp_storage.html">  241</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_scan_1_1_temp_storage.html" title="The operations exposed by BlockScan require a temporary memory allocation of this nested type for thr...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;</div>
+<div class="line"><a name="l00252"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a982e1407d00b704c3046cd72c48acabb">  252</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_scan.html#a982e1407d00b704c3046cd72c48acabb" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">BlockScan</a>()</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    :</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    {}</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;</div>
+<div class="line"><a name="l00262"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#ad0decc1ea510cd9c7df4cd380a26b1b1">  262</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_scan.html#ad0decc1ea510cd9c7df4cd380a26b1b1" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">BlockScan</a>(</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;        <a class="code" href="structcub_1_1_block_scan_1_1_temp_storage.html" title="The operations exposed by BlockScan require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage)             </div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    :</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;    {}</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div>
+<div class="line"><a name="l00273"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#ab364204badf83769f9140d799cc188a7">  273</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_scan.html#ab364204badf83769f9140d799cc188a7" title="Collective constructor using a private static allocation of shared memory as temporary storage...">BlockScan</a>(</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    :</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    {}</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div>
+<div class="line"><a name="l00284"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a6264c3383db3384184cb13f5f282f73d">  284</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_scan.html#a6264c3383db3384184cb13f5f282f73d" title="Collective constructor using the specified memory allocation as temporary storage. Each thread is identified using the supplied linear thread identifier. ">BlockScan</a>(</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;        <a class="code" href="structcub_1_1_block_scan_1_1_temp_storage.html" title="The operations exposed by BlockScan require a temporary memory allocation of this nested type for thr...">TempStorage</a> &amp;temp_storage,             </div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;    :</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;    {}</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;</div>
+<div class="line"><a name="l00335"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#acd75d5aad2d1385bcbe15517011800e8">  335</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#acd75d5aad2d1385bcbe15517011800e8" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;        T               &amp;output)                        </div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    {</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;        T block_aggregate;</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;        InternalBlockScan(temp_storage, linear_tid).ExclusiveSum(input, output, block_aggregate);</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    }</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;</div>
+<div class="line"><a name="l00380"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a1fd276abbe08f7031a0333bf5c98c2f5">  380</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a1fd276abbe08f7031a0333bf5c98c2f5" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. Also provides every thread with the block-wide block_aggregate of all inputs. ">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;        T               &amp;block_aggregate)               </div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;    {</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;        InternalBlockScan(temp_storage, linear_tid).ExclusiveSum(input, output, block_aggregate);</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;    }</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BlockPrefixOp&gt;</div>
+<div class="line"><a name="l00465"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a97e041cbdfdb4005ffc65b45c9276403">  465</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a97e041cbdfdb4005ffc65b45c9276403" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. Instead of using 0 as the block-wide prefix, the call-back functor block_prefix_op is invoked by the first warp in the block, and the value returned by lane0 in that warp is used as the &quot;seed&quot; value that logically prefixes the threadblock&#39;s scan inputs. Also provides every thread with the block-wide block_aggregate of all inputs. ">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;        T               &amp;block_aggregate,               </div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;        BlockPrefixOp   &amp;block_prefix_op)               </div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;    {</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;        InternalBlockScan(temp_storage, linear_tid).ExclusiveSum(input, output, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;    }</div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;</div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;</div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> ITEMS_PER_THREAD&gt;</div>
+<div class="line"><a name="l00519"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#ab8122c00c833f17c78af3d99dc76c5e8">  519</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#ab8122c00c833f17c78af3d99dc76c5e8" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes an array of consecutive input elements. ">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;        T                 (&amp;input)[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;        T                 (&amp;output)[ITEMS_PER_THREAD])  </div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;    {</div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;        <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;        <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum</a> scan_op;</div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;        T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;</div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;        <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#acd75d5aad2d1385bcbe15517011800e8" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">ExclusiveSum</a>(thread_partial, thread_partial);</div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;</div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;        <span class="comment">// Exclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;        <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(input, output, scan_op, thread_partial);</div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;    }</div>
+<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;</div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;</div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> ITEMS_PER_THREAD&gt;</div>
+<div class="line"><a name="l00574"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#aa92950e9b763459fb7e63c8d047c94c2">  574</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#aa92950e9b763459fb7e63c8d047c94c2" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes an array of consecutive input elements. Also provides every thread with the block-wide block_aggregate of all inputs. ">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;        T                 (&amp;input)[ITEMS_PER_THREAD],       </div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;        T                 (&amp;output)[ITEMS_PER_THREAD],      </div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;        T                 &amp;block_aggregate)                 </div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;    {</div>
+<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;        <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;        <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum</a> scan_op;</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;        T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;</div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;        <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#acd75d5aad2d1385bcbe15517011800e8" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">ExclusiveSum</a>(thread_partial, thread_partial, block_aggregate);</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;        <span class="comment">// Exclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;        <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(input, output, scan_op, thread_partial);</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;    }</div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;</div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;        <span class="keywordtype">int</span> ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;        <span class="keyword">typename</span> BlockPrefixOp&gt;</div>
+<div class="line"><a name="l00680"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#ab6f9a0fa1ac832dcfb31bfacd7f1e22b">  680</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#ab6f9a0fa1ac832dcfb31bfacd7f1e22b" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes an array of consecutive input elements. Instead of using 0 as the block-wide prefix, the call-back functor block_prefix_op is invoked by the first warp in the block, and the value returned by lane0 in that warp is used as the &quot;seed&quot; value that logically prefixes the threadblock&#39;s scan inputs. Also provides every thread with the block-wide block_aggregate of all inputs. ">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;        T                 (&amp;input)[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;        T                 (&amp;output)[ITEMS_PER_THREAD],  </div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;        T                 &amp;block_aggregate,             </div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;        BlockPrefixOp     &amp;block_prefix_op)             </div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;    {</div>
+<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;        <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;        <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum</a> scan_op;</div>
+<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;        T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;</div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;        <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#acd75d5aad2d1385bcbe15517011800e8" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">ExclusiveSum</a>(thread_partial, thread_partial, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;</div>
+<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;        <span class="comment">// Exclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;        <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(input, output, scan_op, thread_partial);</div>
+<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;    }</div>
+<div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;</div>
+<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;</div>
+<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;</div>
+<div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;</div>
+<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;</div>
+<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l00744"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7">  744</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160;        T               identity,                       </div>
+<div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160;        ScanOp          scan_op)                        </div>
+<div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;    {</div>
+<div class="line"><a name="l00750"></a><span class="lineno">  750</span>&#160;        T block_aggregate;</div>
+<div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;        InternalBlockScan(temp_storage, linear_tid).ExclusiveScan(input, output, identity, scan_op, block_aggregate);</div>
+<div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;    }</div>
+<div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;</div>
+<div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;</div>
+<div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l00795"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a1e09b0882138e34c23559c4d9a89a0d8">  795</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a1e09b0882138e34c23559c4d9a89a0d8" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. Also provides every thread with the block-wide block_aggregate of all inputs. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;        <span class="keyword">const</span> T         &amp;identity,          </div>
+<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;        ScanOp          scan_op,            </div>
+<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;        T               &amp;block_aggregate)   </div>
+<div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;    {</div>
+<div class="line"><a name="l00802"></a><span class="lineno">  802</span>&#160;        InternalBlockScan(temp_storage, linear_tid).ExclusiveScan(input, output, identity, scan_op, block_aggregate);</div>
+<div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;    }</div>
+<div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160;</div>
+<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;</div>
+<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00886"></a><span class="lineno">  886</span>&#160;        <span class="keyword">typename</span> ScanOp,</div>
+<div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160;        <span class="keyword">typename</span> BlockPrefixOp&gt;</div>
+<div class="line"><a name="l00888"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#ab61af70303ff86b4aead54c1f83f0e30">  888</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#ab61af70303ff86b4aead54c1f83f0e30" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. the call-back functor block_prefix_op is invoked by the first warp in the block, and the value returned by lane0 in that warp is used as the &quot;seed&quot; value that logically prefixes the threadblock&#39;s scan inputs. Also provides every thread with the block-wide block_aggregate of all inputs. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l00889"></a><span class="lineno">  889</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l00891"></a><span class="lineno">  891</span>&#160;        T               identity,                       </div>
+<div class="line"><a name="l00892"></a><span class="lineno">  892</span>&#160;        ScanOp          scan_op,                        </div>
+<div class="line"><a name="l00893"></a><span class="lineno">  893</span>&#160;        T               &amp;block_aggregate,               </div>
+<div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160;        BlockPrefixOp   &amp;block_prefix_op)               </div>
+<div class="line"><a name="l00895"></a><span class="lineno">  895</span>&#160;    {</div>
+<div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;        InternalBlockScan(temp_storage, linear_tid).ExclusiveScan(input, output, identity, scan_op, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l00897"></a><span class="lineno">  897</span>&#160;    }</div>
+<div class="line"><a name="l00898"></a><span class="lineno">  898</span>&#160;</div>
+<div class="line"><a name="l00899"></a><span class="lineno">  899</span>&#160;</div>
+<div class="line"><a name="l00901"></a><span class="lineno">  901</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00905"></a><span class="lineno">  905</span>&#160;</div>
+<div class="line"><a name="l00906"></a><span class="lineno">  906</span>&#160;</div>
+<div class="line"><a name="l00948"></a><span class="lineno">  948</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00949"></a><span class="lineno">  949</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00950"></a><span class="lineno">  950</span>&#160;        <span class="keyword">typename</span>        ScanOp&gt;</div>
+<div class="line"><a name="l00951"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a5b21dfebcaf900cb516a06746dcb48b1">  951</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a5b21dfebcaf900cb516a06746dcb48b1" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes an array of consecutive input elements. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l00952"></a><span class="lineno">  952</span>&#160;        T                 (&amp;input)[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l00953"></a><span class="lineno">  953</span>&#160;        T                 (&amp;output)[ITEMS_PER_THREAD],  </div>
+<div class="line"><a name="l00954"></a><span class="lineno">  954</span>&#160;        <span class="keyword">const</span> T           &amp;identity,                    </div>
+<div class="line"><a name="l00955"></a><span class="lineno">  955</span>&#160;        ScanOp            scan_op)                      </div>
+<div class="line"><a name="l00956"></a><span class="lineno">  956</span>&#160;    {</div>
+<div class="line"><a name="l00957"></a><span class="lineno">  957</span>&#160;        <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l00958"></a><span class="lineno">  958</span>&#160;        T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l00959"></a><span class="lineno">  959</span>&#160;</div>
+<div class="line"><a name="l00960"></a><span class="lineno">  960</span>&#160;        <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l00961"></a><span class="lineno">  961</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(thread_partial, thread_partial, identity, scan_op);</div>
+<div class="line"><a name="l00962"></a><span class="lineno">  962</span>&#160;</div>
+<div class="line"><a name="l00963"></a><span class="lineno">  963</span>&#160;        <span class="comment">// Exclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l00964"></a><span class="lineno">  964</span>&#160;        <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(input, output, scan_op, thread_partial);</div>
+<div class="line"><a name="l00965"></a><span class="lineno">  965</span>&#160;    }</div>
+<div class="line"><a name="l00966"></a><span class="lineno">  966</span>&#160;</div>
+<div class="line"><a name="l00967"></a><span class="lineno">  967</span>&#160;</div>
+<div class="line"><a name="l01009"></a><span class="lineno"> 1009</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01010"></a><span class="lineno"> 1010</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l01011"></a><span class="lineno"> 1011</span>&#160;        <span class="keyword">typename</span>        ScanOp&gt;</div>
+<div class="line"><a name="l01012"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a1cda15ada4f880a7f428bd248c686710"> 1012</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a1cda15ada4f880a7f428bd248c686710" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes an array of consecutive input elements. Also provides every thread with the block-wide block_aggregate of all inputs. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01013"></a><span class="lineno"> 1013</span>&#160;        T                 (&amp;input)[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l01014"></a><span class="lineno"> 1014</span>&#160;        T                 (&amp;output)[ITEMS_PER_THREAD],  </div>
+<div class="line"><a name="l01015"></a><span class="lineno"> 1015</span>&#160;        <span class="keyword">const</span> T           &amp;identity,                    </div>
+<div class="line"><a name="l01016"></a><span class="lineno"> 1016</span>&#160;        ScanOp            scan_op,                      </div>
+<div class="line"><a name="l01017"></a><span class="lineno"> 1017</span>&#160;        T                 &amp;block_aggregate)             </div>
+<div class="line"><a name="l01018"></a><span class="lineno"> 1018</span>&#160;    {</div>
+<div class="line"><a name="l01019"></a><span class="lineno"> 1019</span>&#160;        <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l01020"></a><span class="lineno"> 1020</span>&#160;        T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l01021"></a><span class="lineno"> 1021</span>&#160;</div>
+<div class="line"><a name="l01022"></a><span class="lineno"> 1022</span>&#160;        <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l01023"></a><span class="lineno"> 1023</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(thread_partial, thread_partial, identity, scan_op, block_aggregate);</div>
+<div class="line"><a name="l01024"></a><span class="lineno"> 1024</span>&#160;</div>
+<div class="line"><a name="l01025"></a><span class="lineno"> 1025</span>&#160;        <span class="comment">// Exclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l01026"></a><span class="lineno"> 1026</span>&#160;        <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(input, output, scan_op, thread_partial);</div>
+<div class="line"><a name="l01027"></a><span class="lineno"> 1027</span>&#160;    }</div>
+<div class="line"><a name="l01028"></a><span class="lineno"> 1028</span>&#160;</div>
+<div class="line"><a name="l01029"></a><span class="lineno"> 1029</span>&#160;</div>
+<div class="line"><a name="l01119"></a><span class="lineno"> 1119</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01120"></a><span class="lineno"> 1120</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l01121"></a><span class="lineno"> 1121</span>&#160;        <span class="keyword">typename</span>        ScanOp,</div>
+<div class="line"><a name="l01122"></a><span class="lineno"> 1122</span>&#160;        <span class="keyword">typename</span>        BlockPrefixOp&gt;</div>
+<div class="line"><a name="l01123"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#ab954851d7bd0fc7c3e2e16d31bfcb704"> 1123</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#ab954851d7bd0fc7c3e2e16d31bfcb704" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes an array of consecutive input elements. the call-back functor block_prefix_op is invoked by the first warp in the block, and the value returned by lane0 in that warp is used as the &quot;seed&quot; value that logically prefixes the threadblock&#39;s scan inputs. Also provides every thread with the block-wide block_aggregate of all inputs. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01124"></a><span class="lineno"> 1124</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l01125"></a><span class="lineno"> 1125</span>&#160;        T               (&amp;output)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l01126"></a><span class="lineno"> 1126</span>&#160;        T               identity,                       </div>
+<div class="line"><a name="l01127"></a><span class="lineno"> 1127</span>&#160;        ScanOp          scan_op,                        </div>
+<div class="line"><a name="l01128"></a><span class="lineno"> 1128</span>&#160;        T               &amp;block_aggregate,               </div>
+<div class="line"><a name="l01129"></a><span class="lineno"> 1129</span>&#160;        BlockPrefixOp   &amp;block_prefix_op)               </div>
+<div class="line"><a name="l01130"></a><span class="lineno"> 1130</span>&#160;    {</div>
+<div class="line"><a name="l01131"></a><span class="lineno"> 1131</span>&#160;        <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l01132"></a><span class="lineno"> 1132</span>&#160;        T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l01133"></a><span class="lineno"> 1133</span>&#160;</div>
+<div class="line"><a name="l01134"></a><span class="lineno"> 1134</span>&#160;        <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l01135"></a><span class="lineno"> 1135</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(thread_partial, thread_partial, identity, scan_op, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l01136"></a><span class="lineno"> 1136</span>&#160;</div>
+<div class="line"><a name="l01137"></a><span class="lineno"> 1137</span>&#160;        <span class="comment">// Exclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l01138"></a><span class="lineno"> 1138</span>&#160;        <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(input, output, scan_op, thread_partial);</div>
+<div class="line"><a name="l01139"></a><span class="lineno"> 1139</span>&#160;    }</div>
+<div class="line"><a name="l01140"></a><span class="lineno"> 1140</span>&#160;</div>
+<div class="line"><a name="l01141"></a><span class="lineno"> 1141</span>&#160;</div>
+<div class="line"><a name="l01143"></a><span class="lineno"> 1143</span>&#160;</div>
+<div class="line"><a name="l01144"></a><span class="lineno"> 1144</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l01145"></a><span class="lineno"> 1145</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l01146"></a><span class="lineno"> 1146</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l01150"></a><span class="lineno"> 1150</span>&#160;</div>
+<div class="line"><a name="l01151"></a><span class="lineno"> 1151</span>&#160;</div>
+<div class="line"><a name="l01163"></a><span class="lineno"> 1163</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l01164"></a><span class="lineno"> 1164</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01165"></a><span class="lineno"> 1165</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l01166"></a><span class="lineno"> 1166</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l01167"></a><span class="lineno"> 1167</span>&#160;        ScanOp          scan_op)                        </div>
+<div class="line"><a name="l01168"></a><span class="lineno"> 1168</span>&#160;    {</div>
+<div class="line"><a name="l01169"></a><span class="lineno"> 1169</span>&#160;        T block_aggregate;</div>
+<div class="line"><a name="l01170"></a><span class="lineno"> 1170</span>&#160;        InternalBlockScan(temp_storage, linear_tid).ExclusiveScan(input, output, scan_op, block_aggregate);</div>
+<div class="line"><a name="l01171"></a><span class="lineno"> 1171</span>&#160;    }</div>
+<div class="line"><a name="l01172"></a><span class="lineno"> 1172</span>&#160;</div>
+<div class="line"><a name="l01173"></a><span class="lineno"> 1173</span>&#160;</div>
+<div class="line"><a name="l01185"></a><span class="lineno"> 1185</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l01186"></a><span class="lineno"> 1186</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01187"></a><span class="lineno"> 1187</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l01188"></a><span class="lineno"> 1188</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l01189"></a><span class="lineno"> 1189</span>&#160;        ScanOp          scan_op,                        </div>
+<div class="line"><a name="l01190"></a><span class="lineno"> 1190</span>&#160;        T               &amp;block_aggregate)               </div>
+<div class="line"><a name="l01191"></a><span class="lineno"> 1191</span>&#160;    {</div>
+<div class="line"><a name="l01192"></a><span class="lineno"> 1192</span>&#160;        InternalBlockScan(temp_storage, linear_tid).ExclusiveScan(input, output, scan_op, block_aggregate);</div>
+<div class="line"><a name="l01193"></a><span class="lineno"> 1193</span>&#160;    }</div>
+<div class="line"><a name="l01194"></a><span class="lineno"> 1194</span>&#160;</div>
+<div class="line"><a name="l01195"></a><span class="lineno"> 1195</span>&#160;</div>
+<div class="line"><a name="l01213"></a><span class="lineno"> 1213</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01214"></a><span class="lineno"> 1214</span>&#160;        <span class="keyword">typename</span> ScanOp,</div>
+<div class="line"><a name="l01215"></a><span class="lineno"> 1215</span>&#160;        <span class="keyword">typename</span> BlockPrefixOp&gt;</div>
+<div class="line"><a name="l01216"></a><span class="lineno"> 1216</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01217"></a><span class="lineno"> 1217</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l01218"></a><span class="lineno"> 1218</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l01219"></a><span class="lineno"> 1219</span>&#160;        ScanOp          scan_op,                        </div>
+<div class="line"><a name="l01220"></a><span class="lineno"> 1220</span>&#160;        T               &amp;block_aggregate,               </div>
+<div class="line"><a name="l01221"></a><span class="lineno"> 1221</span>&#160;        BlockPrefixOp   &amp;block_prefix_op)               </div>
+<div class="line"><a name="l01222"></a><span class="lineno"> 1222</span>&#160;    {</div>
+<div class="line"><a name="l01223"></a><span class="lineno"> 1223</span>&#160;        InternalBlockScan(temp_storage, linear_tid).ExclusiveScan(input, output, scan_op, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l01224"></a><span class="lineno"> 1224</span>&#160;    }</div>
+<div class="line"><a name="l01225"></a><span class="lineno"> 1225</span>&#160;</div>
+<div class="line"><a name="l01226"></a><span class="lineno"> 1226</span>&#160;</div>
+<div class="line"><a name="l01228"></a><span class="lineno"> 1228</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l01232"></a><span class="lineno"> 1232</span>&#160;</div>
+<div class="line"><a name="l01233"></a><span class="lineno"> 1233</span>&#160;</div>
+<div class="line"><a name="l01246"></a><span class="lineno"> 1246</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01247"></a><span class="lineno"> 1247</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l01248"></a><span class="lineno"> 1248</span>&#160;        <span class="keyword">typename</span>        ScanOp&gt;</div>
+<div class="line"><a name="l01249"></a><span class="lineno"> 1249</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01250"></a><span class="lineno"> 1250</span>&#160;        T                 (&amp;input)[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l01251"></a><span class="lineno"> 1251</span>&#160;        T                 (&amp;output)[ITEMS_PER_THREAD],  </div>
+<div class="line"><a name="l01252"></a><span class="lineno"> 1252</span>&#160;        ScanOp            scan_op)                      </div>
+<div class="line"><a name="l01253"></a><span class="lineno"> 1253</span>&#160;    {</div>
+<div class="line"><a name="l01254"></a><span class="lineno"> 1254</span>&#160;        <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l01255"></a><span class="lineno"> 1255</span>&#160;        T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l01256"></a><span class="lineno"> 1256</span>&#160;</div>
+<div class="line"><a name="l01257"></a><span class="lineno"> 1257</span>&#160;        <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l01258"></a><span class="lineno"> 1258</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(thread_partial, thread_partial, scan_op);</div>
+<div class="line"><a name="l01259"></a><span class="lineno"> 1259</span>&#160;</div>
+<div class="line"><a name="l01260"></a><span class="lineno"> 1260</span>&#160;        <span class="comment">// Exclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l01261"></a><span class="lineno"> 1261</span>&#160;        <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(input, output, scan_op, thread_partial, (linear_tid != 0));</div>
+<div class="line"><a name="l01262"></a><span class="lineno"> 1262</span>&#160;    }</div>
+<div class="line"><a name="l01263"></a><span class="lineno"> 1263</span>&#160;</div>
+<div class="line"><a name="l01264"></a><span class="lineno"> 1264</span>&#160;</div>
+<div class="line"><a name="l01277"></a><span class="lineno"> 1277</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01278"></a><span class="lineno"> 1278</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l01279"></a><span class="lineno"> 1279</span>&#160;        <span class="keyword">typename</span>        ScanOp&gt;</div>
+<div class="line"><a name="l01280"></a><span class="lineno"> 1280</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01281"></a><span class="lineno"> 1281</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l01282"></a><span class="lineno"> 1282</span>&#160;        T               (&amp;output)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l01283"></a><span class="lineno"> 1283</span>&#160;        ScanOp          scan_op,                        </div>
+<div class="line"><a name="l01284"></a><span class="lineno"> 1284</span>&#160;        T               &amp;block_aggregate)               </div>
+<div class="line"><a name="l01285"></a><span class="lineno"> 1285</span>&#160;    {</div>
+<div class="line"><a name="l01286"></a><span class="lineno"> 1286</span>&#160;        <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l01287"></a><span class="lineno"> 1287</span>&#160;        T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l01288"></a><span class="lineno"> 1288</span>&#160;</div>
+<div class="line"><a name="l01289"></a><span class="lineno"> 1289</span>&#160;        <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l01290"></a><span class="lineno"> 1290</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(thread_partial, thread_partial, scan_op, block_aggregate);</div>
+<div class="line"><a name="l01291"></a><span class="lineno"> 1291</span>&#160;</div>
+<div class="line"><a name="l01292"></a><span class="lineno"> 1292</span>&#160;        <span class="comment">// Exclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l01293"></a><span class="lineno"> 1293</span>&#160;        <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(input, output, scan_op, thread_partial, (linear_tid != 0));</div>
+<div class="line"><a name="l01294"></a><span class="lineno"> 1294</span>&#160;    }</div>
+<div class="line"><a name="l01295"></a><span class="lineno"> 1295</span>&#160;</div>
+<div class="line"><a name="l01296"></a><span class="lineno"> 1296</span>&#160;</div>
+<div class="line"><a name="l01315"></a><span class="lineno"> 1315</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01316"></a><span class="lineno"> 1316</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l01317"></a><span class="lineno"> 1317</span>&#160;        <span class="keyword">typename</span>        ScanOp,</div>
+<div class="line"><a name="l01318"></a><span class="lineno"> 1318</span>&#160;        <span class="keyword">typename</span>        BlockPrefixOp&gt;</div>
+<div class="line"><a name="l01319"></a><span class="lineno"> 1319</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01320"></a><span class="lineno"> 1320</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],   </div>
+<div class="line"><a name="l01321"></a><span class="lineno"> 1321</span>&#160;        T               (&amp;output)[ITEMS_PER_THREAD],  </div>
+<div class="line"><a name="l01322"></a><span class="lineno"> 1322</span>&#160;        ScanOp          scan_op,                      </div>
+<div class="line"><a name="l01323"></a><span class="lineno"> 1323</span>&#160;        T               &amp;block_aggregate,             </div>
+<div class="line"><a name="l01324"></a><span class="lineno"> 1324</span>&#160;        BlockPrefixOp   &amp;block_prefix_op)             </div>
+<div class="line"><a name="l01325"></a><span class="lineno"> 1325</span>&#160;    {</div>
+<div class="line"><a name="l01326"></a><span class="lineno"> 1326</span>&#160;        <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l01327"></a><span class="lineno"> 1327</span>&#160;        T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l01328"></a><span class="lineno"> 1328</span>&#160;</div>
+<div class="line"><a name="l01329"></a><span class="lineno"> 1329</span>&#160;        <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l01330"></a><span class="lineno"> 1330</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(thread_partial, thread_partial, scan_op, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l01331"></a><span class="lineno"> 1331</span>&#160;</div>
+<div class="line"><a name="l01332"></a><span class="lineno"> 1332</span>&#160;        <span class="comment">// Exclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l01333"></a><span class="lineno"> 1333</span>&#160;        <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(input, output, scan_op, thread_partial);</div>
+<div class="line"><a name="l01334"></a><span class="lineno"> 1334</span>&#160;    }</div>
+<div class="line"><a name="l01335"></a><span class="lineno"> 1335</span>&#160;</div>
+<div class="line"><a name="l01336"></a><span class="lineno"> 1336</span>&#160;</div>
+<div class="line"><a name="l01338"></a><span class="lineno"> 1338</span>&#160;</div>
+<div class="line"><a name="l01339"></a><span class="lineno"> 1339</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l01340"></a><span class="lineno"> 1340</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l01341"></a><span class="lineno"> 1341</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l01345"></a><span class="lineno"> 1345</span>&#160;</div>
+<div class="line"><a name="l01346"></a><span class="lineno"> 1346</span>&#160;</div>
+<div class="line"><a name="l01381"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a570505ebdc51e2e47373fcb87e9a7d62"> 1381</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a570505ebdc51e2e47373fcb87e9a7d62" title="Computes an inclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">InclusiveSum</a>(</div>
+<div class="line"><a name="l01382"></a><span class="lineno"> 1382</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l01383"></a><span class="lineno"> 1383</span>&#160;        T               &amp;output)                        </div>
+<div class="line"><a name="l01384"></a><span class="lineno"> 1384</span>&#160;    {</div>
+<div class="line"><a name="l01385"></a><span class="lineno"> 1385</span>&#160;        T block_aggregate;</div>
+<div class="line"><a name="l01386"></a><span class="lineno"> 1386</span>&#160;        InternalBlockScan(temp_storage, linear_tid).InclusiveSum(input, output, block_aggregate);</div>
+<div class="line"><a name="l01387"></a><span class="lineno"> 1387</span>&#160;    }</div>
+<div class="line"><a name="l01388"></a><span class="lineno"> 1388</span>&#160;</div>
+<div class="line"><a name="l01389"></a><span class="lineno"> 1389</span>&#160;</div>
+<div class="line"><a name="l01426"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a0de622762b27b095583770c66b905358"> 1426</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a0de622762b27b095583770c66b905358" title="Computes an inclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. Also provides every thread with the block-wide block_aggregate of all inputs. ">InclusiveSum</a>(</div>
+<div class="line"><a name="l01427"></a><span class="lineno"> 1427</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l01428"></a><span class="lineno"> 1428</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l01429"></a><span class="lineno"> 1429</span>&#160;        T               &amp;block_aggregate)               </div>
+<div class="line"><a name="l01430"></a><span class="lineno"> 1430</span>&#160;    {</div>
+<div class="line"><a name="l01431"></a><span class="lineno"> 1431</span>&#160;        InternalBlockScan(temp_storage, linear_tid).InclusiveSum(input, output, block_aggregate);</div>
+<div class="line"><a name="l01432"></a><span class="lineno"> 1432</span>&#160;    }</div>
+<div class="line"><a name="l01433"></a><span class="lineno"> 1433</span>&#160;</div>
+<div class="line"><a name="l01434"></a><span class="lineno"> 1434</span>&#160;</div>
+<div class="line"><a name="l01435"></a><span class="lineno"> 1435</span>&#160;</div>
+<div class="line"><a name="l01511"></a><span class="lineno"> 1511</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BlockPrefixOp&gt;</div>
+<div class="line"><a name="l01512"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a39c481101dfa78b09374cab355712de9"> 1512</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a39c481101dfa78b09374cab355712de9" title="Computes an inclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. Instead of using 0 as the block-wide prefix, the call-back functor block_prefix_op is invoked by the first warp in the block, and the value returned by lane0 in that warp is used as the &quot;seed&quot; value that logically prefixes the threadblock&#39;s scan inputs. Also provides every thread with the block-wide block_aggregate of all inputs. ">InclusiveSum</a>(</div>
+<div class="line"><a name="l01513"></a><span class="lineno"> 1513</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l01514"></a><span class="lineno"> 1514</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l01515"></a><span class="lineno"> 1515</span>&#160;        T               &amp;block_aggregate,               </div>
+<div class="line"><a name="l01516"></a><span class="lineno"> 1516</span>&#160;        BlockPrefixOp   &amp;block_prefix_op)               </div>
+<div class="line"><a name="l01517"></a><span class="lineno"> 1517</span>&#160;    {</div>
+<div class="line"><a name="l01518"></a><span class="lineno"> 1518</span>&#160;        InternalBlockScan(temp_storage, linear_tid).InclusiveSum(input, output, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l01519"></a><span class="lineno"> 1519</span>&#160;    }</div>
+<div class="line"><a name="l01520"></a><span class="lineno"> 1520</span>&#160;</div>
+<div class="line"><a name="l01521"></a><span class="lineno"> 1521</span>&#160;</div>
+<div class="line"><a name="l01523"></a><span class="lineno"> 1523</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l01527"></a><span class="lineno"> 1527</span>&#160;</div>
+<div class="line"><a name="l01528"></a><span class="lineno"> 1528</span>&#160;</div>
+<div class="line"><a name="l01565"></a><span class="lineno"> 1565</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> ITEMS_PER_THREAD&gt;</div>
+<div class="line"><a name="l01566"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a88ffea45e2a8b5e3abb6e4c4777e66ef"> 1566</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a88ffea45e2a8b5e3abb6e4c4777e66ef" title="Computes an inclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes an array of consecutive input elements. ">InclusiveSum</a>(</div>
+<div class="line"><a name="l01567"></a><span class="lineno"> 1567</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l01568"></a><span class="lineno"> 1568</span>&#160;        T               (&amp;output)[ITEMS_PER_THREAD])    </div>
+<div class="line"><a name="l01569"></a><span class="lineno"> 1569</span>&#160;    {</div>
+<div class="line"><a name="l01570"></a><span class="lineno"> 1570</span>&#160;        <span class="keywordflow">if</span> (ITEMS_PER_THREAD == 1)</div>
+<div class="line"><a name="l01571"></a><span class="lineno"> 1571</span>&#160;        {</div>
+<div class="line"><a name="l01572"></a><span class="lineno"> 1572</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#a570505ebdc51e2e47373fcb87e9a7d62" title="Computes an inclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">InclusiveSum</a>(input[0], output[0]);</div>
+<div class="line"><a name="l01573"></a><span class="lineno"> 1573</span>&#160;        }</div>
+<div class="line"><a name="l01574"></a><span class="lineno"> 1574</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l01575"></a><span class="lineno"> 1575</span>&#160;        {</div>
+<div class="line"><a name="l01576"></a><span class="lineno"> 1576</span>&#160;            <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l01577"></a><span class="lineno"> 1577</span>&#160;            <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum</a> scan_op;</div>
+<div class="line"><a name="l01578"></a><span class="lineno"> 1578</span>&#160;            T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l01579"></a><span class="lineno"> 1579</span>&#160;</div>
+<div class="line"><a name="l01580"></a><span class="lineno"> 1580</span>&#160;            <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l01581"></a><span class="lineno"> 1581</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#acd75d5aad2d1385bcbe15517011800e8" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">ExclusiveSum</a>(thread_partial, thread_partial);</div>
+<div class="line"><a name="l01582"></a><span class="lineno"> 1582</span>&#160;</div>
+<div class="line"><a name="l01583"></a><span class="lineno"> 1583</span>&#160;            <span class="comment">// Inclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l01584"></a><span class="lineno"> 1584</span>&#160;            <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(input, output, scan_op, thread_partial, (linear_tid != 0));</div>
+<div class="line"><a name="l01585"></a><span class="lineno"> 1585</span>&#160;        }</div>
+<div class="line"><a name="l01586"></a><span class="lineno"> 1586</span>&#160;    }</div>
+<div class="line"><a name="l01587"></a><span class="lineno"> 1587</span>&#160;</div>
+<div class="line"><a name="l01588"></a><span class="lineno"> 1588</span>&#160;</div>
+<div class="line"><a name="l01630"></a><span class="lineno"> 1630</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> ITEMS_PER_THREAD&gt;</div>
+<div class="line"><a name="l01631"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a553e70dd3e177545837438ded03b3bfd"> 1631</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a553e70dd3e177545837438ded03b3bfd" title="Computes an inclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes an array of consecutive input elements. Also provides every thread with the block-wide block_aggregate of all inputs. ">InclusiveSum</a>(</div>
+<div class="line"><a name="l01632"></a><span class="lineno"> 1632</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l01633"></a><span class="lineno"> 1633</span>&#160;        T               (&amp;output)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l01634"></a><span class="lineno"> 1634</span>&#160;        T               &amp;block_aggregate)               </div>
+<div class="line"><a name="l01635"></a><span class="lineno"> 1635</span>&#160;    {</div>
+<div class="line"><a name="l01636"></a><span class="lineno"> 1636</span>&#160;        <span class="keywordflow">if</span> (ITEMS_PER_THREAD == 1)</div>
+<div class="line"><a name="l01637"></a><span class="lineno"> 1637</span>&#160;        {</div>
+<div class="line"><a name="l01638"></a><span class="lineno"> 1638</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#a570505ebdc51e2e47373fcb87e9a7d62" title="Computes an inclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">InclusiveSum</a>(input[0], output[0], block_aggregate);</div>
+<div class="line"><a name="l01639"></a><span class="lineno"> 1639</span>&#160;        }</div>
+<div class="line"><a name="l01640"></a><span class="lineno"> 1640</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l01641"></a><span class="lineno"> 1641</span>&#160;        {</div>
+<div class="line"><a name="l01642"></a><span class="lineno"> 1642</span>&#160;            <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l01643"></a><span class="lineno"> 1643</span>&#160;            <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum</a> scan_op;</div>
+<div class="line"><a name="l01644"></a><span class="lineno"> 1644</span>&#160;            T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l01645"></a><span class="lineno"> 1645</span>&#160;</div>
+<div class="line"><a name="l01646"></a><span class="lineno"> 1646</span>&#160;            <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l01647"></a><span class="lineno"> 1647</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#acd75d5aad2d1385bcbe15517011800e8" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">ExclusiveSum</a>(thread_partial, thread_partial, block_aggregate);</div>
+<div class="line"><a name="l01648"></a><span class="lineno"> 1648</span>&#160;</div>
+<div class="line"><a name="l01649"></a><span class="lineno"> 1649</span>&#160;            <span class="comment">// Inclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l01650"></a><span class="lineno"> 1650</span>&#160;            <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(input, output, scan_op, thread_partial, (linear_tid != 0));</div>
+<div class="line"><a name="l01651"></a><span class="lineno"> 1651</span>&#160;        }</div>
+<div class="line"><a name="l01652"></a><span class="lineno"> 1652</span>&#160;    }</div>
+<div class="line"><a name="l01653"></a><span class="lineno"> 1653</span>&#160;</div>
+<div class="line"><a name="l01654"></a><span class="lineno"> 1654</span>&#160;</div>
+<div class="line"><a name="l01741"></a><span class="lineno"> 1741</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01742"></a><span class="lineno"> 1742</span>&#160;        <span class="keywordtype">int</span> ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l01743"></a><span class="lineno"> 1743</span>&#160;        <span class="keyword">typename</span> BlockPrefixOp&gt;</div>
+<div class="line"><a name="l01744"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#ae1a4a4dfbec4ec029dd6a8cce8b6c0a1"> 1744</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#ae1a4a4dfbec4ec029dd6a8cce8b6c0a1" title="Computes an inclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes an array of consecutive input elements. Instead of using 0 as the block-wide prefix, the call-back functor block_prefix_op is invoked by the first warp in the block, and the value returned by lane0 in that warp is used as the &quot;seed&quot; value that logically prefixes the threadblock&#39;s scan inputs. Also provides every thread with the block-wide block_aggregate of all inputs. ">InclusiveSum</a>(</div>
+<div class="line"><a name="l01745"></a><span class="lineno"> 1745</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l01746"></a><span class="lineno"> 1746</span>&#160;        T               (&amp;output)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l01747"></a><span class="lineno"> 1747</span>&#160;        T               &amp;block_aggregate,               </div>
+<div class="line"><a name="l01748"></a><span class="lineno"> 1748</span>&#160;        BlockPrefixOp   &amp;block_prefix_op)               </div>
+<div class="line"><a name="l01749"></a><span class="lineno"> 1749</span>&#160;    {</div>
+<div class="line"><a name="l01750"></a><span class="lineno"> 1750</span>&#160;        <span class="keywordflow">if</span> (ITEMS_PER_THREAD == 1)</div>
+<div class="line"><a name="l01751"></a><span class="lineno"> 1751</span>&#160;        {</div>
+<div class="line"><a name="l01752"></a><span class="lineno"> 1752</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#a570505ebdc51e2e47373fcb87e9a7d62" title="Computes an inclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">InclusiveSum</a>(input[0], output[0], block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l01753"></a><span class="lineno"> 1753</span>&#160;        }</div>
+<div class="line"><a name="l01754"></a><span class="lineno"> 1754</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l01755"></a><span class="lineno"> 1755</span>&#160;        {</div>
+<div class="line"><a name="l01756"></a><span class="lineno"> 1756</span>&#160;            <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l01757"></a><span class="lineno"> 1757</span>&#160;            <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum</a> scan_op;</div>
+<div class="line"><a name="l01758"></a><span class="lineno"> 1758</span>&#160;            T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l01759"></a><span class="lineno"> 1759</span>&#160;</div>
+<div class="line"><a name="l01760"></a><span class="lineno"> 1760</span>&#160;            <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l01761"></a><span class="lineno"> 1761</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#acd75d5aad2d1385bcbe15517011800e8" title="Computes an exclusive block-wide prefix scan using addition (+) as the scan operator. Each thread contributes one input element. ">ExclusiveSum</a>(thread_partial, thread_partial, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l01762"></a><span class="lineno"> 1762</span>&#160;</div>
+<div class="line"><a name="l01763"></a><span class="lineno"> 1763</span>&#160;            <span class="comment">// Inclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l01764"></a><span class="lineno"> 1764</span>&#160;            <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(input, output, scan_op, thread_partial);</div>
+<div class="line"><a name="l01765"></a><span class="lineno"> 1765</span>&#160;        }</div>
+<div class="line"><a name="l01766"></a><span class="lineno"> 1766</span>&#160;    }</div>
+<div class="line"><a name="l01767"></a><span class="lineno"> 1767</span>&#160;</div>
+<div class="line"><a name="l01768"></a><span class="lineno"> 1768</span>&#160;</div>
+<div class="line"><a name="l01770"></a><span class="lineno"> 1770</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l01774"></a><span class="lineno"> 1774</span>&#160;</div>
+<div class="line"><a name="l01775"></a><span class="lineno"> 1775</span>&#160;</div>
+<div class="line"><a name="l01813"></a><span class="lineno"> 1813</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l01814"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#afb56064490291f37a712bcc3064ccbab"> 1814</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#afb56064490291f37a712bcc3064ccbab" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">InclusiveScan</a>(</div>
+<div class="line"><a name="l01815"></a><span class="lineno"> 1815</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l01816"></a><span class="lineno"> 1816</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l01817"></a><span class="lineno"> 1817</span>&#160;        ScanOp          scan_op)                        </div>
+<div class="line"><a name="l01818"></a><span class="lineno"> 1818</span>&#160;    {</div>
+<div class="line"><a name="l01819"></a><span class="lineno"> 1819</span>&#160;        T block_aggregate;</div>
+<div class="line"><a name="l01820"></a><span class="lineno"> 1820</span>&#160;        <a class="code" href="classcub_1_1_block_scan.html#afb56064490291f37a712bcc3064ccbab" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">InclusiveScan</a>(input, output, scan_op, block_aggregate);</div>
+<div class="line"><a name="l01821"></a><span class="lineno"> 1821</span>&#160;    }</div>
+<div class="line"><a name="l01822"></a><span class="lineno"> 1822</span>&#160;</div>
+<div class="line"><a name="l01823"></a><span class="lineno"> 1823</span>&#160;</div>
+<div class="line"><a name="l01863"></a><span class="lineno"> 1863</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l01864"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a60d6f1fb7780e25c4a1442128113270b"> 1864</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a60d6f1fb7780e25c4a1442128113270b" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. Also provides every thread with the block-wide block_aggregate of all inputs. ">InclusiveScan</a>(</div>
+<div class="line"><a name="l01865"></a><span class="lineno"> 1865</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l01866"></a><span class="lineno"> 1866</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l01867"></a><span class="lineno"> 1867</span>&#160;        ScanOp          scan_op,                        </div>
+<div class="line"><a name="l01868"></a><span class="lineno"> 1868</span>&#160;        T               &amp;block_aggregate)               </div>
+<div class="line"><a name="l01869"></a><span class="lineno"> 1869</span>&#160;    {</div>
+<div class="line"><a name="l01870"></a><span class="lineno"> 1870</span>&#160;        InternalBlockScan(temp_storage, linear_tid).InclusiveScan(input, output, scan_op, block_aggregate);</div>
+<div class="line"><a name="l01871"></a><span class="lineno"> 1871</span>&#160;    }</div>
+<div class="line"><a name="l01872"></a><span class="lineno"> 1872</span>&#160;</div>
+<div class="line"><a name="l01873"></a><span class="lineno"> 1873</span>&#160;</div>
+<div class="line"><a name="l01953"></a><span class="lineno"> 1953</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01954"></a><span class="lineno"> 1954</span>&#160;        <span class="keyword">typename</span> ScanOp,</div>
+<div class="line"><a name="l01955"></a><span class="lineno"> 1955</span>&#160;        <span class="keyword">typename</span> BlockPrefixOp&gt;</div>
+<div class="line"><a name="l01956"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a7e1622b40fe73bdb6550f4dca2ae290a"> 1956</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a7e1622b40fe73bdb6550f4dca2ae290a" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. the call-back functor block_prefix_op is invoked by the first warp in the block, and the value returned by lane0 in that warp is used as the &quot;seed&quot; value that logically prefixes the threadblock&#39;s scan inputs. Also provides every thread with the block-wide block_aggregate of all inputs. ">InclusiveScan</a>(</div>
+<div class="line"><a name="l01957"></a><span class="lineno"> 1957</span>&#160;        T               input,                          </div>
+<div class="line"><a name="l01958"></a><span class="lineno"> 1958</span>&#160;        T               &amp;output,                        </div>
+<div class="line"><a name="l01959"></a><span class="lineno"> 1959</span>&#160;        ScanOp          scan_op,                        </div>
+<div class="line"><a name="l01960"></a><span class="lineno"> 1960</span>&#160;        T               &amp;block_aggregate,               </div>
+<div class="line"><a name="l01961"></a><span class="lineno"> 1961</span>&#160;        BlockPrefixOp   &amp;block_prefix_op)               </div>
+<div class="line"><a name="l01962"></a><span class="lineno"> 1962</span>&#160;    {</div>
+<div class="line"><a name="l01963"></a><span class="lineno"> 1963</span>&#160;        InternalBlockScan(temp_storage, linear_tid).InclusiveScan(input, output, scan_op, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l01964"></a><span class="lineno"> 1964</span>&#160;    }</div>
+<div class="line"><a name="l01965"></a><span class="lineno"> 1965</span>&#160;</div>
+<div class="line"><a name="l01966"></a><span class="lineno"> 1966</span>&#160;</div>
+<div class="line"><a name="l01968"></a><span class="lineno"> 1968</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l01972"></a><span class="lineno"> 1972</span>&#160;</div>
+<div class="line"><a name="l01973"></a><span class="lineno"> 1973</span>&#160;</div>
+<div class="line"><a name="l02013"></a><span class="lineno"> 2013</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l02014"></a><span class="lineno"> 2014</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l02015"></a><span class="lineno"> 2015</span>&#160;        <span class="keyword">typename</span>        ScanOp&gt;</div>
+<div class="line"><a name="l02016"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#afac59f8a498efb6a97f6c4a3b239576f"> 2016</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#afac59f8a498efb6a97f6c4a3b239576f" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes an array of consecutive input elements. ">InclusiveScan</a>(</div>
+<div class="line"><a name="l02017"></a><span class="lineno"> 2017</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l02018"></a><span class="lineno"> 2018</span>&#160;        T               (&amp;output)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l02019"></a><span class="lineno"> 2019</span>&#160;        ScanOp          scan_op)                        </div>
+<div class="line"><a name="l02020"></a><span class="lineno"> 2020</span>&#160;    {</div>
+<div class="line"><a name="l02021"></a><span class="lineno"> 2021</span>&#160;        <span class="keywordflow">if</span> (ITEMS_PER_THREAD == 1)</div>
+<div class="line"><a name="l02022"></a><span class="lineno"> 2022</span>&#160;        {</div>
+<div class="line"><a name="l02023"></a><span class="lineno"> 2023</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#afb56064490291f37a712bcc3064ccbab" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">InclusiveScan</a>(input[0], output[0], scan_op);</div>
+<div class="line"><a name="l02024"></a><span class="lineno"> 2024</span>&#160;        }</div>
+<div class="line"><a name="l02025"></a><span class="lineno"> 2025</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l02026"></a><span class="lineno"> 2026</span>&#160;        {</div>
+<div class="line"><a name="l02027"></a><span class="lineno"> 2027</span>&#160;            <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l02028"></a><span class="lineno"> 2028</span>&#160;            T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l02029"></a><span class="lineno"> 2029</span>&#160;</div>
+<div class="line"><a name="l02030"></a><span class="lineno"> 2030</span>&#160;            <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l02031"></a><span class="lineno"> 2031</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(thread_partial, thread_partial, scan_op);</div>
+<div class="line"><a name="l02032"></a><span class="lineno"> 2032</span>&#160;</div>
+<div class="line"><a name="l02033"></a><span class="lineno"> 2033</span>&#160;            <span class="comment">// Inclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l02034"></a><span class="lineno"> 2034</span>&#160;            <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(input, output, scan_op, thread_partial, (linear_tid != 0));</div>
+<div class="line"><a name="l02035"></a><span class="lineno"> 2035</span>&#160;        }</div>
+<div class="line"><a name="l02036"></a><span class="lineno"> 2036</span>&#160;    }</div>
+<div class="line"><a name="l02037"></a><span class="lineno"> 2037</span>&#160;</div>
+<div class="line"><a name="l02038"></a><span class="lineno"> 2038</span>&#160;</div>
+<div class="line"><a name="l02082"></a><span class="lineno"> 2082</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l02083"></a><span class="lineno"> 2083</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l02084"></a><span class="lineno"> 2084</span>&#160;        <span class="keyword">typename</span>         ScanOp&gt;</div>
+<div class="line"><a name="l02085"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#a2885c51314333f4b98dacefcd7c918fc"> 2085</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#a2885c51314333f4b98dacefcd7c918fc" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes an array of consecutive input elements. Also provides every thread with the block-wide block_aggregate of all inputs. ">InclusiveScan</a>(</div>
+<div class="line"><a name="l02086"></a><span class="lineno"> 2086</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l02087"></a><span class="lineno"> 2087</span>&#160;        T               (&amp;output)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l02088"></a><span class="lineno"> 2088</span>&#160;        ScanOp          scan_op,                        </div>
+<div class="line"><a name="l02089"></a><span class="lineno"> 2089</span>&#160;        T               &amp;block_aggregate)               </div>
+<div class="line"><a name="l02090"></a><span class="lineno"> 2090</span>&#160;    {</div>
+<div class="line"><a name="l02091"></a><span class="lineno"> 2091</span>&#160;        <span class="keywordflow">if</span> (ITEMS_PER_THREAD == 1)</div>
+<div class="line"><a name="l02092"></a><span class="lineno"> 2092</span>&#160;        {</div>
+<div class="line"><a name="l02093"></a><span class="lineno"> 2093</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#afb56064490291f37a712bcc3064ccbab" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">InclusiveScan</a>(input[0], output[0], scan_op, block_aggregate);</div>
+<div class="line"><a name="l02094"></a><span class="lineno"> 2094</span>&#160;        }</div>
+<div class="line"><a name="l02095"></a><span class="lineno"> 2095</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l02096"></a><span class="lineno"> 2096</span>&#160;        {</div>
+<div class="line"><a name="l02097"></a><span class="lineno"> 2097</span>&#160;            <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l02098"></a><span class="lineno"> 2098</span>&#160;            T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l02099"></a><span class="lineno"> 2099</span>&#160;</div>
+<div class="line"><a name="l02100"></a><span class="lineno"> 2100</span>&#160;            <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l02101"></a><span class="lineno"> 2101</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(thread_partial, thread_partial, scan_op, block_aggregate);</div>
+<div class="line"><a name="l02102"></a><span class="lineno"> 2102</span>&#160;</div>
+<div class="line"><a name="l02103"></a><span class="lineno"> 2103</span>&#160;            <span class="comment">// Inclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l02104"></a><span class="lineno"> 2104</span>&#160;            <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(input, output, scan_op, thread_partial, (linear_tid != 0));</div>
+<div class="line"><a name="l02105"></a><span class="lineno"> 2105</span>&#160;        }</div>
+<div class="line"><a name="l02106"></a><span class="lineno"> 2106</span>&#160;    }</div>
+<div class="line"><a name="l02107"></a><span class="lineno"> 2107</span>&#160;</div>
+<div class="line"><a name="l02108"></a><span class="lineno"> 2108</span>&#160;</div>
+<div class="line"><a name="l02198"></a><span class="lineno"> 2198</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l02199"></a><span class="lineno"> 2199</span>&#160;        <span class="keywordtype">int</span>             ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l02200"></a><span class="lineno"> 2200</span>&#160;        <span class="keyword">typename</span>        ScanOp,</div>
+<div class="line"><a name="l02201"></a><span class="lineno"> 2201</span>&#160;        <span class="keyword">typename</span>        BlockPrefixOp&gt;</div>
+<div class="line"><a name="l02202"></a><span class="lineno"><a class="code" href="classcub_1_1_block_scan.html#abfce2a901cbcaac1852fef9f53d91a3a"> 2202</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_scan.html#abfce2a901cbcaac1852fef9f53d91a3a" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes an array of consecutive input elements. the call-back functor block_prefix_op is invoked by the first warp in the block, and the value returned by lane0 in that warp is used as the &quot;seed&quot; value that logically prefixes the threadblock&#39;s scan inputs. Also provides every thread with the block-wide block_aggregate of all inputs. ">InclusiveScan</a>(</div>
+<div class="line"><a name="l02203"></a><span class="lineno"> 2203</span>&#160;        T               (&amp;input)[ITEMS_PER_THREAD],     </div>
+<div class="line"><a name="l02204"></a><span class="lineno"> 2204</span>&#160;        T               (&amp;output)[ITEMS_PER_THREAD],    </div>
+<div class="line"><a name="l02205"></a><span class="lineno"> 2205</span>&#160;        ScanOp          scan_op,                        </div>
+<div class="line"><a name="l02206"></a><span class="lineno"> 2206</span>&#160;        T               &amp;block_aggregate,               </div>
+<div class="line"><a name="l02207"></a><span class="lineno"> 2207</span>&#160;        BlockPrefixOp   &amp;block_prefix_op)               </div>
+<div class="line"><a name="l02208"></a><span class="lineno"> 2208</span>&#160;    {</div>
+<div class="line"><a name="l02209"></a><span class="lineno"> 2209</span>&#160;        <span class="keywordflow">if</span> (ITEMS_PER_THREAD == 1)</div>
+<div class="line"><a name="l02210"></a><span class="lineno"> 2210</span>&#160;        {</div>
+<div class="line"><a name="l02211"></a><span class="lineno"> 2211</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#afb56064490291f37a712bcc3064ccbab" title="Computes an inclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">InclusiveScan</a>(input[0], output[0], scan_op, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l02212"></a><span class="lineno"> 2212</span>&#160;        }</div>
+<div class="line"><a name="l02213"></a><span class="lineno"> 2213</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l02214"></a><span class="lineno"> 2214</span>&#160;        {</div>
+<div class="line"><a name="l02215"></a><span class="lineno"> 2215</span>&#160;            <span class="comment">// Reduce consecutive thread items in registers</span></div>
+<div class="line"><a name="l02216"></a><span class="lineno"> 2216</span>&#160;            T thread_partial = <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(input, scan_op);</div>
+<div class="line"><a name="l02217"></a><span class="lineno"> 2217</span>&#160;</div>
+<div class="line"><a name="l02218"></a><span class="lineno"> 2218</span>&#160;            <span class="comment">// Exclusive threadblock-scan</span></div>
+<div class="line"><a name="l02219"></a><span class="lineno"> 2219</span>&#160;            <a class="code" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7" title="Computes an exclusive block-wide prefix scan using the specified binary scan_op functor. Each thread contributes one input element. ">ExclusiveScan</a>(thread_partial, thread_partial, scan_op, block_aggregate, block_prefix_op);</div>
+<div class="line"><a name="l02220"></a><span class="lineno"> 2220</span>&#160;</div>
+<div class="line"><a name="l02221"></a><span class="lineno"> 2221</span>&#160;            <span class="comment">// Inclusive scan in registers with prefix</span></div>
+<div class="line"><a name="l02222"></a><span class="lineno"> 2222</span>&#160;            <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(input, output, scan_op, thread_partial);</div>
+<div class="line"><a name="l02223"></a><span class="lineno"> 2223</span>&#160;        }</div>
+<div class="line"><a name="l02224"></a><span class="lineno"> 2224</span>&#160;    }</div>
+<div class="line"><a name="l02225"></a><span class="lineno"> 2225</span>&#160;</div>
+<div class="line"><a name="l02227"></a><span class="lineno"> 2227</span>&#160;</div>
+<div class="line"><a name="l02228"></a><span class="lineno"> 2228</span>&#160;</div>
+<div class="line"><a name="l02229"></a><span class="lineno"> 2229</span>&#160;};</div>
+<div class="line"><a name="l02230"></a><span class="lineno"> 2230</span>&#160;</div>
+<div class="line"><a name="l02231"></a><span class="lineno"> 2231</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l02232"></a><span class="lineno"> 2232</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l02233"></a><span class="lineno"> 2233</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/block__store_8cuh_source.html b/docs/html/block__store_8cuh_source.html
new file mode 100644
index 0000000000..c2fd267f11
--- /dev/null
+++ b/docs/html/block__store_8cuh_source.html
@@ -0,0 +1,648 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: block_store.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_011e1c944d88f71be72e1e24a5fda7cf.html">block</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">block_store.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="block__store_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;iterator&gt;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../util_macro.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;../util_vector.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;../thread/thread_store.cuh&quot;</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__exchange_8cuh.html">block_exchange.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a>    MODIFIER,</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <span class="keyword">typename</span>            T,</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keywordtype">int</span>                 ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keyword">typename</span>            OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00077"></a><span class="lineno"><a class="code" href="group___io_module.html#ga0e69bdc5b96bad62c9501af85532fc7b">   77</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga0e69bdc5b96bad62c9501af85532fc7b" title="Store a blocked arrangement of items across a thread block into a linear segment of items using the s...">StoreBlocked</a>(</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    <span class="keywordtype">int</span>                 linear_tid,                 </div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;{</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    <span class="comment">// Store directly in thread-blocked order</span></div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    {</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;        ThreadStore&lt;MODIFIER&gt;(block_itr + (linear_tid * ITEMS_PER_THREAD) + ITEM, items[ITEM]);</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    }</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;}</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a>    MODIFIER,</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keyword">typename</span>            T,</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="keywordtype">int</span>                 ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <span class="keyword">typename</span>            OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00106"></a><span class="lineno"><a class="code" href="group___io_module.html#gac84f07cf1f61e45b26290515e9b4d3ae">  106</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga0e69bdc5b96bad62c9501af85532fc7b" title="Store a blocked arrangement of items across a thread block into a linear segment of items using the s...">StoreBlocked</a>(</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="keywordtype">int</span>                 linear_tid,                 </div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    T                   (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="keywordtype">int</span>                 valid_items)                </div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;{</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    <span class="comment">// Store directly in thread-blocked order</span></div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    {</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;        <span class="keywordflow">if</span> (ITEM + (linear_tid * ITEMS_PER_THREAD) &lt; valid_items)</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;        {</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;            ThreadStore&lt;MODIFIER&gt;(block_itr + (linear_tid * ITEMS_PER_THREAD) + ITEM, items[ITEM]);</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;        }</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    }</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;}</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;<span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a>    MODIFIER,</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="keywordtype">int</span>                 BLOCK_THREADS,</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keyword">typename</span>            T,</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    <span class="keywordtype">int</span>                 ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    <span class="keyword">typename</span>            OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00149"></a><span class="lineno"><a class="code" href="group___io_module.html#gadce0282ac2ac679aa9d046e534da6af2">  149</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gadce0282ac2ac679aa9d046e534da6af2" title="Store a striped arrangement of data across the thread block into a linear segment of items using the ...">StoreStriped</a>(</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <span class="keywordtype">int</span>                 linear_tid,                 </div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;{</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <span class="comment">// Store directly in striped order</span></div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    {</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;        ThreadStore&lt;MODIFIER&gt;(block_itr + (ITEM * BLOCK_THREADS) + linear_tid, items[ITEM]);</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    }</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;}</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;    <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a>    MODIFIER,</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    <span class="keywordtype">int</span>                 BLOCK_THREADS,</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    <span class="keyword">typename</span>            T,</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    <span class="keywordtype">int</span>                 ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    <span class="keyword">typename</span>            OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00180"></a><span class="lineno"><a class="code" href="group___io_module.html#ga5d9cc4924d2bd640be9cb86e4754ce8c">  180</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gadce0282ac2ac679aa9d046e534da6af2" title="Store a striped arrangement of data across the thread block into a linear segment of items using the ...">StoreStriped</a>(</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <span class="keywordtype">int</span>                 linear_tid,                 </div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    T                   (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    <span class="keywordtype">int</span>                 valid_items)                </div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;{</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    <span class="comment">// Store directly in striped order</span></div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    {</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;        <span class="keywordflow">if</span> ((ITEM * BLOCK_THREADS) + linear_tid &lt; valid_items)</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;        {</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;            ThreadStore&lt;MODIFIER&gt;(block_itr + (ITEM * BLOCK_THREADS) + linear_tid, items[ITEM]);</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        }</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    }</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;}</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;<span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;    <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a>    MODIFIER,</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <span class="keyword">typename</span>            T,</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;    <span class="keywordtype">int</span>                 ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    <span class="keyword">typename</span>            OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00224"></a><span class="lineno"><a class="code" href="group___io_module.html#ga07c4d38e195128da47fb9a8c582072d7">  224</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga07c4d38e195128da47fb9a8c582072d7" title="Store a warp-striped arrangement of data across the thread block into a linear segment of items using...">StoreWarpStriped</a>(</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    <span class="keywordtype">int</span>                 linear_tid,                 </div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;{</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <span class="keywordtype">int</span> tid         = linear_tid &amp; (<a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> - 1);</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <span class="keywordtype">int</span> wid         = linear_tid &gt;&gt; PtxArchProps::LOG_WARP_THREADS;</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <span class="keywordtype">int</span> warp_offset = wid * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> * ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;    <span class="comment">// Store directly in warp-striped order</span></div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;    {</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;        ThreadStore&lt;MODIFIER&gt;(block_itr + warp_offset + tid + (ITEM * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>), items[ITEM]);</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    }</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;}</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a>    MODIFIER,</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;    <span class="keyword">typename</span>            T,</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    <span class="keywordtype">int</span>                 ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;    <span class="keyword">typename</span>            OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00260"></a><span class="lineno"><a class="code" href="group___io_module.html#ga7b3a3b0c99fbfb1afc76b5fde54ba3dc">  260</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga07c4d38e195128da47fb9a8c582072d7" title="Store a warp-striped arrangement of data across the thread block into a linear segment of items using...">StoreWarpStriped</a>(</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    <span class="keywordtype">int</span>                 linear_tid,                 </div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;    T                   (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    <span class="keywordtype">int</span>                 valid_items)                </div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;{</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    <span class="keywordtype">int</span> tid         = linear_tid &amp; (<a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> - 1);</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;    <span class="keywordtype">int</span> wid         = linear_tid &gt;&gt; PtxArchProps::LOG_WARP_THREADS;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    <span class="keywordtype">int</span> warp_offset = wid * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a> * ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;    <span class="comment">// Store directly in warp-striped order</span></div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;    {</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;        <span class="keywordflow">if</span> (warp_offset + tid + (ITEM * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>) &lt; valid_items)</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;        {</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;            ThreadStore&lt;MODIFIER&gt;(block_itr + warp_offset + tid + (ITEM * <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>), items[ITEM]);</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;        }</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    }</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;}</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;<span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;    <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a>    MODIFIER,</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;    <span class="keyword">typename</span>            T,</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;    <span class="keywordtype">int</span>                 ITEMS_PER_THREAD&gt;</div>
+<div class="line"><a name="l00311"></a><span class="lineno"><a class="code" href="group___io_module.html#gac805e3fdfaecc3be16f81b0af5c1e4db">  311</a></span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#gac805e3fdfaecc3be16f81b0af5c1e4db" title="Store a blocked arrangement of items across a thread block into a linear segment of items using the s...">StoreBlockedVectorized</a>(</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;    <span class="keywordtype">int</span>                 linear_tid,                 </div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;    T                   *block_ptr,                 </div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;    T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;{</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;    {</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;        <span class="comment">// Maximum CUDA vector size is 4 elements</span></div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;        MAX_VEC_SIZE = CUB_MIN(4, ITEMS_PER_THREAD),</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;        <span class="comment">// Vector size must be a power of two and an even divisor of the items per thread</span></div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;        VEC_SIZE = ((((MAX_VEC_SIZE - 1) &amp; MAX_VEC_SIZE) == 0) &amp;&amp; ((ITEMS_PER_THREAD % MAX_VEC_SIZE) == 0)) ?</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;            MAX_VEC_SIZE :</div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;            1,</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;        VECTORS_PER_THREAD = ITEMS_PER_THREAD / VEC_SIZE,</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;    };</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;    <span class="comment">// Vector type</span></div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> VectorHelper&lt;T, VEC_SIZE&gt;::Type Vector;</div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;    <span class="comment">// Alias global pointer</span></div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;    Vector *block_ptr_vectors = <span class="keyword">reinterpret_cast&lt;</span>Vector *<span class="keyword">&gt;</span>(block_ptr);</div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;    <span class="comment">// Alias pointers (use &quot;raw&quot; array here which should get optimized away to prevent conservative PTXAS lmem spilling)</span></div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;    Vector raw_vector[VECTORS_PER_THREAD];</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    T *raw_items = <span class="keyword">reinterpret_cast&lt;</span>T*<span class="keyword">&gt;</span>(raw_vector);</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;    <span class="comment">// Copy</span></div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> ITEM = 0; ITEM &lt; ITEMS_PER_THREAD; ITEM++)</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;    {</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;        raw_items[ITEM] = items[ITEM];</div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    }</div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    <span class="comment">// Direct-store using vector types</span></div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    StoreBlocked&lt;MODIFIER&gt;(linear_tid, block_ptr_vectors, raw_vector);</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;}</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;       <span class="comment">// end group IoModule</span></div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;<span class="comment">// Generic BlockStore abstraction</span></div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;</div>
+<div class="line"><a name="l00364"></a><span class="lineno"><a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700">  364</a></span>&#160;<span class="keyword">enum</span> <a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700" title="cub::BlockStoreAlgorithm enumerates alternative algorithms for cub::BlockStore to write a blocked arr...">BlockStoreAlgorithm</a></div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;{</div>
+<div class="line"><a name="l00377"></a><span class="lineno"><a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700a9b8dcc7b6b06bcfc24af4f499523b880">  377</a></span>&#160;    <a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700a9b8dcc7b6b06bcfc24af4f499523b880">BLOCK_STORE_DIRECT</a>,</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;</div>
+<div class="line"><a name="l00399"></a><span class="lineno"><a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700a0ccd625a7f2f3649155cbd5a27adfb41">  399</a></span>&#160;    <a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700a0ccd625a7f2f3649155cbd5a27adfb41">BLOCK_STORE_VECTORIZE</a>,</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;</div>
+<div class="line"><a name="l00418"></a><span class="lineno"><a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700ab0bbe20613466c3cedfcfea33a97d69c">  418</a></span>&#160;    <a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700ab0bbe20613466c3cedfcfea33a97d69c">BLOCK_STORE_TRANSPOSE</a>,</div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;</div>
+<div class="line"><a name="l00437"></a><span class="lineno"><a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700a9178e3be2332f84a66761cee4ee6f3e3">  437</a></span>&#160;    <a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700a9178e3be2332f84a66761cee4ee6f3e3">BLOCK_STORE_WARP_TRANSPOSE</a>,</div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;};</div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;</div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;</div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;</div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;    <span class="keyword">typename</span>                OutputIteratorRA,</div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;    <span class="keywordtype">int</span>                     BLOCK_THREADS,</div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;    <span class="keywordtype">int</span>                     ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;    <a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700" title="cub::BlockStoreAlgorithm enumerates alternative algorithms for cub::BlockStore to write a blocked arr...">BlockStoreAlgorithm</a>     ALGORITHM           = <a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700a9b8dcc7b6b06bcfc24af4f499523b880">BLOCK_STORE_DIRECT</a>,</div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;    <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a>        MODIFIER            = <a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2a434aa4b3efc8e0c0ce4f1a00cdad26bd" title="Default (no modifier) ">STORE_DEFAULT</a>,</div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;    <span class="keywordtype">bool</span>                    WARP_TIME_SLICING   = <span class="keyword">false</span>&gt;</div>
+<div class="line"><a name="l00518"></a><span class="lineno"><a class="code" href="classcub_1_1_block_store.html">  518</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_block_store.html" title="The BlockStore class provides collective data movement methods for writing a blocked arrangement of i...">BlockStore</a></div>
+<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;{</div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;<span class="comment">     * Constants and typed definitions</span></div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;</div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;    <span class="comment">// Data type of input iterator</span></div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> std::iterator_traits&lt;OutputIteratorRA&gt;::value_type T;</div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;</div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;</div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;<span class="comment">     * Algorithmic variants</span></div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;</div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;    <span class="keyword">template</span> &lt;BlockStoreAlgorithm _POLICY, <span class="keywordtype">int</span> DUMMY = 0&gt;</div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;    <span class="keyword">struct </span>StoreInternal;</div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;</div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;</div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> DUMMY&gt;</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;    <span class="keyword">struct </span>StoreInternal&lt;BLOCK_STORE_DIRECT, DUMMY&gt;</div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;    {</div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;        <span class="keyword">typedef</span> <a class="code" href="structcub_1_1_null_type.html" title="A simple &quot;NULL&quot; marker type. ">NullType</a> <a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a>;</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;        <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;        __device__ __forceinline__ StoreInternal(</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;            <a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a> &amp;temp_storage,</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;            <span class="keywordtype">int</span> linear_tid)</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;        :</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;            linear_tid(linear_tid)</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;        {}</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;</div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;            OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;        {</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;            StoreBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items);</div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;        }</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;            OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;            <span class="keywordtype">int</span>                 valid_items)                </div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;        {</div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;            StoreBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items, valid_items);</div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;        }</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;    };</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;</div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;</div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> DUMMY&gt;</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;    <span class="keyword">struct </span>StoreInternal&lt;BLOCK_STORE_VECTORIZE, DUMMY&gt;</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;    {</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;        <span class="keyword">typedef</span> <a class="code" href="structcub_1_1_null_type.html" title="A simple &quot;NULL&quot; marker type. ">NullType</a> <a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a>;</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;</div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;        <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;        __device__ __forceinline__ StoreInternal(</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;            <a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a> &amp;temp_storage,</div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;            <span class="keywordtype">int</span> linear_tid)</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;        :</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;            linear_tid(linear_tid)</div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;        {}</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;</div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;            T                   *block_ptr,                 </div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;        {</div>
+<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;            StoreBlockedVectorized&lt;MODIFIER&gt;(linear_tid, block_ptr, items);</div>
+<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;        }</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;        <span class="keyword">template</span> &lt;<span class="keyword">typename</span> _OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;            _OutputIteratorRA   block_itr,                  </div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;        {</div>
+<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;            StoreBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items);</div>
+<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;        }</div>
+<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;</div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;            OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;            <span class="keywordtype">int</span>                 valid_items)                </div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;        {</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;            StoreBlocked&lt;MODIFIER&gt;(linear_tid, block_itr, items, valid_items);</div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;        }</div>
+<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;    };</div>
+<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;</div>
+<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;</div>
+<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> DUMMY&gt;</div>
+<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;    <span class="keyword">struct </span>StoreInternal&lt;BLOCK_STORE_TRANSPOSE, DUMMY&gt;</div>
+<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;    {</div>
+<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;        <span class="comment">// BlockExchange utility type for keys</span></div>
+<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;        <span class="keyword">typedef</span> <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange&lt;T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING&gt;</a> <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>;</div>
+<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;</div>
+<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">BlockExchange::TempStorage</a> _TempStorage;</div>
+<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;</div>
+<div class="line"><a name="l00638"></a><span class="lineno"><a class="code" href="structcub_1_1_block_store_1_1_store_internal_3_01_b_l_o_c_k___s_t_o_r_e___t_r_a_n_s_p_o_s_e_00_09dfae03f13932c7dbdb41be30a5767ba.html">  638</a></span>&#160;        <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;</div>
+<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;        <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">_TempStorage</a> &amp;temp_storage;</div>
+<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;</div>
+<div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;        <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;</div>
+<div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;        __device__ __forceinline__ StoreInternal(</div>
+<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;            <a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a> &amp;temp_storage,</div>
+<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;            <span class="keywordtype">int</span> linear_tid)</div>
+<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;        :</div>
+<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;            temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;            linear_tid(linear_tid)</div>
+<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;        {}</div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;</div>
+<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;            OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;        {</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;            <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>(temp_storage).BlockedToStriped(items);</div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;            StoreStriped&lt;MODIFIER, BLOCK_THREADS&gt;(linear_tid, block_itr, items);</div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;        }</div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;</div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;            OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;            <span class="keywordtype">int</span>                 valid_items)                </div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;        {</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;            <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>(temp_storage).BlockedToStriped(items);</div>
+<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;            StoreStriped&lt;MODIFIER, BLOCK_THREADS&gt;(linear_tid, block_itr, items, valid_items);</div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;        }</div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;    };</div>
+<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;</div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;</div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> DUMMY&gt;</div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;    <span class="keyword">struct </span>StoreInternal&lt;<a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700a9178e3be2332f84a66761cee4ee6f3e3">BLOCK_STORE_WARP_TRANSPOSE</a>, DUMMY&gt;</div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;    {</div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;        <span class="keyword">enum</span></div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;        {</div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;            WARP_THREADS = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a></div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;        };</div>
+<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;</div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;        <span class="comment">// Assert BLOCK_THREADS must be a multiple of WARP_THREADS</span></div>
+<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;        CUB_STATIC_ASSERT((BLOCK_THREADS % WARP_THREADS == 0), <span class="stringliteral">&quot;BLOCK_THREADS must be a multiple of WARP_THREADS&quot;</span>);</div>
+<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;</div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;        <span class="comment">// BlockExchange utility type for keys</span></div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;        <span class="keyword">typedef</span> BlockExchange&lt;T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING&gt; BlockExchange;</div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;</div>
+<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> BlockExchange::TempStorage _TempStorage;</div>
+<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;</div>
+<div class="line"><a name="l00697"></a><span class="lineno"><a class="code" href="structcub_1_1_block_store_1_1_store_internal_3_01_b_l_o_c_k___s_t_o_r_e___w_a_r_p___t_r_a_n_s_p_8d170856b7ed1df0ed565731a681b449.html">  697</a></span>&#160;        <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;</div>
+<div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;        <a class="code" href="structcub_1_1_block_exchange_1_1_temp_storage.html" title="The operations exposed by BlockExchange require a temporary memory allocation of this nested type for...">_TempStorage</a> &amp;temp_storage;</div>
+<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;</div>
+<div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;        <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;</div>
+<div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;        __device__ __forceinline__ StoreInternal(</div>
+<div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;            <a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a> &amp;temp_storage,</div>
+<div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;            <span class="keywordtype">int</span> linear_tid)</div>
+<div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;        :</div>
+<div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;            temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;            linear_tid(linear_tid)</div>
+<div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;        {}</div>
+<div class="line"><a name="l00713"></a><span class="lineno">  713</span>&#160;</div>
+<div class="line"><a name="l00715"></a><span class="lineno">  715</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;            OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;        {</div>
+<div class="line"><a name="l00719"></a><span class="lineno">  719</span>&#160;            <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>(temp_storage).BlockedToWarpStriped(items);</div>
+<div class="line"><a name="l00720"></a><span class="lineno">  720</span>&#160;            StoreWarpStriped&lt;MODIFIER&gt;(linear_tid, block_itr, items);</div>
+<div class="line"><a name="l00721"></a><span class="lineno">  721</span>&#160;        }</div>
+<div class="line"><a name="l00722"></a><span class="lineno">  722</span>&#160;</div>
+<div class="line"><a name="l00724"></a><span class="lineno">  724</span>&#160;        __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00725"></a><span class="lineno">  725</span>&#160;            OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00726"></a><span class="lineno">  726</span>&#160;            T                   (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00727"></a><span class="lineno">  727</span>&#160;            <span class="keywordtype">int</span>                 valid_items)                </div>
+<div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;        {</div>
+<div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;            <a class="code" href="classcub_1_1_block_exchange.html" title="The BlockExchange class provides collective methods for rearranging data partitioned across a CUDA th...">BlockExchange</a>(temp_storage).BlockedToWarpStriped(items);</div>
+<div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;            StoreWarpStriped&lt;MODIFIER&gt;(linear_tid, block_itr, items, valid_items);</div>
+<div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;        }</div>
+<div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;    };</div>
+<div class="line"><a name="l00733"></a><span class="lineno">  733</span>&#160;</div>
+<div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;<span class="comment">     * Type definitions</span></div>
+<div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;</div>
+<div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;    <span class="keyword">typedef</span> StoreInternal&lt;ALGORITHM&gt; InternalStore;</div>
+<div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;</div>
+<div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;</div>
+<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> InternalStore::TempStorage _TempStorage;</div>
+<div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;</div>
+<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;</div>
+<div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00747"></a><span class="lineno">  747</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00748"></a><span class="lineno">  748</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00749"></a><span class="lineno">  749</span>&#160;</div>
+<div class="line"><a name="l00751"></a><span class="lineno">  751</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;    {</div>
+<div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;        __shared__ _TempStorage private_storage;</div>
+<div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;    }</div>
+<div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;</div>
+<div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;</div>
+<div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;</div>
+<div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160;</div>
+<div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;    <span class="keywordtype">int</span> linear_tid;</div>
+<div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;</div>
+<div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;</div>
+<div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;</div>
+<div class="line"><a name="l00772"></a><span class="lineno"><a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html">  772</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;</div>
+<div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;</div>
+<div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;</div>
+<div class="line"><a name="l00783"></a><span class="lineno"><a class="code" href="classcub_1_1_block_store.html#a5c3c79c8e460594624e0347f5b44ecf7">  783</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_store.html#a5c3c79c8e460594624e0347f5b44ecf7" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">BlockStore</a>()</div>
+<div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;    :</div>
+<div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;    {}</div>
+<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;</div>
+<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;</div>
+<div class="line"><a name="l00793"></a><span class="lineno"><a class="code" href="classcub_1_1_block_store.html#a975f15b361a6da2d442f5e1bec24fd82">  793</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_store.html#a975f15b361a6da2d442f5e1bec24fd82" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">BlockStore</a>(</div>
+<div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;        <a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a> &amp;temp_storage)             </div>
+<div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;    :</div>
+<div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;        linear_tid(threadIdx.x)</div>
+<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;    {}</div>
+<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;</div>
+<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;</div>
+<div class="line"><a name="l00804"></a><span class="lineno"><a class="code" href="classcub_1_1_block_store.html#ad772f7f8a121b62d0c8d752f545110a3">  804</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_store.html#ad772f7f8a121b62d0c8d752f545110a3" title="Collective constructor using a private static allocation of shared memory as temporary storage...">BlockStore</a>(</div>
+<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;    :</div>
+<div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;    {}</div>
+<div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;</div>
+<div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;</div>
+<div class="line"><a name="l00815"></a><span class="lineno"><a class="code" href="classcub_1_1_block_store.html#ab279118339fa79a05f1f09fc6c318dd9">  815</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_block_store.html#ab279118339fa79a05f1f09fc6c318dd9" title="Collective constructor using the specified memory allocation as temporary storage. Each thread is identified using the supplied linear thread identifier. ">BlockStore</a>(</div>
+<div class="line"><a name="l00816"></a><span class="lineno">  816</span>&#160;        <a class="code" href="structcub_1_1_block_store_1_1_temp_storage.html" title="The operations exposed by BlockStore require a temporary memory allocation of this nested type for th...">TempStorage</a> &amp;temp_storage,             </div>
+<div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;        <span class="keywordtype">int</span> linear_tid)                        </div>
+<div class="line"><a name="l00818"></a><span class="lineno">  818</span>&#160;    :</div>
+<div class="line"><a name="l00819"></a><span class="lineno">  819</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00820"></a><span class="lineno">  820</span>&#160;        linear_tid(linear_tid)</div>
+<div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;    {}</div>
+<div class="line"><a name="l00822"></a><span class="lineno">  822</span>&#160;</div>
+<div class="line"><a name="l00823"></a><span class="lineno">  823</span>&#160;</div>
+<div class="line"><a name="l00825"></a><span class="lineno">  825</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00829"></a><span class="lineno">  829</span>&#160;</div>
+<div class="line"><a name="l00830"></a><span class="lineno">  830</span>&#160;</div>
+<div class="line"><a name="l00868"></a><span class="lineno"><a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c">  868</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac849ae26014bff7c5fb76295c435c73c" title="Store items into a linear segment of memory. ">Store</a>(</div>
+<div class="line"><a name="l00869"></a><span class="lineno">  869</span>&#160;        OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00870"></a><span class="lineno">  870</span>&#160;        T                   (&amp;items)[ITEMS_PER_THREAD]) </div>
+<div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160;    {</div>
+<div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160;        InternalStore(temp_storage, linear_tid).Store(block_itr, items);</div>
+<div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;    }</div>
+<div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;</div>
+<div class="line"><a name="l00913"></a><span class="lineno"><a class="code" href="classcub_1_1_block_store.html#ac02678cf9b327e095376f443bc4feda2">  913</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_block_store.html#ac02678cf9b327e095376f443bc4feda2" title="Store items into a linear segment of memory, guarded by range. ">Store</a>(</div>
+<div class="line"><a name="l00914"></a><span class="lineno">  914</span>&#160;        OutputIteratorRA    block_itr,                  </div>
+<div class="line"><a name="l00915"></a><span class="lineno">  915</span>&#160;        T                   (&amp;items)[ITEMS_PER_THREAD], </div>
+<div class="line"><a name="l00916"></a><span class="lineno">  916</span>&#160;        <span class="keywordtype">int</span>                 valid_items)                </div>
+<div class="line"><a name="l00917"></a><span class="lineno">  917</span>&#160;    {</div>
+<div class="line"><a name="l00918"></a><span class="lineno">  918</span>&#160;        InternalStore(temp_storage, linear_tid).Store(block_itr, items, valid_items);</div>
+<div class="line"><a name="l00919"></a><span class="lineno">  919</span>&#160;    }</div>
+<div class="line"><a name="l00920"></a><span class="lineno">  920</span>&#160;};</div>
+<div class="line"><a name="l00921"></a><span class="lineno">  921</span>&#160;       <span class="comment">// end group BlockModule</span></div>
+<div class="line"><a name="l00923"></a><span class="lineno">  923</span>&#160;</div>
+<div class="line"><a name="l00924"></a><span class="lineno">  924</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00925"></a><span class="lineno">  925</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l00926"></a><span class="lineno">  926</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/cub_8cuh_source.html b/docs/html/cub_8cuh_source.html
new file mode 100644
index 0000000000..71994a953c
--- /dev/null
+++ b/docs/html/cub_8cuh_source.html
@@ -0,0 +1,193 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: cub.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cub.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="cub_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;</div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment">// Block</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__histogram_8cuh.html">block/block_histogram.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__discontinuity_8cuh.html">block/block_discontinuity.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__exchange_8cuh.html">block/block_exchange.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__load_8cuh.html">block/block_load.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;block/block_radix_rank.cuh&quot;</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__radix__sort_8cuh.html">block/block_radix_sort.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__reduce_8cuh.html">block/block_reduce.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__scan_8cuh.html">block/block_scan.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="block__store_8cuh.html">block/block_store.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="comment">// Device</span></div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="device__histogram_8cuh.html">device/device_histogram.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="device__radix__sort_8cuh.html">device/device_radix_sort.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="device__reduce_8cuh.html">device/device_reduce.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="device__scan_8cuh.html">device/device_scan.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="comment">// Grid</span></div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment">//#include &quot;grid/grid_barrier.cuh&quot;</span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="preprocessor">#include &quot;grid/grid_even_share.cuh&quot;</span></div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="preprocessor">#include &quot;grid/grid_mapping.cuh&quot;</span></div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="preprocessor">#include &quot;grid/grid_queue.cuh&quot;</span></div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;<span class="comment">// Host</span></div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<span class="preprocessor">#include &quot;host/spinlock.cuh&quot;</span></div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;<span class="comment">// Thread</span></div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__load_8cuh.html">thread/thread_load.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__operators_8cuh.html">thread/thread_operators.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__reduce_8cuh.html">thread/thread_reduce.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__scan_8cuh.html">thread/thread_scan.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__store_8cuh.html">thread/thread_store.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;<span class="comment">// Warp</span></div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="warp__reduce_8cuh.html">warp/warp_reduce.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="warp__scan_8cuh.html">warp/warp_scan.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="comment">// Util</span></div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;<span class="preprocessor">#include &quot;util_allocator.cuh&quot;</span></div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__arch_8cuh.html">util_arch.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__debug_8cuh.html">util_debug.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__device_8cuh.html">util_device.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="preprocessor">#include &quot;util_macro.cuh&quot;</span></div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="preprocessor">#include &quot;util_ptx.cuh&quot;</span></div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__type_8cuh.html">util_type.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__iterator_8cuh.html">util_iterator.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="preprocessor">#include &quot;util_vector.cuh&quot;</span></div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/device__histogram_8cuh_source.html b/docs/html/device__histogram_8cuh_source.html
new file mode 100644
index 0000000000..1bfa4810d7
--- /dev/null
+++ b/docs/html/device__histogram_8cuh_source.html
@@ -0,0 +1,793 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: device_histogram.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_18fc672d63781b5a743137aee24ff656.html">device</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">device_histogram.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="device__histogram_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;</div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;stdio.h&gt;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;iterator&gt;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;block/block_histo_tiles.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;../grid/grid_even_share.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;../grid/grid_queue.cuh&quot;</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;../util_debug.cuh&quot;</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &quot;../util_device.cuh&quot;</span></div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment"> * Kernel entry points</span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keywordtype">int</span>                                             BINS,                   </div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    <span class="keywordtype">int</span>                                             ACTIVE_CHANNELS,        </div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="keyword">typename</span>                                        SizeT,                  </div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="keyword">typename</span>                                        HistoCounter&gt;           </div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;__launch_bounds__ (BINS, 1)</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;__global__ <span class="keywordtype">void</span> InitHistoKernel(</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    GridQueue&lt;SizeT&gt;                                grid_queue,             </div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    ArrayWrapper&lt;HistoCounter*, ACTIVE_CHANNELS&gt;    d_out_histograms,       </div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    SizeT                                           num_samples)            </div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;{</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    d_out_histograms.array[blockIdx.x][threadIdx.x] = 0;</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keywordflow">if</span> (threadIdx.x == 0) grid_queue.ResetDrain(num_samples);</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;}</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="keyword">typename</span>                                        BlockHistogramTilesPolicy,   </div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <span class="keywordtype">int</span>                                             BINS,                       </div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <span class="keywordtype">int</span>                                             CHANNELS,                   </div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    <span class="keywordtype">int</span>                                             ACTIVE_CHANNELS,            </div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    <span class="keyword">typename</span>                                        InputIteratorRA,            </div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    <span class="keyword">typename</span>                                        HistoCounter,               </div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    <span class="keyword">typename</span>                                        SizeT&gt;                      </div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;__launch_bounds__ (<span class="keywordtype">int</span>(BlockHistogramTilesPolicy::BLOCK_THREADS), BlockHistogramTilesPolicy::SM_OCCUPANCY)</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;__global__ <span class="keywordtype">void</span> MultiBlockHistogramKernel(</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    InputIteratorRA                                 d_samples,                  </div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    ArrayWrapper&lt;HistoCounter*, ACTIVE_CHANNELS&gt;    d_out_histograms,           </div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    SizeT                                           num_samples,                </div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    GridEvenShare&lt;SizeT&gt;                            even_share,                 </div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    GridQueue&lt;SizeT&gt;                                queue)                      </div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;{</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <span class="comment">// Constants</span></div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    {</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;        BLOCK_THREADS       = BlockHistogramTilesPolicy::BLOCK_THREADS,</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;        ITEMS_PER_THREAD    = BlockHistogramTilesPolicy::ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;        TILE_SIZE           = BLOCK_THREADS * ITEMS_PER_THREAD,</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    };</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="comment">// Thread block type for compositing input tiles</span></div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="keyword">typedef</span> BlockHistogramTiles&lt;BlockHistogramTilesPolicy, BINS, CHANNELS, ACTIVE_CHANNELS, InputIteratorRA, HistoCounter, SizeT&gt; BlockHistogramTilesT;</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="comment">// Shared memory for BlockHistogramTiles</span></div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    __shared__ <span class="keyword">typename</span> BlockHistogramTilesT::TempStorage temp_storage;</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="comment">// Consume input tiles</span></div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    BlockHistogramTilesT(temp_storage, d_samples, d_out_histograms.array).ConsumeTiles(</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;        num_samples,</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;        even_share,</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;        queue,</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;        Int2Type&lt;BlockHistogramTilesPolicy::GRID_MAPPING&gt;());</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;}</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    <span class="keywordtype">int</span>                                             BINS,                   </div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <span class="keywordtype">int</span>                                             ACTIVE_CHANNELS,        </div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    <span class="keyword">typename</span>                                        HistoCounter&gt;           </div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;__launch_bounds__ (BINS, 1)</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;__global__ <span class="keywordtype">void</span> AggregateHistoKernel(</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    HistoCounter*                                   d_block_histograms,     </div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    ArrayWrapper&lt;HistoCounter*, ACTIVE_CHANNELS&gt;    d_out_histograms,       </div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="keywordtype">int</span>                                             num_threadblocks)       </div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;{</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    <span class="comment">// Accumulate threadblock-histograms from the channel</span></div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    HistoCounter bin_aggregate = 0;</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    <span class="keywordtype">int</span> block_offset = blockIdx.x * (num_threadblocks * BINS);</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="keywordtype">int</span> block_oob = block_offset + (num_threadblocks * BINS);</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="preprocessor">#if CUB_PTX_ARCH &gt;= 200</span></div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="preprocessor"></span><span class="preprocessor">    #pragma unroll 32</span></div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">while</span> (block_offset &lt; block_oob)</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    {</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;        bin_aggregate += d_block_histograms[block_offset + threadIdx.x];</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;        block_offset += BINS;</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    }</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <span class="comment">// Output</span></div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    d_out_histograms.array[blockIdx.x][threadIdx.x] = bin_aggregate;</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;}</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;<span class="comment"> * DeviceHistogram</span></div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;</div>
+<div class="line"><a name="l00178"></a><span class="lineno"><a class="code" href="structcub_1_1_device_histogram.html">  178</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_device_histogram.html" title="DeviceHistogram provides device-wide parallel operations for constructing histogram(s) from samples d...">DeviceHistogram</a></div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;{</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;<span class="comment">     * Constants and typedefs</span></div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <span class="keyword">struct </span>KernelDispachParams</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    {</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;        <span class="comment">// Policy fields</span></div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;        <span class="keywordtype">int</span>                         block_threads;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;        <span class="keywordtype">int</span>                         items_per_thread;</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;        BlockHistogramTilesAlgorithm    block_algorithm;</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        GridMappingStrategy         grid_mapping;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;        <span class="keywordtype">int</span>                         subscription_factor;</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;        <span class="comment">// Derived fields</span></div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;        <span class="keywordtype">int</span>                         channel_tile_size;</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;        <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BlockHistogramTilesPolicy&gt;</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;        __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;        <span class="keywordtype">void</span> Init(<span class="keywordtype">int</span> subscription_factor = 1)</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;        {</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;            block_threads               = BlockHistogramTilesPolicy::BLOCK_THREADS;</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;            items_per_thread            = BlockHistogramTilesPolicy::ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;            block_algorithm             = BlockHistogramTilesPolicy::GRID_ALGORITHM;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;            grid_mapping                = BlockHistogramTilesPolicy::GRID_MAPPING;</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;            this-&gt;subscription_factor   = subscription_factor;</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;            channel_tile_size           = block_threads * items_per_thread;</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;        }</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;        __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        <span class="keywordtype">void</span> Print()</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;        {</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;            printf(<span class="stringliteral">&quot;%d, %d, %d, %d, %d&quot;</span>,</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;                block_threads,</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;                items_per_thread,</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;                block_algorithm,</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;                grid_mapping,</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;                subscription_factor);</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;        }</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    };</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;<span class="comment">     * Tuning policies</span></div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;        <span class="keywordtype">int</span>                         CHANNELS,</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;        <span class="keywordtype">int</span>                         ACTIVE_CHANNELS,</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;        BlockHistogramTilesAlgorithm    GRID_ALGORITHM,</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;        <span class="keywordtype">int</span>                         ARCH&gt;</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;    <span class="keyword">struct </span>TunedPolicies;</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> CHANNELS, <span class="keywordtype">int</span> ACTIVE_CHANNELS, BlockHistogramTilesAlgorithm GRID_ALGORITHM&gt;</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM, 350&gt;</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;    {</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;        <span class="keyword">typedef</span> BlockHistogramTilesPolicy&lt;</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;            (GRID_ALGORITHM == GRID_HISTO_SORT) ? 128 : 256,</div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;            (GRID_ALGORITHM == GRID_HISTO_SORT) ? 12 : (30 / ACTIVE_CHANNELS),</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;            GRID_ALGORITHM,</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;            (GRID_ALGORITHM == GRID_HISTO_SORT) ? GRID_MAPPING_DYNAMIC : GRID_MAPPING_EVEN_SHARE,</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;            (GRID_ALGORITHM == GRID_HISTO_SORT) ? 8 : 1&gt; MultiBlockPolicy;</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 7 };</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;    };</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> CHANNELS, <span class="keywordtype">int</span> ACTIVE_CHANNELS, BlockHistogramTilesAlgorithm GRID_ALGORITHM&gt;</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM, 300&gt;</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    {</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;        <span class="keyword">typedef</span> BlockHistogramTilesPolicy&lt;</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;            128,</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;            (GRID_ALGORITHM == GRID_HISTO_SORT) ? 20 : (22 / ACTIVE_CHANNELS),</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;            GRID_ALGORITHM,</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;            (GRID_ALGORITHM == GRID_HISTO_SORT) ? GRID_MAPPING_DYNAMIC : GRID_MAPPING_EVEN_SHARE,</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;            1&gt; MultiBlockPolicy;</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 1 };</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    };</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> CHANNELS, <span class="keywordtype">int</span> ACTIVE_CHANNELS, BlockHistogramTilesAlgorithm GRID_ALGORITHM&gt;</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM, 200&gt;</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;    {</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;        <span class="keyword">typedef</span> BlockHistogramTilesPolicy&lt;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;            128,</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;            (GRID_ALGORITHM == GRID_HISTO_SORT) ? 21 : (23 / ACTIVE_CHANNELS),</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;            GRID_ALGORITHM,</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;            GRID_MAPPING_DYNAMIC,</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;            1&gt; MultiBlockPolicy;</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 1 };</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    };</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    <span class="keyword">template</span> &lt;<span class="keywordtype">int</span> CHANNELS, <span class="keywordtype">int</span> ACTIVE_CHANNELS, BlockHistogramTilesAlgorithm GRID_ALGORITHM&gt;</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM, 100&gt;</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;    {</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;        <span class="keyword">typedef</span> BlockHistogramTilesPolicy&lt;</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;            128, </div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;            7, </div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;            GRID_HISTO_SORT,        <span class="comment">// (use sort regardless because atomics are perf-useless)</span></div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;            GRID_MAPPING_EVEN_SHARE,</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;            1&gt; MultiBlockPolicy;</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 1 };</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;    };</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;        <span class="keywordtype">int</span>                         CHANNELS,</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;        <span class="keywordtype">int</span>                         ACTIVE_CHANNELS,</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;        BlockHistogramTilesAlgorithm      GRID_ALGORITHM&gt;</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;    <span class="keyword">struct </span>PtxDefaultPolicies</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;    {</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;        <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> PTX_TUNE_ARCH =   (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 350) ?</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;                                                350 :</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;                                                (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 300) ?</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;                                                    300 :</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;                                                    (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 200) ?</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;                                                        200 :</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;                                                        100;</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;        <span class="comment">// Tuned policy set for the current PTX compiler pass</span></div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;        <span class="keyword">typedef</span> TunedPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM, PTX_TUNE_ARCH&gt; PtxTunedPolicies;</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;        <span class="comment">// Subscription factor for the current PTX compiler pass</span></div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> SUBSCRIPTION_FACTOR = PtxTunedPolicies::SUBSCRIPTION_FACTOR;</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;        <span class="comment">// MultiBlockPolicy that opaquely derives from the specialization corresponding to the current PTX compiler pass</span></div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;        <span class="keyword">struct </span>MultiBlockPolicy : PtxTunedPolicies::MultiBlockPolicy {};</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;        <span class="keyword">static</span> <span class="keywordtype">void</span> InitDispatchParams(<span class="keywordtype">int</span> ptx_version, KernelDispachParams &amp;multi_block_dispatch_params)</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;        {</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;            <span class="keywordflow">if</span> (ptx_version &gt;= 350)</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;            {</div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM, 350&gt; TunedPolicies;</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;                multi_block_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::MultiBlockPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;            }</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;            <span class="keywordflow">else</span> <span class="keywordflow">if</span> (ptx_version &gt;= 300)</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;            {</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM, 300&gt; TunedPolicies;</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;                multi_block_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::MultiBlockPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;            }</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;            <span class="keywordflow">else</span> <span class="keywordflow">if</span> (ptx_version &gt;= 200)</div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;            {</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM, 200&gt; TunedPolicies;</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;                multi_block_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::MultiBlockPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;            }</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;            <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;            {</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM, 100&gt; TunedPolicies;</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;                multi_block_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::MultiBlockPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;            }</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;        }</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    };</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;</div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;        <span class="keywordtype">int</span>                         BINS,                               </div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;        <span class="keywordtype">int</span>                         CHANNELS,                           </div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;        <span class="keywordtype">int</span>                         ACTIVE_CHANNELS,                    </div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;        <span class="keyword">typename</span>                    InitHistoKernelPtr,                 </div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;        <span class="keyword">typename</span>                    MultiBlockHistogramKernelPtr,           </div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;        <span class="keyword">typename</span>                    AggregateHistoKernelPtr,            </div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;        <span class="keyword">typename</span>                    InputIteratorRA,                    </div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;        <span class="keyword">typename</span>                    HistoCounter,                       </div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;        <span class="keyword">typename</span>                    SizeT&gt;                              </div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;    <span class="keyword">static</span> cudaError_t Dispatch(</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;        <span class="keywordtype">void</span>                        *d_temp_storage,                    </div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;        <span class="keywordtype">size_t</span>                      &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;        InitHistoKernelPtr          init_kernel,                        </div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;        MultiBlockHistogramKernelPtr    multi_block_kernel,                 </div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;        AggregateHistoKernelPtr     aggregate_kernel,                   </div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;        KernelDispachParams         &amp;multi_block_dispatch_params,       </div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;        InputIteratorRA             d_samples,                          </div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;        HistoCounter                *d_histograms[ACTIVE_CHANNELS],     </div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;        SizeT                       num_samples,                        </div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;        cudaStream_t                stream              = 0,            </div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;        <span class="keywordtype">bool</span>                        stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;    {</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;<span class="preprocessor">#ifndef CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;        <span class="comment">// Kernel launch not supported from this device</span></div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorNotSupported);</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;</div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;        cudaError error = cudaSuccess;</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;        {</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;            <span class="comment">// Get device ordinal</span></div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;            <span class="keywordtype">int</span> device_ordinal;</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaGetDevice(&amp;device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;            <span class="comment">// Get SM count</span></div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;            <span class="keywordtype">int</span> sm_count;</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceGetAttribute (&amp;sm_count, cudaDevAttrMultiProcessorCount, device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;            <span class="comment">// Get a rough estimate of multi_block_kernel SM occupancy based upon the maximum SM occupancy of the targeted PTX architecture</span></div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;            <span class="keywordtype">int</span> multi_block_sm_occupancy = CUB_MIN(</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;                <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps&lt;CUB_PTX_ARCH&gt;::MAX_SM_THREADBLOCKS</a>,</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;                <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps&lt;CUB_PTX_ARCH&gt;::MAX_SM_THREADS</a> / multi_block_dispatch_params.block_threads);</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;<span class="preprocessor"></span>            <span class="comment">// We&#39;re on the host, so come up with a more accurate estimate of multi_block_kernel SM occupancy from actual device properties</span></div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;            <a class="code" href="classcub_1_1_device.html" title="Properties of a given CUDA device and the corresponding PTX bundle. ">Device</a> device_props;</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = device_props.<a class="code" href="classcub_1_1_device.html#a4c1aecec381d2dce80120362feb2d0ca">Init</a>(device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;</div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = device_props.<a class="code" href="classcub_1_1_device.html#a618bbf36a5737a9b1533ff65834e88e8">MaxSmOccupancy</a>(</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;                multi_block_sm_occupancy,</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;                multi_block_kernel,</div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;                multi_block_dispatch_params.block_threads))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;            <span class="comment">// Get device occupancy for multi_block_kernel</span></div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;            <span class="keywordtype">int</span> multi_block_occupancy = multi_block_sm_occupancy * sm_count;</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;            <span class="comment">// Even-share work distribution</span></div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;            GridEvenShare&lt;SizeT&gt; even_share;</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;            <span class="comment">// Get tile size for multi_block_kernel</span></div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;            <span class="keywordtype">int</span> multi_block_tile_size = multi_block_dispatch_params.channel_tile_size * CHANNELS;</div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;</div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;            <span class="comment">// Get grid size for multi_block_kernel</span></div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;            <span class="keywordtype">int</span> multi_block_grid_size;</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;            <span class="keywordflow">switch</span> (multi_block_dispatch_params.grid_mapping)</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;            {</div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;            <span class="keywordflow">case</span> GRID_MAPPING_EVEN_SHARE:</div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;</div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;                <span class="comment">// Work is distributed evenly</span></div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;                even_share.GridInit(</div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;                    num_samples,</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;                    multi_block_occupancy * multi_block_dispatch_params.subscription_factor,</div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;                    multi_block_tile_size);</div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;                multi_block_grid_size = even_share.grid_size;</div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;                <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;</div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;            <span class="keywordflow">case</span> GRID_MAPPING_DYNAMIC:</div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;</div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;                <span class="comment">// Work is distributed dynamically</span></div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;                <span class="keywordtype">int</span> num_tiles           = (num_samples + multi_block_tile_size - 1) / multi_block_tile_size;</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;                multi_block_grid_size   = (num_tiles &lt; multi_block_occupancy) ?</div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;                    num_tiles :                 <span class="comment">// Not enough to fill the device with threadblocks</span></div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;                    multi_block_occupancy;      <span class="comment">// Fill the device with threadblocks</span></div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;                <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;            };</div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;</div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;            <span class="comment">// Temporary storage allocation requirements</span></div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;            <span class="keywordtype">void</span>* allocations[2];</div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;            <span class="keywordtype">size_t</span> allocation_sizes[2] =</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;            {</div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;                ACTIVE_CHANNELS * multi_block_grid_size * <span class="keyword">sizeof</span>(HistoCounter) * BINS,      <span class="comment">// bytes needed for privatized histograms</span></div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;                GridQueue&lt;int&gt;::AllocationSize()                                            <span class="comment">// bytes needed for grid queue descriptor</span></div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;            };</div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = AliasTemporaries(d_temp_storage, temp_storage_bytes, allocations, allocation_sizes))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;            <span class="comment">// Return if the caller is simply requesting the size of the storage allocation</span></div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;            <span class="keywordflow">if</span> (d_temp_storage == NULL)</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;                <span class="keywordflow">return</span> cudaSuccess;</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;            <span class="comment">// Privatized per-block reductions</span></div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;            HistoCounter *d_block_histograms = (HistoCounter*) allocations[0];</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;            <span class="comment">// Grid queue descriptor</span></div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;            GridQueue&lt;SizeT&gt; queue(allocations[1]);</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;            <span class="comment">// Setup array wrapper for histogram channel output (because we can&#39;t pass static arrays as kernel parameters)</span></div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;            <a class="code" href="structcub_1_1_array_wrapper.html" title="A wrapper for passing simple static arrays as kernel parameters. ">ArrayWrapper&lt;HistoCounter*, ACTIVE_CHANNELS&gt;</a> d_histo_wrapper;</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;            <span class="keywordflow">for</span> (<span class="keywordtype">int</span> CHANNEL = 0; CHANNEL &lt; ACTIVE_CHANNELS; ++CHANNEL)</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;                d_histo_wrapper.<a class="code" href="structcub_1_1_array_wrapper.html#ae665a1b28a83513db861072328de9551" title="Static array of type T. ">array</a>[CHANNEL] = d_histograms[CHANNEL];</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;            <span class="comment">// Setup array wrapper for temporary histogram channel output (because we can&#39;t pass static arrays as kernel parameters)</span></div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;            <a class="code" href="structcub_1_1_array_wrapper.html" title="A wrapper for passing simple static arrays as kernel parameters. ">ArrayWrapper&lt;HistoCounter*, ACTIVE_CHANNELS&gt;</a> d_temp_histo_wrapper;</div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;            for (<span class="keywordtype">int</span> CHANNEL = 0; CHANNEL &lt; ACTIVE_CHANNELS; ++CHANNEL)</div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;                d_temp_histo_wrapper.<a class="code" href="structcub_1_1_array_wrapper.html#ae665a1b28a83513db861072328de9551" title="Static array of type T. ">array</a>[CHANNEL] = d_block_histograms + (CHANNEL * multi_block_grid_size * BINS);</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;</div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;            <span class="comment">// Log init_kernel configuration</span></div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;            <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking init_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;()\n&quot;</span>, ACTIVE_CHANNELS, BINS, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream);</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;</div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;            <span class="comment">// Invoke init_kernel to initialize counters and queue descriptor</span></div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;            init_kernel&lt;&lt;&lt;ACTIVE_CHANNELS, BINS, 0, stream&gt;&gt;&gt;(queue, d_histo_wrapper, num_samples);</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;            <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;            <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;            <span class="comment">// Whether we need privatized histograms (i.e., non-global atomics and multi-block)</span></div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;            <span class="keywordtype">bool</span> privatized_temporaries = (multi_block_grid_size &gt; 1) &amp;&amp; (multi_block_dispatch_params.block_algorithm != GRID_HISTO_GLOBAL_ATOMIC);</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;            <span class="comment">// Log multi_block_kernel configuration</span></div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;            <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking multi_block_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;(), %d items per thread, %d SM occupancy\n&quot;</span>,</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;                multi_block_grid_size, multi_block_dispatch_params.block_threads, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream, multi_block_dispatch_params.items_per_thread, multi_block_sm_occupancy);</div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;            <span class="comment">// Invoke multi_block_kernel</span></div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;            multi_block_kernel&lt;&lt;&lt;multi_block_grid_size, multi_block_dispatch_params.block_threads, 0, stream&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;                d_samples,</div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;                (privatized_temporaries) ?</div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;                    d_temp_histo_wrapper :</div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;                    d_histo_wrapper,</div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;                num_samples,</div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;                even_share,</div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;                queue);</div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;            <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;            <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;</div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;            <span class="comment">// Aggregate privatized block histograms if necessary</span></div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;            <span class="keywordflow">if</span> (privatized_temporaries)</div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;            {</div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;                <span class="comment">// Log aggregate_kernel configuration</span></div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking aggregate_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;()\n&quot;</span>,</div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;                    ACTIVE_CHANNELS, BINS, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream);</div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;</div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;                <span class="comment">// Invoke aggregate_kernel</span></div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;                aggregate_kernel&lt;&lt;&lt;ACTIVE_CHANNELS, BINS, 0, stream&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;                    d_block_histograms,</div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;                    d_histo_wrapper,</div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;                    multi_block_grid_size);</div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;</div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;                <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;            }</div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;        }</div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;</div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;<span class="preprocessor">#endif // CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;</div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;</div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;        BlockHistogramTilesAlgorithm    GRID_ALGORITHM,</div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;        <span class="keywordtype">int</span>                         BINS,                       </div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;        <span class="keywordtype">int</span>                         CHANNELS,                   </div>
+<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;        <span class="keywordtype">int</span>                         ACTIVE_CHANNELS,            </div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;        <span class="keyword">typename</span>                    InputIteratorRA,            </div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;        <span class="keyword">typename</span>                    HistoCounter&gt;               </div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;    <span class="keyword">static</span> cudaError_t Dispatch(</div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;        InputIteratorRA     d_samples,                          </div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;        HistoCounter        *d_histograms[ACTIVE_CHANNELS],     </div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;        <span class="keywordtype">int</span>                 num_samples,                        </div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;    {</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;        <span class="comment">// Type used for array indexing</span></div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;        <span class="keyword">typedef</span> <span class="keywordtype">int</span> SizeT;</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;        <span class="comment">// Tuning polices for the PTX architecture that will get dispatched to</span></div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        <span class="keyword">typedef</span> PtxDefaultPolicies&lt;CHANNELS, ACTIVE_CHANNELS, GRID_ALGORITHM&gt; PtxDefaultPolicies;</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> PtxDefaultPolicies::MultiBlockPolicy MultiBlockPolicy;</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;        cudaError error = cudaSuccess;</div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;        {</div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;            <span class="comment">// Declare dispatch parameters</span></div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;            KernelDispachParams multi_block_dispatch_params;</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;</div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;<span class="preprocessor">        #ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;            <span class="comment">// We&#39;re on the device, so initialize the dispatch parameters with the PtxDefaultPolicies directly</span></div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;            multi_block_dispatch_params.Init&lt;MultiBlockPolicy&gt;(PtxDefaultPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;</div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;<span class="preprocessor">        #else</span></div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;            <span class="comment">// We&#39;re on the host, so lookup and initialize the dispatch parameters with the policies that match the device&#39;s PTX version</span></div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;            <span class="keywordtype">int</span> ptx_version;</div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(ptx_version))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;            PtxDefaultPolicies::InitDispatchParams(ptx_version, multi_block_dispatch_params);</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;</div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;<span class="preprocessor">        #endif</span></div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;            Dispatch&lt;BINS, CHANNELS, ACTIVE_CHANNELS&gt;(</div>
+<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;                d_temp_storage,</div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;                temp_storage_bytes,</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;                InitHistoKernel&lt;BINS, ACTIVE_CHANNELS, SizeT, HistoCounter&gt;,</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;                MultiBlockHistogramKernel&lt;MultiBlockPolicy, BINS, CHANNELS, ACTIVE_CHANNELS, InputIteratorRA, HistoCounter, SizeT&gt;,</div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;                AggregateHistoKernel&lt;BINS, ACTIVE_CHANNELS, HistoCounter&gt;,</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;                multi_block_dispatch_params,</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;                d_samples,</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;                d_histograms,</div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;                num_samples,</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;                stream,</div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;                stream_synchronous);</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error)) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;        }</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;</div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;    }</div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;</div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;<span class="preprocessor">    #endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;</div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;</div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;        <span class="keywordtype">int</span>                 BINS,</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;        <span class="keyword">typename</span>            HistoCounter&gt;</div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00663"></a><span class="lineno"><a class="code" href="structcub_1_1_device_histogram.html#ad0cc7bacd6022916cb228437eeb9c82a">  663</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_histogram.html#ad0cc7bacd6022916cb228437eeb9c82a" title="Computes a device-wide histogram. Uses fast block-sorting to compute the histogram. Delivers consistent throughput regardless of sample diversity, but occupancy may be limited by histogram bin count. ">SingleChannelSorting</a>(</div>
+<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;        InputIteratorRA     d_samples,                          </div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;        HistoCounter*       d_histogram,                        </div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;        <span class="keywordtype">int</span>                 num_samples,                        </div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;    {</div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;        <span class="keywordflow">return</span> Dispatch&lt;GRID_HISTO_SORT, BINS, 1, 1&gt;(</div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;            d_temp_storage, temp_storage_bytes, d_samples, &amp;d_histogram, num_samples, stream, stream_synchronous);</div>
+<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;    }</div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;</div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;</div>
+<div class="line"><a name="l00728"></a><span class="lineno">  728</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00729"></a><span class="lineno">  729</span>&#160;        <span class="keywordtype">int</span>                 BINS,</div>
+<div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;        <span class="keyword">typename</span>            HistoCounter&gt;</div>
+<div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00733"></a><span class="lineno"><a class="code" href="structcub_1_1_device_histogram.html#a425559a4dc730f55f46e0faa5080e266">  733</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_histogram.html#a425559a4dc730f55f46e0faa5080e266" title="Computes a device-wide histogram. Uses shared-memory atomic read-modify-write operations to compute t...">SingleChannelSharedAtomic</a>(</div>
+<div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;        InputIteratorRA     d_samples,                          </div>
+<div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;        HistoCounter*       d_histogram,                        </div>
+<div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;        <span class="keywordtype">int</span>                 num_samples,                        </div>
+<div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;    {</div>
+<div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;        <span class="keywordflow">return</span> Dispatch&lt;GRID_HISTO_SHARED_ATOMIC, BINS, 1, 1&gt;(</div>
+<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;            d_temp_storage, temp_storage_bytes, d_samples, &amp;d_histogram, num_samples, stream, stream_synchronous);</div>
+<div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;    }</div>
+<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;</div>
+<div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;</div>
+<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;        <span class="keywordtype">int</span>                 BINS,</div>
+<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;        <span class="keyword">typename</span>            HistoCounter&gt;</div>
+<div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00802"></a><span class="lineno"><a class="code" href="structcub_1_1_device_histogram.html#a6659e9723fda5e5c0ac587aa66fb54c3">  802</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_histogram.html#a6659e9723fda5e5c0ac587aa66fb54c3" title="Computes a device-wide histogram. Uses global-memory atomic read-modify-write operations to compute t...">SingleChannelGlobalAtomic</a>(</div>
+<div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;        InputIteratorRA     d_samples,                          </div>
+<div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;        HistoCounter*       d_histogram,                        </div>
+<div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;        <span class="keywordtype">int</span>                 num_samples,                        </div>
+<div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;    {</div>
+<div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;        <span class="keywordflow">return</span> Dispatch&lt;GRID_HISTO_GLOBAL_ATOMIC, BINS, 1, 1&gt;(</div>
+<div class="line"><a name="l00812"></a><span class="lineno">  812</span>&#160;            d_temp_storage, temp_storage_bytes, d_samples, &amp;d_histogram, num_samples, stream, stream_synchronous);</div>
+<div class="line"><a name="l00813"></a><span class="lineno">  813</span>&#160;    }</div>
+<div class="line"><a name="l00814"></a><span class="lineno">  814</span>&#160;</div>
+<div class="line"><a name="l00815"></a><span class="lineno">  815</span>&#160;</div>
+<div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;</div>
+<div class="line"><a name="l00822"></a><span class="lineno">  822</span>&#160;</div>
+<div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160;        <span class="keywordtype">int</span>                 BINS,</div>
+<div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;        <span class="keywordtype">int</span>                 CHANNELS,</div>
+<div class="line"><a name="l00882"></a><span class="lineno">  882</span>&#160;        <span class="keywordtype">int</span>                 ACTIVE_CHANNELS,</div>
+<div class="line"><a name="l00883"></a><span class="lineno">  883</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;        <span class="keyword">typename</span>            HistoCounter&gt;</div>
+<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00886"></a><span class="lineno"><a class="code" href="structcub_1_1_device_histogram.html#a7f9a00987e98b828823f062d563aaa8c">  886</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_histogram.html#a7f9a00987e98b828823f062d563aaa8c" title="Computes a device-wide histogram from multi-channel data. Uses fast block-sorting to compute the hist...">MultiChannelSorting</a>(</div>
+<div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00888"></a><span class="lineno">  888</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00889"></a><span class="lineno">  889</span>&#160;        InputIteratorRA     d_samples,                          </div>
+<div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;        HistoCounter        *d_histograms[ACTIVE_CHANNELS],     </div>
+<div class="line"><a name="l00891"></a><span class="lineno">  891</span>&#160;        <span class="keywordtype">int</span>                 num_samples,                        </div>
+<div class="line"><a name="l00892"></a><span class="lineno">  892</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00893"></a><span class="lineno">  893</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160;    {</div>
+<div class="line"><a name="l00895"></a><span class="lineno">  895</span>&#160;        <span class="keywordflow">return</span> Dispatch&lt;GRID_HISTO_SORT, BINS, CHANNELS, ACTIVE_CHANNELS&gt;(</div>
+<div class="line"><a name="l00896"></a><span class="lineno">  896</span>&#160;            d_temp_storage, temp_storage_bytes, d_samples, d_histograms, num_samples, stream, stream_synchronous);</div>
+<div class="line"><a name="l00897"></a><span class="lineno">  897</span>&#160;    }</div>
+<div class="line"><a name="l00898"></a><span class="lineno">  898</span>&#160;</div>
+<div class="line"><a name="l00899"></a><span class="lineno">  899</span>&#160;</div>
+<div class="line"><a name="l00956"></a><span class="lineno">  956</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00957"></a><span class="lineno">  957</span>&#160;        <span class="keywordtype">int</span>                 BINS,</div>
+<div class="line"><a name="l00958"></a><span class="lineno">  958</span>&#160;        <span class="keywordtype">int</span>                 CHANNELS,</div>
+<div class="line"><a name="l00959"></a><span class="lineno">  959</span>&#160;        <span class="keywordtype">int</span>                 ACTIVE_CHANNELS,</div>
+<div class="line"><a name="l00960"></a><span class="lineno">  960</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00961"></a><span class="lineno">  961</span>&#160;        <span class="keyword">typename</span>            HistoCounter&gt;</div>
+<div class="line"><a name="l00962"></a><span class="lineno">  962</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00963"></a><span class="lineno"><a class="code" href="structcub_1_1_device_histogram.html#a9744fa6ed9761986c6c13afdcb20909d">  963</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_histogram.html#a9744fa6ed9761986c6c13afdcb20909d" title="Computes a device-wide histogram from multi-channel data. Uses shared-memory atomic read-modify-write...">MultiChannelSharedAtomic</a>(</div>
+<div class="line"><a name="l00964"></a><span class="lineno">  964</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00965"></a><span class="lineno">  965</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00966"></a><span class="lineno">  966</span>&#160;        InputIteratorRA     d_samples,                          </div>
+<div class="line"><a name="l00967"></a><span class="lineno">  967</span>&#160;        HistoCounter        *d_histograms[ACTIVE_CHANNELS],     </div>
+<div class="line"><a name="l00968"></a><span class="lineno">  968</span>&#160;        <span class="keywordtype">int</span>                 num_samples,                        </div>
+<div class="line"><a name="l00969"></a><span class="lineno">  969</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00970"></a><span class="lineno">  970</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00971"></a><span class="lineno">  971</span>&#160;    {</div>
+<div class="line"><a name="l00972"></a><span class="lineno">  972</span>&#160;        <span class="keywordflow">return</span> Dispatch&lt;GRID_HISTO_SHARED_ATOMIC, BINS, CHANNELS, ACTIVE_CHANNELS&gt;(</div>
+<div class="line"><a name="l00973"></a><span class="lineno">  973</span>&#160;            d_temp_storage, temp_storage_bytes, d_samples, d_histograms, num_samples, stream, stream_synchronous);</div>
+<div class="line"><a name="l00974"></a><span class="lineno">  974</span>&#160;    }</div>
+<div class="line"><a name="l00975"></a><span class="lineno">  975</span>&#160;</div>
+<div class="line"><a name="l00976"></a><span class="lineno">  976</span>&#160;</div>
+<div class="line"><a name="l01034"></a><span class="lineno"> 1034</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01035"></a><span class="lineno"> 1035</span>&#160;        <span class="keywordtype">int</span>                 BINS,</div>
+<div class="line"><a name="l01036"></a><span class="lineno"> 1036</span>&#160;        <span class="keywordtype">int</span>                 CHANNELS,</div>
+<div class="line"><a name="l01037"></a><span class="lineno"> 1037</span>&#160;        <span class="keywordtype">int</span>                 ACTIVE_CHANNELS,</div>
+<div class="line"><a name="l01038"></a><span class="lineno"> 1038</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l01039"></a><span class="lineno"> 1039</span>&#160;        <span class="keyword">typename</span>            HistoCounter&gt;</div>
+<div class="line"><a name="l01040"></a><span class="lineno"> 1040</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l01041"></a><span class="lineno"><a class="code" href="structcub_1_1_device_histogram.html#a0e6bee2938ad70ab128ed1a1c5f6d083"> 1041</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_histogram.html#a0e6bee2938ad70ab128ed1a1c5f6d083" title="Computes a device-wide histogram from multi-channel data. Uses global-memory atomic read-modify-write...">MultiChannelGlobalAtomic</a>(</div>
+<div class="line"><a name="l01042"></a><span class="lineno"> 1042</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l01043"></a><span class="lineno"> 1043</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l01044"></a><span class="lineno"> 1044</span>&#160;        InputIteratorRA     d_samples,                          </div>
+<div class="line"><a name="l01045"></a><span class="lineno"> 1045</span>&#160;        HistoCounter        *d_histograms[ACTIVE_CHANNELS],     </div>
+<div class="line"><a name="l01046"></a><span class="lineno"> 1046</span>&#160;        <span class="keywordtype">int</span>                 num_samples,                        </div>
+<div class="line"><a name="l01047"></a><span class="lineno"> 1047</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l01048"></a><span class="lineno"> 1048</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l01049"></a><span class="lineno"> 1049</span>&#160;    {</div>
+<div class="line"><a name="l01050"></a><span class="lineno"> 1050</span>&#160;        <span class="keywordflow">return</span> Dispatch&lt;GRID_HISTO_GLOBAL_ATOMIC, BINS, CHANNELS, ACTIVE_CHANNELS&gt;(</div>
+<div class="line"><a name="l01051"></a><span class="lineno"> 1051</span>&#160;            d_temp_storage, temp_storage_bytes, d_samples, d_histograms, num_samples, stream, stream_synchronous);</div>
+<div class="line"><a name="l01052"></a><span class="lineno"> 1052</span>&#160;    }</div>
+<div class="line"><a name="l01053"></a><span class="lineno"> 1053</span>&#160;</div>
+<div class="line"><a name="l01055"></a><span class="lineno"> 1055</span>&#160;</div>
+<div class="line"><a name="l01056"></a><span class="lineno"> 1056</span>&#160;};</div>
+<div class="line"><a name="l01057"></a><span class="lineno"> 1057</span>&#160;</div>
+<div class="line"><a name="l01058"></a><span class="lineno"> 1058</span>&#160;</div>
+<div class="line"><a name="l01059"></a><span class="lineno"> 1059</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l01060"></a><span class="lineno"> 1060</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l01061"></a><span class="lineno"> 1061</span>&#160;</div>
+<div class="line"><a name="l01062"></a><span class="lineno"> 1062</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:42 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/device__radix__sort_8cuh_source.html b/docs/html/device__radix__sort_8cuh_source.html
new file mode 100644
index 0000000000..f02810ac75
--- /dev/null
+++ b/docs/html/device__radix__sort_8cuh_source.html
@@ -0,0 +1,861 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: device_radix_sort.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_18fc672d63781b5a743137aee24ff656.html">device</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">device_radix_sort.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="device__radix__sort_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;</div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;stdio.h&gt;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;iterator&gt;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;block/block_radix_sort_upsweep_tiles.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;block/block_radix_sort_downsweep_tiles.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;block/block_scan_tiles.cuh&quot;</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;../grid/grid_even_share.cuh&quot;</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &quot;../util_debug.cuh&quot;</span></div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &quot;../util_device.cuh&quot;</span></div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;<span class="comment"> * Kernel entry points</span></div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    <span class="keyword">typename</span>                BlockRadixSortUpsweepTilesPolicy, </div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    <span class="keyword">typename</span>                Key,                            </div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keyword">typename</span>                SizeT&gt;                          </div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;__launch_bounds__ (<span class="keywordtype">int</span>(BlockRadixSortUpsweepTilesPolicy::BLOCK_THREADS), 1)</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;__global__ <span class="keywordtype">void</span> RadixSortUpsweepKernel(</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    Key                     *d_keys,                        </div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    SizeT                   *d_spine,                       </div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    SizeT                   num_items,                      </div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keywordtype">int</span>                     current_bit,                    </div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    <span class="keywordtype">bool</span>                    use_primary_bit_granularity,    </div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="keywordtype">bool</span>                    first_pass,                     </div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    GridEvenShare&lt;SizeT&gt;    even_share)                     </div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;{</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <span class="comment">// Alternate policy for when fewer bits remain</span></div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> BlockRadixSortUpsweepTilesPolicy::AltPolicy AltPolicy;</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="comment">// Parameterize two versions of BlockRadixSortUpsweepTiles type for the current configuration</span></div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    <span class="keyword">typedef</span> BlockRadixSortUpsweepTiles&lt;BlockRadixSortUpsweepTilesPolicy, Key, SizeT&gt;    BlockRadixSortUpsweepTilesT;          <span class="comment">// Primary</span></div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <span class="keyword">typedef</span> BlockRadixSortUpsweepTiles&lt;AltPolicy, Key, SizeT&gt;                           AltBlockRadixSortUpsweepTilesT;       <span class="comment">// Alternate (smaller bit granularity)</span></div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    <span class="comment">// Shared memory storage</span></div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    __shared__ <span class="keyword">union</span></div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    {</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;        <span class="keyword">typename</span> BlockRadixSortUpsweepTilesT::TempStorage     pass_storage;</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;        <span class="keyword">typename</span> AltBlockRadixSortUpsweepTilesT::TempStorage  alt_pass_storage;</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    } temp_storage;</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    <span class="comment">// Initialize even-share descriptor for this thread block</span></div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    even_share.BlockInit();</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;    <span class="comment">// Process input tiles (each of the first RADIX_DIGITS threads will compute a count for that digit)</span></div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <span class="keywordflow">if</span> (use_primary_bit_granularity)</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    {</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;        <span class="comment">// Primary granularity</span></div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;        SizeT bin_count;</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;        BlockRadixSortUpsweepTilesT(temp_storage.pass_storage, d_keys, current_bit).ProcessTiles(</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;            even_share.block_offset,</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;            even_share.block_oob,</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;            bin_count);</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;        <span class="comment">// Write out digit counts (striped)</span></div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;        <span class="keywordflow">if</span> (threadIdx.x &lt; BlockRadixSortUpsweepTilesT::RADIX_DIGITS)</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;        {</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;            d_spine[(gridDim.x * threadIdx.x) + blockIdx.x] = bin_count;</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;        }</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    }</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    {</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;        <span class="comment">// Alternate granularity</span></div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;        <span class="comment">// Process input tiles (each of the first RADIX_DIGITS threads will compute a count for that digit)</span></div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;        SizeT bin_count;</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;        AltBlockRadixSortUpsweepTilesT(temp_storage.alt_pass_storage, d_keys, current_bit).ProcessTiles(</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;            even_share.block_offset,</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;            even_share.block_oob,</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;            bin_count);</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;        <span class="comment">// Write out digit counts (striped)</span></div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;        <span class="keywordflow">if</span> (threadIdx.x &lt; AltBlockRadixSortUpsweepTilesT::RADIX_DIGITS)</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;        {</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;            d_spine[(gridDim.x * threadIdx.x) + blockIdx.x] = bin_count;</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;        }</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    }</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;}</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    <span class="keyword">typename</span>    BlockScanTilesPolicy,   </div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    <span class="keyword">typename</span>    SizeT&gt;                  </div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;__launch_bounds__ (<span class="keywordtype">int</span>(BlockScanTilesPolicy::BLOCK_THREADS), 1)</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;__global__ <span class="keywordtype">void</span> RadixSortScanKernel(</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;    SizeT       *d_spine,               </div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keywordtype">int</span>         num_counts)             </div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;{</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="comment">// Parameterize the BlockScanTiles type for the current configuration</span></div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="keyword">typedef</span> BlockScanTiles&lt;BlockScanTilesPolicy, SizeT*, SizeT*, cub::Sum, SizeT, SizeT&gt; BlockScanTilesT;</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    <span class="comment">// Shared memory storage</span></div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    __shared__ <span class="keyword">typename</span> BlockScanTilesT::TempStorage temp_storage;</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    <span class="comment">// Block scan instance</span></div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    BlockScanTilesT block_scan(temp_storage, d_spine, d_spine, <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">cub::Sum</a>(), SizeT(0)) ;</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    <span class="comment">// Process full input tiles</span></div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <span class="keywordtype">int</span> block_offset = 0;</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    RunningBlockPrefixOp&lt;SizeT&gt; prefix_op;</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    prefix_op.running_total = 0;</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="keywordflow">while</span> (block_offset &lt; num_counts)</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    {</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;        block_scan.ConsumeTile&lt;<span class="keyword">true</span>, <span class="keyword">false</span>&gt;(block_offset, prefix_op);</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;        block_offset += BlockScanTilesT::TILE_ITEMS;</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    }</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;}</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    <span class="keyword">typename</span>                BlockRadixSortDownsweepTilesPolicy,   </div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    <span class="keyword">typename</span>                Key,                                </div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    <span class="keyword">typename</span>                Value,                              </div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    <span class="keyword">typename</span>                SizeT&gt;                              </div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;__launch_bounds__ (<span class="keywordtype">int</span>(BlockRadixSortDownsweepTilesPolicy::BLOCK_THREADS))</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;__global__ <span class="keywordtype">void</span> RadixSortDownsweepKernel(</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;    Key                     *d_keys_in,                     </div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    Key                     *d_keys_out,                    </div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    Value                   *d_values_in,                   </div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    Value                   *d_values_out,                  </div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    SizeT                   *d_spine,                       </div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    SizeT                   num_items,                      </div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <span class="keywordtype">int</span>                     current_bit,                    </div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keywordtype">bool</span>                    use_primary_bit_granularity,    </div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keywordtype">bool</span>                    first_pass,                     </div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    <span class="keywordtype">bool</span>                    last_pass,                      </div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    GridEvenShare&lt;SizeT&gt;    even_share)                     </div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;{</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    <span class="comment">// Alternate policy for when fewer bits remain</span></div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> BlockRadixSortDownsweepTilesPolicy::AltPolicy AltPolicy;</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <span class="comment">// Parameterize two versions of BlockRadixSortDownsweepTiles type for the current configuration</span></div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    <span class="keyword">typedef</span> BlockRadixSortDownsweepTiles&lt;BlockRadixSortDownsweepTilesPolicy, Key, Value, SizeT&gt;     BlockRadixSortDownsweepTilesT;</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    <span class="keyword">typedef</span> BlockRadixSortDownsweepTiles&lt;AltPolicy, Key, Value, SizeT&gt;                            AltBlockRadixSortDownsweepTilesT;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    <span class="comment">// Shared memory storage</span></div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    __shared__ <span class="keyword">union</span></div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    {</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;        <span class="keyword">typename</span> BlockRadixSortDownsweepTilesT::TempStorage       pass_storage;</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;        <span class="keyword">typename</span> AltBlockRadixSortDownsweepTilesT::TempStorage    alt_pass_storage;</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;    } temp_storage;</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;    <span class="comment">// Initialize even-share descriptor for this thread block</span></div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;    even_share.BlockInit();</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;    <span class="keywordflow">if</span> (use_primary_bit_granularity)</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;    {</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;        <span class="comment">// Process input tiles</span></div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;        BlockRadixSortDownsweepTilesT(temp_storage.pass_storage, num_items, d_spine, d_keys_in, d_keys_out, d_values_in, d_values_out, current_bit).ProcessTiles(</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;            even_share.block_offset,</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;            even_share.block_oob);</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    }</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;    {</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;        <span class="comment">// Process input tiles</span></div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        AltBlockRadixSortDownsweepTilesT(temp_storage.alt_pass_storage, num_items, d_spine, d_keys_in, d_keys_out, d_values_in, d_values_out, current_bit).ProcessTiles(</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;            even_share.block_offset,</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;            even_share.block_oob);</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    }</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;}</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;<span class="comment"> * DeviceRadixSort</span></div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div>
+<div class="line"><a name="l00261"></a><span class="lineno"><a class="code" href="structcub_1_1_device_radix_sort.html">  261</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_device_radix_sort.html" title="DeviceRadixSort provides operations for computing a device-wide, parallel radix sort across data item...">DeviceRadixSort</a></div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;{</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;<span class="preprocessor">    #ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;<span class="comment">     * Constants and typedefs</span></div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;    <span class="keyword">struct </span>KernelDispachParams</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    {</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;        <span class="keywordtype">int</span>                     block_threads;</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;        <span class="keywordtype">int</span>                     items_per_thread;</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;        cudaSharedMemConfig     smem_config;</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;        <span class="keywordtype">int</span>                     radix_bits;</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;        <span class="keywordtype">int</span>                     alt_radix_bits;</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;        <span class="keywordtype">int</span>                     subscription_factor;</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;        <span class="keywordtype">int</span>                     tile_size;</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;        <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SortBlockPolicy&gt;</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;        __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;        <span class="keywordtype">void</span> InitUpsweepPolicy(<span class="keywordtype">int</span> subscription_factor = 1)</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;        {</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;            block_threads               = SortBlockPolicy::BLOCK_THREADS;</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;            items_per_thread            = SortBlockPolicy::ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;            radix_bits                  = SortBlockPolicy::RADIX_BITS;</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;            alt_radix_bits              = SortBlockPolicy::AltPolicy::RADIX_BITS;</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;            smem_config                 = cudaSharedMemBankSizeFourByte;</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;            this-&gt;subscription_factor   = subscription_factor;</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;            tile_size                   = block_threads * items_per_thread;</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;        }</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;        <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanBlockPolicy&gt;</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;        __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;        <span class="keywordtype">void</span> InitScanPolicy()</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;        {</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;            block_threads               = ScanBlockPolicy::BLOCK_THREADS;</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;            items_per_thread            = ScanBlockPolicy::ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;            radix_bits                  = 0;</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;            alt_radix_bits              = 0;</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;            smem_config                 = cudaSharedMemBankSizeFourByte;</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;            subscription_factor         = 0;</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;            tile_size                   = block_threads * items_per_thread;</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;        }</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;        <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SortBlockPolicy&gt;</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;        __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;        <span class="keywordtype">void</span> InitDownsweepPolicy(<span class="keywordtype">int</span> subscription_factor = 1)</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        {</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;            block_threads               = SortBlockPolicy::BLOCK_THREADS;</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;            items_per_thread            = SortBlockPolicy::ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;            radix_bits                  = SortBlockPolicy::RADIX_BITS;</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;            alt_radix_bits              = SortBlockPolicy::AltPolicy::RADIX_BITS;</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;            smem_config                 = SortBlockPolicy::SMEM_CONFIG;</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;            this-&gt;subscription_factor   = subscription_factor;</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;            tile_size                   = block_threads * items_per_thread;</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;        }</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;    };</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;</div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;<span class="comment">     * Tuning policies</span></div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Key, <span class="keyword">typename</span> Value, <span class="keyword">typename</span> SizeT, <span class="keywordtype">int</span> ARCH&gt;</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;    <span class="keyword">struct </span>TunedPolicies;</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Key, <span class="keyword">typename</span> Value, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;Key, Value, SizeT, 350&gt;</div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;    {</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;        <span class="keyword">enum</span> {</div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;            KEYS_ONLY       = (<a class="code" href="structcub_1_1_equals.html" title="Type equality test. ">Equals&lt;Value, NullType&gt;::VALUE</a>),</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;            SCALE_FACTOR    = (CUB_MAX(<span class="keyword">sizeof</span>(Key), <span class="keyword">sizeof</span>(Value)) + 3) / 4,</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;            RADIX_BITS      = 5,</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;        };</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;        <span class="comment">// UpsweepPolicy</span></div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortUpsweepTilesPolicy &lt;64,     CUB_MAX(1, 18 / SCALE_FACTOR), <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da0217758d7be24e5fd450d1d49aec36b8" title="Cache as texture. ">LOAD_LDG</a>, RADIX_BITS&gt; UpsweepPolicyKeys;</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortUpsweepTilesPolicy &lt;128,    CUB_MAX(1, 15 / SCALE_FACTOR), <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da0217758d7be24e5fd450d1d49aec36b8" title="Cache as texture. ">LOAD_LDG</a>, RADIX_BITS&gt; UpsweepPolicyPairs;</div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html#af689e9527f56372e66413b65581ded8e" title="Conditional type result. ">If&lt;KEYS_ONLY, UpsweepPolicyKeys, UpsweepPolicyPairs&gt;::Type</a> UpsweepPolicy;</div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;<span class="comment">/*</span></div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;<span class="comment">        // 4bit</span></div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;<span class="comment">        typedef BlockRadixSortUpsweepTilesPolicy &lt;128, 15, LOAD_LDG, RADIX_BITS&gt; UpsweepPolicyKeys;</span></div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;<span class="comment">        typedef BlockRadixSortUpsweepTilesPolicy &lt;256, 13, LOAD_LDG, RADIX_BITS&gt; UpsweepPolicyPairs;</span></div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;<span class="comment">*/</span></div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;        <span class="comment">// ScanPolicy</span></div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;        <span class="keyword">typedef</span> BlockScanTilesPolicy &lt;1024, 4, BLOCK_LOAD_VECTORIZE, false, LOAD_DEFAULT, BLOCK_STORE_VECTORIZE, false, BLOCK_SCAN_RAKING_MEMOIZE&gt; ScanPolicy;</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;        <span class="comment">// DownsweepPolicy</span></div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortDownsweepTilesPolicy &lt;64,   CUB_MAX(1, 18 / SCALE_FACTOR), <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401a2d4d8900d7e697e9dac4062e97d3d835">BLOCK_LOAD_DIRECT</a>, <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da0217758d7be24e5fd450d1d49aec36b8" title="Cache as texture. ">LOAD_LDG</a>, <span class="keyword">false</span>, <span class="keyword">true</span>, <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba7f51e58246eb53f1a97bd1bc8c0f400f">BLOCK_SCAN_WARP_SCANS</a>, RADIX_SORT_SCATTER_TWO_PHASE, cudaSharedMemBankSizeEightByte, RADIX_BITS&gt; DownsweepPolicyKeys;</div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortDownsweepTilesPolicy &lt;128,  CUB_MAX(1, 15 / SCALE_FACTOR), <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401a2d4d8900d7e697e9dac4062e97d3d835">BLOCK_LOAD_DIRECT</a>, <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da0217758d7be24e5fd450d1d49aec36b8" title="Cache as texture. ">LOAD_LDG</a>, <span class="keyword">false</span>, <span class="keyword">true</span>, <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba7f51e58246eb53f1a97bd1bc8c0f400f">BLOCK_SCAN_WARP_SCANS</a>, RADIX_SORT_SCATTER_TWO_PHASE, cudaSharedMemBankSizeEightByte, RADIX_BITS&gt; DownsweepPolicyPairs;</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html#af689e9527f56372e66413b65581ded8e" title="Conditional type result. ">If&lt;KEYS_ONLY, DownsweepPolicyKeys, DownsweepPolicyPairs&gt;::Type</a> DownsweepPolicy;</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;<span class="comment">/*</span></div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;<span class="comment">        // 4bit</span></div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;<span class="comment">        typedef BlockRadixSortDownsweepTilesPolicy &lt;128, 15, BLOCK_LOAD_DIRECT, LOAD_LDG, false, true, BLOCK_SCAN_WARP_SCANS, RADIX_SORT_SCATTER_TWO_PHASE, cudaSharedMemBankSizeEightByte, RADIX_BITS&gt; DownsweepPolicyKeys;</span></div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;<span class="comment">        typedef BlockRadixSortDownsweepTilesPolicy &lt;256, 13, BLOCK_LOAD_DIRECT, LOAD_LDG, false, true, BLOCK_SCAN_WARP_SCANS, RADIX_SORT_SCATTER_TWO_PHASE, cudaSharedMemBankSizeEightByte, RADIX_BITS&gt; DownsweepPolicyPairs;</span></div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;<span class="comment">*/</span></div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 7 };</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;    };</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;</div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Key, <span class="keyword">typename</span> Value, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;Key, Value, SizeT, 200&gt;</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;    {</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;        <span class="keyword">enum</span> {</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;            KEYS_ONLY       = (<a class="code" href="structcub_1_1_equals.html" title="Type equality test. ">Equals&lt;Value, NullType&gt;::VALUE</a>),</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;            SCALE_FACTOR    = (CUB_MAX(<span class="keyword">sizeof</span>(Key), <span class="keyword">sizeof</span>(Value)) + 3) / 4,</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;            RADIX_BITS      = 5,</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;        };</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;        <span class="comment">// UpsweepPolicy</span></div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortUpsweepTilesPolicy &lt;64, CUB_MAX(1, 18 / SCALE_FACTOR), <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55daee682a9988eceaefd9a53a7ef92fe6e2" title="Default (no modifier) ">LOAD_DEFAULT</a>, RADIX_BITS&gt; UpsweepPolicyKeys;</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortUpsweepTilesPolicy &lt;128, CUB_MAX(1, 13 / SCALE_FACTOR), <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55daee682a9988eceaefd9a53a7ef92fe6e2" title="Default (no modifier) ">LOAD_DEFAULT</a>, RADIX_BITS&gt; UpsweepPolicyPairs;</div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html#af689e9527f56372e66413b65581ded8e" title="Conditional type result. ">If&lt;KEYS_ONLY, UpsweepPolicyKeys, UpsweepPolicyPairs&gt;::Type</a> UpsweepPolicy;</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;        <span class="comment">// ScanPolicy</span></div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;        <span class="keyword">typedef</span> BlockScanTilesPolicy &lt;512, 4, BLOCK_LOAD_VECTORIZE, false, LOAD_DEFAULT, BLOCK_STORE_VECTORIZE, false, BLOCK_SCAN_RAKING_MEMOIZE&gt; ScanPolicy;</div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;        <span class="comment">// DownsweepPolicy</span></div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortDownsweepTilesPolicy &lt;64, CUB_MAX(1, 18 / SCALE_FACTOR), <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401aba21066c09e6c6ebcf08c7e86216eb1f">BLOCK_LOAD_WARP_TRANSPOSE</a>, <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55daee682a9988eceaefd9a53a7ef92fe6e2" title="Default (no modifier) ">LOAD_DEFAULT</a>, <span class="keyword">false</span>, <span class="keyword">false</span>, <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba7f51e58246eb53f1a97bd1bc8c0f400f">BLOCK_SCAN_WARP_SCANS</a>, RADIX_SORT_SCATTER_TWO_PHASE, cudaSharedMemBankSizeFourByte, RADIX_BITS&gt; DownsweepPolicyKeys;</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortDownsweepTilesPolicy &lt;128, CUB_MAX(1, 13 / SCALE_FACTOR), <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401aba21066c09e6c6ebcf08c7e86216eb1f">BLOCK_LOAD_WARP_TRANSPOSE</a>, <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55daee682a9988eceaefd9a53a7ef92fe6e2" title="Default (no modifier) ">LOAD_DEFAULT</a>, <span class="keyword">false</span>, <span class="keyword">false</span>, <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23aba7f51e58246eb53f1a97bd1bc8c0f400f">BLOCK_SCAN_WARP_SCANS</a>, RADIX_SORT_SCATTER_TWO_PHASE, cudaSharedMemBankSizeFourByte, RADIX_BITS&gt; DownsweepPolicyPairs;</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html#af689e9527f56372e66413b65581ded8e" title="Conditional type result. ">If&lt;KEYS_ONLY, DownsweepPolicyKeys, DownsweepPolicyPairs&gt;::Type</a> DownsweepPolicy;</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 3 };</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;    };</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Key, <span class="keyword">typename</span> Value, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;Key, Value, SizeT, 100&gt;</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;    {</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;        <span class="keyword">enum</span> {</div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;            RADIX_BITS = 4,</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;        };</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;        <span class="comment">// UpsweepPolicy</span></div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortUpsweepTilesPolicy &lt;64, 9, LOAD_DEFAULT, RADIX_BITS&gt; UpsweepPolicy;</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;        <span class="comment">// ScanPolicy</span></div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;        <span class="keyword">typedef</span> BlockScanTilesPolicy &lt;256, 4, BLOCK_LOAD_VECTORIZE, false, LOAD_DEFAULT, BLOCK_STORE_VECTORIZE, false, BLOCK_SCAN_RAKING_MEMOIZE&gt; ScanPolicy;</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;        <span class="comment">// DownsweepPolicy</span></div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;        <span class="keyword">typedef</span> BlockRadixSortDownsweepTilesPolicy &lt;64, 9, BLOCK_LOAD_WARP_TRANSPOSE, LOAD_DEFAULT, false, false, BLOCK_SCAN_WARP_SCANS, RADIX_SORT_SCATTER_TWO_PHASE, cudaSharedMemBankSizeFourByte, RADIX_BITS&gt; DownsweepPolicy;</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 3 };</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;    };</div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;<span class="comment">     * Default policy initializer</span></div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Key, <span class="keyword">typename</span> Value, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;    <span class="keyword">struct </span>PtxDefaultPolicies</div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;    {</div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;</div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;        <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> PTX_TUNE_ARCH =   (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 350) ?</div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;                                                350 :</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;                                                (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 200) ?</div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;                                                    200 :</div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;                                                    100;</div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;</div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;        <span class="comment">// Tuned policy set for the current PTX compiler pass</span></div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;        <span class="keyword">typedef</span> TunedPolicies&lt;Key, Value, SizeT, PTX_TUNE_ARCH&gt; PtxTunedPolicies;</div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;</div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;        <span class="comment">// UpsweepPolicy that opaquely derives from the specialization corresponding to the current PTX compiler pass</span></div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;        <span class="keyword">struct </span>UpsweepPolicy : PtxTunedPolicies::UpsweepPolicy {};</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;</div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;        <span class="comment">// ScanPolicy that opaquely derives from the specialization corresponding to the current PTX compiler pass</span></div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;        <span class="keyword">struct </span>ScanPolicy : PtxTunedPolicies::ScanPolicy {};</div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;</div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;        <span class="comment">// DownsweepPolicy that opaquely derives from the specialization corresponding to the current PTX compiler pass</span></div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;        <span class="keyword">struct </span>DownsweepPolicy : PtxTunedPolicies::DownsweepPolicy {};</div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;</div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;        <span class="comment">// Subscription factor for the current PTX compiler pass</span></div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = PtxTunedPolicies::SUBSCRIPTION_FACTOR };</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;</div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;        <span class="keyword">static</span> <span class="keywordtype">void</span> InitDispatchParams(</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;            <span class="keywordtype">int</span>                    ptx_version,</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;            KernelDispachParams    &amp;upsweep_dispatch_params,</div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;            KernelDispachParams    &amp;scan_dispatch_params,</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;            KernelDispachParams    &amp;downsweep_dispatch_params)</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;        {</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;            <span class="keywordflow">if</span> (ptx_version &gt;= 350)</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;            {</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;Key, Value, SizeT, 350&gt; TunedPolicies;</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;                upsweep_dispatch_params.InitUpsweepPolicy&lt;<span class="keyword">typename</span> TunedPolicies::UpsweepPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;                scan_dispatch_params.InitScanPolicy&lt;<span class="keyword">typename</span> TunedPolicies::ScanPolicy&gt;();</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;                downsweep_dispatch_params.InitDownsweepPolicy&lt;<span class="keyword">typename</span> TunedPolicies::DownsweepPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;            }</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;            <span class="keywordflow">else</span> <span class="keywordflow">if</span> (ptx_version &gt;= 200)</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;            {</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;Key, Value, SizeT, 200&gt; TunedPolicies;</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;                upsweep_dispatch_params.InitUpsweepPolicy&lt;<span class="keyword">typename</span> TunedPolicies::UpsweepPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;                scan_dispatch_params.InitScanPolicy&lt;<span class="keyword">typename</span> TunedPolicies::ScanPolicy&gt;();</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;                downsweep_dispatch_params.InitDownsweepPolicy&lt;<span class="keyword">typename</span> TunedPolicies::DownsweepPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;            }</div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;            <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;            {</div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;Key, Value, SizeT, 100&gt; TunedPolicies;</div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;                upsweep_dispatch_params.InitUpsweepPolicy&lt;<span class="keyword">typename</span> TunedPolicies::UpsweepPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;                scan_dispatch_params.InitScanPolicy&lt;<span class="keyword">typename</span> TunedPolicies::ScanPolicy&gt;();</div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;                downsweep_dispatch_params.InitDownsweepPolicy&lt;<span class="keyword">typename</span> TunedPolicies::DownsweepPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;            }</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;        }</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;    };</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;        <span class="keyword">typename</span>            UpsweepKernelPtr,                       </div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;        <span class="keyword">typename</span>            SpineKernelPtr,                         </div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;        <span class="keyword">typename</span>            DownsweepKernelPtr,                     </div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;        <span class="keyword">typename</span>            Key,                                    </div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;        <span class="keyword">typename</span>            Value,                                  </div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;        <span class="keyword">typename</span>            SizeT&gt;                                  </div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;    <span class="keyword">static</span> cudaError_t Dispatch(</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                        </div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                    </div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;        UpsweepKernelPtr    upsweep_kernel,                         </div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;        SpineKernelPtr      scan_kernel,                            </div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;        DownsweepKernelPtr  downsweep_kernel,                       </div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;        KernelDispachParams &amp;upsweep_dispatch_params,               </div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;        KernelDispachParams &amp;scan_dispatch_params,                  </div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;        KernelDispachParams &amp;downsweep_dispatch_params,             </div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html" title="Double-buffer storage wrapper for multi-pass stream transformations that require more than one storag...">DoubleBuffer&lt;Key&gt;</a>   &amp;d_keys,                                </div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html" title="Double-buffer storage wrapper for multi-pass stream transformations that require more than one storag...">DoubleBuffer&lt;Value&gt;</a> &amp;d_values,                              </div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;        SizeT               num_items,                              </div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;        <span class="keywordtype">int</span>                 begin_bit           = 0,                </div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;        <span class="keywordtype">int</span>                 end_bit             = <span class="keyword">sizeof</span>(Key) * 8,  </div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;        cudaStream_t        stream              = 0,                </div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)            </div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;    {</div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;<span class="preprocessor">#ifndef CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;        <span class="comment">// Kernel launch not supported from this device</span></div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorNotSupported );</div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;</div>
+<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;        cudaError error = cudaSuccess;</div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;        {</div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;            <span class="comment">// Get device ordinal</span></div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;            <span class="keywordtype">int</span> device_ordinal;</div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaGetDevice(&amp;device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;</div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;            <span class="comment">// Get SM count</span></div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;            <span class="keywordtype">int</span> sm_count;</div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceGetAttribute (&amp;sm_count, cudaDevAttrMultiProcessorCount, device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;</div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;            <span class="comment">// Get a rough estimate of downsweep_kernel SM occupancy based upon the maximum SM occupancy of the targeted PTX architecture</span></div>
+<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;            <span class="keywordtype">int</span> downsweep_sm_occupancy = CUB_MIN(</div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;                <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps&lt;CUB_PTX_ARCH&gt;::MAX_SM_THREADBLOCKS</a>,</div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;                <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps&lt;CUB_PTX_ARCH&gt;::MAX_SM_THREADS</a> / downsweep_dispatch_params.block_threads);</div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;            <span class="keywordtype">int</span> upsweep_sm_occupancy = downsweep_sm_occupancy;</div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;</div>
+<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;<span class="preprocessor"></span>            <span class="comment">// We&#39;re on the host, so come up with more accurate estimates of SM occupancy from actual device properties</span></div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;            <a class="code" href="classcub_1_1_device.html" title="Properties of a given CUDA device and the corresponding PTX bundle. ">Device</a> device_props;</div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = device_props.<a class="code" href="classcub_1_1_device.html#a4c1aecec381d2dce80120362feb2d0ca">Init</a>(device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;</div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = device_props.<a class="code" href="classcub_1_1_device.html#a618bbf36a5737a9b1533ff65834e88e8">MaxSmOccupancy</a>(</div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;                downsweep_sm_occupancy,</div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;                downsweep_kernel,</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;                downsweep_dispatch_params.block_threads))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = device_props.<a class="code" href="classcub_1_1_device.html#a618bbf36a5737a9b1533ff65834e88e8">MaxSmOccupancy</a>(</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;                upsweep_sm_occupancy,</div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;                upsweep_kernel,</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;                upsweep_dispatch_params.block_threads))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;<span class="preprocessor"></span>            <span class="comment">// Get device occupancies</span></div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;            <span class="keywordtype">int</span> downsweep_occupancy = downsweep_sm_occupancy * sm_count;</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;            <span class="comment">// Get even-share work distribution descriptor</span></div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;            GridEvenShare&lt;SizeT&gt; even_share;</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;            <span class="keywordtype">int</span> max_downsweep_grid_size = downsweep_occupancy * downsweep_dispatch_params.subscription_factor;</div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;            <span class="keywordtype">int</span> downsweep_grid_size;</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;            even_share.GridInit(num_items, max_downsweep_grid_size, downsweep_dispatch_params.tile_size);</div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;            downsweep_grid_size = even_share.grid_size;</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;            <span class="comment">// Get number of spine elements (round up to nearest spine scan kernel tile size)</span></div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;            <span class="keywordtype">int</span> bins            = 1 &lt;&lt; downsweep_dispatch_params.radix_bits;</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;            <span class="keywordtype">int</span> spine_size      = downsweep_grid_size * bins;</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;            <span class="keywordtype">int</span> spine_tiles     = (spine_size + scan_dispatch_params.tile_size - 1) / scan_dispatch_params.tile_size;</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;            spine_size          = spine_tiles * scan_dispatch_params.tile_size;</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;</div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;            <span class="keywordtype">int</span> alt_bins            = 1 &lt;&lt; downsweep_dispatch_params.alt_radix_bits;</div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;            <span class="keywordtype">int</span> alt_spine_size      = downsweep_grid_size * alt_bins;</div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;            <span class="keywordtype">int</span> alt_spine_tiles     = (alt_spine_size + scan_dispatch_params.tile_size - 1) / scan_dispatch_params.tile_size;</div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;            alt_spine_size          = alt_spine_tiles * scan_dispatch_params.tile_size;</div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;            <span class="comment">// Temporary storage allocation requirements</span></div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;            <span class="keywordtype">void</span>* allocations[1];</div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;            <span class="keywordtype">size_t</span> allocation_sizes[1] =</div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;            {</div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;                spine_size * <span class="keyword">sizeof</span>(SizeT),    <span class="comment">// bytes needed for privatized block digit histograms</span></div>
+<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;            };</div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;            <span class="comment">// Alias temporaries (or set the necessary size of the storage allocation)</span></div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = AliasTemporaries(d_temp_storage, temp_storage_bytes, allocations, allocation_sizes))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;            <span class="comment">// Return if the caller is simply requesting the size of the storage allocation</span></div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;            <span class="keywordflow">if</span> (d_temp_storage == NULL)</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;                <span class="keywordflow">return</span> cudaSuccess;</div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;            <span class="comment">// Privatized per-block digit histograms</span></div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;            SizeT *d_spine = (SizeT*) allocations[0];</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;<span class="preprocessor"></span>            <span class="comment">// Get current smem bank configuration</span></div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;            cudaSharedMemConfig original_smem_config;</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceGetSharedMemConfig(&amp;original_smem_config))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;            cudaSharedMemConfig current_smem_config = original_smem_config;</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;<span class="preprocessor"></span>            <span class="comment">// Iterate over digit places</span></div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;            <span class="keywordtype">int</span> current_bit = begin_bit;</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;            <span class="keywordflow">while</span> (current_bit &lt; end_bit)</div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;            {</div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;                <span class="comment">// Use primary bit granularity if bits remaining is a whole multiple of bit primary granularity</span></div>
+<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;                <span class="keywordtype">int</span> bits_remaining = end_bit - current_bit;</div>
+<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;                <span class="keywordtype">bool</span> use_primary_bit_granularity = (bits_remaining % downsweep_dispatch_params.radix_bits == 0);</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;                <span class="keywordtype">int</span> radix_bits = (use_primary_bit_granularity) ?</div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;                    downsweep_dispatch_params.radix_bits :</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;                    downsweep_dispatch_params.alt_radix_bits;</div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;</div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;#ifndef __CUDA_ARCH__</div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;                <span class="comment">// Update smem config if necessary</span></div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;                if (current_smem_config != upsweep_dispatch_params.smem_config)</div>
+<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;                {</div>
+<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;                    <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceSetSharedMemConfig(upsweep_dispatch_params.smem_config))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;                    current_smem_config = upsweep_dispatch_params.smem_config;</div>
+<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;                }</div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;                <span class="comment">// Log upsweep_kernel configuration</span></div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous)</div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;                    <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking upsweep_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;(), %d smem config, %d items per thread, %d SM occupancy, selector %d, current bit %d, bit_grain %d\n&quot;</span>,</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;                    downsweep_grid_size, upsweep_dispatch_params.block_threads, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream, upsweep_dispatch_params.smem_config, upsweep_dispatch_params.items_per_thread, upsweep_sm_occupancy, d_keys.<a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a>, current_bit, radix_bits);</div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;</div>
+<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;                <span class="comment">// Invoke upsweep_kernel with same grid size as downsweep_kernel</span></div>
+<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;                upsweep_kernel&lt;&lt;&lt;downsweep_grid_size, upsweep_dispatch_params.block_threads, 0, stream&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;                    d_keys.<a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[d_keys.<a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a>],</div>
+<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;                    d_spine,</div>
+<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;                    num_items,</div>
+<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;                    current_bit,</div>
+<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;                    use_primary_bit_granularity,</div>
+<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;                    (current_bit == begin_bit),</div>
+<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;                    even_share);</div>
+<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;</div>
+<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;                <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;</div>
+<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;                <span class="comment">// Log scan_kernel configuration</span></div>
+<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking scan_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;(), %d items per thread\n&quot;</span>,</div>
+<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;                    1, scan_dispatch_params.block_threads, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream, scan_dispatch_params.items_per_thread);</div>
+<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;</div>
+<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;                <span class="comment">// Invoke scan_kernel</span></div>
+<div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;                scan_kernel&lt;&lt;&lt;1, scan_dispatch_params.block_threads, 0, stream&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;                    d_spine,</div>
+<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;                    (use_primary_bit_granularity) ? spine_size : alt_spine_size);</div>
+<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;</div>
+<div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;                <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;</div>
+<div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;<span class="preprocessor"></span>                <span class="comment">// Update smem config if necessary</span></div>
+<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;                <span class="keywordflow">if</span> (current_smem_config != downsweep_dispatch_params.smem_config)</div>
+<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;                {</div>
+<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;                    <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceSetSharedMemConfig(downsweep_dispatch_params.smem_config))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;                    current_smem_config = downsweep_dispatch_params.smem_config;</div>
+<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;                }</div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;                <span class="comment">// Log downsweep_kernel configuration</span></div>
+<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking downsweep_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;(), %d smem config, %d items per thread, %d SM occupancy\n&quot;</span>,</div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;                    downsweep_grid_size, downsweep_dispatch_params.block_threads, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream, downsweep_dispatch_params.smem_config, downsweep_dispatch_params.items_per_thread, downsweep_sm_occupancy);</div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;                <span class="comment">// Invoke downsweep_kernel</span></div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;                downsweep_kernel&lt;&lt;&lt;downsweep_grid_size, downsweep_dispatch_params.block_threads, 0, stream&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;                    d_keys.<a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[d_keys.<a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a>],</div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;                    d_keys.<a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[d_keys.<a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a> ^ 1],</div>
+<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;                    d_values.<a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[d_values.<a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a>],</div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;                    d_values.<a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[d_values.<a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a> ^ 1],</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;                    d_spine,</div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;                    num_items,</div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;                    current_bit,</div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;                    use_primary_bit_granularity,</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;                    (current_bit == begin_bit),</div>
+<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;                    (current_bit + downsweep_dispatch_params.radix_bits &gt;= end_bit),</div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;                    even_share);</div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;</div>
+<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;                <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;</div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;                <span class="comment">// Invert selectors</span></div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;                d_keys.<a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a> ^= 1;</div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;                d_values.<a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a> ^= 1;</div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;</div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;                <span class="comment">// Update current bit position</span></div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;                current_bit += radix_bits;</div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;            }</div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;</div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;<span class="preprocessor"></span>            <span class="comment">// Reset smem config if necessary</span></div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;            <span class="keywordflow">if</span> (current_smem_config != original_smem_config)</div>
+<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;            {</div>
+<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceSetSharedMemConfig(original_smem_config))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;            }</div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;        }</div>
+<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;</div>
+<div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;</div>
+<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;<span class="preprocessor">#endif // CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;</div>
+<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;</div>
+<div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;</div>
+<div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;<span class="preprocessor">    #endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;<span class="comment">     * Interface</span></div>
+<div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;</div>
+<div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;</div>
+<div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00756"></a><span class="lineno">  756</span>&#160;        <span class="keyword">typename</span>            Key,</div>
+<div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;        <span class="keyword">typename</span>            Value&gt;</div>
+<div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00759"></a><span class="lineno"><a class="code" href="structcub_1_1_device_radix_sort.html#ad42b50b38c4296c371572efdedd49fed">  759</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_radix_sort.html#ad42b50b38c4296c371572efdedd49fed" title="Sorts key-value pairs. ">SortPairs</a>(</div>
+<div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                        </div>
+<div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                    </div>
+<div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html" title="Double-buffer storage wrapper for multi-pass stream transformations that require more than one storag...">DoubleBuffer&lt;Key&gt;</a>   &amp;d_keys,                                </div>
+<div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html" title="Double-buffer storage wrapper for multi-pass stream transformations that require more than one storag...">DoubleBuffer&lt;Value&gt;</a> &amp;d_values,                              </div>
+<div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160;        <span class="keywordtype">int</span>                 num_items,                              </div>
+<div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;        <span class="keywordtype">int</span>                 begin_bit           = 0,                </div>
+<div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;        <span class="keywordtype">int</span>                 end_bit             = <span class="keyword">sizeof</span>(Key) * 8,  </div>
+<div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;        cudaStream_t        stream              = 0,                </div>
+<div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)            </div>
+<div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;    {</div>
+<div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;        <span class="comment">// Type used for array indexing</span></div>
+<div class="line"><a name="l00771"></a><span class="lineno">  771</span>&#160;        <span class="keyword">typedef</span> <span class="keywordtype">int</span> SizeT;</div>
+<div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;</div>
+<div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;        <span class="comment">// Tuning polices</span></div>
+<div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;        <span class="keyword">typedef</span> PtxDefaultPolicies&lt;Key, Value, SizeT&gt;           PtxDefaultPolicies; <span class="comment">// Wrapper of default kernel policies</span></div>
+<div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> PtxDefaultPolicies::UpsweepPolicy      UpsweepPolicy;      <span class="comment">// Upsweep kernel policy</span></div>
+<div class="line"><a name="l00776"></a><span class="lineno">  776</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> PtxDefaultPolicies::ScanPolicy         ScanPolicy;         <span class="comment">// Scan kernel policy</span></div>
+<div class="line"><a name="l00777"></a><span class="lineno">  777</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> PtxDefaultPolicies::DownsweepPolicy    DownsweepPolicy;    <span class="comment">// Downsweep kernel policy</span></div>
+<div class="line"><a name="l00778"></a><span class="lineno">  778</span>&#160;</div>
+<div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;        cudaError error = cudaSuccess;</div>
+<div class="line"><a name="l00780"></a><span class="lineno">  780</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;        {</div>
+<div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160;            <span class="comment">// Declare dispatch parameters</span></div>
+<div class="line"><a name="l00783"></a><span class="lineno">  783</span>&#160;            KernelDispachParams upsweep_dispatch_params;</div>
+<div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;            KernelDispachParams scan_dispatch_params;</div>
+<div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160;            KernelDispachParams downsweep_dispatch_params;</div>
+<div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;</div>
+<div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;<span class="preprocessor">#ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;<span class="preprocessor"></span>            <span class="comment">// We&#39;re on the device, so initialize the dispatch parameters with the PtxDefaultPolicies directly</span></div>
+<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;            upsweep_dispatch_params.InitUpsweepPolicy&lt;UpsweepPolicy&gt;(PtxDefaultPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;            scan_dispatch_params.InitScanPolicy&lt;ScanPolicy&gt;();</div>
+<div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160;            downsweep_dispatch_params.InitDownsweepPolicy&lt;DownsweepPolicy&gt;(PtxDefaultPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00793"></a><span class="lineno">  793</span>&#160;<span class="preprocessor"></span>            <span class="comment">// We&#39;re on the host, so lookup and initialize the dispatch parameters with the policies that match the device&#39;s PTX version</span></div>
+<div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;            <span class="keywordtype">int</span> ptx_version;</div>
+<div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(ptx_version))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;            PtxDefaultPolicies::InitDispatchParams(</div>
+<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;                ptx_version,</div>
+<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;                upsweep_dispatch_params,</div>
+<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;                scan_dispatch_params,</div>
+<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;                downsweep_dispatch_params);</div>
+<div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00802"></a><span class="lineno">  802</span>&#160;<span class="preprocessor"></span>            <span class="comment">// Dispatch</span></div>
+<div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = Dispatch(</div>
+<div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160;                d_temp_storage,</div>
+<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;                temp_storage_bytes,</div>
+<div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;                RadixSortUpsweepKernel&lt;UpsweepPolicy, Key, SizeT&gt;,</div>
+<div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;                RadixSortScanKernel&lt;ScanPolicy, SizeT&gt;,</div>
+<div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;                RadixSortDownsweepKernel&lt;DownsweepPolicy, Key, Value, SizeT&gt;,</div>
+<div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;                upsweep_dispatch_params,</div>
+<div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;                scan_dispatch_params,</div>
+<div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;                downsweep_dispatch_params,</div>
+<div class="line"><a name="l00812"></a><span class="lineno">  812</span>&#160;                d_keys,</div>
+<div class="line"><a name="l00813"></a><span class="lineno">  813</span>&#160;                d_values,</div>
+<div class="line"><a name="l00814"></a><span class="lineno">  814</span>&#160;                num_items,</div>
+<div class="line"><a name="l00815"></a><span class="lineno">  815</span>&#160;                begin_bit,</div>
+<div class="line"><a name="l00816"></a><span class="lineno">  816</span>&#160;                end_bit,</div>
+<div class="line"><a name="l00817"></a><span class="lineno">  817</span>&#160;                stream,</div>
+<div class="line"><a name="l00818"></a><span class="lineno">  818</span>&#160;                stream_synchronous))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00819"></a><span class="lineno">  819</span>&#160;        }</div>
+<div class="line"><a name="l00820"></a><span class="lineno">  820</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00821"></a><span class="lineno">  821</span>&#160;</div>
+<div class="line"><a name="l00822"></a><span class="lineno">  822</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00823"></a><span class="lineno">  823</span>&#160;    }</div>
+<div class="line"><a name="l00824"></a><span class="lineno">  824</span>&#160;</div>
+<div class="line"><a name="l00825"></a><span class="lineno">  825</span>&#160;</div>
+<div class="line"><a name="l00868"></a><span class="lineno">  868</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> Key&gt;</div>
+<div class="line"><a name="l00869"></a><span class="lineno">  869</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00870"></a><span class="lineno"><a class="code" href="structcub_1_1_device_radix_sort.html#aafc81e527c3fe142b482ed59835fd0d3">  870</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_radix_sort.html#aafc81e527c3fe142b482ed59835fd0d3" title="Sorts keys. ">SortKeys</a>(</div>
+<div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                        </div>
+<div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                    </div>
+<div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html" title="Double-buffer storage wrapper for multi-pass stream transformations that require more than one storag...">DoubleBuffer&lt;Key&gt;</a>   &amp;d_keys,                                </div>
+<div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;        <span class="keywordtype">int</span>                 num_items,                              </div>
+<div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;        <span class="keywordtype">int</span>                 begin_bit           = 0,                </div>
+<div class="line"><a name="l00876"></a><span class="lineno">  876</span>&#160;        <span class="keywordtype">int</span>                 end_bit             = <span class="keyword">sizeof</span>(Key) * 8,  </div>
+<div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160;        cudaStream_t        stream              = 0,                </div>
+<div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)            </div>
+<div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160;    {</div>
+<div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html" title="Double-buffer storage wrapper for multi-pass stream transformations that require more than one storag...">DoubleBuffer&lt;NullType&gt;</a> d_values;</div>
+<div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="structcub_1_1_device_radix_sort.html#ad42b50b38c4296c371572efdedd49fed" title="Sorts key-value pairs. ">SortPairs</a>(d_temp_storage, temp_storage_bytes, d_keys, d_values, num_items, begin_bit, end_bit, stream, stream_synchronous);</div>
+<div class="line"><a name="l00882"></a><span class="lineno">  882</span>&#160;    }</div>
+<div class="line"><a name="l00883"></a><span class="lineno">  883</span>&#160;</div>
+<div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;};</div>
+<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;</div>
+<div class="line"><a name="l00886"></a><span class="lineno">  886</span>&#160;</div>
+<div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00888"></a><span class="lineno">  888</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l00889"></a><span class="lineno">  889</span>&#160;</div>
+<div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/device__reduce_8cuh_source.html b/docs/html/device__reduce_8cuh_source.html
new file mode 100644
index 0000000000..872040822c
--- /dev/null
+++ b/docs/html/device__reduce_8cuh_source.html
@@ -0,0 +1,765 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: device_reduce.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_18fc672d63781b5a743137aee24ff656.html">device</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">device_reduce.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="device__reduce_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;</div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;stdio.h&gt;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;iterator&gt;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;block/block_reduce_tiles.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;../thread/thread_operators.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;../grid/grid_even_share.cuh&quot;</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;../grid/grid_queue.cuh&quot;</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &quot;../util_debug.cuh&quot;</span></div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &quot;../util_device.cuh&quot;</span></div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;<span class="comment"> * Kernel entry points</span></div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keyword">typename</span>                BlockReduceTilesPolicy, </div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    <span class="keyword">typename</span>                InputIteratorRA,        </div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <span class="keyword">typename</span>                OutputIteratorRA,       </div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    <span class="keyword">typename</span>                SizeT,                  </div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    <span class="keyword">typename</span>                ReductionOp&gt;            </div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;__launch_bounds__ (<span class="keywordtype">int</span>(BlockReduceTilesPolicy::BLOCK_THREADS), 1)</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;__global__ <span class="keywordtype">void</span> ReducePrivatizedKernel(</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    InputIteratorRA         d_in,                   </div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    OutputIteratorRA        d_out,                  </div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    SizeT                   num_items,              </div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    GridEvenShare&lt;SizeT&gt;    even_share,             </div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    GridQueue&lt;SizeT&gt;        queue,                  </div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    ReductionOp             reduction_op)           </div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;{</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    <span class="comment">// Data type</span></div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type T;</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <span class="comment">// Thread block type for reducing input tiles</span></div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    <span class="keyword">typedef</span> BlockReduceTiles&lt;BlockReduceTilesPolicy, InputIteratorRA, SizeT, ReductionOp&gt; BlockReduceTilesT;</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    <span class="comment">// Block-wide aggregate</span></div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    T block_aggregate;</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;    <span class="comment">// Shared memory storage</span></div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    __shared__ <span class="keyword">typename</span> BlockReduceTilesT::TempStorage temp_storage;</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    <span class="comment">// Consume input tiles</span></div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    BlockReduceTilesT(temp_storage, d_in, reduction_op).ConsumeTiles(</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;        num_items,</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;        even_share,</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;        queue,</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;        block_aggregate,</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;        Int2Type&lt;BlockReduceTilesPolicy::GRID_MAPPING&gt;());</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="comment">// Output result</span></div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="keywordflow">if</span> (threadIdx.x == 0)</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    {</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;        d_out[blockIdx.x] = block_aggregate;</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    }</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;}</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    <span class="keyword">typename</span>                BlockReduceTilesPolicy,  </div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    <span class="keyword">typename</span>                InputIteratorRA,        </div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keyword">typename</span>                OutputIteratorRA,       </div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;    <span class="keyword">typename</span>                SizeT,                  </div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    <span class="keyword">typename</span>                ReductionOp&gt;            </div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;__launch_bounds__ (<span class="keywordtype">int</span>(BlockReduceTilesPolicy::BLOCK_THREADS), 1)</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;__global__ <span class="keywordtype">void</span> ReduceSingleKernel(</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    InputIteratorRA         d_in,                   </div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    OutputIteratorRA        d_out,                  </div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    SizeT                   num_items,              </div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    ReductionOp             reduction_op)           </div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;{</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <span class="comment">// Data type</span></div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type T;</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <span class="comment">// Thread block type for reducing input tiles</span></div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    <span class="keyword">typedef</span> BlockReduceTiles&lt;BlockReduceTilesPolicy, InputIteratorRA, SizeT, ReductionOp&gt; BlockReduceTilesT;</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="comment">// Block-wide aggregate</span></div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    T block_aggregate;</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <span class="comment">// Shared memory storage</span></div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    __shared__ <span class="keyword">typename</span> BlockReduceTilesT::TempStorage temp_storage;</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="comment">// Consume input tiles</span></div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    BlockReduceTilesT(temp_storage, d_in, reduction_op).ConsumeTiles(</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;        SizeT(0),</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;        SizeT(num_items),</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;        block_aggregate);</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="comment">// Output result</span></div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keywordflow">if</span> (threadIdx.x == 0)</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    {</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;        d_out[blockIdx.x] = block_aggregate;</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    }</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;}</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="comment"> * DeviceReduce</span></div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;</div>
+<div class="line"><a name="l00175"></a><span class="lineno"><a class="code" href="structcub_1_1_device_reduce.html">  175</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_device_reduce.html" title="DeviceReduce provides operations for computing a device-wide, parallel reduction across data items re...">DeviceReduce</a></div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;{</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;<span class="comment">     * Constants and typedefs</span></div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    <span class="keyword">struct </span>KernelDispachParams</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    {</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;        <span class="keywordtype">int</span>                     block_threads;</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;        <span class="keywordtype">int</span>                     items_per_thread;</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;        <span class="keywordtype">int</span>                     vector_load_length;</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;        <a class="code" href="namespacecub.html#add0251c713859b8974806079e498d10a">BlockReduceAlgorithm</a>    block_algorithm;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;        <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a>         load_modifier;</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;        GridMappingStrategy     grid_mapping;</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        <span class="keywordtype">int</span>                     subscription_factor;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;        <span class="keywordtype">int</span>                     tile_size;</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;        <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BlockPolicy&gt;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;        __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;        <span class="keywordtype">void</span> Init(<span class="keywordtype">int</span> subscription_factor = 1)</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;        {</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;            block_threads               = BlockPolicy::BLOCK_THREADS;</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;            items_per_thread            = BlockPolicy::ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;            vector_load_length          = BlockPolicy::VECTOR_LOAD_LENGTH;</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;            block_algorithm             = BlockPolicy::BLOCK_ALGORITHM;</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;            load_modifier               = BlockPolicy::LOAD_MODIFIER;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;            grid_mapping                = BlockPolicy::GRID_MAPPING;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;            this-&gt;subscription_factor   = subscription_factor;</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;            tile_size                   = block_threads * items_per_thread;</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;        }</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;        __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;        <span class="keywordtype">void</span> Print()</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;        {</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;            printf(<span class="stringliteral">&quot;%d threads, %d per thread, %d veclen, %d algo, %d loadmod, %d mapping, %d subscription&quot;</span>,</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;                block_threads,</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;                items_per_thread,</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;                vector_load_length,</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;                block_algorithm,</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;                load_modifier,</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;                grid_mapping,</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;                subscription_factor);</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;        }</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    };</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;<span class="comment">     * Tuning policies</span></div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;        <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;        <span class="keyword">typename</span>    SizeT,</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;        <span class="keywordtype">int</span>         ARCH&gt;</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;    <span class="keyword">struct </span>TunedPolicies;</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;T, SizeT, 350&gt;</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;    {</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;        <span class="comment">// PrivatizedPolicy (1B): GTX Titan: 206.0 GB/s @ 192M 1B items</span></div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;128, 12,  1, BLOCK_REDUCE_RAKING, LOAD_LDG, GRID_MAPPING_DYNAMIC&gt;                PrivatizedPolicy1B;</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;</div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;        <span class="comment">// PrivatizedPolicy (4B): GTX Titan: 254.2 GB/s @ 48M 4B items</span></div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;512, 20,  1, BLOCK_REDUCE_RAKING, LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;         PrivatizedPolicy4B;</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;        <span class="comment">// PrivatizedPolicy</span></div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html" title="Type selection (IF ? ThenType : ElseType) ">If</a>&lt;(<span class="keyword">sizeof</span>(T) &lt; 4),</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;            PrivatizedPolicy1B,</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;            PrivatizedPolicy4B&gt;::Type PrivatizedPolicy;</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;        <span class="comment">// SinglePolicy</span></div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;256, 8, 1, BLOCK_REDUCE_WARP_REDUCTIONS, LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;  SinglePolicy;</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 7 };</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;    };</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;T, SizeT, 300&gt;</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    {</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;        <span class="comment">// PrivatizedPolicy: GTX670: 154.0 @ 48M 32-bit T</span></div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;256, 2,  1, BLOCK_REDUCE_WARP_REDUCTIONS,  LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;    PrivatizedPolicy;</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;        <span class="comment">// SinglePolicy</span></div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;256, 24, 4, BLOCK_REDUCE_WARP_REDUCTIONS,  LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;    SinglePolicy;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 1 };</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;    };</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;T, SizeT, 200&gt;</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    {</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;        <span class="comment">// PrivatizedPolicy (1B): GTX 580: 158.1 GB/s @ 192M 1B items</span></div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;192, 24,  4, BLOCK_REDUCE_RAKING, LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;            PrivatizedPolicy1B;</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;        <span class="comment">// PrivatizedPolicy (4B): GTX 580: 178.9 GB/s @ 48M 4B items</span></div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;128, 8,  4, BLOCK_REDUCE_RAKING, LOAD_DEFAULT, GRID_MAPPING_DYNAMIC&gt;                PrivatizedPolicy4B;</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;        <span class="comment">// PrivatizedPolicy</span></div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html" title="Type selection (IF ? ThenType : ElseType) ">If</a>&lt;(<span class="keyword">sizeof</span>(T) &lt; 4),</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;            PrivatizedPolicy1B,</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;            PrivatizedPolicy4B&gt;::Type PrivatizedPolicy;</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;        <span class="comment">// SinglePolicy</span></div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;192, 7,  1, BLOCK_REDUCE_RAKING, LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;             SinglePolicy;</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 2 };</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    };</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;T, SizeT, 130&gt;</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;    {</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;        <span class="comment">// PrivatizedPolicy</span></div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;128, 8,  2,  BLOCK_REDUCE_RAKING, LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;            PrivatizedPolicy;</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;        <span class="comment">// SinglePolicy</span></div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;32,  4,  4,  BLOCK_REDUCE_RAKING, LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;            SinglePolicy;</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 1 };</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;    };</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;T, SizeT, 100&gt;</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;    {</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        <span class="comment">// PrivatizedPolicy</span></div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;128, 8,  2,  BLOCK_REDUCE_RAKING, LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;            PrivatizedPolicy;</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;</div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;        <span class="comment">// SinglePolicy</span></div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;        <span class="keyword">typedef</span> BlockReduceTilesPolicy&lt;32,  4,  4,  BLOCK_REDUCE_RAKING, LOAD_DEFAULT, GRID_MAPPING_EVEN_SHARE&gt;            SinglePolicy;</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;        <span class="keyword">enum</span> { SUBSCRIPTION_FACTOR = 1 };</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;    };</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;<span class="comment">     * Default policy initializer</span></div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;    <span class="keyword">struct </span>PtxDefaultPolicies</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;    {</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;        <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> PTX_TUNE_ARCH =   (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 350) ?</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;                                                350 :</div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;                                                (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 300) ?</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;                                                    300 :</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;                                                    (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 200) ?</div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;                                                        200 :</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;                                                        (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 130) ?</div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;                                                            130 :</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;                                                            100;</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;        <span class="comment">// Tuned policy set for the current PTX compiler pass</span></div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;        <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, PTX_TUNE_ARCH&gt; PtxTunedPolicies;</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;        <span class="comment">// Subscription factor for the current PTX compiler pass</span></div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;        <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> SUBSCRIPTION_FACTOR = PtxTunedPolicies::SUBSCRIPTION_FACTOR;</div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;</div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;        <span class="comment">// PrivatizedPolicy that opaquely derives from the specialization corresponding to the current PTX compiler pass</span></div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;        <span class="keyword">struct </span>PrivatizedPolicy : PtxTunedPolicies::PrivatizedPolicy {};</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;        <span class="comment">// SinglePolicy that opaquely derives from the specialization corresponding to the current PTX compiler pass</span></div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;        <span class="keyword">struct </span>SinglePolicy : PtxTunedPolicies::SinglePolicy {};</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;</div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;        <span class="keyword">static</span> <span class="keywordtype">void</span> InitDispatchParams(</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;            <span class="keywordtype">int</span>                    ptx_version,</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;            KernelDispachParams    &amp;privatized_dispatch_params,</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;            KernelDispachParams    &amp;single_dispatch_params)</div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;        {</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;            <span class="keywordflow">if</span> (ptx_version &gt;= 350)</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;            {</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, 350&gt; TunedPolicies;</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;                privatized_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::PrivatizedPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;                single_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::SinglePolicy &gt;();</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;            }</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;            <span class="keywordflow">else</span> <span class="keywordflow">if</span> (ptx_version &gt;= 300)</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;            {</div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, 300&gt; TunedPolicies;</div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;                privatized_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::PrivatizedPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;                single_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::SinglePolicy &gt;();</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;            }</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;            <span class="keywordflow">else</span> <span class="keywordflow">if</span> (ptx_version &gt;= 200)</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;            {</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, 200&gt; TunedPolicies;</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;                privatized_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::PrivatizedPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;                single_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::SinglePolicy &gt;();</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;            }</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;            <span class="keywordflow">else</span> <span class="keywordflow">if</span> (ptx_version &gt;= 130)</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;            {</div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, 130&gt; TunedPolicies;</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;                privatized_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::PrivatizedPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;                single_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::SinglePolicy &gt;();</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;            }</div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;            <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;            {</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, 100&gt; TunedPolicies;</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;                privatized_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::PrivatizedPolicy&gt;(TunedPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;                single_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::SinglePolicy &gt;();</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;            }</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;        }</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;    };</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;        <span class="keyword">typename</span>                    ReducePrivatizedKernelPtr,          </div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;        <span class="keyword">typename</span>                    ReduceSingleKernelPtr,              </div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;        <span class="keyword">typename</span>                    ResetDrainKernelPtr,                </div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;        <span class="keyword">typename</span>                    InputIteratorRA,                    </div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;        <span class="keyword">typename</span>                    OutputIteratorRA,                   </div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;        <span class="keyword">typename</span>                    SizeT,                              </div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;        <span class="keyword">typename</span>                    ReductionOp&gt;                        </div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;    <span class="keyword">static</span> cudaError_t Dispatch(</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;        <span class="keywordtype">void</span>                        *d_temp_storage,                    </div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;        <span class="keywordtype">size_t</span>                      &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;        ReducePrivatizedKernelPtr   privatized_kernel,                  </div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;        ReduceSingleKernelPtr       single_kernel,                      </div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;        ResetDrainKernelPtr         prepare_drain_kernel,               </div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;        KernelDispachParams         &amp;privatized_dispatch_params,        </div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;        KernelDispachParams         &amp;single_dispatch_params,            </div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;        InputIteratorRA             d_in,                               </div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;        OutputIteratorRA            d_out,                              </div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;        SizeT                       num_items,                          </div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;        ReductionOp                 reduction_op,                       </div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;        cudaStream_t                stream              = 0,            </div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;        <span class="keywordtype">bool</span>                        stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;    {</div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;<span class="preprocessor">#ifndef CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;        <span class="comment">// Kernel launch not supported from this device</span></div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorNotSupported );</div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;</div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;        <span class="comment">// Data type of input iterator</span></div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type T;</div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;        cudaError error = cudaSuccess;</div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;        {</div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;            <span class="keywordflow">if</span> ((privatized_kernel == NULL) || (num_items &lt;= (single_dispatch_params.tile_size)))</div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;            {</div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;                <span class="comment">// Dispatch a single-block reduction kernel</span></div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;</div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;                <span class="comment">// Return if the caller is simply requesting the size of the storage allocation</span></div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;                <span class="keywordflow">if</span> (d_temp_storage == NULL)</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;                {</div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;                    temp_storage_bytes = 1;</div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;                    <span class="keywordflow">return</span> cudaSuccess;</div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;                }</div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;                <span class="comment">// Log single_kernel configuration</span></div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking ReduceSingle&lt;&lt;&lt;1, %d, 0, %lld&gt;&gt;&gt;(), %d items per thread\n&quot;</span>,</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;                    single_dispatch_params.block_threads, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream, single_dispatch_params.items_per_thread);</div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;                <span class="comment">// Invoke single_kernel</span></div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;                single_kernel&lt;&lt;&lt;1, single_dispatch_params.block_threads&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;                    d_in,</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;                    d_out,</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;                    num_items,</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;                    reduction_op);</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;                <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;            }</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;            <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;            {</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;                <span class="comment">// Dispatch two kernels: a multi-block kernel to compute</span></div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;                <span class="comment">// privatized per-block reductions, and then a single-block</span></div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;                <span class="comment">// to reduce those</span></div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;                <span class="comment">// Get device ordinal</span></div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;                <span class="keywordtype">int</span> device_ordinal;</div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaGetDevice(&amp;device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;</div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;                <span class="comment">// Get SM count</span></div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;                <span class="keywordtype">int</span> sm_count;</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceGetAttribute (&amp;sm_count, cudaDevAttrMultiProcessorCount, device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;                <span class="comment">// Get a rough estimate of privatized_kernel SM occupancy based upon the maximum SM occupancy of the targeted PTX architecture</span></div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;                <span class="keywordtype">int</span> privatized_sm_occupancy = CUB_MIN(</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;                    <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps&lt;CUB_PTX_ARCH&gt;::MAX_SM_THREADBLOCKS</a>,</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;                    <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps&lt;CUB_PTX_ARCH&gt;::MAX_SM_THREADS</a> / privatized_dispatch_params.block_threads);</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;<span class="preprocessor"></span>                <span class="comment">// We&#39;re on the host, so come up with a more accurate estimate of privatized_kernel SM occupancy from actual device properties</span></div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;                <a class="code" href="classcub_1_1_device.html" title="Properties of a given CUDA device and the corresponding PTX bundle. ">Device</a> device_props;</div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = device_props.<a class="code" href="classcub_1_1_device.html#a4c1aecec381d2dce80120362feb2d0ca">Init</a>(device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = device_props.<a class="code" href="classcub_1_1_device.html#a618bbf36a5737a9b1533ff65834e88e8">MaxSmOccupancy</a>(</div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;                    privatized_sm_occupancy,</div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;                    privatized_kernel,</div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;                    privatized_dispatch_params.block_threads))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;                <span class="comment">// Get device occupancy for privatized_kernel</span></div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;                <span class="keywordtype">int</span> privatized_occupancy = privatized_sm_occupancy * sm_count;</div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;                <span class="comment">// Even-share work distribution</span></div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;                GridEvenShare&lt;SizeT&gt; even_share;</div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;</div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;                <span class="comment">// Get grid size for privatized_kernel</span></div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;                <span class="keywordtype">int</span> privatized_grid_size;</div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;                <span class="keywordflow">switch</span> (privatized_dispatch_params.grid_mapping)</div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;                {</div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;                <span class="keywordflow">case</span> GRID_MAPPING_EVEN_SHARE:</div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;</div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;                    <span class="comment">// Work is distributed evenly</span></div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;                    even_share.GridInit(</div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;                        num_items,</div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;                        privatized_occupancy * privatized_dispatch_params.subscription_factor,</div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;                        privatized_dispatch_params.tile_size);</div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;                    privatized_grid_size = even_share.grid_size;</div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;                    <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;</div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;                <span class="keywordflow">case</span> GRID_MAPPING_DYNAMIC:</div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;</div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;                    <span class="comment">// Work is distributed dynamically</span></div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;                    <span class="keywordtype">int</span> num_tiles = (num_items + privatized_dispatch_params.tile_size - 1) / privatized_dispatch_params.tile_size;</div>
+<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;                    privatized_grid_size   = (num_tiles &lt; privatized_occupancy) ?</div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;                        num_tiles :                 <span class="comment">// Not enough to fill the device with threadblocks</span></div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;                        privatized_occupancy;      <span class="comment">// Fill the device with threadblocks</span></div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;                    <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;                };</div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;</div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;                <span class="comment">// Temporary storage allocation requirements</span></div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;                <span class="keywordtype">void</span>* allocations[2];</div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;                <span class="keywordtype">size_t</span> allocation_sizes[2] =</div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;                {</div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;                    privatized_grid_size * <span class="keyword">sizeof</span>(T),      <span class="comment">// bytes needed for privatized block reductions</span></div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;                    GridQueue&lt;int&gt;::AllocationSize()        <span class="comment">// bytes needed for grid queue descriptor</span></div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;                };</div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;</div>
+<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;                <span class="comment">// Alias temporaries (or set the necessary size of the storage allocation)</span></div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = AliasTemporaries(d_temp_storage, temp_storage_bytes, allocations, allocation_sizes))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;</div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;                <span class="comment">// Return if the caller is simply requesting the size of the storage allocation</span></div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;                <span class="keywordflow">if</span> (d_temp_storage == NULL)</div>
+<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;                    <span class="keywordflow">return</span> cudaSuccess;</div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;</div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;                <span class="comment">// Privatized per-block reductions</span></div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;                T *d_block_reductions = (T*) allocations[0];</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;</div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;                <span class="comment">// Grid queue descriptor</span></div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;                GridQueue&lt;SizeT&gt; queue(allocations[1]);</div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;                <span class="comment">// Prepare the dynamic queue descriptor if necessary</span></div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;                <span class="keywordflow">if</span> (privatized_dispatch_params.grid_mapping == GRID_MAPPING_DYNAMIC)</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;                {</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;                    <span class="comment">// Prepare queue using a kernel so we know it gets prepared once per operation</span></div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;                    <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking prepare_drain_kernel&lt;&lt;&lt;1, 1, 0, %lld&gt;&gt;&gt;()\n&quot;</span>, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream);</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;                    <span class="comment">// Invoke prepare_drain_kernel</span></div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;                    prepare_drain_kernel&lt;&lt;&lt;1, 1, 0, stream&gt;&gt;&gt;(queue, num_items);</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;                    <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;                    <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;                }</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;</div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;                <span class="comment">// Log privatized_kernel configuration</span></div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking privatized_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;(), %d items per thread, %d SM occupancy\n&quot;</span>,</div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;                    privatized_grid_size, privatized_dispatch_params.block_threads, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream, privatized_dispatch_params.items_per_thread, privatized_sm_occupancy);</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;                <span class="comment">// Invoke privatized_kernel</span></div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;                privatized_kernel&lt;&lt;&lt;privatized_grid_size, privatized_dispatch_params.block_threads, 0, stream&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;                    d_in,</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;                    d_block_reductions,</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;                    num_items,</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;                    even_share,</div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;                    queue,</div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;                    reduction_op);</div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;</div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;                <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;                <span class="comment">// Log single_kernel configuration</span></div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking single_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;(), %d items per thread\n&quot;</span>,</div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;                    1, single_dispatch_params.block_threads, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream, single_dispatch_params.items_per_thread);</div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;</div>
+<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;                <span class="comment">// Invoke single_kernel</span></div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;                single_kernel&lt;&lt;&lt;1, single_dispatch_params.block_threads, 0, stream&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;                    d_block_reductions,</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;                    d_out,</div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;                    privatized_grid_size,</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;                    reduction_op);</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;                <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;                <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;            }</div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;        }</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;</div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;<span class="preprocessor">#endif // CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;</div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;</div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;<span class="comment">     * Interface</span></div>
+<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;</div>
+<div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;        <span class="keyword">typename</span>                    InputIteratorRA,</div>
+<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;        <span class="keyword">typename</span>                    OutputIteratorRA,</div>
+<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;        <span class="keyword">typename</span>                    ReductionOp&gt;</div>
+<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00651"></a><span class="lineno"><a class="code" href="structcub_1_1_device_reduce.html#ae7d87f3c83dd336e77b2ae900f74e092">  651</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_reduce.html#ae7d87f3c83dd336e77b2ae900f74e092" title="Computes a device-wide reduction using the specified binary reduction_op functor. ...">Reduce</a>(</div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;        <span class="keywordtype">void</span>                        *d_temp_storage,                    </div>
+<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;        <span class="keywordtype">size_t</span>                      &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;        InputIteratorRA             d_in,                               </div>
+<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;        OutputIteratorRA            d_out,                              </div>
+<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;        <span class="keywordtype">int</span>                         num_items,                          </div>
+<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;        ReductionOp                 reduction_op,                       </div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;        cudaStream_t                stream              = 0,            </div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;        <span class="keywordtype">bool</span>                        stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;    {</div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;        <span class="comment">// Type used for array indexing</span></div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;        <span class="keyword">typedef</span> <span class="keywordtype">int</span> SizeT;</div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;</div>
+<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;        <span class="comment">// Data type of input iterator</span></div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type T;</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;</div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;        <span class="comment">// Tuning polices</span></div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;        <span class="keyword">typedef</span> PtxDefaultPolicies&lt;T, SizeT&gt;                    PtxDefaultPolicies;     <span class="comment">// Wrapper of default kernel policies</span></div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> PtxDefaultPolicies::PrivatizedPolicy   PrivatizedPolicy;       <span class="comment">// Multi-block kernel policy</span></div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> PtxDefaultPolicies::SinglePolicy       SinglePolicy;           <span class="comment">// Single-block kernel policy</span></div>
+<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;</div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;        cudaError error = cudaSuccess;</div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;        {</div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;            <span class="comment">// Declare dispatch parameters</span></div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;            KernelDispachParams privatized_dispatch_params;</div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;            KernelDispachParams single_dispatch_params;</div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;</div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;<span class="preprocessor">#ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;<span class="preprocessor"></span>            <span class="comment">// We&#39;re on the device, so initialize the dispatch parameters with the PtxDefaultPolicies directly</span></div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;            privatized_dispatch_params.Init&lt;PrivatizedPolicy&gt;(PtxDefaultPolicies::SUBSCRIPTION_FACTOR);</div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;            single_dispatch_params.Init&lt;SinglePolicy&gt;();</div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;<span class="preprocessor"></span>            <span class="comment">// We&#39;re on the host, so lookup and initialize the dispatch parameters with the policies that match the device&#39;s PTX version</span></div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;            <span class="keywordtype">int</span> ptx_version;</div>
+<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(ptx_version))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;            PtxDefaultPolicies::InitDispatchParams(ptx_version, privatized_dispatch_params, single_dispatch_params);</div>
+<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;            <span class="comment">// Dispatch</span></div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = Dispatch(</div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;                d_temp_storage,</div>
+<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;                temp_storage_bytes,</div>
+<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;                ReducePrivatizedKernel&lt;PrivatizedPolicy, InputIteratorRA, T*, SizeT, ReductionOp&gt;,</div>
+<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;                ReduceSingleKernel&lt;SinglePolicy, T*, OutputIteratorRA, SizeT, ReductionOp&gt;,</div>
+<div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;                ResetDrainKernel&lt;SizeT&gt;,</div>
+<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;                privatized_dispatch_params,</div>
+<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;                single_dispatch_params,</div>
+<div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160;                d_in,</div>
+<div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;                d_out,</div>
+<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;                num_items,</div>
+<div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;                reduction_op,</div>
+<div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;                stream,</div>
+<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;                stream_synchronous))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;        }</div>
+<div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;</div>
+<div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;    }</div>
+<div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;</div>
+<div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;</div>
+<div class="line"><a name="l00752"></a><span class="lineno">  752</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00753"></a><span class="lineno">  753</span>&#160;        <span class="keyword">typename</span>                    InputIteratorRA,</div>
+<div class="line"><a name="l00754"></a><span class="lineno">  754</span>&#160;        <span class="keyword">typename</span>                    OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00755"></a><span class="lineno">  755</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00756"></a><span class="lineno"><a class="code" href="structcub_1_1_device_reduce.html#ae927a1815745ceed75ff677ffd3b0701">  756</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_reduce.html#ae927a1815745ceed75ff677ffd3b0701" title="Computes a device-wide sum using the addition (&#39;+&#39;) operator. ">Sum</a>(</div>
+<div class="line"><a name="l00757"></a><span class="lineno">  757</span>&#160;        <span class="keywordtype">void</span>                        *d_temp_storage,                    </div>
+<div class="line"><a name="l00758"></a><span class="lineno">  758</span>&#160;        <span class="keywordtype">size_t</span>                      &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00759"></a><span class="lineno">  759</span>&#160;        InputIteratorRA             d_in,                               </div>
+<div class="line"><a name="l00760"></a><span class="lineno">  760</span>&#160;        OutputIteratorRA            d_out,                              </div>
+<div class="line"><a name="l00761"></a><span class="lineno">  761</span>&#160;        <span class="keywordtype">int</span>                         num_items,                          </div>
+<div class="line"><a name="l00762"></a><span class="lineno">  762</span>&#160;        cudaStream_t                stream              = 0,            </div>
+<div class="line"><a name="l00763"></a><span class="lineno">  763</span>&#160;        <span class="keywordtype">bool</span>                        stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00764"></a><span class="lineno">  764</span>&#160;    {</div>
+<div class="line"><a name="l00765"></a><span class="lineno">  765</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="structcub_1_1_device_reduce.html#ae7d87f3c83dd336e77b2ae900f74e092" title="Computes a device-wide reduction using the specified binary reduction_op functor. ...">Reduce</a>(d_temp_storage, temp_storage_bytes, d_in, d_out, num_items, <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">cub::Sum</a>(), stream, stream_synchronous);</div>
+<div class="line"><a name="l00766"></a><span class="lineno">  766</span>&#160;    }</div>
+<div class="line"><a name="l00767"></a><span class="lineno">  767</span>&#160;</div>
+<div class="line"><a name="l00768"></a><span class="lineno">  768</span>&#160;</div>
+<div class="line"><a name="l00769"></a><span class="lineno">  769</span>&#160;};</div>
+<div class="line"><a name="l00770"></a><span class="lineno">  770</span>&#160;</div>
+<div class="line"><a name="l00771"></a><span class="lineno">  771</span>&#160;</div>
+<div class="line"><a name="l00772"></a><span class="lineno">  772</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00773"></a><span class="lineno">  773</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l00774"></a><span class="lineno">  774</span>&#160;</div>
+<div class="line"><a name="l00775"></a><span class="lineno">  775</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/device__scan_8cuh_source.html b/docs/html/device__scan_8cuh_source.html
new file mode 100644
index 0000000000..7ed16146e7
--- /dev/null
+++ b/docs/html/device__scan_8cuh_source.html
@@ -0,0 +1,710 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: device_scan.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_18fc672d63781b5a743137aee24ff656.html">device</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">device_scan.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="device__scan_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;</div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;</div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;stdio.h&gt;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;iterator&gt;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;block/block_scan_tiles.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;../thread/thread_operators.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;../grid/grid_queue.cuh&quot;</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;../util_debug.cuh&quot;</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &quot;../util_device.cuh&quot;</span></div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment"> * Kernel entry points</span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keyword">typename</span> T,                                     </div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;    <span class="keyword">typename</span> SizeT&gt;                                 </div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;__global__ <span class="keywordtype">void</span> ScanInitKernel(</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    GridQueue&lt;SizeT&gt;            grid_queue,         </div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    ScanTileDescriptor&lt;T&gt;       *d_tile_status,     </div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    <span class="keywordtype">int</span>                         num_tiles)          </div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;{</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    <span class="keyword">typedef</span> ScanTileDescriptor&lt;T&gt; ScanTileDescriptorT;</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    {</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;        TILE_STATUS_PADDING = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>,</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    };</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    <span class="comment">// Reset queue descriptor</span></div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    <span class="keywordflow">if</span> ((blockIdx.x == 0) &amp;&amp; (threadIdx.x == 0)) grid_queue.ResetDrain(num_tiles);</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    <span class="comment">// Initialize tile status</span></div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    <span class="keywordtype">int</span> tile_offset = (blockIdx.x * blockDim.x) + threadIdx.x;</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    if (tile_offset &lt; num_tiles)</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;    {</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;        <span class="comment">// Not-yet-set</span></div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;        d_tile_status[TILE_STATUS_PADDING + tile_offset].status = SCAN_TILE_INVALID;</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    }</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    <span class="keywordflow">if</span> ((blockIdx.x == 0) &amp;&amp; (threadIdx.x &lt; TILE_STATUS_PADDING))</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    {</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;        <span class="comment">// Padding</span></div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;        d_tile_status[threadIdx.x].status = SCAN_TILE_OOB;</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    }</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;}</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    <span class="keyword">typename</span>    BlockScanTilesPolicy,           </div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keyword">typename</span>    InputIteratorRA,                </div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="keyword">typename</span>    OutputIteratorRA,               </div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <span class="keyword">typename</span>    T,                              </div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="keyword">typename</span>    ScanOp,                         </div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    <span class="keyword">typename</span>    Identity,                       </div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="keyword">typename</span>    SizeT&gt;                          </div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;__launch_bounds__ (<span class="keywordtype">int</span>(BlockScanTilesPolicy::BLOCK_THREADS))</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;__global__ <span class="keywordtype">void</span> ScanKernel(</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    InputIteratorRA             d_in,           </div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    OutputIteratorRA            d_out,          </div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    ScanTileDescriptor&lt;T&gt;       *d_tile_status, </div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    ScanOp                      scan_op,        </div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    Identity                    identity,       </div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;    SizeT                       num_items,      </div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    GridQueue&lt;<span class="keywordtype">int</span>&gt;              queue)          </div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;{</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    {</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;        TILE_STATUS_PADDING = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>,</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    };</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    <span class="comment">// Thread block type for scanning input tiles</span></div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <span class="keyword">typedef</span> BlockScanTiles&lt;</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;        BlockScanTilesPolicy,</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;        InputIteratorRA,</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;        OutputIteratorRA,</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;        ScanOp,</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;        Identity,</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;        SizeT&gt; BlockScanTilesT;</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="comment">// Shared memory for BlockScanTiles</span></div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    __shared__ <span class="keyword">typename</span> BlockScanTilesT::TempStorage temp_storage;</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <span class="comment">// Process tiles</span></div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    BlockScanTilesT(temp_storage, d_in, d_out, scan_op, identity).ConsumeTiles(</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;        num_items,</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;        queue,</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;        d_tile_status + TILE_STATUS_PADDING);</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;}</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;<span class="comment"> * DeviceScan</span></div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div>
+<div class="line"><a name="l00173"></a><span class="lineno"><a class="code" href="structcub_1_1_device_scan.html">  173</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_device_scan.html" title="DeviceScan provides operations for computing a device-wide, parallel prefix scan across data items re...">DeviceScan</a></div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;{</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="comment">     * Constants and typedefs</span></div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keyword">struct </span>KernelDispachParams</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    {</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;        <span class="comment">// Policy fields</span></div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;        <span class="keywordtype">int</span>                     block_threads;</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;        <span class="keywordtype">int</span>                     items_per_thread;</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;        <a class="code" href="namespacecub.html#a9d7e37497fdd99864c57adecda710401" title="cub::BlockLoadAlgorithm enumerates alternative algorithms for cub::BlockLoad to read a linear segment...">BlockLoadAlgorithm</a>      load_policy;</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;        <a class="code" href="namespacecub.html#a839b145451e9eec3d44172e3c3619700" title="cub::BlockStoreAlgorithm enumerates alternative algorithms for cub::BlockStore to write a blocked arr...">BlockStoreAlgorithm</a>     store_policy;</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;        <a class="code" href="namespacecub.html#abec44bba36037c547e7e84906d0d23ab" title="BlockScanAlgorithm enumerates alternative algorithms for cub::BlockScan to compute a parallel prefix ...">BlockScanAlgorithm</a>      scan_algorithm;</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;        <span class="comment">// Other misc</span></div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;        <span class="keywordtype">int</span>                     tile_size;</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;        <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BlockScanTilesPolicy&gt;</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;        __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;        <span class="keywordtype">void</span> Init()</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;        {</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;            block_threads               = BlockScanTilesPolicy::BLOCK_THREADS;</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;            items_per_thread            = BlockScanTilesPolicy::ITEMS_PER_THREAD;</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;            load_policy                 = BlockScanTilesPolicy::LOAD_ALGORITHM;</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;            store_policy                = BlockScanTilesPolicy::STORE_ALGORITHM;</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;            scan_algorithm              = BlockScanTilesPolicy::SCAN_ALGORITHM;</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;            tile_size                   = block_threads * items_per_thread;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;        }</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;        __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;        <span class="keywordtype">void</span> Print()</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;        {</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;            printf(<span class="stringliteral">&quot;%d, %d, %d, %d, %d&quot;</span>,</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;                block_threads,</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;                items_per_thread,</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;                load_policy,</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;                store_policy,</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;                scan_algorithm);</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        }</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    };</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;<span class="comment">     * Tuning policies</span></div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;        <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;        <span class="keyword">typename</span>    SizeT,</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;        <span class="keywordtype">int</span>         ARCH&gt;</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <span class="keyword">struct </span>TunedPolicies;</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;T, SizeT, 350&gt;</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;    {</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;        <span class="keyword">enum</span> {</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;            NOMINAL_4B_ITEMS_PER_THREAD = 16,</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;            ITEMS_PER_THREAD            = CUB_MIN(NOMINAL_4B_ITEMS_PER_THREAD, CUB_MAX(1, (NOMINAL_4B_ITEMS_PER_THREAD * 4 / <span class="keyword">sizeof</span>(T)))),</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;        };</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;        <span class="comment">// ScanPolicy: GTX Titan: 29.1B items/s (232.4 GB/s) @ 48M 32-bit T</span></div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;        <span class="keyword">typedef</span> BlockScanTilesPolicy&lt;128, ITEMS_PER_THREAD,  BLOCK_LOAD_DIRECT, false, LOAD_LDG, BLOCK_STORE_WARP_TRANSPOSE, true, BLOCK_SCAN_RAKING_MEMOIZE&gt; ScanPolicy;</div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;    };</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;T, SizeT, 300&gt;</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;    {</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;        <span class="keyword">enum</span> {</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;            NOMINAL_4B_ITEMS_PER_THREAD = 9,</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;            ITEMS_PER_THREAD            = CUB_MIN(NOMINAL_4B_ITEMS_PER_THREAD, CUB_MAX(1, (NOMINAL_4B_ITEMS_PER_THREAD * 4 / <span class="keyword">sizeof</span>(T)))),</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;        };</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;        <span class="keyword">typedef</span> BlockScanTilesPolicy&lt;256, ITEMS_PER_THREAD,  BLOCK_LOAD_WARP_TRANSPOSE, false, LOAD_DEFAULT, BLOCK_STORE_WARP_TRANSPOSE, false, BLOCK_SCAN_RAKING_MEMOIZE&gt; ScanPolicy;</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    };</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;T, SizeT, 200&gt;</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    {</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;        <span class="keyword">enum</span> {</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;            NOMINAL_4B_ITEMS_PER_THREAD = 15,</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;            ITEMS_PER_THREAD            = CUB_MIN(NOMINAL_4B_ITEMS_PER_THREAD, CUB_MAX(1, (NOMINAL_4B_ITEMS_PER_THREAD * 4 / <span class="keyword">sizeof</span>(T)))),</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;        };</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;        <span class="comment">// ScanPolicy: GTX 580: 20.3B items/s (162.3 GB/s) @ 48M 32-bit T</span></div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;        <span class="keyword">typedef</span> BlockScanTilesPolicy&lt;128, ITEMS_PER_THREAD, BLOCK_LOAD_WARP_TRANSPOSE, false, LOAD_DEFAULT, BLOCK_STORE_WARP_TRANSPOSE, false, BLOCK_SCAN_RAKING_MEMOIZE&gt; ScanPolicy;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;    };</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;    <span class="keyword">struct </span>TunedPolicies&lt;T, SizeT, 100&gt;</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;    {</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;        <span class="keyword">enum</span> {</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;            NOMINAL_4B_ITEMS_PER_THREAD = 7,</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;            ITEMS_PER_THREAD            = CUB_MIN(NOMINAL_4B_ITEMS_PER_THREAD, CUB_MAX(1, (NOMINAL_4B_ITEMS_PER_THREAD * 4 / <span class="keyword">sizeof</span>(T)))),</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;        };</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;        <span class="keyword">typedef</span> BlockScanTilesPolicy&lt;128, ITEMS_PER_THREAD, BLOCK_LOAD_TRANSPOSE, false, LOAD_DEFAULT, BLOCK_STORE_TRANSPOSE, false, BLOCK_SCAN_RAKING&gt; ScanPolicy;</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;    };</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;    <span class="keyword">struct </span>PtxDefaultPolicies</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;    {</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;        <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">int</span> PTX_TUNE_ARCH =   (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 350) ?</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;                                                350 :</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;                                                (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 300) ?</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;                                                    300 :</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;                                                    (<a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a> &gt;= 200) ?</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;                                                        200 :</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;                                                        100;</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;        <span class="comment">// Tuned policy set for the current PTX compiler pass</span></div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;        <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, PTX_TUNE_ARCH&gt; PtxTunedPolicies;</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;        <span class="comment">// ScanPolicy that opaquely derives from the specialization corresponding to the current PTX compiler pass</span></div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;        <span class="keyword">struct </span>ScanPolicy : PtxTunedPolicies::ScanPolicy {};</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;        <span class="keyword">static</span> <span class="keywordtype">void</span> InitDispatchParams(<span class="keywordtype">int</span> ptx_version, KernelDispachParams &amp;scan_dispatch_params)</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;        {</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;            <span class="keywordflow">if</span> (ptx_version &gt;= 350)</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;            {</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, 350&gt; TunedPolicies;</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;                scan_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::ScanPolicy&gt;();</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;            }</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;            <span class="keywordflow">else</span> <span class="keywordflow">if</span> (ptx_version &gt;= 300)</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;            {</div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, 300&gt; TunedPolicies;</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;                scan_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::ScanPolicy&gt;();</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;            }</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;            <span class="keywordflow">else</span> <span class="keywordflow">if</span> (ptx_version &gt;= 200)</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;            {</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, 200&gt; TunedPolicies;</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;                scan_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::ScanPolicy&gt;();</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;            }</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;            <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;            {</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;                <span class="keyword">typedef</span> TunedPolicies&lt;T, SizeT, 100&gt; TunedPolicies;</div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;                scan_dispatch_params.Init&lt;<span class="keyword">typename</span> TunedPolicies::ScanPolicy&gt;();</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;            }</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;        }</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;    };</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;        <span class="keyword">typename</span>                    ScanInitKernelPtr,              </div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;        <span class="keyword">typename</span>                    ScanKernelPtr,                  </div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;        <span class="keyword">typename</span>                    InputIteratorRA,                </div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;        <span class="keyword">typename</span>                    OutputIteratorRA,               </div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;        <span class="keyword">typename</span>                    ScanOp,                         </div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;        <span class="keyword">typename</span>                    Identity,                       </div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;        <span class="keyword">typename</span>                    SizeT&gt;                          </div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    <span class="keyword">static</span> cudaError_t Dispatch(</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;        <span class="keywordtype">int</span>                         ptx_version,                    </div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;        <span class="keywordtype">void</span>                        *d_temp_storage,                </div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;        <span class="keywordtype">size_t</span>                      &amp;temp_storage_bytes,            </div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;        ScanInitKernelPtr           init_kernel,                    </div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;        ScanKernelPtr               scan_kernel,                    </div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;        KernelDispachParams         &amp;scan_dispatch_params,          </div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;        InputIteratorRA             d_in,                           </div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;        OutputIteratorRA            d_out,                          </div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;        ScanOp                      scan_op,                        </div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;        Identity                    identity,                       </div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;        SizeT                       num_items,                      </div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;        cudaStream_t                stream              = 0,        </div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;        <span class="keywordtype">bool</span>                        stream_synchronous  = <span class="keyword">false</span>)    </div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;    {</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;<span class="preprocessor">#ifndef CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;        <span class="comment">// Kernel launch not supported from this device</span></div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorNotSupported);</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;        <span class="keyword">enum</span></div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;        {</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;            TILE_STATUS_PADDING     = 32,</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;            INIT_KERNEL_THREADS     = 128</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;        };</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;        <span class="comment">// Data type</span></div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type T;</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;        <span class="comment">// Tile status descriptor type</span></div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;        <span class="keyword">typedef</span> ScanTileDescriptor&lt;T&gt; ScanTileDescriptorT;</div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;        cudaError error = cudaSuccess;</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;        {</div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;            <span class="comment">// Number of input tiles</span></div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;            <span class="keywordtype">int</span> num_tiles = (num_items + scan_dispatch_params.tile_size - 1) / scan_dispatch_params.tile_size;</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;            <span class="comment">// Temporary storage allocation requirements</span></div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;            <span class="keywordtype">void</span>* allocations[2];</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;            <span class="keywordtype">size_t</span> allocation_sizes[2] =</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;            {</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;                (num_tiles + TILE_STATUS_PADDING) * <span class="keyword">sizeof</span>(ScanTileDescriptorT),      <span class="comment">// bytes needed for tile status descriptors</span></div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;                GridQueue&lt;int&gt;::AllocationSize()                                      <span class="comment">// bytes needed for grid queue descriptor</span></div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;            };</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;            <span class="comment">// Alias temporaries (or set the necessary size of the storage allocation)</span></div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = AliasTemporaries(d_temp_storage, temp_storage_bytes, allocations, allocation_sizes))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;            <span class="comment">// Return if the caller is simply requesting the size of the storage allocation</span></div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;            <span class="keywordflow">if</span> (d_temp_storage == NULL)</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;                <span class="keywordflow">return</span> cudaSuccess;</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;            <span class="comment">// Global list of tile status</span></div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;            ScanTileDescriptorT *d_tile_status = (ScanTileDescriptorT*) allocations[0];</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;            <span class="comment">// Grid queue descriptor</span></div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;            GridQueue&lt;int&gt; queue(allocations[1]);</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;            <span class="comment">// Log init_kernel configuration</span></div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;            <span class="keywordtype">int</span> init_grid_size = (num_tiles + INIT_KERNEL_THREADS - 1) / INIT_KERNEL_THREADS;</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;            <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking init_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;()\n&quot;</span>, init_grid_size, INIT_KERNEL_THREADS, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream);</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;            <span class="comment">// Invoke init_kernel to initialize tile descriptors and queue descriptors</span></div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;            init_kernel&lt;&lt;&lt;init_grid_size, INIT_KERNEL_THREADS, 0, stream&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;                queue,</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;                d_tile_status,</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;                num_tiles);</div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;</div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;            <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;            <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;            <span class="comment">// Get grid size for multi-block kernel</span></div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;            <span class="keywordtype">int</span> scan_grid_size;</div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;            <span class="keywordtype">int</span> multi_sm_occupancy = -1;</div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;            <span class="keywordflow">if</span> (ptx_version &lt; 200)</div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;            {</div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;                <span class="comment">// We don&#39;t have atomics (or don&#39;t have fast ones), so just assign one</span></div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;                <span class="comment">// block per tile (limited to 65K tiles)</span></div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;                scan_grid_size = num_tiles;</div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;            }</div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;            <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;            {</div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;                <span class="comment">// We have atomics and can thus reuse blocks across multiple tiles using a queue descriptor.</span></div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;                <span class="comment">// Get GPU id</span></div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;                <span class="keywordtype">int</span> device_ordinal;</div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaGetDevice(&amp;device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;</div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;                <span class="comment">// Get SM count</span></div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;                <span class="keywordtype">int</span> sm_count;</div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceGetAttribute (&amp;sm_count, cudaDevAttrMultiProcessorCount, device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;</div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;                <span class="comment">// Get a rough estimate of scan_kernel SM occupancy based upon the maximum SM occupancy of the targeted PTX architecture</span></div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;                multi_sm_occupancy = CUB_MIN(</div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;                    <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps&lt;CUB_PTX_ARCH&gt;::MAX_SM_THREADBLOCKS</a>,</div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;                    <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps&lt;CUB_PTX_ARCH&gt;::MAX_SM_THREADS</a> / scan_dispatch_params.block_threads);</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;</div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;<span class="preprocessor"></span>                <span class="comment">// We&#39;re on the host, so come up with a</span></div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;                <a class="code" href="classcub_1_1_device.html" title="Properties of a given CUDA device and the corresponding PTX bundle. ">Device</a> device_props;</div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = device_props.<a class="code" href="classcub_1_1_device.html#a4c1aecec381d2dce80120362feb2d0ca">Init</a>(device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = device_props.<a class="code" href="classcub_1_1_device.html#a618bbf36a5737a9b1533ff65834e88e8">MaxSmOccupancy</a>(</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;                    multi_sm_occupancy,</div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;                    scan_kernel,</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;                    scan_dispatch_params.block_threads))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;<span class="preprocessor"></span>                <span class="comment">// Get device occupancy for scan_kernel</span></div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;                <span class="keywordtype">int</span> scan_occupancy = multi_sm_occupancy * sm_count;</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;                <span class="comment">// Get grid size for scan_kernel</span></div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;                scan_grid_size = (num_tiles &lt; scan_occupancy) ?</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;                    num_tiles :                 <span class="comment">// Not enough to fill the device with threadblocks</span></div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;                    scan_occupancy;      <span class="comment">// Fill the device with threadblocks</span></div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;            }</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;            <span class="comment">// Log scan_kernel configuration</span></div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;            <span class="keywordflow">if</span> (stream_synchronous) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;Invoking scan_kernel&lt;&lt;&lt;%d, %d, 0, %lld&gt;&gt;&gt;(), %d items per thread, %d SM occupancy\n&quot;</span>,</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;                scan_grid_size, scan_dispatch_params.block_threads, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) stream, scan_dispatch_params.items_per_thread, multi_sm_occupancy);</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;</div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;            <span class="comment">// Invoke scan_kernel</span></div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;            scan_kernel&lt;&lt;&lt;scan_grid_size, scan_dispatch_params.block_threads, 0, stream&gt;&gt;&gt;(</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;                d_in,</div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;                d_out,</div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;                d_tile_status,</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;                scan_op,</div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;                identity,</div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;                num_items,</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;                queue);</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;            <span class="comment">// Sync the stream if specified</span></div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;            <span class="keywordflow">if</span> (stream_synchronous &amp;&amp; (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = SyncStream(stream)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;        }</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;<span class="preprocessor">#endif  // CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;</div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;</div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;        <span class="keyword">typename</span>                    InputIteratorRA,                </div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;        <span class="keyword">typename</span>                    OutputIteratorRA,               </div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;        <span class="keyword">typename</span>                    ScanOp,                         </div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;        <span class="keyword">typename</span>                    Identity,                       </div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;        <span class="keyword">typename</span>                    SizeT&gt;                          </div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;    <span class="keyword">static</span> cudaError_t Dispatch(</div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;        <span class="keywordtype">void</span>                        *d_temp_storage,                </div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;        <span class="keywordtype">size_t</span>                      &amp;temp_storage_bytes,            </div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;        InputIteratorRA             d_in,                           </div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;        OutputIteratorRA            d_out,                          </div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;        ScanOp                      scan_op,                        </div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;        Identity                    identity,                       </div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;        SizeT                       num_items,                      </div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;        cudaStream_t                stream              = 0,        </div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;        <span class="keywordtype">bool</span>                        stream_synchronous  = <span class="keyword">false</span>)    </div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;    {</div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;        <span class="comment">// Data type</span></div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type T;</div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;</div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;        <span class="comment">// Tuning polices</span></div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;        <span class="keyword">typedef</span> PtxDefaultPolicies&lt;T, SizeT&gt;                    PtxDefaultPolicies;     <span class="comment">// Wrapper of default kernel policies</span></div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> PtxDefaultPolicies::ScanPolicy   ScanPolicy;       <span class="comment">// Scan kernel policy</span></div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;</div>
+<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;        cudaError error = cudaSuccess;</div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;        {</div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;            <span class="comment">// Declare dispatch parameters</span></div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;            KernelDispachParams scan_dispatch_params;</div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;</div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;            <span class="keywordtype">int</span> ptx_version;</div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;<span class="preprocessor">#ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;<span class="preprocessor"></span>            <span class="comment">// We&#39;re on the device, so initialize the dispatch parameters with the PtxDefaultPolicies directly</span></div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;            scan_dispatch_params.Init&lt;ScanPolicy&gt;();</div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;            ptx_version = <a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a>;</div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;<span class="preprocessor"></span>            <span class="comment">// We&#39;re on the host, so lookup and initialize the dispatch parameters with the policies that match the device&#39;s PTX version</span></div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(ptx_version))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;            PtxDefaultPolicies::InitDispatchParams(ptx_version, scan_dispatch_params);</div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;            Dispatch(</div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;                ptx_version,</div>
+<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;                d_temp_storage,</div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;                temp_storage_bytes,</div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;                ScanInitKernel&lt;T, SizeT&gt;,</div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;                ScanKernel&lt;ScanPolicy, InputIteratorRA, OutputIteratorRA, T, ScanOp, Identity, SizeT&gt;,</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;                scan_dispatch_params,</div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;                d_in,</div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;                d_out,</div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;                scan_op,</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;                identity,</div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;                num_items,</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;                stream,</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;                stream_synchronous);</div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error)) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;        }</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;    }</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;<span class="preprocessor">    #endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;</div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;        <span class="keyword">typename</span>            OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00608"></a><span class="lineno"><a class="code" href="structcub_1_1_device_scan.html#ac49b99df1f6b561b477d4fd797fe0ea8">  608</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_scan.html#ac49b99df1f6b561b477d4fd797fe0ea8" title="Computes a device-wide exclusive prefix sum. ">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;        InputIteratorRA     d_in,                               </div>
+<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;        OutputIteratorRA    d_out,                              </div>
+<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;        <span class="keywordtype">int</span>                 num_items,                          </div>
+<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;    {</div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;        <span class="keyword">typedef</span> <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type T;</div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;        <span class="keywordflow">return</span> Dispatch(d_temp_storage, temp_storage_bytes, d_in, d_out, <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum</a>(), T(), num_items, stream, stream_synchronous);</div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;    }</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;</div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;</div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;        <span class="keyword">typename</span>            OutputIteratorRA,</div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;        <span class="keyword">typename</span>            ScanOp,</div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;        <span class="keyword">typename</span>            Identity&gt;</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00671"></a><span class="lineno"><a class="code" href="structcub_1_1_device_scan.html#a5fb74735fdd88202a9310432c77a4a3a">  671</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_scan.html#a5fb74735fdd88202a9310432c77a4a3a" title="Computes a device-wide exclusive prefix scan using the specified binary scan_op functor. ">ExclusiveScan</a>(</div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;        InputIteratorRA     d_in,                               </div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;        OutputIteratorRA    d_out,                              </div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;        ScanOp              scan_op,                            </div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;        Identity            identity,                           </div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;        <span class="keywordtype">int</span>                 num_items,                          </div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;    {</div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;        <span class="keywordflow">return</span> Dispatch(d_temp_storage, temp_storage_bytes, d_in, d_out, scan_op, identity, num_items, stream, stream_synchronous);</div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;    }</div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;</div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;</div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;</div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;</div>
+<div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00731"></a><span class="lineno">  731</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;        <span class="keyword">typename</span>            OutputIteratorRA&gt;</div>
+<div class="line"><a name="l00733"></a><span class="lineno">  733</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00734"></a><span class="lineno"><a class="code" href="structcub_1_1_device_scan.html#a7c8471b7508fca37dfd3198b9111911a">  734</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_scan.html#a7c8471b7508fca37dfd3198b9111911a" title="Computes a device-wide inclusive prefix sum. ">InclusiveSum</a>(</div>
+<div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;        InputIteratorRA     d_in,                               </div>
+<div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;        OutputIteratorRA    d_out,                              </div>
+<div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;        <span class="keywordtype">int</span>                 num_items,                          </div>
+<div class="line"><a name="l00740"></a><span class="lineno">  740</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00741"></a><span class="lineno">  741</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00742"></a><span class="lineno">  742</span>&#160;    {</div>
+<div class="line"><a name="l00743"></a><span class="lineno">  743</span>&#160;        <span class="keywordflow">return</span> Dispatch(d_temp_storage, temp_storage_bytes, d_in, d_out, <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum</a>(), <a class="code" href="structcub_1_1_null_type.html" title="A simple &quot;NULL&quot; marker type. ">NullType</a>(), num_items, stream, stream_synchronous);</div>
+<div class="line"><a name="l00744"></a><span class="lineno">  744</span>&#160;    }</div>
+<div class="line"><a name="l00745"></a><span class="lineno">  745</span>&#160;</div>
+<div class="line"><a name="l00746"></a><span class="lineno">  746</span>&#160;</div>
+<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;        <span class="keyword">typename</span>            InputIteratorRA,</div>
+<div class="line"><a name="l00790"></a><span class="lineno">  790</span>&#160;        <span class="keyword">typename</span>            OutputIteratorRA,</div>
+<div class="line"><a name="l00791"></a><span class="lineno">  791</span>&#160;        <span class="keyword">typename</span>            ScanOp&gt;</div>
+<div class="line"><a name="l00792"></a><span class="lineno">  792</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00793"></a><span class="lineno"><a class="code" href="structcub_1_1_device_scan.html#a2f6de564140e06b391ad0d987142762f">  793</a></span>&#160;    <span class="keyword">static</span> cudaError_t <a class="code" href="structcub_1_1_device_scan.html#a2f6de564140e06b391ad0d987142762f" title="Computes a device-wide inclusive prefix scan using the specified binary scan_op functor. ">InclusiveScan</a>(</div>
+<div class="line"><a name="l00794"></a><span class="lineno">  794</span>&#160;        <span class="keywordtype">void</span>                *d_temp_storage,                    </div>
+<div class="line"><a name="l00795"></a><span class="lineno">  795</span>&#160;        <span class="keywordtype">size_t</span>              &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00796"></a><span class="lineno">  796</span>&#160;        InputIteratorRA     d_in,                               </div>
+<div class="line"><a name="l00797"></a><span class="lineno">  797</span>&#160;        OutputIteratorRA    d_out,                              </div>
+<div class="line"><a name="l00798"></a><span class="lineno">  798</span>&#160;        ScanOp              scan_op,                            </div>
+<div class="line"><a name="l00799"></a><span class="lineno">  799</span>&#160;        <span class="keywordtype">int</span>                 num_items,                          </div>
+<div class="line"><a name="l00800"></a><span class="lineno">  800</span>&#160;        cudaStream_t        stream              = 0,            </div>
+<div class="line"><a name="l00801"></a><span class="lineno">  801</span>&#160;        <span class="keywordtype">bool</span>                stream_synchronous  = <span class="keyword">false</span>)        </div>
+<div class="line"><a name="l00802"></a><span class="lineno">  802</span>&#160;    {</div>
+<div class="line"><a name="l00803"></a><span class="lineno">  803</span>&#160;        <span class="keywordflow">return</span> Dispatch(d_temp_storage, temp_storage_bytes, d_in, d_out, scan_op, <a class="code" href="structcub_1_1_null_type.html" title="A simple &quot;NULL&quot; marker type. ">NullType</a>(), num_items, stream, stream_synchronous);</div>
+<div class="line"><a name="l00804"></a><span class="lineno">  804</span>&#160;    }</div>
+<div class="line"><a name="l00805"></a><span class="lineno">  805</span>&#160;</div>
+<div class="line"><a name="l00806"></a><span class="lineno">  806</span>&#160;};</div>
+<div class="line"><a name="l00807"></a><span class="lineno">  807</span>&#160;</div>
+<div class="line"><a name="l00808"></a><span class="lineno">  808</span>&#160;</div>
+<div class="line"><a name="l00809"></a><span class="lineno">  809</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00810"></a><span class="lineno">  810</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+<div class="line"><a name="l00811"></a><span class="lineno">  811</span>&#160;</div>
+<div class="line"><a name="l00812"></a><span class="lineno">  812</span>&#160;</div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x62.html b/docs/html/functions_0x62.html
new file mode 100644
index 0000000000..8d0f8f4431
--- /dev/null
+++ b/docs/html/functions_0x62.html
@@ -0,0 +1,175 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li class="current"><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_b"></a>- b -</h3><ul>
+<li>BindTexture()
+: <a class="el" href="classcub_1_1_tex_iterator_r_a.html#aae5f3547c60cf33d51c65685ea9d131a">cub::TexIteratorRA&lt; T &gt;</a>
+, <a class="el" href="classcub_1_1_tex_transform_iterator_r_a.html#ae354a7954b301d8eb127763eb014dd9c">cub::TexTransformIteratorRA&lt; OutputType, ConversionOp, InputType &gt;</a>
+</li>
+<li>BlockDiscontinuity()
+: <a class="el" href="classcub_1_1_block_discontinuity.html#a3f5c69462af0c9609f845e474842cfb2">cub::BlockDiscontinuity&lt; T, BLOCK_THREADS &gt;</a>
+</li>
+<li>BlockedToStriped()
+: <a class="el" href="classcub_1_1_block_exchange.html#a5e487b2f594fa0ae466bf1c7b6b9c06d">cub::BlockExchange&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING &gt;</a>
+</li>
+<li>BlockedToWarpStriped()
+: <a class="el" href="classcub_1_1_block_exchange.html#a74fc1a62cac21f54289bb7092250a868">cub::BlockExchange&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING &gt;</a>
+</li>
+<li>BlockExchange()
+: <a class="el" href="classcub_1_1_block_exchange.html#a31f5a889713220dfe21669a4865f3f4e">cub::BlockExchange&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING &gt;</a>
+</li>
+<li>BlockHistogram()
+: <a class="el" href="classcub_1_1_block_histogram.html#ae87c89f1175ce34f0c60f1cf9719d5f0">cub::BlockHistogram&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, BINS, ALGORITHM &gt;</a>
+</li>
+<li>BlockLoad()
+: <a class="el" href="classcub_1_1_block_load.html#a5d282946b5009f81cb8eb030f0c88db3">cub::BlockLoad&lt; InputIteratorRA, BLOCK_THREADS, ITEMS_PER_THREAD, ALGORITHM, MODIFIER, WARP_TIME_SLICING &gt;</a>
+</li>
+<li>BlockRadixSort()
+: <a class="el" href="classcub_1_1_block_radix_sort.html#ac7c896d6549960400b7710a262532e0e">cub::BlockRadixSort&lt; Key, BLOCK_THREADS, ITEMS_PER_THREAD, Value, RADIX_BITS, MEMOIZE_OUTER_SCAN, INNER_SCAN_ALGORITHM, SMEM_CONFIG &gt;</a>
+</li>
+<li>BlockReduce()
+: <a class="el" href="classcub_1_1_block_reduce.html#a126757e3d17a046190ed6e4383d8f615">cub::BlockReduce&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+</li>
+<li>BlockScan()
+: <a class="el" href="classcub_1_1_block_scan.html#a6264c3383db3384184cb13f5f282f73d">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+</li>
+<li>BlockStore()
+: <a class="el" href="classcub_1_1_block_store.html#ad772f7f8a121b62d0c8d752f545110a3">cub::BlockStore&lt; OutputIteratorRA, BLOCK_THREADS, ITEMS_PER_THREAD, ALGORITHM, MODIFIER, WARP_TIME_SLICING &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x63.html b/docs/html/functions_0x63.html
new file mode 100644
index 0000000000..8af143b62e
--- /dev/null
+++ b/docs/html/functions_0x63.html
@@ -0,0 +1,159 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li class="current"><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_c"></a>- c -</h3><ul>
+<li>CachingDeviceAllocator()
+: <a class="el" href="structcub_1_1_caching_device_allocator.html#a36b5c020ec501279b2b1275eae578918">cub::CachingDeviceAllocator</a>
+</li>
+<li>Callback()
+: <a class="el" href="classcub_1_1_device.html#a3c986a6aa2d3b69fe8a7ab14c85a6477">cub::Device</a>
+</li>
+<li>CATEGORY
+: <a class="el" href="structcub_1_1_base_traits.html#a25ff6477c84dc3bd5f4b5e70cd600f09">cub::BaseTraits&lt; _CATEGORY, _PRIMITIVE, _NULL_TYPE, _UnsignedBits &gt;</a>
+</li>
+<li>Composite()
+: <a class="el" href="classcub_1_1_block_histogram.html#a86aca800e8a8e886b5d328e7aa3c5582">cub::BlockHistogram&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, BINS, ALGORITHM &gt;</a>
+</li>
+<li>ConstantIteratorRA()
+: <a class="el" href="classcub_1_1_constant_iterator_r_a.html#aa2e8da63f412840cadb94578a0f36348">cub::ConstantIteratorRA&lt; OutputType &gt;</a>
+</li>
+<li>Current()
+: <a class="el" href="structcub_1_1_double_buffer.html#a861d3dff1a70d5e5926057a44d9b8724">cub::DoubleBuffer&lt; T &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x64.html b/docs/html/functions_0x64.html
new file mode 100644
index 0000000000..31c4371932
--- /dev/null
+++ b/docs/html/functions_0x64.html
@@ -0,0 +1,156 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li class="current"><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_d"></a>- d -</h3><ul>
+<li>d_buffers
+: <a class="el" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4">cub::DoubleBuffer&lt; T &gt;</a>
+</li>
+<li>DeviceAllocate()
+: <a class="el" href="structcub_1_1_caching_device_allocator.html#a4a6fd29b17ff15c6a2ee01a25c5e45fb">cub::CachingDeviceAllocator</a>
+</li>
+<li>DeviceFree()
+: <a class="el" href="structcub_1_1_caching_device_allocator.html#aafd80ae2cdadb883fe1da0c8a549228c">cub::CachingDeviceAllocator</a>
+</li>
+<li>DeviceWord
+: <a class="el" href="structcub_1_1_uninitialized.html#ab100c102e4368f8c9038f8a2e80d3fc9">cub::Uninitialized&lt; T &gt;</a>
+</li>
+<li>DoubleBuffer()
+: <a class="el" href="structcub_1_1_double_buffer.html#a100c51f0e1aefdff4cdfe6480c89f59e">cub::DoubleBuffer&lt; T &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x65.html b/docs/html/functions_0x65.html
new file mode 100644
index 0000000000..e95a76fa06
--- /dev/null
+++ b/docs/html/functions_0x65.html
@@ -0,0 +1,158 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li class="current"><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_e"></a>- e -</h3><ul>
+<li>ExclusiveScan()
+: <a class="el" href="classcub_1_1_block_scan.html#a2cd6dc7b523db630f4719b1b77df4db7">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_scan.html#aafbc42fcea0a11b83289629554cbe625">cub::WarpScan&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="classcub_1_1_block_scan.html#a1cda15ada4f880a7f428bd248c686710">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_scan.html#ada12695322d9e1f5354fcae9d0910113">cub::WarpScan&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="classcub_1_1_block_scan.html#ab61af70303ff86b4aead54c1f83f0e30">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_scan.html#af51aef1f68a2ca876f7515b6b3213d72">cub::WarpScan&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="structcub_1_1_device_scan.html#a5fb74735fdd88202a9310432c77a4a3a">cub::DeviceScan</a>
+</li>
+<li>ExclusiveSum()
+: <a class="el" href="classcub_1_1_block_scan.html#ab6f9a0fa1ac832dcfb31bfacd7f1e22b">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="structcub_1_1_device_scan.html#ac49b99df1f6b561b477d4fd797fe0ea8">cub::DeviceScan</a>
+, <a class="el" href="classcub_1_1_warp_scan.html#ab68084364e2235b53998861731b267f8">cub::WarpScan&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="classcub_1_1_block_scan.html#a1fd276abbe08f7031a0333bf5c98c2f5">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_scan.html#acf4960fcb08e5960ca7c9aa28a34ae1c">cub::WarpScan&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="classcub_1_1_block_scan.html#a97e041cbdfdb4005ffc65b45c9276403">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x66.html b/docs/html/functions_0x66.html
new file mode 100644
index 0000000000..bb95653b51
--- /dev/null
+++ b/docs/html/functions_0x66.html
@@ -0,0 +1,150 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li class="current"><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_f"></a>- f -</h3><ul>
+<li>FlagHeads()
+: <a class="el" href="classcub_1_1_block_discontinuity.html#afabe7f18d7098e7d0f149696bec17186">cub::BlockDiscontinuity&lt; T, BLOCK_THREADS &gt;</a>
+</li>
+<li>FlagTails()
+: <a class="el" href="classcub_1_1_block_discontinuity.html#ad80f6195b0366d7f88180dc349043179">cub::BlockDiscontinuity&lt; T, BLOCK_THREADS &gt;</a>
+</li>
+<li>FreeAllCached()
+: <a class="el" href="structcub_1_1_caching_device_allocator.html#afbe43fd3a59ba6f4b974a4a66315c86e">cub::CachingDeviceAllocator</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x68.html b/docs/html/functions_0x68.html
new file mode 100644
index 0000000000..9b9bd565da
--- /dev/null
+++ b/docs/html/functions_0x68.html
@@ -0,0 +1,153 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li class="current"><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_h"></a>- h -</h3><ul>
+<li>HAS_PARAM
+: <a class="el" href="structcub_1_1_binary_op_has_idx_param.html#a8eb893aad920fb1153670ff4a5b75f7a">cub::BinaryOpHasIdxParam&lt; T, BinaryOp &gt;</a>
+</li>
+<li>HeadSegmentedReduce()
+: <a class="el" href="classcub_1_1_warp_reduce.html#a85d8612201876163a74a807c585b0af1">cub::WarpReduce&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+</li>
+<li>HeadSegmentedSum()
+: <a class="el" href="classcub_1_1_warp_reduce.html#abc0cd1853c09b27fc45f564596163be4">cub::WarpReduce&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+</li>
+<li>Histogram()
+: <a class="el" href="classcub_1_1_block_histogram.html#a53ca73d018639c89b4e0b1ed3e0f67f0">cub::BlockHistogram&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, BINS, ALGORITHM &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x69.html b/docs/html/functions_0x69.html
new file mode 100644
index 0000000000..6f53445b1d
--- /dev/null
+++ b/docs/html/functions_0x69.html
@@ -0,0 +1,162 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li class="current"><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_i"></a>- i -</h3><ul>
+<li>InclusiveScan()
+: <a class="el" href="classcub_1_1_block_scan.html#afb56064490291f37a712bcc3064ccbab">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_scan.html#aafd14f3920c493b104a3a6a0cc6a39d2">cub::WarpScan&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="classcub_1_1_block_scan.html#a2885c51314333f4b98dacefcd7c918fc">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_scan.html#adf74795dbe02947facd24657bc519c40">cub::WarpScan&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="classcub_1_1_block_scan.html#a7e1622b40fe73bdb6550f4dca2ae290a">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="structcub_1_1_device_scan.html#a2f6de564140e06b391ad0d987142762f">cub::DeviceScan</a>
+</li>
+<li>InclusiveSum()
+: <a class="el" href="classcub_1_1_block_scan.html#ae1a4a4dfbec4ec029dd6a8cce8b6c0a1">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="structcub_1_1_device_scan.html#a7c8471b7508fca37dfd3198b9111911a">cub::DeviceScan</a>
+, <a class="el" href="classcub_1_1_block_scan.html#a570505ebdc51e2e47373fcb87e9a7d62">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_scan.html#a906d0d6381b3af1ad105ec69547350f3">cub::WarpScan&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="classcub_1_1_block_scan.html#a88ffea45e2a8b5e3abb6e4c4777e66ef">cub::BlockScan&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+</li>
+<li>Init()
+: <a class="el" href="classcub_1_1_device.html#a4c1aecec381d2dce80120362feb2d0ca">cub::Device</a>
+</li>
+<li>InitHistogram()
+: <a class="el" href="classcub_1_1_block_histogram.html#a3cae3cfe2ca8388fb2e3a18c0822db3a">cub::BlockHistogram&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, BINS, ALGORITHM &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x6c.html b/docs/html/functions_0x6c.html
new file mode 100644
index 0000000000..b2100fb3ac
--- /dev/null
+++ b/docs/html/functions_0x6c.html
@@ -0,0 +1,147 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li class="current"><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_l"></a>- l -</h3><ul>
+<li>Load()
+: <a class="el" href="classcub_1_1_block_load.html#aa49d3ea3d7a6fcb5c2c4f376ece3a65f">cub::BlockLoad&lt; InputIteratorRA, BLOCK_THREADS, ITEMS_PER_THREAD, ALGORITHM, MODIFIER, WARP_TIME_SLICING &gt;</a>
+</li>
+<li>LOG_SMEM_BANKS
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x6d.html b/docs/html/functions_0x6d.html
new file mode 100644
index 0000000000..3b20f3b6c9
--- /dev/null
+++ b/docs/html/functions_0x6d.html
@@ -0,0 +1,180 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li class="current"><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_m"></a>- m -</h3><ul>
+<li>MAX_BLOCK_THREADS
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9079f42fbfb80e59ef7affc574bf6001">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>max_block_threads
+: <a class="el" href="classcub_1_1_device.html#ab55f58e3252d369ee50d34b190df2277">cub::Device</a>
+</li>
+<li>max_sm_blocks
+: <a class="el" href="classcub_1_1_device.html#ac614bed852b56bf8c616803aa8601caf">cub::Device</a>
+</li>
+<li>MAX_SM_REGISTERS
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a90062d88d6a9abcfdfd4c29111a5ac3e">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>max_sm_registers
+: <a class="el" href="classcub_1_1_device.html#af321be8fe9aecd0942d04739f7520c61">cub::Device</a>
+</li>
+<li>MAX_SM_THREADBLOCKS
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063abdc229ee36991bb6055f3bd42fc59387">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>max_sm_threads
+: <a class="el" href="classcub_1_1_device.html#a963c497e442ac283b2655faa578614d3">cub::Device</a>
+</li>
+<li>MAX_SM_THREADS
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a3aa3c3db5dc28ef11961f6867fee7101">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>max_sm_warps
+: <a class="el" href="classcub_1_1_device.html#a5ee84e74af9939896bb81b48d4843d17">cub::Device</a>
+</li>
+<li>MaxSmOccupancy()
+: <a class="el" href="classcub_1_1_device.html#a618bbf36a5737a9b1533ff65834e88e8">cub::Device</a>
+</li>
+<li>MultiChannelGlobalAtomic()
+: <a class="el" href="structcub_1_1_device_histogram.html#a0e6bee2938ad70ab128ed1a1c5f6d083">cub::DeviceHistogram</a>
+</li>
+<li>MultiChannelSharedAtomic()
+: <a class="el" href="structcub_1_1_device_histogram.html#a9744fa6ed9761986c6c13afdcb20909d">cub::DeviceHistogram</a>
+</li>
+<li>MultiChannelSorting()
+: <a class="el" href="structcub_1_1_device_histogram.html#a7f9a00987e98b828823f062d563aaa8c">cub::DeviceHistogram</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x6f.html b/docs/html/functions_0x6f.html
new file mode 100644
index 0000000000..e76fd4018c
--- /dev/null
+++ b/docs/html/functions_0x6f.html
@@ -0,0 +1,149 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li class="current"><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_o"></a>- o -</h3><ul>
+<li>operator()()
+: <a class="el" href="structcub_1_1_equality.html#a8d794f350ea8af24762aa2c7c0a33ffd">cub::Equality</a>
+, <a class="el" href="structcub_1_1_cast.html#a7dbee2a0bbb0725ee68c7ef29c81d158">cub::Cast&lt; B &gt;</a>
+, <a class="el" href="structcub_1_1_min.html#a97a64bb018710d853899e2c404f95a46">cub::Min</a>
+, <a class="el" href="structcub_1_1_max.html#af1c750dc060716f98a0c1ecb7659f49e">cub::Max</a>
+, <a class="el" href="structcub_1_1_sum.html#af18505bb0216d1991cd7eaf796f12d0f">cub::Sum</a>
+, <a class="el" href="structcub_1_1_inequality.html#a3f5336babc38ad540a06df134292fbb0">cub::Inequality</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x70.html b/docs/html/functions_0x70.html
new file mode 100644
index 0000000000..0d161ccb01
--- /dev/null
+++ b/docs/html/functions_0x70.html
@@ -0,0 +1,144 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li class="current"><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_p"></a>- p -</h3><ul>
+<li>ptx_version
+: <a class="el" href="classcub_1_1_device.html#a416909debdeaa9116d7087ed55ed870f">cub::Device</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x72.html b/docs/html/functions_0x72.html
new file mode 100644
index 0000000000..8e073ec5a8
--- /dev/null
+++ b/docs/html/functions_0x72.html
@@ -0,0 +1,160 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li class="current"><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_r"></a>- r -</h3><ul>
+<li>Reduce()
+: <a class="el" href="classcub_1_1_block_reduce.html#a77dac72eafb56f394762b8d3b937de79">cub::BlockReduce&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="structcub_1_1_device_reduce.html#ae7d87f3c83dd336e77b2ae900f74e092">cub::DeviceReduce</a>
+, <a class="el" href="classcub_1_1_warp_reduce.html#a1aa0a6e1a2c3feabbc20c27864df15c1">cub::WarpReduce&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="classcub_1_1_block_reduce.html#a0c9d086cb37f41a74d1a4c02fae741c4">cub::BlockReduce&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_reduce.html#a176c3c913e3e077aab691a186f161d8e">cub::WarpReduce&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+</li>
+<li>reg_alloc_unit
+: <a class="el" href="classcub_1_1_device.html#aa432ab8fdb1d1117b29811422c83a187">cub::Device</a>
+</li>
+<li>REG_ALLOC_UNIT
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a5f6934930aa379cd70b7c8e19bcff4bc">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>regs_by_block
+: <a class="el" href="classcub_1_1_device.html#a721a479d183aaa1846c69de998f84ffc">cub::Device</a>
+</li>
+<li>REGS_BY_BLOCK
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063addc3e62803e3ed6d8ec351faa7a2c45d">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x73.html b/docs/html/functions_0x73.html
new file mode 100644
index 0000000000..bfaab62689
--- /dev/null
+++ b/docs/html/functions_0x73.html
@@ -0,0 +1,221 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li class="current"><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_s"></a>- s -</h3><ul>
+<li>ScatterToBlocked()
+: <a class="el" href="classcub_1_1_block_exchange.html#ac8dd22c90a28e54a8c1d6b0637054661">cub::BlockExchange&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING &gt;</a>
+</li>
+<li>ScatterToStriped()
+: <a class="el" href="classcub_1_1_block_exchange.html#a53516886ba6750060819581b1bb23d68">cub::BlockExchange&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING &gt;</a>
+</li>
+<li>selector
+: <a class="el" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4">cub::DoubleBuffer&lt; T &gt;</a>
+</li>
+<li>SetMaxCachedBytes()
+: <a class="el" href="structcub_1_1_caching_device_allocator.html#a2216ab13fdeb11ce61f04f69899fff33">cub::CachingDeviceAllocator</a>
+</li>
+<li>SingleChannelGlobalAtomic()
+: <a class="el" href="structcub_1_1_device_histogram.html#a6659e9723fda5e5c0ac587aa66fb54c3">cub::DeviceHistogram</a>
+</li>
+<li>SingleChannelSharedAtomic()
+: <a class="el" href="structcub_1_1_device_histogram.html#a425559a4dc730f55f46e0faa5080e266">cub::DeviceHistogram</a>
+</li>
+<li>SingleChannelSorting()
+: <a class="el" href="structcub_1_1_device_histogram.html#ad0cc7bacd6022916cb228437eeb9c82a">cub::DeviceHistogram</a>
+</li>
+<li>sm_count
+: <a class="el" href="classcub_1_1_device.html#a68885a90ea0badcffc2a3511b0b4fd5c">cub::Device</a>
+</li>
+<li>sm_version
+: <a class="el" href="classcub_1_1_device.html#ac9b36b3b0edb207aeee60110fbee6406">cub::Device</a>
+</li>
+<li>SMEM_ALLOC_UNIT
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063af554a252a393bce18200236640959bab">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>smem_alloc_unit
+: <a class="el" href="classcub_1_1_device.html#aca17efd166d916008f0fc378adc00b1f">cub::Device</a>
+</li>
+<li>SMEM_BANK_BYTES
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ab56aa4deb8408a51e7cc139c2c1e14f5">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>smem_bank_bytes
+: <a class="el" href="classcub_1_1_device.html#a909d34dd31bdb6f754a603e8eb2b10ab">cub::Device</a>
+</li>
+<li>SMEM_BANKS
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a55ab5a77ae95f67255bbec10cd3993e1">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>smem_banks
+: <a class="el" href="classcub_1_1_device.html#a2e835add85abdf0eb640c551abec2a0b">cub::Device</a>
+</li>
+<li>SMEM_BYTES
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a993d6ee811a054da1a8579132c6301a1">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>smem_bytes
+: <a class="el" href="classcub_1_1_device.html#a838c9a2e207c38ef24e79a40bccdd1ac">cub::Device</a>
+</li>
+<li>Sort()
+: <a class="el" href="classcub_1_1_block_radix_sort.html#aac3d9424388b0cb6da360624e627b61e">cub::BlockRadixSort&lt; Key, BLOCK_THREADS, ITEMS_PER_THREAD, Value, RADIX_BITS, MEMOIZE_OUTER_SCAN, INNER_SCAN_ALGORITHM, SMEM_CONFIG &gt;</a>
+</li>
+<li>SortBlockedToStriped()
+: <a class="el" href="classcub_1_1_block_radix_sort.html#a4be0c8d355a7fc75f8b405a776d884d3">cub::BlockRadixSort&lt; Key, BLOCK_THREADS, ITEMS_PER_THREAD, Value, RADIX_BITS, MEMOIZE_OUTER_SCAN, INNER_SCAN_ALGORITHM, SMEM_CONFIG &gt;</a>
+</li>
+<li>SortKeys()
+: <a class="el" href="structcub_1_1_device_radix_sort.html#aafc81e527c3fe142b482ed59835fd0d3">cub::DeviceRadixSort</a>
+</li>
+<li>SortPairs()
+: <a class="el" href="structcub_1_1_device_radix_sort.html#ad42b50b38c4296c371572efdedd49fed">cub::DeviceRadixSort</a>
+</li>
+<li>storage
+: <a class="el" href="structcub_1_1_uninitialized.html#a5fa7311d943222333e8c87497ff8e782">cub::Uninitialized&lt; T &gt;</a>
+</li>
+<li>Store()
+: <a class="el" href="classcub_1_1_block_store.html#ac02678cf9b327e095376f443bc4feda2">cub::BlockStore&lt; OutputIteratorRA, BLOCK_THREADS, ITEMS_PER_THREAD, ALGORITHM, MODIFIER, WARP_TIME_SLICING &gt;</a>
+</li>
+<li>StripedToBlocked()
+: <a class="el" href="classcub_1_1_block_exchange.html#a063505380e68bb5744d12fa7e1f16145">cub::BlockExchange&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING &gt;</a>
+</li>
+<li>Sum()
+: <a class="el" href="classcub_1_1_block_reduce.html#a7565f00c47dc7dfb286668bea15dad05">cub::BlockReduce&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="structcub_1_1_device_reduce.html#ae927a1815745ceed75ff677ffd3b0701">cub::DeviceReduce</a>
+, <a class="el" href="classcub_1_1_block_reduce.html#a2611610d09bb8daca91e414a77c1e937">cub::BlockReduce&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_reduce.html#a2ccc6eb62a1e6caf145eb94a8cd58f0f">cub::WarpReduce&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+, <a class="el" href="classcub_1_1_block_reduce.html#aa52adf836e96dee812f456283cac13f7">cub::BlockReduce&lt; T, BLOCK_THREADS, ALGORITHM &gt;</a>
+, <a class="el" href="classcub_1_1_warp_reduce.html#a3327a2b8c9bdce58f7af1e2485489eed">cub::WarpReduce&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x74.html b/docs/html/functions_0x74.html
new file mode 100644
index 0000000000..1eb890dbe1
--- /dev/null
+++ b/docs/html/functions_0x74.html
@@ -0,0 +1,165 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li class="current"><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_t"></a>- t -</h3><ul>
+<li>TailSegmentedReduce()
+: <a class="el" href="classcub_1_1_warp_reduce.html#a074ddcaf999d4e97376b145086e78ddb">cub::WarpReduce&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+</li>
+<li>TailSegmentedSum()
+: <a class="el" href="classcub_1_1_warp_reduce.html#a5b0134131d03909e43d24d6b0b50beb4">cub::WarpReduce&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+</li>
+<li>TexBindingTag
+: <a class="el" href="classcub_1_1_tex_transform_iterator_r_a.html#ad3c3a602ae30d4badc2710dfa9148d27">cub::TexTransformIteratorRA&lt; OutputType, ConversionOp, InputType &gt;</a>
+, <a class="el" href="classcub_1_1_tex_iterator_r_a.html#a5e210ab4fc1c16ef4fadffb56eba1319">cub::TexIteratorRA&lt; T &gt;</a>
+</li>
+<li>TexIteratorRA()
+: <a class="el" href="classcub_1_1_tex_iterator_r_a.html#a1b8f21c2753cee33dd90944e4027fa36">cub::TexIteratorRA&lt; T &gt;</a>
+</li>
+<li>TexTransformIteratorRA()
+: <a class="el" href="classcub_1_1_tex_transform_iterator_r_a.html#a825dd0bd64a07e8f31f646fc220edffa">cub::TexTransformIteratorRA&lt; OutputType, ConversionOp, InputType &gt;</a>
+</li>
+<li>TransformIteratorRA()
+: <a class="el" href="classcub_1_1_transform_iterator_r_a.html#abac05c9208f609ac1b2f1b94241cdcec">cub::TransformIteratorRA&lt; OutputType, ConversionOp, InputType &gt;</a>
+</li>
+<li>Type
+: <a class="el" href="structcub_1_1_enable_if.html#aafd9405b5887d2a6d3553eee0202798a">cub::EnableIf&lt; Condition, T &gt;</a>
+, <a class="el" href="structcub_1_1_if.html#af689e9527f56372e66413b65581ded8e">cub::If&lt; IF, ThenType, ElseType &gt;</a>
+, <a class="el" href="structcub_1_1_remove_qualifiers.html#a9143e196ef5e6a0176b953f677e94671">cub::RemoveQualifiers&lt; Tp, Up &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x75.html b/docs/html/functions_0x75.html
new file mode 100644
index 0000000000..da529e9e23
--- /dev/null
+++ b/docs/html/functions_0x75.html
@@ -0,0 +1,145 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li class="current"><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_u"></a>- u -</h3><ul>
+<li>UnbindTexture()
+: <a class="el" href="classcub_1_1_tex_iterator_r_a.html#abfc8c42e2da2beffb05ac81ec89ed8b9">cub::TexIteratorRA&lt; T &gt;</a>
+, <a class="el" href="classcub_1_1_tex_transform_iterator_r_a.html#abd030991795b9c9ca31f4293486d206a">cub::TexTransformIteratorRA&lt; OutputType, ConversionOp, InputType &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x77.html b/docs/html/functions_0x77.html
new file mode 100644
index 0000000000..0fa68a4662
--- /dev/null
+++ b/docs/html/functions_0x77.html
@@ -0,0 +1,162 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li class="current"><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_w"></a>- w -</h3><ul>
+<li>WARP_ALLOC_UNIT
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a25bc7bb8dac71df0b7962776e0ed9cde">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>warp_alloc_unit
+: <a class="el" href="classcub_1_1_device.html#ac5f8afb6f319b0dbd689f3f1188fc20b">cub::Device</a>
+</li>
+<li>warp_threads
+: <a class="el" href="classcub_1_1_device.html#a4498c242e597f67a4a752426ae262049">cub::Device</a>
+</li>
+<li>WARP_THREADS
+: <a class="el" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c">cub::ArchProps&lt; SM_ARCH &gt;</a>
+</li>
+<li>WarpReduce()
+: <a class="el" href="classcub_1_1_warp_reduce.html#aac44f5e8003911f074156366969947e4">cub::WarpReduce&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+</li>
+<li>WarpScan()
+: <a class="el" href="classcub_1_1_warp_scan.html#a27ca414b95f92f2b52701cda45273b05">cub::WarpScan&lt; T, LOGICAL_WARPS, LOGICAL_WARP_THREADS &gt;</a>
+</li>
+<li>WarpStripedToBlocked()
+: <a class="el" href="classcub_1_1_block_exchange.html#a09969c12793c1876a2e6328c97c0330a">cub::BlockExchange&lt; T, BLOCK_THREADS, ITEMS_PER_THREAD, WARP_TIME_SLICING &gt;</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/functions_0x7e.html b/docs/html/functions_0x7e.html
new file mode 100644
index 0000000000..91f0ed6c0e
--- /dev/null
+++ b/docs/html/functions_0x7e.html
@@ -0,0 +1,144 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Class Members</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow3" class="tabs2">
+    <ul class="tablist">
+      <li class="current"><a href="functions.html"><span>All</span></a></li>
+      <li><a href="functions_func.html"><span>Functions</span></a></li>
+      <li><a href="functions_vars.html"><span>Variables</span></a></li>
+      <li><a href="functions_type.html"><span>Typedefs</span></a></li>
+      <li><a href="functions_eval.html"><span>Enumerator</span></a></li>
+    </ul>
+  </div>
+  <div id="navrow4" class="tabs3">
+    <ul class="tablist">
+      <li><a href="functions.html#index_a"><span>a</span></a></li>
+      <li><a href="functions_0x62.html#index_b"><span>b</span></a></li>
+      <li><a href="functions_0x63.html#index_c"><span>c</span></a></li>
+      <li><a href="functions_0x64.html#index_d"><span>d</span></a></li>
+      <li><a href="functions_0x65.html#index_e"><span>e</span></a></li>
+      <li><a href="functions_0x66.html#index_f"><span>f</span></a></li>
+      <li><a href="functions_0x68.html#index_h"><span>h</span></a></li>
+      <li><a href="functions_0x69.html#index_i"><span>i</span></a></li>
+      <li><a href="functions_0x6c.html#index_l"><span>l</span></a></li>
+      <li><a href="functions_0x6d.html#index_m"><span>m</span></a></li>
+      <li><a href="functions_0x6f.html#index_o"><span>o</span></a></li>
+      <li><a href="functions_0x70.html#index_p"><span>p</span></a></li>
+      <li><a href="functions_0x72.html#index_r"><span>r</span></a></li>
+      <li><a href="functions_0x73.html#index_s"><span>s</span></a></li>
+      <li><a href="functions_0x74.html#index_t"><span>t</span></a></li>
+      <li><a href="functions_0x75.html#index_u"><span>u</span></a></li>
+      <li><a href="functions_0x77.html#index_w"><span>w</span></a></li>
+      <li class="current"><a href="functions_0x7e.html#index_0x7e"><span>~</span></a></li>
+    </ul>
+  </div>
+</div><!-- top -->
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div class="contents">
+<div class="textblock">Here is a list of all documented class members with links to the class documentation for each member:</div>
+
+<h3><a class="anchor" id="index_0x7e"></a>- ~ -</h3><ul>
+<li>~CachingDeviceAllocator()
+: <a class="el" href="structcub_1_1_caching_device_allocator.html#a2a521f7464d3eee98486b4d321fc8cc7">cub::CachingDeviceAllocator</a>
+</li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:47 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/structcub_1_1_inequality-members.html b/docs/html/structcub_1_1_inequality-members.html
new file mode 100644
index 0000000000..04e607d77b
--- /dev/null
+++ b/docs/html/structcub_1_1_inequality-members.html
@@ -0,0 +1,118 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecub.html">cub</a></li><li class="navelem"><a class="el" href="structcub_1_1_inequality.html">Inequality</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cub::Inequality Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcub_1_1_inequality.html">cub::Inequality</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcub_1_1_inequality.html#a3f5336babc38ad540a06df134292fbb0">operator()</a>(const T &amp;a, const T &amp;b)</td><td class="entry"><a class="el" href="structcub_1_1_inequality.html">cub::Inequality</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:46 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/structcub_1_1_inequality.html b/docs/html/structcub_1_1_inequality.html
new file mode 100644
index 0000000000..2b65c4c0c4
--- /dev/null
+++ b/docs/html/structcub_1_1_inequality.html
@@ -0,0 +1,134 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: cub::Inequality Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecub.html">cub</a></li><li class="navelem"><a class="el" href="structcub_1_1_inequality.html">Inequality</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Methods</a> &#124;
+<a href="structcub_1_1_inequality-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cub::Inequality Struct Reference<div class="ingroups"><a class="el" href="group___thread_module.html">Thread</a></div></div>  </div>
+</div><!--header-->
+<div class="contents">
+<a name="details" id="details"></a><h2 class="groupheader">Detailed description</h2>
+<div class="textblock"><p>Default inequality functor. </p>
+
+<p>Definition at line <a class="el" href="thread__operators_8cuh_source.html#l00072">72</a> of file <a class="el" href="thread__operators_8cuh_source.html">thread_operators.cuh</a>.</p>
+</div><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Methods</h2></td></tr>
+<tr class="memitem:a3f5336babc38ad540a06df134292fbb0"><td class="memTemplParams" colspan="2"><a class="anchor" id="a3f5336babc38ad540a06df134292fbb0"></a>
+template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a3f5336babc38ad540a06df134292fbb0"><td class="memTemplItemLeft" align="right" valign="top">__host__ __device__ <br class="typebreak"/>
+__forceinline__ bool&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcub_1_1_inequality.html#a3f5336babc38ad540a06df134292fbb0">operator()</a> (const T &amp;a, const T &amp;b)</td></tr>
+<tr class="memdesc:a3f5336babc38ad540a06df134292fbb0"><td class="mdescLeft">&#160;</td><td class="mdescRight">Boolean inequality operator, returns <code>(a != b)</code> <br/></td></tr>
+<tr class="separator:a3f5336babc38ad540a06df134292fbb0"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="thread__operators_8cuh_source.html">thread_operators.cuh</a></li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:46 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/structcub_1_1_min-members.html b/docs/html/structcub_1_1_min-members.html
new file mode 100644
index 0000000000..e4c6bf3838
--- /dev/null
+++ b/docs/html/structcub_1_1_min-members.html
@@ -0,0 +1,118 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: Member List</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecub.html">cub</a></li><li class="navelem"><a class="el" href="structcub_1_1_min.html">Min</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">cub::Min Member List</div>  </div>
+</div><!--header-->
+<div class="contents">
+
+<p>This is the complete list of members for <a class="el" href="structcub_1_1_min.html">cub::Min</a>, including all inherited members.</p>
+<table class="directory">
+  <tr class="even"><td class="entry"><a class="el" href="structcub_1_1_min.html#a97a64bb018710d853899e2c404f95a46">operator()</a>(const T &amp;a, const T &amp;b)</td><td class="entry"><a class="el" href="structcub_1_1_min.html">cub::Min</a></td><td class="entry"><span class="mlabel">inline</span></td></tr>
+</table></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:46 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/structcub_1_1_min.html b/docs/html/structcub_1_1_min.html
new file mode 100644
index 0000000000..9dc36d9423
--- /dev/null
+++ b/docs/html/structcub_1_1_min.html
@@ -0,0 +1,134 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: cub::Min Struct Reference</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li class="current"><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="annotated.html"><span>Class&#160;List</span></a></li>
+      <li><a href="classes.html"><span>Class&#160;Index</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="namespacecub.html">cub</a></li><li class="navelem"><a class="el" href="structcub_1_1_min.html">Min</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="summary">
+<a href="#pub-methods">Public Methods</a> &#124;
+<a href="structcub_1_1_min-members.html">List of all members</a>  </div>
+  <div class="headertitle">
+<div class="title">cub::Min Struct Reference<div class="ingroups"><a class="el" href="group___thread_module.html">Thread</a></div></div>  </div>
+</div><!--header-->
+<div class="contents">
+<a name="details" id="details"></a><h2 class="groupheader">Detailed description</h2>
+<div class="textblock"><p>Default min functor. </p>
+
+<p>Definition at line <a class="el" href="thread__operators_8cuh_source.html#l00114">114</a> of file <a class="el" href="thread__operators_8cuh_source.html">thread_operators.cuh</a>.</p>
+</div><table class="memberdecls">
+<tr class="heading"><td colspan="2"><h2 class="groupheader"><a name="pub-methods"></a>
+Public Methods</h2></td></tr>
+<tr class="memitem:a97a64bb018710d853899e2c404f95a46"><td class="memTemplParams" colspan="2"><a class="anchor" id="a97a64bb018710d853899e2c404f95a46"></a>
+template&lt;typename T &gt; </td></tr>
+<tr class="memitem:a97a64bb018710d853899e2c404f95a46"><td class="memTemplItemLeft" align="right" valign="top">__host__ __device__ <br class="typebreak"/>
+__forceinline__ T&#160;</td><td class="memTemplItemRight" valign="bottom"><a class="el" href="structcub_1_1_min.html#a97a64bb018710d853899e2c404f95a46">operator()</a> (const T &amp;a, const T &amp;b)</td></tr>
+<tr class="memdesc:a97a64bb018710d853899e2c404f95a46"><td class="mdescLeft">&#160;</td><td class="mdescRight">Boolean min operator, returns <code>(a &lt; b) ? a : b</code> <br/></td></tr>
+<tr class="separator:a97a64bb018710d853899e2c404f95a46"><td class="memSeparator" colspan="2">&#160;</td></tr>
+</table>
+<hr/>The documentation for this struct was generated from the following file:<ul>
+<li><a class="el" href="thread__operators_8cuh_source.html">thread_operators.cuh</a></li>
+</ul>
+</div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:46 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/thread__load_8cuh_source.html b/docs/html/thread__load_8cuh_source.html
new file mode 100644
index 0000000000..686d16eb79
--- /dev/null
+++ b/docs/html/thread__load_8cuh_source.html
@@ -0,0 +1,444 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: thread_load.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_bb50a5ef59f19d030d06415663184d05.html">thread</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">thread_load.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="thread__load_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;cuda.h&gt;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &lt;iterator&gt;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;../util_ptx.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment">// Tags and constants</span></div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div>
+<div class="line"><a name="l00062"></a><span class="lineno"><a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d">   62</a></span>&#160;<span class="keyword">enum</span> <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a></div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;{</div>
+<div class="line"><a name="l00064"></a><span class="lineno"><a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55daee682a9988eceaefd9a53a7ef92fe6e2">   64</a></span>&#160;    <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55daee682a9988eceaefd9a53a7ef92fe6e2" title="Default (no modifier) ">LOAD_DEFAULT</a>,       </div>
+<div class="line"><a name="l00065"></a><span class="lineno"><a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55dacec87ab52dfb122d1555bfdfe44c23ae">   65</a></span>&#160;    <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55dacec87ab52dfb122d1555bfdfe44c23ae" title="Cache at all levels. ">LOAD_CA</a>,            </div>
+<div class="line"><a name="l00066"></a><span class="lineno"><a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55dafad1bebebe5fe5ee6f6dfb5dc220009f">   66</a></span>&#160;    <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55dafad1bebebe5fe5ee6f6dfb5dc220009f" title="Cache at global level. ">LOAD_CG</a>,            </div>
+<div class="line"><a name="l00067"></a><span class="lineno"><a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da6f0ae5826ad5eee54046731f7c71c874">   67</a></span>&#160;    <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da6f0ae5826ad5eee54046731f7c71c874" title="Cache streaming (likely to be accessed once) ">LOAD_CS</a>,            </div>
+<div class="line"><a name="l00068"></a><span class="lineno"><a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da83161be6f5901c6559583c0f7ea96076">   68</a></span>&#160;    <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da83161be6f5901c6559583c0f7ea96076" title="Cache as volatile (including cached system lines) ">LOAD_CV</a>,            </div>
+<div class="line"><a name="l00069"></a><span class="lineno"><a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da0217758d7be24e5fd450d1d49aec36b8">   69</a></span>&#160;    <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da0217758d7be24e5fd450d1d49aec36b8" title="Cache as texture. ">LOAD_LDG</a>,           </div>
+<div class="line"><a name="l00070"></a><span class="lineno"><a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da390f7351eaf6b5b6ea23b4ec089a8236">   70</a></span>&#160;    <a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da390f7351eaf6b5b6ea23b4ec089a8236" title="Volatile (any memory space) ">LOAD_VOLATILE</a>,      </div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;};</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    <span class="keyword">typename</span> InputIteratorRA&gt;</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;__device__ __forceinline__ <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type <a class="code" href="group___io_module.html#ga2467f2337aeeea3a3a1b39d19996d3c2" title="Thread utility for reading memory using cub::PtxLoadModifier cache modifiers. ">ThreadLoad</a>(InputIteratorRA itr);</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="preprocessor">#define CUB_LOAD_16(cub_modifier, ptx_modifier)                                             \</span></div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="preprocessor">    __device__ __forceinline__ int4 ThreadLoad&lt;cub_modifier, int4*&gt;(int4* ptr)              \</span></div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;<span class="preprocessor">        int4 retval;                                                                        \</span></div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;<span class="preprocessor">        asm volatile (&quot;ld.&quot;#ptx_modifier&quot;.v4.s32 {%0, %1, %2, %3}, [%4];&quot; :                 \</span></div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="preprocessor">            &quot;=r&quot;(retval.x),                                                                 \</span></div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="preprocessor">            &quot;=r&quot;(retval.y),                                                                 \</span></div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="preprocessor">            &quot;=r&quot;(retval.z),                                                                 \</span></div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="preprocessor">            &quot;=r&quot;(retval.w) :                                                                \</span></div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr));                                                            \</span></div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="preprocessor">        return retval;                                                                      \</span></div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="preprocessor">    }                                                                                       \</span></div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;<span class="preprocessor">    __device__ __forceinline__ longlong2 ThreadLoad&lt;cub_modifier, longlong2*&gt;(longlong2* ptr)              \</span></div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="preprocessor">        longlong2 retval;                                                                   \</span></div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="preprocessor">        asm volatile (&quot;ld.&quot;#ptx_modifier&quot;.v2.s64 {%0, %1}, [%2];&quot; :                         \</span></div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="preprocessor">            &quot;=l&quot;(retval.x),                                                                 \</span></div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="preprocessor">            &quot;=l&quot;(retval.y) :                                                                \</span></div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr));                                                            \</span></div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;<span class="preprocessor">        return retval;                                                                      \</span></div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;<span class="preprocessor">#define CUB_LOAD_8(cub_modifier, ptx_modifier)                                              \</span></div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="preprocessor">    __device__ __forceinline__ short4 ThreadLoad&lt;cub_modifier, short4*&gt;(short4* ptr)        \</span></div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="preprocessor">        short4 retval;                                                                      \</span></div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="preprocessor">        asm volatile (&quot;ld.&quot;#ptx_modifier&quot;.v4.s16 {%0, %1, %2, %3}, [%4];&quot; :                 \</span></div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;<span class="preprocessor">            &quot;=h&quot;(retval.x),                                                                 \</span></div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;<span class="preprocessor">            &quot;=h&quot;(retval.y),                                                                 \</span></div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;<span class="preprocessor">            &quot;=h&quot;(retval.z),                                                                 \</span></div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;<span class="preprocessor">            &quot;=h&quot;(retval.w) :                                                                \</span></div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr));                                                            \</span></div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;<span class="preprocessor">        return retval;                                                                      \</span></div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;<span class="preprocessor">    }                                                                                       \</span></div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;<span class="preprocessor">    __device__ __forceinline__ int2 ThreadLoad&lt;cub_modifier, int2*&gt;(int2* ptr)              \</span></div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="preprocessor">        int2 retval;                                                                        \</span></div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;<span class="preprocessor">        asm volatile (&quot;ld.&quot;#ptx_modifier&quot;.v2.s32 {%0, %1}, [%2];&quot; :                         \</span></div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;<span class="preprocessor">            &quot;=r&quot;(retval.x),                                                                 \</span></div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="preprocessor">            &quot;=r&quot;(retval.y) :                                                                \</span></div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr));                                                            \</span></div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;<span class="preprocessor">        return retval;                                                                      \</span></div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="preprocessor">    }                                                                                       \</span></div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;<span class="preprocessor">    __device__ __forceinline__ long long ThreadLoad&lt;cub_modifier, long long*&gt;(long long* ptr)                 \</span></div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;<span class="preprocessor">        long long retval;                                                                   \</span></div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;<span class="preprocessor">        asm volatile (&quot;ld.&quot;#ptx_modifier&quot;.s64 %0, [%1];&quot; :                                  \</span></div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;<span class="preprocessor">            &quot;=l&quot;(retval) :                                                                  \</span></div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr));                                                            \</span></div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;<span class="preprocessor">        return retval;                                                                      \</span></div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;<span class="preprocessor">#define CUB_LOAD_4(cub_modifier, ptx_modifier)                                              \</span></div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;<span class="preprocessor">    __device__ __forceinline__ int ThreadLoad&lt;cub_modifier, int*&gt;(int* ptr)                 \</span></div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;<span class="preprocessor">        int retval;                                                                         \</span></div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;<span class="preprocessor">        asm volatile (&quot;ld.&quot;#ptx_modifier&quot;.s32 %0, [%1];&quot; :                                  \</span></div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;<span class="preprocessor">            &quot;=r&quot;(retval) :                                                                  \</span></div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr));                                                            \</span></div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;<span class="preprocessor">        return retval;                                                                      \</span></div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;<span class="preprocessor">#define CUB_LOAD_2(cub_modifier, ptx_modifier)                                              \</span></div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;<span class="preprocessor">    __device__ __forceinline__ short ThreadLoad&lt;cub_modifier, short*&gt;(short* ptr)           \</span></div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;<span class="preprocessor">        short retval;                                                                       \</span></div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;<span class="preprocessor">        asm volatile (&quot;ld.&quot;#ptx_modifier&quot;.s16 %0, [%1];&quot; :                                  \</span></div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;<span class="preprocessor">            &quot;=h&quot;(retval) :                                                                  \</span></div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr));                                                            \</span></div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;<span class="preprocessor">        return retval;                                                                      \</span></div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;<span class="preprocessor">#define CUB_LOAD_1(cub_modifier, ptx_modifier)                                              \</span></div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;<span class="preprocessor">    __device__ __forceinline__ char ThreadLoad&lt;cub_modifier, char*&gt;(char* ptr)              \</span></div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;<span class="preprocessor">        short retval;                                                                       \</span></div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;<span class="preprocessor">        asm volatile (                                                                      \</span></div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;<span class="preprocessor">        &quot;{&quot;                                                                                 \</span></div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;<span class="preprocessor">        &quot;   .reg .s8 datum;&quot;                                                                \</span></div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;<span class="preprocessor">        &quot;    ld.&quot;#ptx_modifier&quot;.s8 datum, [%1];&quot;                                            \</span></div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;<span class="preprocessor">        &quot;    cvt.s16.s8 %0, datum;&quot;                                                         \</span></div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;<span class="preprocessor">        &quot;}&quot; :                                                                               \</span></div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;<span class="preprocessor">            &quot;=h&quot;(retval) :                                                                  \</span></div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr));                                                            \</span></div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;<span class="preprocessor">        return (char) retval;                                                               \</span></div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;<span class="preprocessor">#define CUB_LOAD_ALL(cub_modifier, ptx_modifier)                                            \</span></div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;<span class="preprocessor">    CUB_LOAD_16(cub_modifier, ptx_modifier)                                                 \</span></div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;<span class="preprocessor">    CUB_LOAD_8(cub_modifier, ptx_modifier)                                                  \</span></div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;<span class="preprocessor">    CUB_LOAD_4(cub_modifier, ptx_modifier)                                                  \</span></div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;<span class="preprocessor">    CUB_LOAD_2(cub_modifier, ptx_modifier)                                                  \</span></div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;<span class="preprocessor">    CUB_LOAD_1(cub_modifier, ptx_modifier)                                                  \</span></div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;<span class="preprocessor">#if CUB_PTX_ARCH &gt;= 200</span></div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;<span class="preprocessor"></span>    CUB_LOAD_ALL(<a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55dacec87ab52dfb122d1555bfdfe44c23ae" title="Cache at all levels. ">LOAD_CA</a>, ca)</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;    CUB_LOAD_ALL(<a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55dafad1bebebe5fe5ee6f6dfb5dc220009f" title="Cache at global level. ">LOAD_CG</a>, cg)</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    CUB_LOAD_ALL(<a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da6f0ae5826ad5eee54046731f7c71c874" title="Cache streaming (likely to be accessed once) ">LOAD_CS</a>, cs)</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    CUB_LOAD_ALL(<a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da83161be6f5901c6559583c0f7ea96076" title="Cache as volatile (including cached system lines) ">LOAD_CV</a>, cv)</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;<span class="preprocessor"></span>    <span class="comment">// LOAD_CV on SM10-13 uses &quot;volatile.global&quot; to ensure reads from last level</span></div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    CUB_LOAD_ALL(LOAD_CV, <span class="keyword">volatile</span>.global)</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#if CUB_PTX_ARCH &gt;= 350</span></div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;<span class="preprocessor"></span>    CUB_LOAD_ALL(<a class="code" href="group___io_module.html#gga023420f30fec7d4b187fc98f4fd2a55da0217758d7be24e5fd450d1d49aec36b8" title="Cache as texture. ">LOAD_LDG</a>, global.nc)</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;<span class="keyword">template</span> &lt;PtxLoadModifier MODIFIER, <span class="keywordtype">int</span> COUNT, <span class="keywordtype">int</span> MAX&gt;</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;<span class="keyword">struct </span>IterateThreadLoad</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;{</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ <span class="keywordtype">void</span> Load(T *ptr, T *vals)</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;    {</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;        vals[COUNT] = ThreadLoad&lt;MODIFIER&gt;(ptr + COUNT);</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;        IterateThreadLoad&lt;MODIFIER, COUNT + 1, MAX&gt;::Load(ptr, vals);</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    }</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;};</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;<span class="keyword">template</span> &lt;PtxLoadModifier MODIFIER, <span class="keywordtype">int</span> MAX&gt;</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;<span class="keyword">struct </span>IterateThreadLoad&lt;MODIFIER, MAX, MAX&gt;</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;{</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ <span class="keywordtype">void</span> Load(T *ptr, T *vals) {}</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;};</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> InputIteratorRA&gt;</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;__device__ __forceinline__ <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type <a class="code" href="group___io_module.html#ga2467f2337aeeea3a3a1b39d19996d3c2" title="Thread utility for reading memory using cub::PtxLoadModifier cache modifiers. ">ThreadLoad</a>(</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;    InputIteratorRA         itr,</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    Int2Type&lt;LOAD_DEFAULT&gt;  modifier,</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;    Int2Type&lt;false&gt;         is_pointer)</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;{</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;    <span class="keywordflow">return</span> *itr;</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;}</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;__device__ __forceinline__ T <a class="code" href="group___io_module.html#ga2467f2337aeeea3a3a1b39d19996d3c2" title="Thread utility for reading memory using cub::PtxLoadModifier cache modifiers. ">ThreadLoad</a>(</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;    T                       *ptr,</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;    Int2Type&lt;LOAD_DEFAULT&gt;  modifier,</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;    Int2Type&lt;true&gt;          is_pointer)</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;{</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;    <span class="keywordflow">return</span> *ptr;</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;}</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;__device__ __forceinline__ T ThreadLoadVolatile(</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;    T                       *ptr,</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;    Int2Type&lt;true&gt;          is_primitive)</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;{</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;    T retval = *<span class="keyword">reinterpret_cast&lt;</span><span class="keyword">volatile </span>T*<span class="keyword">&gt;</span>(ptr);</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH &lt;= 130)</span></div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">if</span> (<span class="keyword">sizeof</span>(T) == 1) __threadfence_block();</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;    <span class="keywordflow">return</span> retval;</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;}</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;__device__ __forceinline__ T ThreadLoadVolatile(</div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;    T                       *ptr,</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;    Int2Type&lt;false&gt;          is_primitive)</div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;{</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> WordAlignment&lt;T&gt;::VolatileWord VolatileWord;   <span class="comment">// Word type for memcopying</span></div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    <span class="keyword">enum</span> { NUM_WORDS = <span class="keyword">sizeof</span>(T) / <span class="keyword">sizeof</span>(VolatileWord) };</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;    <span class="comment">// Memcopy from aliased source into array of uninitialized words</span></div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <span class="keyword">typename</span> WordAlignment&lt;T&gt;::UninitializedVolatileWords words;</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; NUM_WORDS; ++i)</div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;        words.buf[i] = reinterpret_cast&lt;volatile VolatileWord*&gt;(ptr)[i];</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;    <span class="comment">// Load from words</span></div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">reinterpret_cast&lt;</span>T*<span class="keyword">&gt;</span>(words.buf);</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;}</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;</div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;__device__ __forceinline__ T <a class="code" href="group___io_module.html#ga2467f2337aeeea3a3a1b39d19996d3c2" title="Thread utility for reading memory using cub::PtxLoadModifier cache modifiers. ">ThreadLoad</a>(</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    T                       *ptr,</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    Int2Type&lt;LOAD_VOLATILE&gt; modifier,</div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;    Int2Type&lt;true&gt;          is_pointer)</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;{</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;    <span class="keywordflow">return</span> ThreadLoadVolatile(ptr, Int2Type&lt;Traits&lt;T&gt;::PRIMITIVE&gt;());</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;}</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH &lt;= 130)</span></div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;__device__ __forceinline__ T <a class="code" href="group___io_module.html#ga2467f2337aeeea3a3a1b39d19996d3c2" title="Thread utility for reading memory using cub::PtxLoadModifier cache modifiers. ">ThreadLoad</a>(</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;    T                       *ptr,</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;    Int2Type&lt;LOAD_CG&gt;       modifier,</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;    Int2Type&lt;true&gt;          is_pointer)</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;{</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;    <span class="keywordflow">return</span> ThreadLoad&lt;LOAD_CV&gt;(ptr);</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;}</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;<span class="preprocessor">#endif  // (CUB_PTX_ARCH &lt;= 130)</span></div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> MODIFIER&gt;</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;__device__ __forceinline__ T <a class="code" href="group___io_module.html#ga2467f2337aeeea3a3a1b39d19996d3c2" title="Thread utility for reading memory using cub::PtxLoadModifier cache modifiers. ">ThreadLoad</a>(</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;    T                       *ptr,</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;    Int2Type&lt;MODIFIER&gt;      modifier,</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;    Int2Type&lt;true&gt;          is_pointer)</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;{</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> WordAlignment&lt;T&gt;::DeviceWord DeviceWord;</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;    <span class="keyword">enum</span> { NUM_WORDS = <span class="keyword">sizeof</span>(T) / <span class="keyword">sizeof</span>(DeviceWord) };</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;    <span class="comment">// Memcopy from aliased source into array of uninitialized words</span></div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;    <span class="keyword">typename</span> WordAlignment&lt;T&gt;::UninitializedDeviceWords words;</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;    IterateThreadLoad&lt;PtxLoadModifier(MODIFIER), 0, NUM_WORDS&gt;::Load(</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;        <span class="keyword">reinterpret_cast&lt;</span>DeviceWord*<span class="keyword">&gt;</span>(ptr),</div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;        words.buf);</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;    <span class="comment">// Load from words</span></div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;    <span class="keywordflow">return</span> *<span class="keyword">reinterpret_cast&lt;</span>T*<span class="keyword">&gt;</span>(words.buf);</div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;}</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;</div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;    <a class="code" href="group___io_module.html#ga023420f30fec7d4b187fc98f4fd2a55d" title="Enumeration of PTX cache-modifiers for memory load operations. ">PtxLoadModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;    <span class="keyword">typename</span> InputIteratorRA&gt;</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;__device__ __forceinline__ <span class="keyword">typename</span> std::iterator_traits&lt;InputIteratorRA&gt;::value_type <a class="code" href="group___io_module.html#ga2467f2337aeeea3a3a1b39d19996d3c2" title="Thread utility for reading memory using cub::PtxLoadModifier cache modifiers. ">ThreadLoad</a>(InputIteratorRA itr)</div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;{</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="group___io_module.html#ga2467f2337aeeea3a3a1b39d19996d3c2" title="Thread utility for reading memory using cub::PtxLoadModifier cache modifiers. ">ThreadLoad</a>(</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;        itr,</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;        Int2Type&lt;MODIFIER&gt;(),</div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;        Int2Type&lt;IsPointer&lt;InputIteratorRA&gt;::VALUE&gt;());</div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;}</div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;</div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;       <span class="comment">// end group IoModule</span></div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;</div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/thread__operators_8cuh_source.html b/docs/html/thread__operators_8cuh_source.html
new file mode 100644
index 0000000000..e8bf57f92c
--- /dev/null
+++ b/docs/html/thread__operators_8cuh_source.html
@@ -0,0 +1,222 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: thread_operators.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_bb50a5ef59f19d030d06415663184d05.html">thread</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">thread_operators.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="thread__operators_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="comment"> * Simple functor operators</span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;../util_macro.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div>
+<div class="line"><a name="l00058"></a><span class="lineno"><a class="code" href="structcub_1_1_equality.html">   58</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_equality.html" title="Default equality functor. ">Equality</a></div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;{</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00062"></a><span class="lineno"><a class="code" href="structcub_1_1_equality.html#a8d794f350ea8af24762aa2c7c0a33ffd">   62</a></span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> <a class="code" href="structcub_1_1_equality.html#a8d794f350ea8af24762aa2c7c0a33ffd" title="Boolean equality operator, returns (a == b) ">operator()</a>(<span class="keyword">const</span> T &amp;a, <span class="keyword">const</span> T &amp;b)</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    {</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;        <span class="keywordflow">return</span> a == b;</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    }</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;};</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div>
+<div class="line"><a name="l00072"></a><span class="lineno"><a class="code" href="structcub_1_1_inequality.html">   72</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_inequality.html" title="Default inequality functor. ">Inequality</a></div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;{</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00076"></a><span class="lineno"><a class="code" href="structcub_1_1_inequality.html#a3f5336babc38ad540a06df134292fbb0">   76</a></span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> <a class="code" href="structcub_1_1_inequality.html#a3f5336babc38ad540a06df134292fbb0" title="Boolean inequality operator, returns (a != b) ">operator()</a>(<span class="keyword">const</span> T &amp;a, <span class="keyword">const</span> T &amp;b)</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    {</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;        <span class="keywordflow">return</span> a != b;</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    }</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;};</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;</div>
+<div class="line"><a name="l00086"></a><span class="lineno"><a class="code" href="structcub_1_1_sum.html">   86</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">Sum</a></div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;{</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00090"></a><span class="lineno"><a class="code" href="structcub_1_1_sum.html#af18505bb0216d1991cd7eaf796f12d0f">   90</a></span>&#160;    __host__ __device__ __forceinline__ T <a class="code" href="structcub_1_1_sum.html#af18505bb0216d1991cd7eaf796f12d0f" title="Boolean sum operator, returns a + b ">operator()</a>(<span class="keyword">const</span> T &amp;a, <span class="keyword">const</span> T &amp;b)</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    {</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;        <span class="keywordflow">return</span> a + b;</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    }</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;};</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div>
+<div class="line"><a name="l00100"></a><span class="lineno"><a class="code" href="structcub_1_1_max.html">  100</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_max.html" title="Default max functor. ">Max</a></div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;{</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00104"></a><span class="lineno"><a class="code" href="structcub_1_1_max.html#af1c750dc060716f98a0c1ecb7659f49e">  104</a></span>&#160;    __host__ __device__ __forceinline__ T <a class="code" href="structcub_1_1_max.html#af1c750dc060716f98a0c1ecb7659f49e" title="Boolean max operator, returns (a &gt; b) ? a : b ">operator()</a>(<span class="keyword">const</span> T &amp;a, <span class="keyword">const</span> T &amp;b)</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    {</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;        <span class="keywordflow">return</span> CUB_MAX(a, b);</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    }</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;};</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div>
+<div class="line"><a name="l00114"></a><span class="lineno"><a class="code" href="structcub_1_1_min.html">  114</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_min.html" title="Default min functor. ">Min</a></div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;{</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00118"></a><span class="lineno"><a class="code" href="structcub_1_1_min.html#a97a64bb018710d853899e2c404f95a46">  118</a></span>&#160;    __host__ __device__ __forceinline__ T <a class="code" href="structcub_1_1_min.html#a97a64bb018710d853899e2c404f95a46" title="Boolean min operator, returns (a &lt; b) ? a : b ">operator()</a>(<span class="keyword">const</span> T &amp;a, <span class="keyword">const</span> T &amp;b)</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;    {</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;        <span class="keywordflow">return</span> CUB_MIN(a, b);</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    }</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;};</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> B&gt;</div>
+<div class="line"><a name="l00129"></a><span class="lineno"><a class="code" href="structcub_1_1_cast.html">  129</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_cast.html" title="Default cast functor. ">Cast</a></div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;{</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> A&gt;</div>
+<div class="line"><a name="l00133"></a><span class="lineno"><a class="code" href="structcub_1_1_cast.html#a7dbee2a0bbb0725ee68c7ef29c81d158">  133</a></span>&#160;    __host__ __device__ __forceinline__ B <a class="code" href="structcub_1_1_cast.html#a7dbee2a0bbb0725ee68c7ef29c81d158" title="Boolean max operator, returns (a &gt; b) ? a : b ">operator()</a>(<span class="keyword">const</span> A &amp;a)</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    {</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;        <span class="keywordflow">return</span> (B) a;</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    }</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;};</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;       <span class="comment">// end group ThreadModule</span></div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/thread__reduce_8cuh_source.html b/docs/html/thread__reduce_8cuh_source.html
new file mode 100644
index 0000000000..880c37d5b5
--- /dev/null
+++ b/docs/html/thread__reduce_8cuh_source.html
@@ -0,0 +1,212 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: thread_reduce.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_bb50a5ef59f19d030d06415663184d05.html">thread</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">thread_reduce.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="thread__reduce_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;../thread/thread_operators.cuh&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keyword">typename</span>    ReductionOp&gt;</div>
+<div class="line"><a name="l00066"></a><span class="lineno"><a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc">   66</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    T*          input,                  </div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    ReductionOp reduction_op,           </div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    T           prefix)                 </div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;{</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; LENGTH; ++i)</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    {</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;        prefix = reduction_op(prefix, input[i]);</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    }</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="keywordflow">return</span> prefix;</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;}</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    <span class="keyword">typename</span>    ReductionOp&gt;</div>
+<div class="line"><a name="l00092"></a><span class="lineno"><a class="code" href="group___thread_module.html#gaeafffc414146089dec3bf734a0022b23">   92</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    T*          input,                  </div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    ReductionOp reduction_op)           </div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;{</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;    T prefix = input[0];</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    <span class="keywordflow">return</span> <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>&lt;LENGTH - 1&gt;(input + 1, reduction_op, prefix);</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;}</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    <span class="keyword">typename</span>    ReductionOp&gt;</div>
+<div class="line"><a name="l00112"></a><span class="lineno"><a class="code" href="group___thread_module.html#gaa532e530f559bb9922754bd610f5fe84">  112</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    T           (&amp;input)[LENGTH],       </div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    ReductionOp reduction_op,           </div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;    T           prefix)                 </div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;{</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keywordflow">return</span> ThreadReduce&lt;LENGTH&gt;(input, reduction_op, prefix);</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;}</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    <span class="keyword">typename</span>    ReductionOp&gt;</div>
+<div class="line"><a name="l00132"></a><span class="lineno"><a class="code" href="group___thread_module.html#ga5d4d3204c873db5af48a3a3f831a9ef8">  132</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga48320d1f549b7931ae1f72040f9e42dc" title="Perform a sequential reduction over LENGTH elements of the input array, seeded with the specified pre...">ThreadReduce</a>(</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    T           (&amp;input)[LENGTH],       </div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    ReductionOp reduction_op)           </div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;{</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;    <span class="keywordflow">return</span> ThreadReduce&lt;LENGTH&gt;((T*) input, reduction_op);</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;}</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;       <span class="comment">// end group ThreadModule</span></div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/thread__scan_8cuh_source.html b/docs/html/thread__scan_8cuh_source.html
new file mode 100644
index 0000000000..11977b659c
--- /dev/null
+++ b/docs/html/thread__scan_8cuh_source.html
@@ -0,0 +1,284 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: thread_scan.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_bb50a5ef59f19d030d06415663184d05.html">thread</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">thread_scan.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="thread__scan_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;../thread/thread_operators.cuh&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;    <span class="keyword">typename</span>    ScanOp&gt;</div>
+<div class="line"><a name="l00066"></a><span class="lineno"><a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545">   66</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;    T           *input,                 </div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;    T           *output,                </div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    ScanOp      scan_op,                </div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    T           prefix,                 </div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <span class="keywordtype">bool</span>        apply_prefix = <span class="keyword">true</span>)    </div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;{</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;    T inclusive = input[0];</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <span class="keywordflow">if</span> (apply_prefix)</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    {</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;        inclusive = scan_op(prefix, inclusive);</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    }</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    output[0] = prefix;</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    T exclusive = inclusive;</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 1; i &lt; LENGTH; ++i)</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;    {</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;        inclusive = scan_op(exclusive, input[i]);</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;        output[i] = exclusive;</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;        exclusive = inclusive;</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    }</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;    <span class="keywordflow">return</span> inclusive;</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;}</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    <span class="keyword">typename</span>    ScanOp&gt;</div>
+<div class="line"><a name="l00104"></a><span class="lineno"><a class="code" href="group___thread_module.html#ga145ad5e3b05134aef8d86f84df9c25b8">  104</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga37fa2b0ca9bb32096517480e98894545" title="Perform a sequential exclusive prefix scan over LENGTH elements of the input array, seeded with the specified prefix. The aggregate is returned. ">ThreadScanExclusive</a>(</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    T           (&amp;input)[LENGTH],       </div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    T           (&amp;output)[LENGTH],      </div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;    ScanOp      scan_op,                </div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    T           prefix,                 </div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    <span class="keywordtype">bool</span>        apply_prefix = <span class="keyword">true</span>)    </div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;{</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;    <span class="keywordflow">return</span> ThreadScanExclusive&lt;LENGTH&gt;((T*) input, (T*) output, scan_op, prefix);</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;}</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;    <span class="keyword">typename</span>    ScanOp&gt;</div>
+<div class="line"><a name="l00126"></a><span class="lineno"><a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c">  126</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    T           *input,                 </div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    T           *output,                </div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    ScanOp      scan_op)                </div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;{</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    T inclusive = input[0];</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    output[0] = inclusive;</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;    <span class="comment">// Continue scan</span></div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; LENGTH; ++i)</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    {</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;        inclusive = scan_op(inclusive, input[i]);</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;        output[i] = inclusive;</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    }</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keywordflow">return</span> inclusive;</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;}</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    <span class="keyword">typename</span>    ScanOp&gt;</div>
+<div class="line"><a name="l00157"></a><span class="lineno"><a class="code" href="group___thread_module.html#gae78193279081a554432b6aea10a7295a">  157</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    T           (&amp;input)[LENGTH],       </div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    T           (&amp;output)[LENGTH],      </div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;    ScanOp      scan_op)                </div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;{</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;    <span class="keywordflow">return</span> ThreadScanInclusive&lt;LENGTH&gt;((T*) input, (T*) output, scan_op);</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;}</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    <span class="keyword">typename</span>    ScanOp&gt;</div>
+<div class="line"><a name="l00177"></a><span class="lineno"><a class="code" href="group___thread_module.html#ga0e00b3a9b522249581b2ff98f670087b">  177</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    T           *input,                 </div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;    T           *output,                </div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    ScanOp      scan_op,                </div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    T           prefix,                 </div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keywordtype">bool</span>        apply_prefix = <span class="keyword">true</span>)    </div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;{</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    T inclusive = input[0];</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    <span class="keywordflow">if</span> (apply_prefix)</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    {</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;        inclusive = scan_op(prefix, inclusive);</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    }</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    output[0] = inclusive;</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <span class="comment">// Continue scan</span></div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 1; i &lt; LENGTH; ++i)</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    {</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;        inclusive = scan_op(inclusive, input[i]);</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;        output[i] = inclusive;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    }</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    <span class="keywordflow">return</span> inclusive;</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;}</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;    <span class="keywordtype">int</span>         LENGTH,</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;    <span class="keyword">typename</span>    ScanOp&gt;</div>
+<div class="line"><a name="l00214"></a><span class="lineno"><a class="code" href="group___thread_module.html#gadb4aed8a804827b6fb97eca790572099">  214</a></span>&#160;__device__ __forceinline__ T <a class="code" href="group___thread_module.html#ga4004b2a6bfb2b4f024b0389e9c46074c" title="Perform a sequential inclusive prefix scan over LENGTH elements of the input array. The aggregate is returned. ">ThreadScanInclusive</a>(</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    T           (&amp;input)[LENGTH],       </div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    T           (&amp;output)[LENGTH],      </div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;    ScanOp      scan_op,                </div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    T           prefix,                 </div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <span class="keywordtype">bool</span>        apply_prefix = <span class="keyword">true</span>)    </div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;{</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;    <span class="keywordflow">return</span> ThreadScanInclusive&lt;LENGTH&gt;((T*) input, (T*) output, scan_op, prefix, apply_prefix);</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;}</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;       <span class="comment">// end group ThreadModule</span></div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/thread__store_8cuh_source.html b/docs/html/thread__store_8cuh_source.html
new file mode 100644
index 0000000000..5e911c54b2
--- /dev/null
+++ b/docs/html/thread__store_8cuh_source.html
@@ -0,0 +1,422 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: thread_store.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_bb50a5ef59f19d030d06415663184d05.html">thread</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">thread_store.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="thread__store_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;cuda.h&gt;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;</div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../util_ptx.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment">// Tags and constants</span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment">//-----------------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div>
+<div class="line"><a name="l00061"></a><span class="lineno"><a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2">   61</a></span>&#160;<span class="keyword">enum</span> <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a></div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;{</div>
+<div class="line"><a name="l00063"></a><span class="lineno"><a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2a434aa4b3efc8e0c0ce4f1a00cdad26bd">   63</a></span>&#160;    <a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2a434aa4b3efc8e0c0ce4f1a00cdad26bd" title="Default (no modifier) ">STORE_DEFAULT</a>,              </div>
+<div class="line"><a name="l00064"></a><span class="lineno"><a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2afd29f1e82f0a9dc8258fb7977b0a8237">   64</a></span>&#160;    <a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2afd29f1e82f0a9dc8258fb7977b0a8237" title="Cache write-back all coherent levels. ">STORE_WB</a>,                   </div>
+<div class="line"><a name="l00065"></a><span class="lineno"><a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2aacea07ea298b89dd1962a40b4823652d">   65</a></span>&#160;    <a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2aacea07ea298b89dd1962a40b4823652d" title="Cache at global level. ">STORE_CG</a>,                   </div>
+<div class="line"><a name="l00066"></a><span class="lineno"><a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2a00ae8891d1acad179d134fdd60d7839b">   66</a></span>&#160;    <a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2a00ae8891d1acad179d134fdd60d7839b" title="Cache streaming (likely to be accessed once) ">STORE_CS</a>,                   </div>
+<div class="line"><a name="l00067"></a><span class="lineno"><a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2a5bf33b361cb9f3229588c95402fc484f">   67</a></span>&#160;    <a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2a5bf33b361cb9f3229588c95402fc484f" title="Cache write-through (to system memory) ">STORE_WT</a>,                   </div>
+<div class="line"><a name="l00068"></a><span class="lineno"><a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2aba537dcdd7a709bcdff169e014dcaf08">   68</a></span>&#160;    <a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2aba537dcdd7a709bcdff169e014dcaf08" title="Volatile shared (any memory space) ">STORE_VOLATILE</a>,             </div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;};</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    <a class="code" href="group___io_module.html#gae9c7d6a6af7104f528509182ac9c9da2" title="Enumeration of PTX cache-modifiers for memory store operations. ">PtxStoreModifier</a> MODIFIER,</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;    <span class="keyword">typename</span> OutputIteratorRA,</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;    <span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga870b5b156d3d0a65a8c551884b18a2d6" title="Thread utility for writing memory using cub::PtxStoreModifier cache modifiers. ">ThreadStore</a>(OutputIteratorRA itr, T val);</div>
+<div class="line"><a name="l00116"></a><span class="lineno">  116</span>&#160;</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="preprocessor">#define CUB_STORE_16(cub_modifier, ptx_modifier)                                            \</span></div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;<span class="preprocessor">    __device__ __forceinline__ void ThreadStore&lt;cub_modifier, int4*, int4&gt;(int4* ptr, int4 val)              \</span></div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="preprocessor">        asm volatile (&quot;st.&quot;#ptx_modifier&quot;.v4.s32 [%0], {%1, %2, %3, %4};&quot; : :               \</span></div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr),                                                             \</span></div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;<span class="preprocessor">            &quot;r&quot;(val.x),                                                                     \</span></div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;<span class="preprocessor">            &quot;r&quot;(val.y),                                                                     \</span></div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="preprocessor">            &quot;r&quot;(val.z),                                                                     \</span></div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="preprocessor">            &quot;r&quot;(val.w));                                                                    \</span></div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="preprocessor">    }                                                                                       \</span></div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;<span class="preprocessor">    __device__ __forceinline__ void ThreadStore&lt;cub_modifier, longlong2*, longlong2&gt;(longlong2* ptr, longlong2 val)              \</span></div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="preprocessor">        asm volatile (&quot;st.&quot;#ptx_modifier&quot;.v2.s64 [%0], {%1, %2};&quot; : :                       \</span></div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr),                                                             \</span></div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="preprocessor">            &quot;l&quot;(val.x),                                                                     \</span></div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="preprocessor">            &quot;l&quot;(val.y));                                                                    \</span></div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="preprocessor">#define CUB_STORE_8(cub_modifier, ptx_modifier)                                             \</span></div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="preprocessor">    __device__ __forceinline__ void ThreadStore&lt;cub_modifier, short4*, short4&gt;(short4* ptr, short4 val)              \</span></div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;<span class="preprocessor">        asm volatile (&quot;st.&quot;#ptx_modifier&quot;.v4.s16 [%0], {%1, %2, %3, %4};&quot; : :               \</span></div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr),                                                             \</span></div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="preprocessor">            &quot;h&quot;(val.x),                                                                     \</span></div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;<span class="preprocessor">            &quot;h&quot;(val.y),                                                                     \</span></div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;<span class="preprocessor">            &quot;h&quot;(val.z),                                                                     \</span></div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;<span class="preprocessor">            &quot;h&quot;(val.w));                                                                    \</span></div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;<span class="preprocessor">    }                                                                                       \</span></div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;<span class="preprocessor">    __device__ __forceinline__ void ThreadStore&lt;cub_modifier, int2*, int2&gt;(int2* ptr, int2 val)              \</span></div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;<span class="preprocessor">        asm volatile (&quot;st.&quot;#ptx_modifier&quot;.v2.s32 [%0], {%1, %2};&quot; : :                       \</span></div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr),                                                             \</span></div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;<span class="preprocessor">            &quot;r&quot;(val.x),                                                                     \</span></div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="preprocessor">            &quot;r&quot;(val.y));                                                                    \</span></div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;<span class="preprocessor">    }                                                                                       \</span></div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;<span class="preprocessor">    __device__ __forceinline__ void ThreadStore&lt;cub_modifier, long long*, long long&gt;(long long* ptr, long long val)                 \</span></div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;<span class="preprocessor">        asm volatile (&quot;st.&quot;#ptx_modifier&quot;.s64 [%0], %1;&quot; : :                                \</span></div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr),                                                             \</span></div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;<span class="preprocessor">            &quot;l&quot;(val));                                                                      \</span></div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;<span class="preprocessor">#define CUB_STORE_4(cub_modifier, ptx_modifier)                                             \</span></div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;<span class="preprocessor">    __device__ __forceinline__ void ThreadStore&lt;cub_modifier, int*, int&gt;(int* ptr, int val)                 \</span></div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;<span class="preprocessor">        asm volatile (&quot;st.&quot;#ptx_modifier&quot;.s32 [%0], %1;&quot; : :                                \</span></div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr),                                                             \</span></div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;<span class="preprocessor">            &quot;r&quot;(val));                                                                      \</span></div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;<span class="preprocessor">#define CUB_STORE_2(cub_modifier, ptx_modifier)                                             \</span></div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;<span class="preprocessor">    __device__ __forceinline__ void ThreadStore&lt;cub_modifier, short*, short&gt;(short* ptr, short val)           \</span></div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;<span class="preprocessor">        asm volatile (&quot;st.&quot;#ptx_modifier&quot;.s16 [%0], %1;&quot; : :                                \</span></div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr),                                                             \</span></div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;<span class="preprocessor">            &quot;h&quot;(val));                                                                      \</span></div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;<span class="preprocessor">#define CUB_STORE_1(cub_modifier, ptx_modifier)                                             \</span></div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;<span class="preprocessor">    template&lt;&gt;                                                                              \</span></div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;<span class="preprocessor">    __device__ __forceinline__ void ThreadStore&lt;cub_modifier, char*, char&gt;(char* ptr, char val)              \</span></div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;<span class="preprocessor">    {                                                                                       \</span></div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;<span class="preprocessor">        asm volatile (                                                                      \</span></div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;<span class="preprocessor">        &quot;{&quot;                                                                                 \</span></div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;<span class="preprocessor">        &quot;   .reg .s8 datum;&quot;                                                                \</span></div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;<span class="preprocessor">        &quot;   cvt.s8.s16 datum, %1;&quot;                                                          \</span></div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;<span class="preprocessor">        &quot;   st.&quot;#ptx_modifier&quot;.s8 [%0], datum;&quot;                                             \</span></div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;<span class="preprocessor">        &quot;}&quot; : :                                                                             \</span></div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;<span class="preprocessor">            _CUB_ASM_PTR_(ptr),                                                             \</span></div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;<span class="preprocessor">            &quot;h&quot;(short(val)));                                                               \</span></div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;<span class="preprocessor">    }</span></div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;<span class="preprocessor">#define CUB_STORE_ALL(cub_modifier, ptx_modifier)                                           \</span></div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;<span class="preprocessor">    CUB_STORE_16(cub_modifier, ptx_modifier)                                                \</span></div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;<span class="preprocessor">    CUB_STORE_8(cub_modifier, ptx_modifier)                                                 \</span></div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;<span class="preprocessor">    CUB_STORE_4(cub_modifier, ptx_modifier)                                                 \</span></div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;<span class="preprocessor">    CUB_STORE_2(cub_modifier, ptx_modifier)                                                 \</span></div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;<span class="preprocessor">    CUB_STORE_1(cub_modifier, ptx_modifier)                                                 \</span></div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;<span class="preprocessor">#if CUB_PTX_ARCH &gt;= 200</span></div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;<span class="preprocessor"></span>    CUB_STORE_ALL(<a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2afd29f1e82f0a9dc8258fb7977b0a8237" title="Cache write-back all coherent levels. ">STORE_WB</a>, ca)</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;    CUB_STORE_ALL(<a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2aacea07ea298b89dd1962a40b4823652d" title="Cache at global level. ">STORE_CG</a>, cg)</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    CUB_STORE_ALL(<a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2a00ae8891d1acad179d134fdd60d7839b" title="Cache streaming (likely to be accessed once) ">STORE_CS</a>, cs)</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    CUB_STORE_ALL(<a class="code" href="group___io_module.html#ggae9c7d6a6af7104f528509182ac9c9da2a5bf33b361cb9f3229588c95402fc484f" title="Cache write-through (to system memory) ">STORE_WT</a>, cv)</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;<span class="preprocessor"></span>    <span class="comment">// STORE_WT on SM10-13 uses &quot;volatile.global&quot; to ensure writes to last level</span></div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;    CUB_STORE_ALL(STORE_WT, <span class="keyword">volatile</span>.global)</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;<span class="keyword">template</span> &lt;PtxStoreModifier MODIFIER, <span class="keywordtype">int</span> COUNT, <span class="keywordtype">int</span> MAX&gt;</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;<span class="keyword">struct </span>IterateThreadStore</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;{</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ <span class="keywordtype">void</span> Store(T *ptr, T *vals)</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;    {</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;        ThreadStore&lt;MODIFIER&gt;(ptr + COUNT, vals[COUNT]);</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;        IterateThreadStore&lt;MODIFIER, COUNT + 1, MAX&gt;::Store(ptr, vals);</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;    }</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;};</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;<span class="keyword">template</span> &lt;PtxStoreModifier MODIFIER, <span class="keywordtype">int</span> MAX&gt;</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<span class="keyword">struct </span>IterateThreadStore&lt;MODIFIER, MAX, MAX&gt;</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;{</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ <span class="keywordtype">void</span> Store(T *ptr, T *vals) {}</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;};</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputIteratorRA, <span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga870b5b156d3d0a65a8c551884b18a2d6" title="Thread utility for writing memory using cub::PtxStoreModifier cache modifiers. ">ThreadStore</a>(</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;    OutputIteratorRA            itr,</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;    T                           val,</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;    Int2Type&lt;STORE_DEFAULT&gt;     modifier,</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    Int2Type&lt;false&gt;             is_pointer)</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;{</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;    *itr = val;</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;}</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga870b5b156d3d0a65a8c551884b18a2d6" title="Thread utility for writing memory using cub::PtxStoreModifier cache modifiers. ">ThreadStore</a>(</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;    T                           *ptr,</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;    T                           val,</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;    Int2Type&lt;STORE_DEFAULT&gt;     modifier,</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;    Int2Type&lt;true&gt;              is_pointer)</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;{</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;    *ptr = val;</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;}</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> ThreadStoreVolatile(</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;    T                           *ptr,</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;    T                           val,</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;    Int2Type&lt;true&gt;              is_primitive)</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;{</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;    *<span class="keyword">reinterpret_cast&lt;</span><span class="keyword">volatile </span>T*<span class="keyword">&gt;</span>(ptr) = val;</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;}</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> ThreadStoreVolatile(</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;    T                           *ptr,</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;    T                           val,</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;    Int2Type&lt;false&gt;             is_primitive)</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;{</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> WordAlignment&lt;T&gt;::VolatileWord VolatileWord;   <span class="comment">// Word type for memcopying</span></div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;    <span class="keyword">enum</span> { NUM_WORDS = <span class="keyword">sizeof</span>(T) / <span class="keyword">sizeof</span>(VolatileWord) };</div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;    <span class="comment">// Store into array of uninitialized words</span></div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;    <span class="keyword">typename</span> WordAlignment&lt;T&gt;::UninitializedVolatileWords words;</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;    *<span class="keyword">reinterpret_cast&lt;</span>T*<span class="keyword">&gt;</span>(words.buf) = val;</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;    <span class="comment">// Memcopy words to aliased destination</span></div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;<span class="preprocessor">    #pragma unroll</span></div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; NUM_WORDS; ++i)</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;        reinterpret_cast&lt;volatile VolatileWord*&gt;(ptr)[i] = words.buf[i];</div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;}</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga870b5b156d3d0a65a8c551884b18a2d6" title="Thread utility for writing memory using cub::PtxStoreModifier cache modifiers. ">ThreadStore</a>(</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;    T                           *ptr,</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;    T                           val,</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    Int2Type&lt;STORE_VOLATILE&gt;    modifier,</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;    Int2Type&lt;true&gt;              is_pointer)</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;{</div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;    ThreadStoreVolatile(ptr, val, Int2Type&lt;Traits&lt;T&gt;::PRIMITIVE&gt;());</div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;}</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH &lt;= 350)</span></div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga870b5b156d3d0a65a8c551884b18a2d6" title="Thread utility for writing memory using cub::PtxStoreModifier cache modifiers. ">ThreadStore</a>(</div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;    T                           *ptr,</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;    T                           val,</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;    Int2Type&lt;STORE_CG&gt;          modifier,</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;    Int2Type&lt;true&gt;              is_pointer)</div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;{</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;    ThreadStore&lt;STORE_DEFAULT&gt;(ptr, val);</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;}</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;<span class="preprocessor">#endif  // (CUB_PTX_ARCH &lt;= 350)</span></div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;</div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> MODIFIER&gt;</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga870b5b156d3d0a65a8c551884b18a2d6" title="Thread utility for writing memory using cub::PtxStoreModifier cache modifiers. ">ThreadStore</a>(</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;    T                           *ptr,</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;    T                           val,</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;    Int2Type&lt;MODIFIER&gt;          modifier,</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;    Int2Type&lt;true&gt;              is_pointer)</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;{</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> WordAlignment&lt;T&gt;::DeviceWord DeviceWord;   <span class="comment">// Word type for memcopying</span></div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;    <span class="keyword">enum</span> { NUM_WORDS = <span class="keyword">sizeof</span>(T) / <span class="keyword">sizeof</span>(DeviceWord) };</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;    <span class="comment">// Store into array of uninitialized words</span></div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;    <span class="keyword">typename</span> WordAlignment&lt;T&gt;::UninitializedDeviceWords words;</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;    *<span class="keyword">reinterpret_cast&lt;</span>T*<span class="keyword">&gt;</span>(words.buf) = val;</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;    <span class="comment">// Memcopy words to aliased destination</span></div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;    IterateThreadStore&lt;PtxStoreModifier(MODIFIER), 0, NUM_WORDS&gt;::Store(</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;        <span class="keyword">reinterpret_cast&lt;</span>DeviceWord*<span class="keyword">&gt;</span>(ptr),</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;        words.buf);</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;}</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;</div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;<span class="keyword">template</span> &lt;PtxStoreModifier MODIFIER, <span class="keyword">typename</span> OutputIteratorRA, <span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;__device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="group___io_module.html#ga870b5b156d3d0a65a8c551884b18a2d6" title="Thread utility for writing memory using cub::PtxStoreModifier cache modifiers. ">ThreadStore</a>(OutputIteratorRA itr, T val)</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;{</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;    <a class="code" href="group___io_module.html#ga870b5b156d3d0a65a8c551884b18a2d6" title="Thread utility for writing memory using cub::PtxStoreModifier cache modifiers. ">ThreadStore</a>(</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;        itr,</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;        val,</div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;        Int2Type&lt;MODIFIER&gt;(),</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;        Int2Type&lt;IsPointer&lt;OutputIteratorRA&gt;::VALUE&gt;());</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;}</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;</div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;       <span class="comment">// end group IoModule</span></div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/util__allocator_8cuh_source.html b/docs/html/util__allocator_8cuh_source.html
new file mode 100644
index 0000000000..bbabf0da8e
--- /dev/null
+++ b/docs/html/util__allocator_8cuh_source.html
@@ -0,0 +1,681 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: util_allocator.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">util_allocator.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00029"></a><span class="lineno">   29</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00030"></a><span class="lineno">   30</span>&#160;<span class="comment"> * Simple caching allocator for device memory allocations. The allocator is</span></div>
+<div class="line"><a name="l00031"></a><span class="lineno">   31</span>&#160;<span class="comment"> * thread-safe and capable of managing device allocations on multiple devices.</span></div>
+<div class="line"><a name="l00032"></a><span class="lineno">   32</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00033"></a><span class="lineno">   33</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor"></span><span class="preprocessor">    #include &lt;set&gt;</span>              <span class="comment">// NVCC (EDG, really) takes FOREVER to compile std::map</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">    #include &lt;map&gt;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &lt;math.h&gt;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="preprocessor">#include &quot;util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__debug_8cuh.html">util_debug.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;<span class="preprocessor">#include &quot;host/spinlock.cuh&quot;</span></div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div>
+<div class="line"><a name="l00052"></a><span class="lineno"><a class="code" href="namespacecub.html">   52</a></span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;<span class="comment"> * CachingDeviceAllocator (host use)</span></div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;</div>
+<div class="line"><a name="l00099"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html">   99</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_caching_device_allocator.html" title="A simple caching allocator for device memory allocations. ">CachingDeviceAllocator</a></div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;{</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;    <span class="comment">//---------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <span class="comment">// Type definitions and constants</span></div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;    <span class="comment">//---------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;    {</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;        INVALID_DEVICE_ORDINAL = -1,</div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;    };</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;    <span class="keyword">static</span> <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> IntPow(</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> base,</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> exp)</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;    {</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> retval = 1;</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;        <span class="keywordflow">while</span> (exp &gt; 0)</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;        {</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;            <span class="keywordflow">if</span> (exp &amp; 1) {</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;                retval = retval * base;        <span class="comment">// multiply the result by the current base</span></div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;            }</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;            base = base * base;                <span class="comment">// square the base</span></div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;            exp = exp &gt;&gt; 1;                    <span class="comment">// divide the exponent in half</span></div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;        }</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;        <span class="keywordflow">return</span> retval;</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    }</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;    <span class="keyword">static</span> <span class="keywordtype">void</span> NearestPowerOf(</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> &amp;power,</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;        <span class="keywordtype">size_t</span> &amp;rounded_bytes,</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> base,</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;        <span class="keywordtype">size_t</span> value)</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    {</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;        power = 0;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;        rounded_bytes = 1;</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;        <span class="keywordflow">while</span> (rounded_bytes &lt; value)</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;        {</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;            rounded_bytes *= base;</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;            power++;</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;        }</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    }</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    <span class="keyword">struct </span>BlockDescriptor</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    {</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;        <span class="keywordtype">int</span>   device;        <span class="comment">// device ordinal</span></div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;        <span class="keywordtype">void</span>*           d_ptr;      <span class="comment">// Device pointer</span></div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;        <span class="keywordtype">size_t</span>          bytes;      <span class="comment">// Size of allocation in bytes</span></div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span>    bin;        <span class="comment">// Bin enumeration</span></div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;        <span class="comment">// Constructor</span></div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;        BlockDescriptor(<span class="keywordtype">void</span> *d_ptr, <span class="keywordtype">int</span> device) :</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;            d_ptr(d_ptr),</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;            bytes(0),</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;            bin(0),</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;            device(device) {}</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;        <span class="comment">// Constructor</span></div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;        BlockDescriptor(<span class="keywordtype">size_t</span> bytes, <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> bin, <span class="keywordtype">int</span> device) :</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;            d_ptr(NULL),</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;            bytes(bytes),</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;            bin(bin),</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;            device(device) {}</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;        <span class="comment">// Comparison functor for comparing device pointers</span></div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;        <span class="keyword">static</span> <span class="keywordtype">bool</span> PtrCompare(<span class="keyword">const</span> BlockDescriptor &amp;a, <span class="keyword">const</span> BlockDescriptor &amp;b)</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;        {</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;            <span class="keywordflow">if</span> (a.device &lt; b.device) {</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;                <span class="keywordflow">return</span> <span class="keyword">true</span>;</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;            } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (a.device &gt; b.device) {</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;                <span class="keywordflow">return</span> <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;            } <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;                <span class="keywordflow">return</span> (a.d_ptr &lt; b.d_ptr);</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;            }</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;        }</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;        <span class="comment">// Comparison functor for comparing allocation sizes</span></div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;        <span class="keyword">static</span> <span class="keywordtype">bool</span> SizeCompare(<span class="keyword">const</span> BlockDescriptor &amp;a, <span class="keyword">const</span> BlockDescriptor &amp;b)</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;        {</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;            <span class="keywordflow">if</span> (a.device &lt; b.device) {</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;                <span class="keywordflow">return</span> <span class="keyword">true</span>;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;            } <span class="keywordflow">else</span> <span class="keywordflow">if</span> (a.device &gt; b.device) {</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;                <span class="keywordflow">return</span> <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;            } <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;                <span class="keywordflow">return</span> (a.bytes &lt; b.bytes);</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;            }</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;        }</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    };</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;    <span class="keyword">typedef</span> bool (*Compare)(<span class="keyword">const</span> BlockDescriptor &amp;, <span class="keyword">const</span> BlockDescriptor &amp;);</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__   // Only define STL container members in host code</span></div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;    <span class="keyword">typedef</span> std::multiset&lt;BlockDescriptor, Compare&gt; CachedBlocks;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;    <span class="keyword">typedef</span> std::multiset&lt;BlockDescriptor, Compare&gt; BusyBlocks;</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;    <span class="keyword">typedef</span> std::map&lt;int, size_t&gt; GpuCachedBytes;</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;<span class="preprocessor">#endif // __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;    <span class="comment">//---------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;    <span class="comment">// Fields</span></div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;    <span class="comment">//---------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;    Spinlock        spin_lock;          </div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span>    bin_growth;         </div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span>    min_bin;            </div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span>    max_bin;            </div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;    <span class="keywordtype">size_t</span>          min_bin_bytes;      </div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <span class="keywordtype">size_t</span>          max_bin_bytes;      </div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <span class="keywordtype">size_t</span>          max_cached_bytes;   </div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    <span class="keywordtype">bool</span>            debug;              </div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;    <span class="keywordtype">bool</span>            skip_cleanup;       </div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__   // Only define STL container members in host code</span></div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;    GpuCachedBytes  cached_bytes;       </div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    CachedBlocks    cached_blocks;      </div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    BusyBlocks      live_blocks;        </div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;<span class="preprocessor">#endif // __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;    <span class="comment">//---------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;    <span class="comment">// Methods</span></div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;    <span class="comment">//---------------------------------------------------------------------</span></div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;</div>
+<div class="line"><a name="l00252"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html#a36b5c020ec501279b2b1275eae578918">  252</a></span>&#160;    <a class="code" href="structcub_1_1_caching_device_allocator.html#a36b5c020ec501279b2b1275eae578918" title="Constructor. ">CachingDeviceAllocator</a>(</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> bin_growth,    </div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> min_bin,       </div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> max_bin,       </div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;        <span class="keywordtype">size_t</span> max_cached_bytes)    </div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;    :</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;    #ifndef __CUDA_ARCH__   <span class="comment">// Only define STL container members in host code</span></div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;            cached_blocks(BlockDescriptor::SizeCompare),</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;            live_blocks(BlockDescriptor::PtrCompare),</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    #endif</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;            debug(false),</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;            spin_lock(0),</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;            bin_growth(bin_growth),</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;            min_bin(min_bin),</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;            max_bin(max_bin),</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;            min_bin_bytes(IntPow(bin_growth, min_bin)),</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;            max_bin_bytes(IntPow(bin_growth, max_bin)),</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;            max_cached_bytes(max_cached_bytes)</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;    {}</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;</div>
+<div class="line"><a name="l00286"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html#ab08a4c3d066ec2303d07363a25466bff">  286</a></span>&#160;    <a class="code" href="structcub_1_1_caching_device_allocator.html#ab08a4c3d066ec2303d07363a25466bff" title="Default constructor. ">CachingDeviceAllocator</a>(<span class="keywordtype">bool</span> skip_cleanup = <span class="keyword">false</span>) :</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;    #ifndef __CUDA_ARCH__   <span class="comment">// Only define STL container members in host code</span></div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;        cached_blocks(BlockDescriptor::SizeCompare),</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;        live_blocks(BlockDescriptor::PtrCompare),</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;    #endif</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;        skip_cleanup(skip_cleanup),</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;        debug(false),</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;        spin_lock(0),</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;        bin_growth(8),</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;        min_bin(3),</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;        max_bin(7),</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;        min_bin_bytes(IntPow(bin_growth, min_bin)),</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;        max_bin_bytes(IntPow(bin_growth, max_bin)),</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;        max_cached_bytes((max_bin_bytes * 3) - 1)</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;    {}</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;</div>
+<div class="line"><a name="l00306"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html#a2216ab13fdeb11ce61f04f69899fff33">  306</a></span>&#160;    cudaError_t <a class="code" href="structcub_1_1_caching_device_allocator.html#a2216ab13fdeb11ce61f04f69899fff33" title="Sets the limit on the number bytes this allocator is allowed to cache per device. ...">SetMaxCachedBytes</a>(</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;        <span class="keywordtype">size_t</span> max_cached_bytes)</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;    {</div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;<span class="preprocessor">    #ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Caching functionality only defined on host</span></div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorInvalidConfiguration);</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;<span class="preprocessor">    #else</span></div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;        <span class="comment">// Lock</span></div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;        Lock(&amp;spin_lock);</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;</div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;        this-&gt;max_cached_bytes = max_cached_bytes;</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;        <span class="keywordflow">if</span> (debug) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;New max_cached_bytes(%lld)\n&quot;</span>, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) max_cached_bytes);</div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;        <span class="comment">// Unlock</span></div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;        Unlock(&amp;spin_lock);</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;</div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;        <span class="keywordflow">return</span> cudaSuccess;</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;<span class="preprocessor">    #endif  // __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;</div>
+<div class="line"><a name="l00333"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html#a4a6fd29b17ff15c6a2ee01a25c5e45fb">  333</a></span>&#160;    cudaError_t <a class="code" href="structcub_1_1_caching_device_allocator.html#a4a6fd29b17ff15c6a2ee01a25c5e45fb" title="Provides a suitable allocation of device memory for the given size on the specified device...">DeviceAllocate</a>(</div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;        <span class="keywordtype">void</span>** d_ptr,</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;        <span class="keywordtype">size_t</span> bytes,</div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;        <span class="keywordtype">int</span> device)</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    {</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;<span class="preprocessor">    #ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Caching functionality only defined on host</span></div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorInvalidConfiguration);</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;<span class="preprocessor">    #else</span></div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;        <span class="keywordtype">bool</span> locked                     = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;        <span class="keywordtype">int</span> entrypoint_device           = INVALID_DEVICE_ORDINAL;</div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;        cudaError_t error               = cudaSuccess;</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;        <span class="comment">// Round up to nearest bin size</span></div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;        <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> bin;</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;        <span class="keywordtype">size_t</span> bin_bytes;</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;        NearestPowerOf(bin, bin_bytes, bin_growth, bytes);</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;        <span class="keywordflow">if</span> (bin &lt; min_bin) {</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;            bin = min_bin;</div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;            bin_bytes = min_bin_bytes;</div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;        }</div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;        <span class="comment">// Check if bin is greater than our maximum bin</span></div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;        <span class="keywordflow">if</span> (bin &gt; max_bin)</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;        {</div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;            <span class="comment">// Allocate the request exactly and give out-of-range bin</span></div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;            bin = (<span class="keywordtype">unsigned</span> int) -1;</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;            bin_bytes = bytes;</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;        }</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;        BlockDescriptor search_key(bin_bytes, bin, device);</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;        <span class="comment">// Lock</span></div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;        <span class="keywordflow">if</span> (!locked) {</div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;            Lock(&amp;spin_lock);</div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;            locked = <span class="keyword">true</span>;</div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;        }</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;        <span class="keywordflow">do</span> {</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;            <span class="comment">// Find a free block big enough within the same bin on the same device</span></div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;            CachedBlocks::iterator block_itr = cached_blocks.lower_bound(search_key);</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;            <span class="keywordflow">if</span> ((block_itr != cached_blocks.end()) &amp;&amp;</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;                (block_itr-&gt;device == device) &amp;&amp;</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;                (block_itr-&gt;bin == search_key.bin))</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;            {</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;                <span class="comment">// Reuse existing cache block.  Insert into live blocks.</span></div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;                search_key = *block_itr;</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;                live_blocks.insert(search_key);</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;                <span class="comment">// Remove from free blocks</span></div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;                cached_blocks.erase(block_itr);</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;                cached_bytes[device] -= search_key.bytes;</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;                <span class="keywordflow">if</span> (debug) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;\tdevice %d reused cached block (%lld bytes). %lld available blocks cached (%lld bytes), %lld live blocks outstanding.\n&quot;</span>,</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;                    device, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) search_key.bytes, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) cached_blocks.size(), (<span class="keywordtype">long</span> long) cached_bytes[device], (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) live_blocks.size());</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;            }</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;            <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;            {</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;                <span class="comment">// Need to allocate a new cache block. Unlock.</span></div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;                <span class="keywordflow">if</span> (locked) {</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;                    Unlock(&amp;spin_lock);</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;                    locked = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;                }</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;                <span class="comment">// Set to specified device</span></div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaGetDevice(&amp;entrypoint_device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaSetDevice(device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;                <span class="comment">// Allocate</span></div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaMalloc(&amp;search_key.d_ptr, search_key.bytes))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;                <span class="comment">// Lock</span></div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;                <span class="keywordflow">if</span> (!locked) {</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;                    Lock(&amp;spin_lock);</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;                    locked = <span class="keyword">true</span>;</div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;                }</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;                <span class="comment">// Insert into live blocks</span></div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;                live_blocks.insert(search_key);</div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;                <span class="keywordflow">if</span> (debug) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;\tdevice %d allocating new device block %lld bytes. %lld available blocks cached (%lld bytes), %lld live blocks outstanding.\n&quot;</span>,</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;                    device, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) search_key.bytes, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) cached_blocks.size(), (<span class="keywordtype">long</span> long) cached_bytes[device], (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) live_blocks.size());</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;            }</div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;        } <span class="keywordflow">while</span>(0);</div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;</div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;        <span class="comment">// Unlock</span></div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;        <span class="keywordflow">if</span> (locked) {</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;            Unlock(&amp;spin_lock);</div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;            locked = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;        }</div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;</div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;        <span class="comment">// Copy device pointer to output parameter (NULL on error)</span></div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;        *d_ptr = search_key.d_ptr;</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;</div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;        <span class="comment">// Attempt to revert back to previous device if necessary</span></div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;        <span class="keywordflow">if</span> (entrypoint_device != INVALID_DEVICE_ORDINAL)</div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;        {</div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaSetDevice(entrypoint_device))) <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;        }</div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;</div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;<span class="preprocessor">    #endif  // __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;</div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;</div>
+<div class="line"><a name="l00443"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html#a7d8a199c902d88ed14f0433bdf94318c">  443</a></span>&#160;    cudaError_t <a class="code" href="structcub_1_1_caching_device_allocator.html#a7d8a199c902d88ed14f0433bdf94318c" title="Provides a suitable allocation of device memory for the given size on the current device...">DeviceAllocate</a>(</div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;        <span class="keywordtype">void</span>** d_ptr,</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;        <span class="keywordtype">size_t</span> bytes)</div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;    {</div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;<span class="preprocessor">    #ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Caching functionality only defined on host</span></div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorInvalidConfiguration);</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;<span class="preprocessor">    #else</span></div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;<span class="preprocessor"></span>        cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;        <span class="keywordflow">do</span> {</div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;            <span class="keywordtype">int</span> current_device;</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaGetDevice(&amp;current_device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="structcub_1_1_caching_device_allocator.html#a4a6fd29b17ff15c6a2ee01a25c5e45fb" title="Provides a suitable allocation of device memory for the given size on the specified device...">DeviceAllocate</a>(d_ptr, bytes, current_device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;        } <span class="keywordflow">while</span>(0);</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;<span class="preprocessor">    #endif  // __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;</div>
+<div class="line"><a name="l00467"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html#aafd80ae2cdadb883fe1da0c8a549228c">  467</a></span>&#160;    cudaError_t <a class="code" href="structcub_1_1_caching_device_allocator.html#aafd80ae2cdadb883fe1da0c8a549228c" title="Frees a live allocation of device memory on the specified device, returning it to the allocator...">DeviceFree</a>(</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;        <span class="keywordtype">void</span>* d_ptr,</div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;        <span class="keywordtype">int</span> device)</div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;    {</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;<span class="preprocessor">    #ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Caching functionality only defined on host</span></div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorInvalidConfiguration);</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;<span class="preprocessor">    #else</span></div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;        <span class="keywordtype">bool</span> locked                     = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;        <span class="keywordtype">int</span> entrypoint_device           = INVALID_DEVICE_ORDINAL;</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;        cudaError_t error               = cudaSuccess;</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;        BlockDescriptor search_key(d_ptr, device);</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;        <span class="comment">// Lock</span></div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;        <span class="keywordflow">if</span> (!locked) {</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;            Lock(&amp;spin_lock);</div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;            locked = <span class="keyword">true</span>;</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;        }</div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;        <span class="keywordflow">do</span> {</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;            <span class="comment">// Find corresponding block descriptor</span></div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;            BusyBlocks::iterator block_itr = live_blocks.find(search_key);</div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;            <span class="keywordflow">if</span> (block_itr == live_blocks.end())</div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;            {</div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;                <span class="comment">// Cannot find pointer</span></div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaErrorUnknown)) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;            }</div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;            <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;            {</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;                <span class="comment">// Remove from live blocks</span></div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;                search_key = *block_itr;</div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;                live_blocks.erase(block_itr);</div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;</div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;                <span class="comment">// Check if we should keep the returned allocation</span></div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;                <span class="keywordflow">if</span> (cached_bytes[device] + search_key.bytes &lt;= max_cached_bytes)</div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;                {</div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;                    <span class="comment">// Insert returned allocation into free blocks</span></div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;                    cached_blocks.insert(search_key);</div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;                    cached_bytes[device] += search_key.bytes;</div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;</div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;                    <span class="keywordflow">if</span> (debug) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;\tdevice %d returned %lld bytes. %lld available blocks cached (%lld bytes), %lld live blocks outstanding.\n&quot;</span>,</div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;                        device, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) search_key.bytes, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) cached_blocks.size(), (<span class="keywordtype">long</span> long) cached_bytes[device], (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) live_blocks.size());</div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;                }</div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;                <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;                {</div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;                    <span class="comment">// Free the returned allocation.  Unlock.</span></div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;                    <span class="keywordflow">if</span> (locked) {</div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;                        Unlock(&amp;spin_lock);</div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;                        locked = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;                    }</div>
+<div class="line"><a name="l00519"></a><span class="lineno">  519</span>&#160;</div>
+<div class="line"><a name="l00520"></a><span class="lineno">  520</span>&#160;                    <span class="comment">// Set to specified device</span></div>
+<div class="line"><a name="l00521"></a><span class="lineno">  521</span>&#160;                    <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaGetDevice(&amp;entrypoint_device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00522"></a><span class="lineno">  522</span>&#160;                    <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaSetDevice(device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;</div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;                    <span class="comment">// Free device memory</span></div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;                    <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaFree(d_ptr))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;</div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;                    <span class="keywordflow">if</span> (debug) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;\tdevice %d freed %lld bytes.  %lld available blocks cached (%lld bytes), %lld live blocks outstanding.\n&quot;</span>,</div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;                        device, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) search_key.bytes, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) cached_blocks.size(), (<span class="keywordtype">long</span> long) cached_bytes[device], (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) live_blocks.size());</div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;                }</div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;            }</div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;        } <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;</div>
+<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;        <span class="comment">// Unlock</span></div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;        <span class="keywordflow">if</span> (locked) {</div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;            Unlock(&amp;spin_lock);</div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;            locked = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;        }</div>
+<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;</div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;        <span class="comment">// Attempt to revert back to entry-point device if necessary</span></div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;        <span class="keywordflow">if</span> (entrypoint_device != INVALID_DEVICE_ORDINAL)</div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;        {</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaSetDevice(entrypoint_device))) <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;        }</div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;</div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;</div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;<span class="preprocessor">    #endif  // __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;</div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;</div>
+<div class="line"><a name="l00554"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html#adbf65c59172b140420636e150325deeb">  554</a></span>&#160;    cudaError_t <a class="code" href="structcub_1_1_caching_device_allocator.html#adbf65c59172b140420636e150325deeb" title="Frees a live allocation of device memory on the current device, returning it to the allocator...">DeviceFree</a>(</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        <span class="keywordtype">void</span>* d_ptr)</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;    {</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;<span class="preprocessor">    #ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Caching functionality only defined on host</span></div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorInvalidConfiguration);</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;<span class="preprocessor">    #else</span></div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;        <span class="keywordtype">int</span> current_device;</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;        cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;        <span class="keywordflow">do</span> {</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaGetDevice(&amp;current_device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="structcub_1_1_caching_device_allocator.html#aafd80ae2cdadb883fe1da0c8a549228c" title="Frees a live allocation of device memory on the specified device, returning it to the allocator...">DeviceFree</a>(d_ptr, current_device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;        } <span class="keywordflow">while</span>(0);</div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;</div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;</div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;<span class="preprocessor">    #endif  // __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;</div>
+<div class="line"><a name="l00579"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html#afbe43fd3a59ba6f4b974a4a66315c86e">  579</a></span>&#160;    cudaError_t <a class="code" href="structcub_1_1_caching_device_allocator.html#afbe43fd3a59ba6f4b974a4a66315c86e" title="Frees all cached device allocations on all devices. ">FreeAllCached</a>()</div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;    {</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;<span class="preprocessor">    #ifdef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Caching functionality only defined on host</span></div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorInvalidConfiguration);</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;<span class="preprocessor">    #else</span></div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;        cudaError_t error         = cudaSuccess;</div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;        <span class="keywordtype">bool</span> locked               = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;        <span class="keywordtype">int</span> entrypoint_device     = INVALID_DEVICE_ORDINAL;</div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;        <span class="keywordtype">int</span> current_device        = INVALID_DEVICE_ORDINAL;</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;        <span class="comment">// Lock</span></div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;        <span class="keywordflow">if</span> (!locked) {</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;            Lock(&amp;spin_lock);</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;            locked = <span class="keyword">true</span>;</div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;        }</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;</div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;        <span class="keywordflow">while</span> (!cached_blocks.empty())</div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;        {</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;            <span class="comment">// Get first block</span></div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;            CachedBlocks::iterator begin = cached_blocks.begin();</div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;</div>
+<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;            <span class="comment">// Get entry-point device ordinal if necessary</span></div>
+<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;            <span class="keywordflow">if</span> (entrypoint_device == INVALID_DEVICE_ORDINAL)</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;            {</div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaGetDevice(&amp;entrypoint_device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;            }</div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;</div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;            <span class="comment">// Set current device ordinal if necessary</span></div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;            <span class="keywordflow">if</span> (begin-&gt;device != current_device)</div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;            {</div>
+<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;                <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaSetDevice(begin-&gt;device))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;                current_device = begin-&gt;device;</div>
+<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;            }</div>
+<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;</div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;            <span class="comment">// Free device memory</span></div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaFree(begin-&gt;d_ptr))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;</div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;            <span class="comment">// Reduce balance and erase entry</span></div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;            cached_bytes[current_device] -= begin-&gt;bytes;</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;            cached_blocks.erase(begin);</div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;</div>
+<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;            <span class="keywordflow">if</span> (debug) <a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db" title="Log macro for printf statements. ">CubLog</a>(<span class="stringliteral">&quot;\tdevice %d freed %lld bytes.  %lld available blocks cached (%lld bytes), %lld live blocks outstanding.\n&quot;</span>,</div>
+<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;                current_device, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) begin-&gt;bytes, (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) cached_blocks.size(), (<span class="keywordtype">long</span> long) cached_bytes[current_device], (<span class="keywordtype">long</span> <span class="keywordtype">long</span>) live_blocks.size());</div>
+<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;        }</div>
+<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;</div>
+<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;        <span class="comment">// Unlock</span></div>
+<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;        <span class="keywordflow">if</span> (locked) {</div>
+<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;            Unlock(&amp;spin_lock);</div>
+<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;            locked = <span class="keyword">false</span>;</div>
+<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;        }</div>
+<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;</div>
+<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;        <span class="comment">// Attempt to revert back to entry-point device if necessary</span></div>
+<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;        <span class="keywordflow">if</span> (entrypoint_device != INVALID_DEVICE_ORDINAL)</div>
+<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;        {</div>
+<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaSetDevice(entrypoint_device))) <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;        }</div>
+<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;</div>
+<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;</div>
+<div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;<span class="preprocessor">    #endif  // __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;</div>
+<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;</div>
+<div class="line"><a name="l00647"></a><span class="lineno"><a class="code" href="structcub_1_1_caching_device_allocator.html#a2a521f7464d3eee98486b4d321fc8cc7">  647</a></span>&#160;    <span class="keyword">virtual</span> <a class="code" href="structcub_1_1_caching_device_allocator.html#a2a521f7464d3eee98486b4d321fc8cc7" title="Destructor. ">~CachingDeviceAllocator</a>()</div>
+<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;    {</div>
+<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;        <span class="keywordflow">if</span> (!skip_cleanup)</div>
+<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;            <a class="code" href="structcub_1_1_caching_device_allocator.html#afbe43fd3a59ba6f4b974a4a66315c86e" title="Frees all cached device allocations on all devices. ">FreeAllCached</a>();</div>
+<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;    }</div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;</div>
+<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;};</div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;</div>
+<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;</div>
+<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;</div>
+<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;       <span class="comment">// end group UtilModule</span></div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/util__arch_8cuh_source.html b/docs/html/util__arch_8cuh_source.html
new file mode 100644
index 0000000000..9b85590502
--- /dev/null
+++ b/docs/html/util__arch_8cuh_source.html
@@ -0,0 +1,359 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: util_arch.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">util_arch.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="util__arch_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="comment"> * Static architectural properties by SM version.</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="comment"> * &quot;Device&quot; reflects the PTX architecture targeted by the active compiler</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="comment"> * pass.  It provides useful compile-time statics within device code.  E.g.,:</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="comment"> *     __shared__ int[Device::WARP_THREADS];</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;<span class="comment"> *     int padded_offset = threadIdx.x + (threadIdx.x &gt;&gt; Device::LOG_SMEM_BANKS);</span></div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="preprocessor">#include &quot;util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00066"></a><span class="lineno"><a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f">   66</a></span>&#160;<span class="preprocessor"></span><span class="preprocessor">    #define CUB_PTX_ARCH 0</span></div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;<span class="preprocessor"></span><span class="preprocessor">    #define CUB_PTX_ARCH __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="preprocessor">#if !defined(__CUDA_ARCH__) || defined(CUB_CDP)</span></div>
+<div class="line"><a name="l00074"></a><span class="lineno"><a class="code" href="group___util_module.html#gac029dc29df3c1871ab3b8a38f50904a6">   74</a></span>&#160;<span class="preprocessor"></span><span class="preprocessor">#define CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="preprocessor">#if ((CUB_PTX_ARCH &gt; 0) &amp;&amp; (CUB_PTX_ARCH &lt; 200))</span></div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="preprocessor"></span><span class="preprocessor">    #define CUB_DESTRUCTOR __host__</span></div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00082"></a><span class="lineno"><a class="code" href="group___util_module.html#ga756ebe2b0566abfdfcd3c13fe7d1e9c6">   82</a></span>&#160;<span class="preprocessor"></span><span class="preprocessor">    #define CUB_DESTRUCTOR __host__ __device__</span></div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> SM_ARCH&gt;</div>
+<div class="line"><a name="l00092"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html">   92</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps</a></div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;{</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    {</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;        LOG_WARP_THREADS    =</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;                                        5,                        </div>
+<div class="line"><a name="l00098"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c">   98</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">WARP_THREADS</a>        =</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;                                        1 &lt;&lt; LOG_WARP_THREADS,    </div>
+<div class="line"><a name="l00100"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5">  100</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5" title="Number of threads per warp. ">LOG_SMEM_BANKS</a>      =</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;                                        4,                        </div>
+<div class="line"><a name="l00102"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a55ab5a77ae95f67255bbec10cd3993e1">  102</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a55ab5a77ae95f67255bbec10cd3993e1" title="Log of the number of smem banks. ">SMEM_BANKS</a>          =</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;                                        1 &lt;&lt; <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5" title="Number of threads per warp. ">LOG_SMEM_BANKS</a>,      </div>
+<div class="line"><a name="l00104"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ab56aa4deb8408a51e7cc139c2c1e14f5">  104</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ab56aa4deb8408a51e7cc139c2c1e14f5" title="The number of smem banks. ">SMEM_BANK_BYTES</a>     =</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;                                        4,                        </div>
+<div class="line"><a name="l00106"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a993d6ee811a054da1a8579132c6301a1">  106</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a993d6ee811a054da1a8579132c6301a1" title="Size of smem bank words. ">SMEM_BYTES</a>          =</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;                                        16 * 1024,                </div>
+<div class="line"><a name="l00108"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063af554a252a393bce18200236640959bab">  108</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063af554a252a393bce18200236640959bab" title="Maximum SM shared memory. ">SMEM_ALLOC_UNIT</a>     =</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;                                        512,                      </div>
+<div class="line"><a name="l00110"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063addc3e62803e3ed6d8ec351faa7a2c45d">  110</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063addc3e62803e3ed6d8ec351faa7a2c45d" title="Smem allocation size in bytes. ">REGS_BY_BLOCK</a>       =</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;                                        <span class="keyword">true</span>,                     </div>
+<div class="line"><a name="l00112"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a5f6934930aa379cd70b7c8e19bcff4bc">  112</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a5f6934930aa379cd70b7c8e19bcff4bc" title="Whether or not the architecture allocates registers by block (or by warp) ">REG_ALLOC_UNIT</a>      =</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;                                        256,                      </div>
+<div class="line"><a name="l00114"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a25bc7bb8dac71df0b7962776e0ed9cde">  114</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a25bc7bb8dac71df0b7962776e0ed9cde" title="Number of registers allocated at a time per block (or by warp) ">WARP_ALLOC_UNIT</a>     =</div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;                                        2,                        </div>
+<div class="line"><a name="l00116"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a3aa3c3db5dc28ef11961f6867fee7101">  116</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a3aa3c3db5dc28ef11961f6867fee7101" title="Granularity of warps for which registers are allocated. ">MAX_SM_THREADS</a>      =</div>
+<div class="line"><a name="l00117"></a><span class="lineno">  117</span>&#160;                                        768,                      </div>
+<div class="line"><a name="l00118"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063abdc229ee36991bb6055f3bd42fc59387">  118</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063abdc229ee36991bb6055f3bd42fc59387" title="Maximum number of threads per SM. ">MAX_SM_THREADBLOCKS</a> =</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;                                        8,                        </div>
+<div class="line"><a name="l00120"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9079f42fbfb80e59ef7affc574bf6001">  120</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9079f42fbfb80e59ef7affc574bf6001" title="Maximum number of thread blocks per SM. ">MAX_BLOCK_THREADS</a>   =</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;                                        512,                      </div>
+<div class="line"><a name="l00122"></a><span class="lineno"><a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a90062d88d6a9abcfdfd4c29111a5ac3e">  122</a></span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a90062d88d6a9abcfdfd4c29111a5ac3e" title="Maximum number of thread per thread block. ">MAX_SM_REGISTERS</a>    =</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;                                        8 * 1024,                 </div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;    };</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;};</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;</div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="keyword">template</span> &lt;&gt;</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="keyword">struct </span>ArchProps&lt;300&gt;</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;{</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    {</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;        LOG_WARP_THREADS    = 5,                        <span class="comment">// 32 threads per warp</span></div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">WARP_THREADS</a>        = 1 &lt;&lt; LOG_WARP_THREADS,</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5" title="Number of threads per warp. ">LOG_SMEM_BANKS</a>      = 5,                        <span class="comment">// 32 banks</span></div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a55ab5a77ae95f67255bbec10cd3993e1" title="Log of the number of smem banks. ">SMEM_BANKS</a>          = 1 &lt;&lt; <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5" title="Number of threads per warp. ">LOG_SMEM_BANKS</a>,</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ab56aa4deb8408a51e7cc139c2c1e14f5" title="The number of smem banks. ">SMEM_BANK_BYTES</a>     = 4,                        <span class="comment">// 4 byte bank words</span></div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a993d6ee811a054da1a8579132c6301a1" title="Size of smem bank words. ">SMEM_BYTES</a>          = 48 * 1024,                <span class="comment">// 48KB shared memory</span></div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063af554a252a393bce18200236640959bab" title="Maximum SM shared memory. ">SMEM_ALLOC_UNIT</a>     = 256,                      <span class="comment">// 256B smem allocation segment size</span></div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063addc3e62803e3ed6d8ec351faa7a2c45d" title="Smem allocation size in bytes. ">REGS_BY_BLOCK</a>       = <span class="keyword">false</span>,                    <span class="comment">// Allocates registers by warp</span></div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a5f6934930aa379cd70b7c8e19bcff4bc" title="Whether or not the architecture allocates registers by block (or by warp) ">REG_ALLOC_UNIT</a>      = 256,                      <span class="comment">// 256 registers allocated at a time per warp</span></div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a25bc7bb8dac71df0b7962776e0ed9cde" title="Number of registers allocated at a time per block (or by warp) ">WARP_ALLOC_UNIT</a>     = 4,                        <span class="comment">// Registers are allocated at a granularity of every 4 warps per threadblock</span></div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a3aa3c3db5dc28ef11961f6867fee7101" title="Granularity of warps for which registers are allocated. ">MAX_SM_THREADS</a>      = 2048,                     <span class="comment">// 2K max threads per SM</span></div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063abdc229ee36991bb6055f3bd42fc59387" title="Maximum number of threads per SM. ">MAX_SM_THREADBLOCKS</a> = 16,                       <span class="comment">// 16 max threadblocks per SM</span></div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9079f42fbfb80e59ef7affc574bf6001" title="Maximum number of thread blocks per SM. ">MAX_BLOCK_THREADS</a>   = 1024,                     <span class="comment">// 1024 max threads per threadblock</span></div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a90062d88d6a9abcfdfd4c29111a5ac3e" title="Maximum number of thread per thread block. ">MAX_SM_REGISTERS</a>    = 64 * 1024,                <span class="comment">// 64K max registers per SM</span></div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    };</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    <span class="comment">// Callback utility</span></div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    <span class="keyword">static</span> __host__ __device__ __forceinline__ <span class="keywordtype">void</span> Callback(T &amp;target, <span class="keywordtype">int</span> sm_version)</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    {</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;        target.template Callback&lt;ArchProps&gt;();</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    }</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;};</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="keyword">template</span> &lt;&gt;</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;<span class="keyword">struct </span>ArchProps&lt;200&gt;</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;{</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    {</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;        LOG_WARP_THREADS    = 5,                        <span class="comment">// 32 threads per warp</span></div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">WARP_THREADS</a>        = 1 &lt;&lt; LOG_WARP_THREADS,</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5" title="Number of threads per warp. ">LOG_SMEM_BANKS</a>      = 5,                        <span class="comment">// 32 banks</span></div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a55ab5a77ae95f67255bbec10cd3993e1" title="Log of the number of smem banks. ">SMEM_BANKS</a>          = 1 &lt;&lt; <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5" title="Number of threads per warp. ">LOG_SMEM_BANKS</a>,</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ab56aa4deb8408a51e7cc139c2c1e14f5" title="The number of smem banks. ">SMEM_BANK_BYTES</a>     = 4,                        <span class="comment">// 4 byte bank words</span></div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a993d6ee811a054da1a8579132c6301a1" title="Size of smem bank words. ">SMEM_BYTES</a>          = 48 * 1024,                <span class="comment">// 48KB shared memory</span></div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063af554a252a393bce18200236640959bab" title="Maximum SM shared memory. ">SMEM_ALLOC_UNIT</a>     = 128,                      <span class="comment">// 128B smem allocation segment size</span></div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063addc3e62803e3ed6d8ec351faa7a2c45d" title="Smem allocation size in bytes. ">REGS_BY_BLOCK</a>       = <span class="keyword">false</span>,                    <span class="comment">// Allocates registers by warp</span></div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a5f6934930aa379cd70b7c8e19bcff4bc" title="Whether or not the architecture allocates registers by block (or by warp) ">REG_ALLOC_UNIT</a>      = 64,                       <span class="comment">// 64 registers allocated at a time per warp</span></div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a25bc7bb8dac71df0b7962776e0ed9cde" title="Number of registers allocated at a time per block (or by warp) ">WARP_ALLOC_UNIT</a>     = 2,                        <span class="comment">// Registers are allocated at a granularity of every 2 warps per threadblock</span></div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a3aa3c3db5dc28ef11961f6867fee7101" title="Granularity of warps for which registers are allocated. ">MAX_SM_THREADS</a>      = 1536,                     <span class="comment">// 1536 max threads per SM</span></div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063abdc229ee36991bb6055f3bd42fc59387" title="Maximum number of threads per SM. ">MAX_SM_THREADBLOCKS</a> = 8,                        <span class="comment">// 8 max threadblocks per SM</span></div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9079f42fbfb80e59ef7affc574bf6001" title="Maximum number of thread blocks per SM. ">MAX_BLOCK_THREADS</a>   = 1024,                     <span class="comment">// 1024 max threads per threadblock</span></div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a90062d88d6a9abcfdfd4c29111a5ac3e" title="Maximum number of thread per thread block. ">MAX_SM_REGISTERS</a>    = 32 * 1024,                <span class="comment">// 32K max registers per SM</span></div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    };</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    <span class="comment">// Callback utility</span></div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    <span class="keyword">static</span> __host__ __device__ __forceinline__ <span class="keywordtype">void</span> Callback(T &amp;target, <span class="keywordtype">int</span> sm_version)</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    {</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        <span class="keywordflow">if</span> (sm_version &gt; 200) {</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;            ArchProps&lt;300&gt;::Callback(target, sm_version);</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;        } <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;            target.template Callback&lt;ArchProps&gt;();</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;        }</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    }</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;};</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;<span class="keyword">template</span> &lt;&gt;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;<span class="keyword">struct </span>ArchProps&lt;120&gt;</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;{</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;    {</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;        LOG_WARP_THREADS    = 5,                        <span class="comment">// 32 threads per warp</span></div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">WARP_THREADS</a>        = 1 &lt;&lt; LOG_WARP_THREADS,</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5" title="Number of threads per warp. ">LOG_SMEM_BANKS</a>      = 4,                        <span class="comment">// 16 banks</span></div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a55ab5a77ae95f67255bbec10cd3993e1" title="Log of the number of smem banks. ">SMEM_BANKS</a>          = 1 &lt;&lt; <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9596af8e6d63db07ffae0c5c35f513d5" title="Number of threads per warp. ">LOG_SMEM_BANKS</a>,</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ab56aa4deb8408a51e7cc139c2c1e14f5" title="The number of smem banks. ">SMEM_BANK_BYTES</a>     = 4,                        <span class="comment">// 4 byte bank words</span></div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a993d6ee811a054da1a8579132c6301a1" title="Size of smem bank words. ">SMEM_BYTES</a>          = 16 * 1024,                <span class="comment">// 16KB shared memory</span></div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063af554a252a393bce18200236640959bab" title="Maximum SM shared memory. ">SMEM_ALLOC_UNIT</a>     = 512,                      <span class="comment">// 512B smem allocation segment size</span></div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063addc3e62803e3ed6d8ec351faa7a2c45d" title="Smem allocation size in bytes. ">REGS_BY_BLOCK</a>       = <span class="keyword">true</span>,                     <span class="comment">// Allocates registers by threadblock</span></div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a5f6934930aa379cd70b7c8e19bcff4bc" title="Whether or not the architecture allocates registers by block (or by warp) ">REG_ALLOC_UNIT</a>      = 512,                      <span class="comment">// 512 registers allocated at time per threadblock</span></div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a25bc7bb8dac71df0b7962776e0ed9cde" title="Number of registers allocated at a time per block (or by warp) ">WARP_ALLOC_UNIT</a>     = 2,                        <span class="comment">// Registers are allocated at a granularity of every 2 warps per threadblock</span></div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a3aa3c3db5dc28ef11961f6867fee7101" title="Granularity of warps for which registers are allocated. ">MAX_SM_THREADS</a>      = 1024,                     <span class="comment">// 1024 max threads per SM</span></div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063abdc229ee36991bb6055f3bd42fc59387" title="Maximum number of threads per SM. ">MAX_SM_THREADBLOCKS</a> = 8,                        <span class="comment">// 8 max threadblocks per SM</span></div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9079f42fbfb80e59ef7affc574bf6001" title="Maximum number of thread blocks per SM. ">MAX_BLOCK_THREADS</a>   = 512,                      <span class="comment">// 512 max threads per threadblock</span></div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;        <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a90062d88d6a9abcfdfd4c29111a5ac3e" title="Maximum number of thread per thread block. ">MAX_SM_REGISTERS</a>    = 16 * 1024,                <span class="comment">// 16K max registers per SM</span></div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    };</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;    <span class="comment">// Callback utility</span></div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;    <span class="keyword">static</span> __host__ __device__ __forceinline__ <span class="keywordtype">void</span> Callback(T &amp;target, <span class="keywordtype">int</span> sm_version)</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    {</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;        <span class="keywordflow">if</span> (sm_version &gt; 120) {</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;            ArchProps&lt;200&gt;::Callback(target, sm_version);</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;        } <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;            target.template Callback&lt;ArchProps&gt;();</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;        }</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;    }</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;};</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;<span class="keyword">template</span> &lt;&gt;</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;<span class="keyword">struct </span>ArchProps&lt;100&gt; : ArchProps&lt;0&gt;</div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;{</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;    <span class="comment">// Callback utility</span></div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;    <span class="keyword">static</span> __host__ __device__ __forceinline__ <span class="keywordtype">void</span> Callback(T &amp;target, <span class="keywordtype">int</span> sm_version)</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    {</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;        <span class="keywordflow">if</span> (sm_version &gt; 100) {</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;            ArchProps&lt;120&gt;::Callback(target, sm_version);</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;        } <span class="keywordflow">else</span> {</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;            target.template Callback&lt;ArchProps&gt;();</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;        }</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    }</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;};</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<span class="keyword">template</span> &lt;&gt;</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;<span class="keyword">struct </span>ArchProps&lt;350&gt; : ArchProps&lt;300&gt; {};        <span class="comment">// Derives from SM30</span></div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;<span class="keyword">template</span> &lt;&gt;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;<span class="keyword">struct </span>ArchProps&lt;210&gt; : ArchProps&lt;200&gt; {};        <span class="comment">// Derives from SM20</span></div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;<span class="keyword">template</span> &lt;&gt;</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;<span class="keyword">struct </span>ArchProps&lt;130&gt; : ArchProps&lt;120&gt; {};        <span class="comment">// Derives from SM12</span></div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;<span class="keyword">template</span> &lt;&gt;</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;<span class="keyword">struct </span>ArchProps&lt;110&gt; : ArchProps&lt;100&gt; {};        <span class="comment">// Derives from SM10</span></div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;</div>
+<div class="line"><a name="l00289"></a><span class="lineno"><a class="code" href="structcub_1_1_ptx_arch_props.html">  289</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_ptx_arch_props.html" title="The architectural properties for the PTX version targeted by the active compiler pass. ">PtxArchProps</a> : <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps</a>&lt;CUB_PTX_ARCH&gt; {};</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;       <span class="comment">// end group UtilModule</span></div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/util__debug_8cuh_source.html b/docs/html/util__debug_8cuh_source.html
new file mode 100644
index 0000000000..b474e6e045
--- /dev/null
+++ b/docs/html/util__debug_8cuh_source.html
@@ -0,0 +1,197 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: util_debug.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">util_debug.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="util__debug_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &lt;stdio.h&gt;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__arch_8cuh.html">util_arch.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="preprocessor">#if (defined(DEBUG) || defined(_DEBUG))</span></div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="preprocessor"></span><span class="preprocessor">    #define CUB_STDERR</span></div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div>
+<div class="line"><a name="l00068"></a><span class="lineno"><a class="code" href="group___util_module.html#ga5a175d2a88f63f7f1ab30e8b4f2cfa95">   68</a></span>&#160;__host__ __device__ __forceinline__ cudaError_t <a class="code" href="group___util_module.html#ga5a175d2a88f63f7f1ab30e8b4f2cfa95" title="CUB error reporting macro (prints error messages to stderr) ">Debug</a>(</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    cudaError_t     error,</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">char</span>*     filename,</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <span class="keywordtype">int</span>             line)</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;{</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;<span class="preprocessor">#ifdef CUB_STDERR</span></div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">if</span> (error)</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    {</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;<span class="preprocessor">    #if (CUB_PTX_ARCH == 0)</span></div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;<span class="preprocessor"></span>        fprintf(stderr, <span class="stringliteral">&quot;CUDA error %d [%s, %d]: %s\n&quot;</span>, error, filename, line, cudaGetErrorString(error));</div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;        fflush(stderr);</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;<span class="preprocessor">    #elif (CUB_PTX_ARCH &gt;= 200)</span></div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="preprocessor"></span>        printf(<span class="stringliteral">&quot;CUDA error %d [block %d, thread %d, %s, %d]\n&quot;</span>, error, blockIdx.x, threadIdx.x, filename, line);</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;<span class="preprocessor">    #endif</span></div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;}</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;</div>
+<div class="line"><a name="l00091"></a><span class="lineno"><a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236">   91</a></span>&#160;<span class="preprocessor">#define CubDebug(e) cub::Debug((e), __FILE__, __LINE__)</span></div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div>
+<div class="line"><a name="l00097"></a><span class="lineno"><a class="code" href="group___util_module.html#ga26211db894893b3cec946e4e537536f8">   97</a></span>&#160;<span class="preprocessor">#define CubDebugExit(e) if (cub::Debug((e), __FILE__, __LINE__)) { exit(1); }</span></div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH == 0)</span></div>
+<div class="line"><a name="l00104"></a><span class="lineno"><a class="code" href="group___util_module.html#ga6788287a780dc10c443aa1ab5ae9f0db">  104</a></span>&#160;<span class="preprocessor"></span><span class="preprocessor">    #define CubLog(format, ...) printf(format,__VA_ARGS__);</span></div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#elif (CUB_PTX_ARCH &gt;= 200)</span></div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;<span class="preprocessor"></span><span class="preprocessor">    #define CubLog(format, ...) printf(&quot;[block %d, thread %d]: &quot; format, blockIdx.x, threadIdx.x, __VA_ARGS__);</span></div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;<span class="preprocessor"></span><span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;       <span class="comment">// end group UtilModule</span></div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00115"></a><span class="lineno">  115</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/util__device_8cuh_source.html b/docs/html/util__device_8cuh_source.html
new file mode 100644
index 0000000000..6f790399c7
--- /dev/null
+++ b/docs/html/util__device_8cuh_source.html
@@ -0,0 +1,450 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: util_device.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">util_device.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="util__device_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__arch_8cuh.html">util_arch.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__debug_8cuh.html">util_debug.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;util_macro.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;__global__ <span class="keywordtype">void</span> EmptyKernel(<span class="keywordtype">void</span>) { }</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;</div>
+<div class="line"><a name="l00066"></a><span class="lineno">   66</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> ALLOCATIONS&gt;</div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;__host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;cudaError_t AliasTemporaries(</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keywordtype">void</span>    *d_temp_storage,                    </div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    <span class="keywordtype">size_t</span>  &amp;temp_storage_bytes,                </div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;    <span class="keywordtype">void</span>*   (&amp;allocations)[ALLOCATIONS],        </div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;    <span class="keywordtype">size_t</span>  (&amp;allocation_sizes)[ALLOCATIONS])   </div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;{</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">int</span> ALIGN_BYTES   = 256;</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;    <span class="keyword">const</span> <span class="keywordtype">int</span> ALIGN_MASK    = ~(ALIGN_BYTES - 1);</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;    <span class="comment">// Compute exclusive prefix sum over allocation requests</span></div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;    <span class="keywordtype">size_t</span> bytes_needed = 0;</div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; ALLOCATIONS; ++i)</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;    {</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;        <span class="keywordtype">size_t</span> allocation_bytes = (allocation_sizes[i] + ALIGN_BYTES - 1) &amp; ALIGN_MASK;</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;        allocation_sizes[i] = bytes_needed;</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;        bytes_needed += allocation_bytes;</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    }</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;    <span class="comment">// Check if the caller is simply requesting the size of the storage allocation</span></div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;    <span class="keywordflow">if</span> (!d_temp_storage)</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;    {</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;        temp_storage_bytes = bytes_needed;</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;        <span class="keywordflow">return</span> cudaSuccess;</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    }</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;    <span class="comment">// Check if enough storage provided</span></div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    <span class="keywordflow">if</span> (temp_storage_bytes &lt; bytes_needed)</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;    {</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorMemoryAllocation);</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;    }</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;    <span class="comment">// Alias</span></div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;    <span class="keywordflow">for</span> (<span class="keywordtype">int</span> i = 0; i &lt; ALLOCATIONS; ++i)</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;    {</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;        allocations[i] = <span class="keyword">static_cast&lt;</span><span class="keywordtype">char</span>*<span class="keyword">&gt;</span>(d_temp_storage) + allocation_sizes[i];</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;    }</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    <span class="keywordflow">return</span> cudaSuccess;</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;}</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;</div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;</div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="preprocessor">#endif  // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;</div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;</div>
+<div class="line"><a name="l00117"></a><span class="lineno"><a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e">  117</a></span>&#160;__host__ __device__ __forceinline__ cudaError_t <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(<span class="keywordtype">int</span> &amp;ptx_version)</div>
+<div class="line"><a name="l00118"></a><span class="lineno">  118</span>&#160;{</div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;<span class="preprocessor">#ifndef CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;    <span class="comment">// CUDA API calls not supported from this device</span></div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    <span class="keywordflow">return</span> cudaErrorInvalidConfiguration;</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;    cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;    <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    {</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;        cudaFuncAttributes empty_kernel_attrs;</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;        <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaFuncGetAttributes(&amp;empty_kernel_attrs, EmptyKernel&lt;void&gt;))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;        ptx_version = empty_kernel_attrs.ptxVersion * 10;</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    }</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;    <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;<span class="preprocessor"></span>}</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;__host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;<span class="keyword">static</span> cudaError_t SyncStream(cudaStream_t stream)</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;{</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="preprocessor">#ifndef __CUDA_ARCH__</span></div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;<span class="preprocessor"></span>    <span class="keywordflow">return</span> cudaStreamSynchronize(stream);</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="preprocessor"></span>    <span class="comment">// Device can&#39;t yet sync on a specific stream</span></div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;    <span class="keywordflow">return</span> cudaDeviceSynchronize();</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;<span class="preprocessor"></span>}</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;</div>
+<div class="line"><a name="l00160"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html">  160</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_device.html" title="Properties of a given CUDA device and the corresponding PTX bundle. ">Device</a></div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;{</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;    <span class="keyword">typedef</span> void (*EmptyKernelPtr)();</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    EmptyKernelPtr Empty()</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    {</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;        <span class="keywordflow">return</span> EmptyKernel&lt;void&gt;;</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    }</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    <span class="comment">// Version information</span></div>
+<div class="line"><a name="l00177"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#ac9b36b3b0edb207aeee60110fbee6406">  177</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#ac9b36b3b0edb207aeee60110fbee6406" title="SM version of target device (SM version X.YZ in XYZ integer form) ">sm_version</a>;             </div>
+<div class="line"><a name="l00178"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a416909debdeaa9116d7087ed55ed870f">  178</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#a416909debdeaa9116d7087ed55ed870f" title="Bundled PTX version for target device (PTX version X.YZ in XYZ integer form) ">ptx_version</a>;            </div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <span class="comment">// Target device properties</span></div>
+<div class="line"><a name="l00181"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a68885a90ea0badcffc2a3511b0b4fd5c">  181</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#a68885a90ea0badcffc2a3511b0b4fd5c" title="Number of SMs. ">sm_count</a>;               </div>
+<div class="line"><a name="l00182"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a4498c242e597f67a4a752426ae262049">  182</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#a4498c242e597f67a4a752426ae262049" title="Number of threads per warp. ">warp_threads</a>;           </div>
+<div class="line"><a name="l00183"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a909d34dd31bdb6f754a603e8eb2b10ab">  183</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#a909d34dd31bdb6f754a603e8eb2b10ab" title="Number of bytes per SM bank. ">smem_bank_bytes</a>;        </div>
+<div class="line"><a name="l00184"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a2e835add85abdf0eb640c551abec2a0b">  184</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#a2e835add85abdf0eb640c551abec2a0b" title="Number of smem banks. ">smem_banks</a>;             </div>
+<div class="line"><a name="l00185"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a838c9a2e207c38ef24e79a40bccdd1ac">  185</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#a838c9a2e207c38ef24e79a40bccdd1ac" title="Smem bytes per SM. ">smem_bytes</a>;             </div>
+<div class="line"><a name="l00186"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#aca17efd166d916008f0fc378adc00b1f">  186</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#aca17efd166d916008f0fc378adc00b1f" title="Smem segment size. ">smem_alloc_unit</a>;        </div>
+<div class="line"><a name="l00187"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a721a479d183aaa1846c69de998f84ffc">  187</a></span>&#160;    <span class="keywordtype">bool</span>    <a class="code" href="classcub_1_1_device.html#a721a479d183aaa1846c69de998f84ffc" title="Whether registers are allocated by threadblock (or by warp) ">regs_by_block</a>;          </div>
+<div class="line"><a name="l00188"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#aa432ab8fdb1d1117b29811422c83a187">  188</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#aa432ab8fdb1d1117b29811422c83a187" title="Granularity of register allocation within the SM. ">reg_alloc_unit</a>;         </div>
+<div class="line"><a name="l00189"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#ac5f8afb6f319b0dbd689f3f1188fc20b">  189</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#ac5f8afb6f319b0dbd689f3f1188fc20b" title="Granularity of warp allocation within the SM. ">warp_alloc_unit</a>;        </div>
+<div class="line"><a name="l00190"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a963c497e442ac283b2655faa578614d3">  190</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#a963c497e442ac283b2655faa578614d3" title="Maximum number of threads per SM. ">max_sm_threads</a>;         </div>
+<div class="line"><a name="l00191"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#ac614bed852b56bf8c616803aa8601caf">  191</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#ac614bed852b56bf8c616803aa8601caf" title="Maximum number of threadblocks per SM. ">max_sm_blocks</a>;          </div>
+<div class="line"><a name="l00192"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#ab55f58e3252d369ee50d34b190df2277">  192</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#ab55f58e3252d369ee50d34b190df2277" title="Maximum number of threads per threadblock. ">max_block_threads</a>;      </div>
+<div class="line"><a name="l00193"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#af321be8fe9aecd0942d04739f7520c61">  193</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#af321be8fe9aecd0942d04739f7520c61" title="Maximum number of registers per SM. ">max_sm_registers</a>;       </div>
+<div class="line"><a name="l00194"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a5ee84e74af9939896bb81b48d4843d17">  194</a></span>&#160;    <span class="keywordtype">int</span>     <a class="code" href="classcub_1_1_device.html#a5ee84e74af9939896bb81b48d4843d17" title="Maximum number of warps per SM. ">max_sm_warps</a>;           </div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ArchProps&gt;</div>
+<div class="line"><a name="l00200"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a3c986a6aa2d3b69fe8a7ab14c85a6477">  200</a></span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_device.html#a3c986a6aa2d3b69fe8a7ab14c85a6477">Callback</a>()</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;    {</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;        <a class="code" href="classcub_1_1_device.html#a4498c242e597f67a4a752426ae262049" title="Number of threads per warp. ">warp_threads</a>        = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">ArchProps::WARP_THREADS</a>;</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;        <a class="code" href="classcub_1_1_device.html#a909d34dd31bdb6f754a603e8eb2b10ab" title="Number of bytes per SM bank. ">smem_bank_bytes</a>     = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ab56aa4deb8408a51e7cc139c2c1e14f5" title="The number of smem banks. ">ArchProps::SMEM_BANK_BYTES</a>;</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;        <a class="code" href="classcub_1_1_device.html#a2e835add85abdf0eb640c551abec2a0b" title="Number of smem banks. ">smem_banks</a>          = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a55ab5a77ae95f67255bbec10cd3993e1" title="Log of the number of smem banks. ">ArchProps::SMEM_BANKS</a>;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;        <a class="code" href="classcub_1_1_device.html#a838c9a2e207c38ef24e79a40bccdd1ac" title="Smem bytes per SM. ">smem_bytes</a>          = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a993d6ee811a054da1a8579132c6301a1" title="Size of smem bank words. ">ArchProps::SMEM_BYTES</a>;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;        <a class="code" href="classcub_1_1_device.html#aca17efd166d916008f0fc378adc00b1f" title="Smem segment size. ">smem_alloc_unit</a>     = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063af554a252a393bce18200236640959bab" title="Maximum SM shared memory. ">ArchProps::SMEM_ALLOC_UNIT</a>;</div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;        <a class="code" href="classcub_1_1_device.html#a721a479d183aaa1846c69de998f84ffc" title="Whether registers are allocated by threadblock (or by warp) ">regs_by_block</a>       = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063addc3e62803e3ed6d8ec351faa7a2c45d" title="Smem allocation size in bytes. ">ArchProps::REGS_BY_BLOCK</a>;</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;        <a class="code" href="classcub_1_1_device.html#aa432ab8fdb1d1117b29811422c83a187" title="Granularity of register allocation within the SM. ">reg_alloc_unit</a>      = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a5f6934930aa379cd70b7c8e19bcff4bc" title="Whether or not the architecture allocates registers by block (or by warp) ">ArchProps::REG_ALLOC_UNIT</a>;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;        <a class="code" href="classcub_1_1_device.html#ac5f8afb6f319b0dbd689f3f1188fc20b" title="Granularity of warp allocation within the SM. ">warp_alloc_unit</a>     = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a25bc7bb8dac71df0b7962776e0ed9cde" title="Number of registers allocated at a time per block (or by warp) ">ArchProps::WARP_ALLOC_UNIT</a>;</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;        <a class="code" href="classcub_1_1_device.html#a963c497e442ac283b2655faa578614d3" title="Maximum number of threads per SM. ">max_sm_threads</a>      = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a3aa3c3db5dc28ef11961f6867fee7101" title="Granularity of warps for which registers are allocated. ">ArchProps::MAX_SM_THREADS</a>;</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;        <a class="code" href="classcub_1_1_device.html#ac614bed852b56bf8c616803aa8601caf" title="Maximum number of threadblocks per SM. ">max_sm_blocks</a>       = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063abdc229ee36991bb6055f3bd42fc59387" title="Maximum number of threads per SM. ">ArchProps::MAX_SM_THREADBLOCKS</a>;</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;        <a class="code" href="classcub_1_1_device.html#ab55f58e3252d369ee50d34b190df2277" title="Maximum number of threads per threadblock. ">max_block_threads</a>   = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a9079f42fbfb80e59ef7affc574bf6001" title="Maximum number of thread blocks per SM. ">ArchProps::MAX_BLOCK_THREADS</a>;</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        <a class="code" href="classcub_1_1_device.html#af321be8fe9aecd0942d04739f7520c61" title="Maximum number of registers per SM. ">max_sm_registers</a>    = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063a90062d88d6a9abcfdfd4c29111a5ac3e" title="Maximum number of thread per thread block. ">ArchProps::MAX_SM_REGISTERS</a>;</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;        <a class="code" href="classcub_1_1_device.html#a5ee84e74af9939896bb81b48d4843d17" title="Maximum number of warps per SM. ">max_sm_warps</a>        = <a class="code" href="classcub_1_1_device.html#a963c497e442ac283b2655faa578614d3" title="Maximum number of threads per SM. ">max_sm_threads</a> / <a class="code" href="classcub_1_1_device.html#a4498c242e597f67a4a752426ae262049" title="Number of threads per warp. ">warp_threads</a>;</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    }</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00224"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a4c1aecec381d2dce80120362feb2d0ca">  224</a></span>&#160;    cudaError_t <a class="code" href="classcub_1_1_device.html#a4c1aecec381d2dce80120362feb2d0ca">Init</a>(<span class="keywordtype">int</span> device_ordinal)</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    {</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;<span class="preprocessor">    #ifndef CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;        <span class="comment">// CUDA API calls not supported from this device</span></div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorInvalidConfiguration);</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;<span class="preprocessor">    #else</span></div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;        cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;        {</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;            <span class="comment">// Fill in SM version</span></div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;            <span class="keywordtype">int</span> major, minor;</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceGetAttribute(&amp;major, cudaDevAttrComputeCapabilityMajor, device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceGetAttribute(&amp;minor, cudaDevAttrComputeCapabilityMinor, device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;            <a class="code" href="classcub_1_1_device.html#ac9b36b3b0edb207aeee60110fbee6406" title="SM version of target device (SM version X.YZ in XYZ integer form) ">sm_version</a> = major * 100 + minor * 10;</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;            <span class="comment">// Fill in static SM properties</span></div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;            <span class="comment">// Initialize our device properties via callback from static device properties</span></div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;            <a class="code" href="structcub_1_1_arch_props.html" title="Structure for statically reporting CUDA device properties, parameterized by SM architecture. ">ArchProps&lt;100&gt;::Callback</a>(*<span class="keyword">this</span>, <a class="code" href="classcub_1_1_device.html#ac9b36b3b0edb207aeee60110fbee6406" title="SM version of target device (SM version X.YZ in XYZ integer form) ">sm_version</a>);</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;            <span class="comment">// Fill in SM count</span></div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaDeviceGetAttribute (&amp;<a class="code" href="classcub_1_1_device.html#a68885a90ea0badcffc2a3511b0b4fd5c" title="Number of SMs. ">sm_count</a>, cudaDevAttrMultiProcessorCount, device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;            <span class="comment">// Fill in PTX version</span></div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;<span class="preprocessor">        #if CUB_PTX_ARCH &gt; 0</span></div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;<span class="preprocessor"></span>            <a class="code" href="classcub_1_1_device.html#a416909debdeaa9116d7087ed55ed870f" title="Bundled PTX version for target device (PTX version X.YZ in XYZ integer form) ">ptx_version</a> = <a class="code" href="group___util_module.html#ga76769ce380739b38e0bd00f57e0dbe4f" title="CUB_PTX_ARCH reflects the PTX version targeted by the active compiler pass (or zero during the host p...">CUB_PTX_ARCH</a>;</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;<span class="preprocessor">        #else</span></div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;<span class="preprocessor"></span>            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(<a class="code" href="classcub_1_1_device.html#a416909debdeaa9116d7087ed55ed870f" title="Bundled PTX version for target device (PTX version X.YZ in XYZ integer form) ">ptx_version</a>))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;<span class="preprocessor">        #endif</span></div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;        }</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;<span class="preprocessor">    #endif</span></div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00269"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#af5217a10a5c9d26ce226e257665a45ce">  269</a></span>&#160;    cudaError_t <a class="code" href="classcub_1_1_device.html#af5217a10a5c9d26ce226e257665a45ce">Init</a>()</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;    {</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;<span class="preprocessor">    #ifndef CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;        <span class="comment">// CUDA API calls not supported from this device</span></div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorInvalidConfiguration);</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;<span class="preprocessor">    #else</span></div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;        cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;        {</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;            <span class="keywordtype">int</span> device_ordinal;</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;            <span class="keywordflow">if</span> ((error = <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaGetDevice(&amp;device_ordinal)))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;            <span class="keywordflow">if</span> ((error = <a class="code" href="classcub_1_1_device.html#af5217a10a5c9d26ce226e257665a45ce">Init</a>(device_ordinal))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;        }</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;        <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;<span class="preprocessor">    #endif</span></div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> KernelPtr&gt;</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;    __host__ __device__ __forceinline__</div>
+<div class="line"><a name="l00297"></a><span class="lineno"><a class="code" href="classcub_1_1_device.html#a618bbf36a5737a9b1533ff65834e88e8">  297</a></span>&#160;    cudaError_t <a class="code" href="classcub_1_1_device.html#a618bbf36a5737a9b1533ff65834e88e8">MaxSmOccupancy</a>(</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;        <span class="keywordtype">int</span>                 &amp;max_sm_occupancy,          </div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;        KernelPtr           kernel_ptr,                 </div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;        <span class="keywordtype">int</span>                 block_threads)              </div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;    {</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;<span class="preprocessor">    #ifndef CUB_RUNTIME_ENABLED</span></div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;        <span class="comment">// CUDA API calls not supported from this device</span></div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaErrorInvalidConfiguration);</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;<span class="preprocessor">    #else</span></div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;        cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        <span class="keywordflow">do</span></div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;        {</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;            <span class="comment">// Get kernel attributes</span></div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;            cudaFuncAttributes kernel_attrs;</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;            <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = cudaFuncGetAttributes(&amp;kernel_attrs, kernel_ptr))) <span class="keywordflow">break</span>;</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;            <span class="comment">// Number of warps per threadblock</span></div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;            <span class="keywordtype">int</span> block_warps = (block_threads +  <a class="code" href="classcub_1_1_device.html#a4498c242e597f67a4a752426ae262049" title="Number of threads per warp. ">warp_threads</a> - 1) / <a class="code" href="classcub_1_1_device.html#a4498c242e597f67a4a752426ae262049" title="Number of threads per warp. ">warp_threads</a>;</div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;</div>
+<div class="line"><a name="l00319"></a><span class="lineno">  319</span>&#160;            <span class="comment">// Max warp occupancy</span></div>
+<div class="line"><a name="l00320"></a><span class="lineno">  320</span>&#160;            <span class="keywordtype">int</span> max_warp_occupancy = (block_warps &gt; 0) ?</div>
+<div class="line"><a name="l00321"></a><span class="lineno">  321</span>&#160;                <a class="code" href="classcub_1_1_device.html#a5ee84e74af9939896bb81b48d4843d17" title="Maximum number of warps per SM. ">max_sm_warps</a> / block_warps :</div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;                <a class="code" href="classcub_1_1_device.html#ac614bed852b56bf8c616803aa8601caf" title="Maximum number of threadblocks per SM. ">max_sm_blocks</a>;</div>
+<div class="line"><a name="l00323"></a><span class="lineno">  323</span>&#160;</div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;            <span class="comment">// Maximum register occupancy</span></div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;            <span class="keywordtype">int</span> max_reg_occupancy;</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;            <span class="keywordflow">if</span> ((block_threads == 0) || (kernel_attrs.numRegs == 0))</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;            {</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;                <span class="comment">// Prevent divide-by-zero</span></div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;                max_reg_occupancy = <a class="code" href="classcub_1_1_device.html#ac614bed852b56bf8c616803aa8601caf" title="Maximum number of threadblocks per SM. ">max_sm_blocks</a>;</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;            }</div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;            <span class="keywordflow">else</span> <span class="keywordflow">if</span> (<a class="code" href="classcub_1_1_device.html#a721a479d183aaa1846c69de998f84ffc" title="Whether registers are allocated by threadblock (or by warp) ">regs_by_block</a>)</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;            {</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;                <span class="comment">// Allocates registers by threadblock</span></div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;                <span class="keywordtype">int</span> block_regs = CUB_ROUND_UP_NEAREST(kernel_attrs.numRegs * <a class="code" href="classcub_1_1_device.html#a4498c242e597f67a4a752426ae262049" title="Number of threads per warp. ">warp_threads</a> * block_warps, <a class="code" href="classcub_1_1_device.html#aa432ab8fdb1d1117b29811422c83a187" title="Granularity of register allocation within the SM. ">reg_alloc_unit</a>);</div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;                max_reg_occupancy = <a class="code" href="classcub_1_1_device.html#af321be8fe9aecd0942d04739f7520c61" title="Maximum number of registers per SM. ">max_sm_registers</a> / block_regs;</div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;            }</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;            <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;            {</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;                <span class="comment">// Allocates registers by warp</span></div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;                <span class="keywordtype">int</span> sm_sides                = <a class="code" href="classcub_1_1_device.html#ac5f8afb6f319b0dbd689f3f1188fc20b" title="Granularity of warp allocation within the SM. ">warp_alloc_unit</a>;</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;                <span class="keywordtype">int</span> sm_registers_per_side   = <a class="code" href="classcub_1_1_device.html#af321be8fe9aecd0942d04739f7520c61" title="Maximum number of registers per SM. ">max_sm_registers</a> / sm_sides;</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;                <span class="keywordtype">int</span> regs_per_warp           = CUB_ROUND_UP_NEAREST(kernel_attrs.numRegs * <a class="code" href="classcub_1_1_device.html#a4498c242e597f67a4a752426ae262049" title="Number of threads per warp. ">warp_threads</a>, <a class="code" href="classcub_1_1_device.html#aa432ab8fdb1d1117b29811422c83a187" title="Granularity of register allocation within the SM. ">reg_alloc_unit</a>);</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;                <span class="keywordtype">int</span> warps_per_side          = sm_registers_per_side / regs_per_warp;</div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;                <span class="keywordtype">int</span> warps                   = warps_per_side * sm_sides;</div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;                max_reg_occupancy           = warps / block_warps;</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;            }</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;            <span class="comment">// Shared memory per threadblock</span></div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;            <span class="keywordtype">int</span> block_allocated_smem = CUB_ROUND_UP_NEAREST(</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;                kernel_attrs.sharedSizeBytes,</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;                <a class="code" href="classcub_1_1_device.html#aca17efd166d916008f0fc378adc00b1f" title="Smem segment size. ">smem_alloc_unit</a>);</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;            <span class="comment">// Max shared memory occupancy</span></div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;            <span class="keywordtype">int</span> max_smem_occupancy = (block_allocated_smem &gt; 0) ?</div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;                (<a class="code" href="classcub_1_1_device.html#a838c9a2e207c38ef24e79a40bccdd1ac" title="Smem bytes per SM. ">smem_bytes</a> / block_allocated_smem) :</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;                <a class="code" href="classcub_1_1_device.html#ac614bed852b56bf8c616803aa8601caf" title="Maximum number of threadblocks per SM. ">max_sm_blocks</a>;</div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;            <span class="comment">// Max occupancy</span></div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;            max_sm_occupancy = CUB_MIN(</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;                CUB_MIN(<a class="code" href="classcub_1_1_device.html#ac614bed852b56bf8c616803aa8601caf" title="Maximum number of threadblocks per SM. ">max_sm_blocks</a>, max_warp_occupancy),</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;                CUB_MIN(max_smem_occupancy, max_reg_occupancy));</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;<span class="comment">//            printf(&quot;max_smem_occupancy(%d), max_warp_occupancy(%d), max_reg_occupancy(%d)&quot;, max_smem_occupancy, max_warp_occupancy, max_reg_occupancy);</span></div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;        } <span class="keywordflow">while</span> (0);</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;        <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;</div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;<span class="preprocessor">    #endif</span></div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;};</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;       <span class="comment">// end group UtilModule</span></div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/util__iterator_8cuh_source.html b/docs/html/util__iterator_8cuh_source.html
new file mode 100644
index 0000000000..c36540c380
--- /dev/null
+++ b/docs/html/util__iterator_8cuh_source.html
@@ -0,0 +1,737 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: util_iterator.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">util_iterator.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="util__iterator_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="thread__load_8cuh.html">thread/thread_load.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__device_8cuh.html">util_device.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;<a class="code" href="util__debug_8cuh.html">util_debug.cuh</a>&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;<span class="comment"> * Texture references</span></div>
+<div class="line"><a name="l00050"></a><span class="lineno">   50</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00051"></a><span class="lineno">   51</span>&#160;</div>
+<div class="line"><a name="l00052"></a><span class="lineno">   52</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00053"></a><span class="lineno">   53</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00054"></a><span class="lineno">   54</span>&#160;<span class="comment">// Anonymous namespace</span></div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="keyword">namespace </span>{</div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;</div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00059"></a><span class="lineno">   59</span>&#160;<span class="keyword">struct </span>TexIteratorRef</div>
+<div class="line"><a name="l00060"></a><span class="lineno">   60</span>&#160;{</div>
+<div class="line"><a name="l00061"></a><span class="lineno">   61</span>&#160;    <span class="comment">// Texture reference type</span></div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;    <span class="keyword">typedef</span> texture&lt;T, cudaTextureType1D, cudaReadModeElementType&gt; TexRef;</div>
+<div class="line"><a name="l00063"></a><span class="lineno">   63</span>&#160;</div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;    <span class="keyword">static</span> TexRef ref;</div>
+<div class="line"><a name="l00065"></a><span class="lineno">   65</span>&#160;</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;    <span class="keyword">static</span> cudaError_t BindTexture(<span class="keywordtype">void</span> *d_in)</div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;    {</div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;        cudaChannelFormatDesc tex_desc = cudaCreateChannelDesc&lt;T&gt;();</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;        <span class="keywordflow">if</span> (d_in)</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;            <span class="keywordflow">return</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaBindTexture(NULL, ref, d_in, tex_desc)));</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;</div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;        <span class="keywordflow">return</span> cudaSuccess;</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;    }</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;</div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;    <span class="keyword">static</span> cudaError_t UnbindTexture()</div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;    {</div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(cudaUnbindTexture(ref));</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;    }</div>
+<div class="line"><a name="l00085"></a><span class="lineno">   85</span>&#160;};</div>
+<div class="line"><a name="l00086"></a><span class="lineno">   86</span>&#160;</div>
+<div class="line"><a name="l00087"></a><span class="lineno">   87</span>&#160;<span class="comment">// Texture reference definitions</span></div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Value&gt;</div>
+<div class="line"><a name="l00089"></a><span class="lineno">   89</span>&#160;<span class="keyword">typename</span> TexIteratorRef&lt;Value&gt;::TexRef TexIteratorRef&lt;Value&gt;::ref = 0;</div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;} <span class="comment">// Anonymous namespace</span></div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;</div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;</div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="comment"> * Iterators</span></div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;<span class="comment"> *****************************************************************************/</span></div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;</div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputType&gt;</div>
+<div class="line"><a name="l00122"></a><span class="lineno"><a class="code" href="classcub_1_1_constant_iterator_r_a.html">  122</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_constant_iterator_r_a.html" title="A simple random-access iterator pointing to a range of constant values. ">ConstantIteratorRA</a></div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;{</div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00127"></a><span class="lineno">  127</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00128"></a><span class="lineno">  128</span>&#160;    <span class="keyword">typedef</span> <a class="code" href="classcub_1_1_constant_iterator_r_a.html" title="A simple random-access iterator pointing to a range of constant values. ">ConstantIteratorRA</a>                  self_type;</div>
+<div class="line"><a name="l00129"></a><span class="lineno">  129</span>&#160;    <span class="keyword">typedef</span> OutputType                          value_type;</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;    <span class="keyword">typedef</span> OutputType                          reference;</div>
+<div class="line"><a name="l00131"></a><span class="lineno">  131</span>&#160;    <span class="keyword">typedef</span> OutputType*                         pointer;</div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;    <span class="keyword">typedef</span> std::random_access_iterator_tag     iterator_category;</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;    <span class="keyword">typedef</span> <span class="keywordtype">int</span>                                 difference_type;</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;<span class="preprocessor">#endif  // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    OutputType    val;</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;</div>
+<div class="line"><a name="l00144"></a><span class="lineno"><a class="code" href="classcub_1_1_constant_iterator_r_a.html#aa2e8da63f412840cadb94578a0f36348">  144</a></span>&#160;    __host__ __device__ __forceinline__ <a class="code" href="classcub_1_1_constant_iterator_r_a.html#aa2e8da63f412840cadb94578a0f36348" title="Constructor. ">ConstantIteratorRA</a>(</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;        <span class="keyword">const</span> OutputType &amp;val)          </div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    :</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;        val(val)</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;    {}</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    __host__ __device__ __forceinline__ self_type operator++()</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    {</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;        self_type i = *<span class="keyword">this</span>;</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;        <span class="keywordflow">return</span> i;</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    }</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div>
+<div class="line"><a name="l00158"></a><span class="lineno">  158</span>&#160;    __host__ __device__ __forceinline__ self_type operator++(<span class="keywordtype">int</span> junk)</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    {</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;        <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;    }</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;    __host__ __device__ __forceinline__ reference operator*()</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    {</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;        <span class="keywordflow">return</span> val;</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;    }</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    __host__ __device__ __forceinline__ self_type operator+(SizeT n)</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;    {</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="classcub_1_1_constant_iterator_r_a.html#aa2e8da63f412840cadb94578a0f36348" title="Constructor. ">ConstantIteratorRA</a>(val);</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    }</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;    __host__ __device__ __forceinline__ self_type operator-(SizeT n)</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;    {</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="classcub_1_1_constant_iterator_r_a.html#aa2e8da63f412840cadb94578a0f36348" title="Constructor. ">ConstantIteratorRA</a>(val);</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    }</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    __host__ __device__ __forceinline__ reference operator[](SizeT n)</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    {</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="classcub_1_1_constant_iterator_r_a.html#aa2e8da63f412840cadb94578a0f36348" title="Constructor. ">ConstantIteratorRA</a>(val);</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;    }</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    __host__ __device__ __forceinline__ pointer operator-&gt;()</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    {</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;        <span class="keywordflow">return</span> &amp;val;</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;    }</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> operator==(<span class="keyword">const</span> self_type&amp; rhs)</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    {</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        <span class="keywordflow">return</span> (val == rhs.val);</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;    }</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> operator!=(<span class="keyword">const</span> self_type&amp; rhs)</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    {</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;        <span class="keywordflow">return</span> (val != rhs.val);</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    }</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;};</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputType, <span class="keyword">typename</span> ConversionOp, <span class="keyword">typename</span> InputType&gt;</div>
+<div class="line"><a name="l00221"></a><span class="lineno"><a class="code" href="classcub_1_1_transform_iterator_r_a.html">  221</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_transform_iterator_r_a.html" title="A simple random-access transform iterator for applying a transformation operator. ...">TransformIteratorRA</a></div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;{</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;    <span class="keyword">typedef</span> <a class="code" href="classcub_1_1_transform_iterator_r_a.html" title="A simple random-access transform iterator for applying a transformation operator. ...">TransformIteratorRA</a>                 self_type;</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;    <span class="keyword">typedef</span> OutputType                          value_type;</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;    <span class="keyword">typedef</span> OutputType                          reference;</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;    <span class="keyword">typedef</span> OutputType*                         pointer;</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    <span class="keyword">typedef</span> std::random_access_iterator_tag     iterator_category;</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    <span class="keyword">typedef</span> <span class="keywordtype">int</span>                                 difference_type;</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;<span class="preprocessor">#endif  // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;    ConversionOp    conversion_op;</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    InputType*      ptr;</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;</div>
+<div class="line"><a name="l00248"></a><span class="lineno"><a class="code" href="classcub_1_1_transform_iterator_r_a.html#abac05c9208f609ac1b2f1b94241cdcec">  248</a></span>&#160;    __host__ __device__ __forceinline__ <a class="code" href="classcub_1_1_transform_iterator_r_a.html#abac05c9208f609ac1b2f1b94241cdcec" title="Constructor. ">TransformIteratorRA</a>(InputType* ptr, ConversionOp conversion_op) :</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;        conversion_op(conversion_op),</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;        ptr(ptr) {}</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;    __host__ __device__ __forceinline__ self_type operator++()</div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;    {</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;        self_type i = *<span class="keyword">this</span>;</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;        ptr++;</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;        <span class="keywordflow">return</span> i;</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;    }</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;    __host__ __device__ __forceinline__ self_type operator++(<span class="keywordtype">int</span> junk)</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    {</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;        ptr++;</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;        <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;    }</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;    __host__ __device__ __forceinline__ reference operator*()</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    {</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;        <span class="keywordflow">return</span> conversion_op(*ptr);</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;    }</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;    __host__ __device__ __forceinline__ self_type operator+(SizeT n)</div>
+<div class="line"><a name="l00274"></a><span class="lineno">  274</span>&#160;    {</div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;        <a class="code" href="classcub_1_1_transform_iterator_r_a.html#abac05c9208f609ac1b2f1b94241cdcec" title="Constructor. ">TransformIteratorRA</a> retval(ptr + n, conversion_op);</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;        <span class="keywordflow">return</span> retval;</div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;    }</div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;    __host__ __device__ __forceinline__ self_type operator-(SizeT n)</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;    {</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;        <a class="code" href="classcub_1_1_transform_iterator_r_a.html#abac05c9208f609ac1b2f1b94241cdcec" title="Constructor. ">TransformIteratorRA</a> retval(ptr - n, conversion_op);</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;        <span class="keywordflow">return</span> retval;</div>
+<div class="line"><a name="l00284"></a><span class="lineno">  284</span>&#160;    }</div>
+<div class="line"><a name="l00285"></a><span class="lineno">  285</span>&#160;</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;    __host__ __device__ __forceinline__ reference operator[](SizeT n)</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;    {</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;        <span class="keywordflow">return</span> conversion_op(ptr[n]);</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;    }</div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;</div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;    __host__ __device__ __forceinline__ pointer operator-&gt;()</div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;    {</div>
+<div class="line"><a name="l00294"></a><span class="lineno">  294</span>&#160;        <span class="keywordflow">return</span> &amp;conversion_op(*ptr);</div>
+<div class="line"><a name="l00295"></a><span class="lineno">  295</span>&#160;    }</div>
+<div class="line"><a name="l00296"></a><span class="lineno">  296</span>&#160;</div>
+<div class="line"><a name="l00297"></a><span class="lineno">  297</span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> operator==(<span class="keyword">const</span> self_type&amp; rhs)</div>
+<div class="line"><a name="l00298"></a><span class="lineno">  298</span>&#160;    {</div>
+<div class="line"><a name="l00299"></a><span class="lineno">  299</span>&#160;        <span class="keywordflow">return</span> (ptr == rhs.ptr);</div>
+<div class="line"><a name="l00300"></a><span class="lineno">  300</span>&#160;    }</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;</div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> operator!=(<span class="keyword">const</span> self_type&amp; rhs)</div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;    {</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;        <span class="keywordflow">return</span> (ptr != rhs.ptr);</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;    }</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;};</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00330"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_iterator_r_a.html">  330</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_tex_iterator_r_a.html" title="A simple random-access iterator for loading primitive values through texture cache. ">TexIteratorRA</a></div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;{</div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00335"></a><span class="lineno">  335</span>&#160;    <span class="keyword">typedef</span> <a class="code" href="classcub_1_1_tex_iterator_r_a.html" title="A simple random-access iterator for loading primitive values through texture cache. ">TexIteratorRA</a>                       self_type;</div>
+<div class="line"><a name="l00336"></a><span class="lineno">  336</span>&#160;    <span class="keyword">typedef</span> T                                   value_type;</div>
+<div class="line"><a name="l00337"></a><span class="lineno">  337</span>&#160;    <span class="keyword">typedef</span> T                                   reference;</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;    <span class="keyword">typedef</span> T*                                  pointer;</div>
+<div class="line"><a name="l00339"></a><span class="lineno">  339</span>&#160;    <span class="keyword">typedef</span> std::random_access_iterator_tag     iterator_category;</div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;    <span class="keyword">typedef</span> <span class="keywordtype">int</span>                                 difference_type;</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00345"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_iterator_r_a.html#a5e210ab4fc1c16ef4fadffb56eba1319">  345</a></span>&#160;    <span class="keyword">typedef</span> <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_tex_iterator_r_a.html#a5e210ab4fc1c16ef4fadffb56eba1319" title="Tag identifying iterator type as being texture-bindable. ">TexBindingTag</a>;</div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    T*                  ptr;</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;    <span class="keywordtype">size_t</span>              tex_align_offset;</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;    cudaTextureObject_t tex_obj;</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;</div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div>
+<div class="line"><a name="l00358"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_iterator_r_a.html#a1b8f21c2753cee33dd90944e4027fa36">  358</a></span>&#160;    __host__ __device__ __forceinline__ <a class="code" href="classcub_1_1_tex_iterator_r_a.html#a1b8f21c2753cee33dd90944e4027fa36" title="Constructor. ">TexIteratorRA</a>()</div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;    :</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;        ptr(NULL),</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;        tex_align_offset(0),</div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;        tex_obj(0)</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;    {}</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;</div>
+<div class="line"><a name="l00366"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_iterator_r_a.html#aae5f3547c60cf33d51c65685ea9d131a">  366</a></span>&#160;    cudaError_t <a class="code" href="classcub_1_1_tex_iterator_r_a.html#aae5f3547c60cf33d51c65685ea9d131a" title="Bind iterator to texture reference. ">BindTexture</a>(</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;        T               *ptr,                   </div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;        <span class="keywordtype">size_t</span>          bytes,                  </div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;        <span class="keywordtype">size_t</span>          tex_align_offset = 0)   </div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;    {</div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;        this-&gt;ptr = ptr;</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;        this-&gt;tex_align_offset = tex_align_offset;</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;        <span class="keywordtype">int</span> ptx_version;</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;        cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;        <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(ptx_version))) <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;        <span class="keywordflow">if</span> (ptx_version &gt;= 300)</div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;        {</div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;            <span class="comment">// Use texture object</span></div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;            cudaChannelFormatDesc   channel_desc = cudaCreateChannelDesc&lt;T&gt;();</div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;            cudaResourceDesc        res_desc;</div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;            cudaTextureDesc         tex_desc;</div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;            memset(&amp;res_desc, 0, <span class="keyword">sizeof</span>(cudaResourceDesc));</div>
+<div class="line"><a name="l00384"></a><span class="lineno">  384</span>&#160;            memset(&amp;tex_desc, 0, <span class="keyword">sizeof</span>(cudaTextureDesc));</div>
+<div class="line"><a name="l00385"></a><span class="lineno">  385</span>&#160;            res_desc.resType                = cudaResourceTypeLinear;</div>
+<div class="line"><a name="l00386"></a><span class="lineno">  386</span>&#160;            res_desc.res.linear.devPtr      = ptr;</div>
+<div class="line"><a name="l00387"></a><span class="lineno">  387</span>&#160;            res_desc.res.linear.desc        = channel_desc;</div>
+<div class="line"><a name="l00388"></a><span class="lineno">  388</span>&#160;            res_desc.res.linear.sizeInBytes = bytes;</div>
+<div class="line"><a name="l00389"></a><span class="lineno">  389</span>&#160;            tex_desc.readMode               = cudaReadModeElementType;</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;            <span class="keywordflow">return</span> cudaCreateTextureObject(&amp;tex_obj, &amp;res_desc, &amp;tex_desc, NULL);</div>
+<div class="line"><a name="l00391"></a><span class="lineno">  391</span>&#160;        }</div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00393"></a><span class="lineno">  393</span>&#160;        {</div>
+<div class="line"><a name="l00394"></a><span class="lineno">  394</span>&#160;            <span class="comment">// Use texture reference</span></div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;            <span class="keywordflow">return</span> TexIteratorRef&lt;T&gt;::BindTexture(ptr);</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;        }</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;    }</div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;</div>
+<div class="line"><a name="l00400"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_iterator_r_a.html#abfc8c42e2da2beffb05ac81ec89ed8b9">  400</a></span>&#160;    cudaError_t <a class="code" href="classcub_1_1_tex_iterator_r_a.html#abfc8c42e2da2beffb05ac81ec89ed8b9" title="Unbind iterator to texture reference. ">UnbindTexture</a>()</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;    {</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;        <span class="keywordtype">int</span> ptx_version;</div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;        cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;        <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(ptx_version))) <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;        <span class="keywordflow">if</span> (ptx_version &lt; 300)</div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;        {</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;            <span class="comment">// Use texture reference</span></div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;            <span class="keywordflow">return</span> TexIteratorRef&lt;T&gt;::UnbindTexture();</div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;        }</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;        {</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;            <span class="comment">// Use texture object</span></div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;            <span class="keywordflow">return</span> cudaDestroyTextureObject(tex_obj);</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;        }</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;    }</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;</div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;    __host__ __device__ __forceinline__ self_type operator++()</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;    {</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;        self_type i = *<span class="keyword">this</span>;</div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;        ptr++;</div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;        tex_align_offset++;</div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;        <span class="keywordflow">return</span> i;</div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;    }</div>
+<div class="line"><a name="l00426"></a><span class="lineno">  426</span>&#160;</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;    __host__ __device__ __forceinline__ self_type operator++(<span class="keywordtype">int</span> junk)</div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;    {</div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;        ptr++;</div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;        tex_align_offset++;</div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;        <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;    }</div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;</div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;    __host__ __device__ __forceinline__ reference operator*()</div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;    {</div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH == 0)</span></div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Simply dereference the pointer on the host</span></div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;        <span class="keywordflow">return</span> *ptr;</div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;<span class="preprocessor">#elif (CUB_PTX_ARCH &lt; 300)</span></div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture reference</span></div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;        <span class="keywordflow">return</span> tex1Dfetch(TexIteratorRef&lt;T&gt;::ref, tex_align_offset);</div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture object</span></div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;        <span class="keywordflow">return</span> conversion_op(tex1Dfetch&lt;InputType&gt;(tex_obj, tex_align_offset));</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;</div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;    __host__ __device__ __forceinline__ self_type operator+(SizeT n)</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;    {</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;        <a class="code" href="classcub_1_1_tex_iterator_r_a.html#a1b8f21c2753cee33dd90944e4027fa36" title="Constructor. ">TexIteratorRA</a> retval;</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;        retval.ptr = ptr + n;</div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;        retval.tex_align_offset = tex_align_offset + n;</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;        <span class="keywordflow">return</span> retval;</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;    }</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;    __host__ __device__ __forceinline__ self_type operator-(SizeT n)</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;    {</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;        <a class="code" href="classcub_1_1_tex_iterator_r_a.html#a1b8f21c2753cee33dd90944e4027fa36" title="Constructor. ">TexIteratorRA</a> retval;</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;        retval.ptr = ptr - n;</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;        retval.tex_align_offset = tex_align_offset - n;</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;        <span class="keywordflow">return</span> retval;</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;    }</div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;    __host__ __device__ __forceinline__ reference operator[](SizeT n)</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;    {</div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH == 0)</span></div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Simply dereference the pointer on the host</span></div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;        <span class="keywordflow">return</span> ptr[n];</div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;<span class="preprocessor">#elif (CUB_PTX_ARCH &lt; 300)</span></div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture reference</span></div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;        <span class="keywordflow">return</span> tex1Dfetch(TexIteratorRef&lt;T&gt;::ref, tex_align_offset + n);</div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture object</span></div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;        <span class="keywordflow">return</span> conversion_op(tex1Dfetch&lt;InputType&gt;(tex_obj, tex_align_offset + n));</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;    __host__ __device__ __forceinline__ pointer operator-&gt;()</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;    {</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH == 0)</span></div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Simply dereference the pointer on the host</span></div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;        <span class="keywordflow">return</span> &amp;(*ptr);</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;<span class="preprocessor">#elif (CUB_PTX_ARCH &lt; 300)</span></div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture reference</span></div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;        <span class="keywordflow">return</span> &amp;(tex1Dfetch(TexIteratorRef&lt;T&gt;::ref, tex_align_offset));</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture object</span></div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;        <span class="keywordflow">return</span> conversion_op(tex1Dfetch&lt;InputType&gt;(tex_obj, tex_align_offset));</div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;</div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> operator==(<span class="keyword">const</span> self_type&amp; rhs)</div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;    {</div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;        <span class="keywordflow">return</span> (ptr == rhs.ptr);</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;    }</div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;</div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> operator!=(<span class="keyword">const</span> self_type&amp; rhs)</div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;    {</div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;        <span class="keywordflow">return</span> (ptr != rhs.ptr);</div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;    }</div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;</div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;};</div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;</div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;</div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> OutputType, <span class="keyword">typename</span> ConversionOp, <span class="keyword">typename</span> InputType&gt;</div>
+<div class="line"><a name="l00529"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html">  529</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html" title="A simple random-access transform iterator for loading primitive values through texture cache and and ...">TexTransformIteratorRA</a></div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;{</div>
+<div class="line"><a name="l00531"></a><span class="lineno">  531</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00532"></a><span class="lineno">  532</span>&#160;</div>
+<div class="line"><a name="l00533"></a><span class="lineno">  533</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00535"></a><span class="lineno">  535</span>&#160;    <span class="keyword">typedef</span> <a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html" title="A simple random-access transform iterator for loading primitive values through texture cache and and ...">TexTransformIteratorRA</a>              self_type;</div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;    <span class="keyword">typedef</span> OutputType                          value_type;</div>
+<div class="line"><a name="l00537"></a><span class="lineno">  537</span>&#160;    <span class="keyword">typedef</span> OutputType                          reference;</div>
+<div class="line"><a name="l00538"></a><span class="lineno">  538</span>&#160;    <span class="keyword">typedef</span> OutputType*                         pointer;</div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;    <span class="keyword">typedef</span> std::random_access_iterator_tag     iterator_category;</div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;    <span class="keyword">typedef</span> <span class="keywordtype">int</span>                                 difference_type;</div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;<span class="preprocessor">#endif  // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00545"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#ad3c3a602ae30d4badc2710dfa9148d27">  545</a></span>&#160;    <span class="keyword">typedef</span> <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#ad3c3a602ae30d4badc2710dfa9148d27" title="Tag identifying iterator type as being texture-bindable. ">TexBindingTag</a>;</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;</div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;</div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;    ConversionOp        conversion_op;</div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;    InputType*          ptr;</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;    <span class="keywordtype">size_t</span>              tex_align_offset;</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;    cudaTextureObject_t tex_obj;</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;</div>
+<div class="line"><a name="l00559"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#a825dd0bd64a07e8f31f646fc220edffa">  559</a></span>&#160;    <a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#a825dd0bd64a07e8f31f646fc220edffa" title="Constructor. ">TexTransformIteratorRA</a>(</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;        ConversionOp    conversion_op)          </div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;    :</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;        conversion_op(conversion_op),</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;        ptr(NULL),</div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;        tex_align_offset(0),</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;        tex_obj(0)</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;    {}</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;</div>
+<div class="line"><a name="l00569"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#ae354a7954b301d8eb127763eb014dd9c">  569</a></span>&#160;    cudaError_t <a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#ae354a7954b301d8eb127763eb014dd9c" title="Bind iterator to texture reference. ">BindTexture</a>(</div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;        InputType*      ptr,                    </div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;        <span class="keywordtype">size_t</span>          bytes,                  </div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;        <span class="keywordtype">size_t</span>          tex_align_offset = 0)   </div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;    {</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;        this-&gt;ptr = ptr;</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;        this-&gt;tex_align_offset = tex_align_offset;</div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;</div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;        <span class="keywordtype">int</span> ptx_version;</div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;        cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00579"></a><span class="lineno">  579</span>&#160;        <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(ptx_version))) <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00580"></a><span class="lineno">  580</span>&#160;        <span class="keywordflow">if</span> (ptx_version &gt;= 300)</div>
+<div class="line"><a name="l00581"></a><span class="lineno">  581</span>&#160;        {</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;            <span class="comment">// Use texture object</span></div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;            cudaChannelFormatDesc   channel_desc = cudaCreateChannelDesc&lt;InputType&gt;();</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;            cudaResourceDesc        res_desc;</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;            cudaTextureDesc         tex_desc;</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;            memset(&amp;res_desc, 0, <span class="keyword">sizeof</span>(cudaResourceDesc));</div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;            memset(&amp;tex_desc, 0, <span class="keyword">sizeof</span>(cudaTextureDesc));</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;            res_desc.resType                = cudaResourceTypeLinear;</div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;            res_desc.res.linear.devPtr      = ptr;</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;            res_desc.res.linear.desc        = channel_desc;</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;            res_desc.res.linear.sizeInBytes = bytes;</div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;            tex_desc.readMode               = cudaReadModeElementType;</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;            <span class="keywordflow">return</span> cudaCreateTextureObject(&amp;tex_obj, &amp;res_desc, &amp;tex_desc, NULL);</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;        }</div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;        {</div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;            <span class="comment">// Use texture reference</span></div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;            <span class="keywordflow">return</span> TexIteratorRef&lt;InputType&gt;::BindTexture(ptr);</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;        }</div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;    }</div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;</div>
+<div class="line"><a name="l00603"></a><span class="lineno"><a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#abd030991795b9c9ca31f4293486d206a">  603</a></span>&#160;    cudaError_t <a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#abd030991795b9c9ca31f4293486d206a" title="Unbind iterator to texture reference. ">UnbindTexture</a>()</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;    {</div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;        <span class="keywordtype">int</span> ptx_version;</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;        cudaError_t error = cudaSuccess;</div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;        <span class="keywordflow">if</span> (<a class="code" href="group___util_module.html#ga84c3a4c178bf6593e0fad2b763606236" title="Debug macro. ">CubDebug</a>(error = <a class="code" href="group___util_module.html#gac3d86a53650d110862fe8a84fce61c2e" title="Retrieves the PTX version (major * 100 + minor * 10) ">PtxVersion</a>(ptx_version))) <span class="keywordflow">return</span> error;</div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;        <span class="keywordflow">if</span> (ptx_version &gt;= 300)</div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;        {</div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;            <span class="comment">// Use texture object</span></div>
+<div class="line"><a name="l00611"></a><span class="lineno">  611</span>&#160;            <span class="keywordflow">return</span> cudaDestroyTextureObject(tex_obj);</div>
+<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;        }</div>
+<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;        {</div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;            <span class="comment">// Use texture reference</span></div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;            <span class="keywordflow">return</span> TexIteratorRef&lt;InputType&gt;::UnbindTexture();</div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;        }</div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;    }</div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;    __host__ __device__ __forceinline__ self_type operator++()</div>
+<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;    {</div>
+<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;        self_type i = *<span class="keyword">this</span>;</div>
+<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;        ptr++;</div>
+<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;        tex_align_offset++;</div>
+<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;        <span class="keywordflow">return</span> i;</div>
+<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;    }</div>
+<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;</div>
+<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;    __host__ __device__ __forceinline__ self_type operator++(<span class="keywordtype">int</span> junk)</div>
+<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;    {</div>
+<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;        ptr++;</div>
+<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;        tex_align_offset++;</div>
+<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;        <span class="keywordflow">return</span> *<span class="keyword">this</span>;</div>
+<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;    }</div>
+<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;</div>
+<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;    __host__ __device__ __forceinline__ reference operator*()</div>
+<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;    {</div>
+<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH == 0)</span></div>
+<div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Simply dereference the pointer on the host</span></div>
+<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;        <span class="keywordflow">return</span> conversion_op(*ptr);</div>
+<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;<span class="preprocessor">#elif (CUB_PTX_ARCH &lt; 300)</span></div>
+<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture reference</span></div>
+<div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;        <span class="keywordflow">return</span> conversion_op(tex1Dfetch(TexIteratorRef&lt;InputType&gt;::ref, tex_align_offset));</div>
+<div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00646"></a><span class="lineno">  646</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture object</span></div>
+<div class="line"><a name="l00647"></a><span class="lineno">  647</span>&#160;        <span class="keywordflow">return</span> conversion_op(tex1Dfetch&lt;InputType&gt;(tex_obj, tex_align_offset));</div>
+<div class="line"><a name="l00648"></a><span class="lineno">  648</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00649"></a><span class="lineno">  649</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;</div>
+<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;    __host__ __device__ __forceinline__ self_type operator+(SizeT n)</div>
+<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;    {</div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;        <a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#a825dd0bd64a07e8f31f646fc220edffa" title="Constructor. ">TexTransformIteratorRA</a> retval(conversion_op);</div>
+<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;        retval.ptr = ptr + n;</div>
+<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;        retval.tex_align_offset = tex_align_offset + n;</div>
+<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;        <span class="keywordflow">return</span> retval;</div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;    }</div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;    __host__ __device__ __forceinline__ self_type operator-(SizeT n)</div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;    {</div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;        <a class="code" href="classcub_1_1_tex_transform_iterator_r_a.html#a825dd0bd64a07e8f31f646fc220edffa" title="Constructor. ">TexTransformIteratorRA</a> retval(conversion_op);</div>
+<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;        retval.ptr = ptr - n;</div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;        retval.tex_align_offset = tex_align_offset - n;</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;        <span class="keywordflow">return</span> retval;</div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;    }</div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;</div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> SizeT&gt;</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;    __host__ __device__ __forceinline__ reference operator[](SizeT n)</div>
+<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;    {</div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH == 0)</span></div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Simply dereference the pointer on the host</span></div>
+<div class="line"><a name="l00674"></a><span class="lineno">  674</span>&#160;        <span class="keywordflow">return</span> conversion_op(ptr[n]);</div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;<span class="preprocessor">#elif (CUB_PTX_ARCH &lt; 300)</span></div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture reference</span></div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;        <span class="keywordflow">return</span> conversion_op(tex1Dfetch(TexIteratorRef&lt;InputType&gt;::ref, tex_align_offset + n));</div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture object</span></div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;        <span class="keywordflow">return</span> conversion_op(tex1Dfetch&lt;InputType&gt;(tex_obj, tex_align_offset + n));</div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;</div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;    __host__ __device__ __forceinline__ pointer operator-&gt;()</div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;    {</div>
+<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;<span class="preprocessor">#if (CUB_PTX_ARCH == 0)</span></div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Simply dereference the pointer on the host</span></div>
+<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;        <span class="keywordflow">return</span> &amp;conversion_op(*ptr);</div>
+<div class="line"><a name="l00689"></a><span class="lineno">  689</span>&#160;<span class="preprocessor">#elif (CUB_PTX_ARCH &lt; 300)</span></div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture reference</span></div>
+<div class="line"><a name="l00691"></a><span class="lineno">  691</span>&#160;        <span class="keywordflow">return</span> &amp;conversion_op(tex1Dfetch(TexIteratorRef&lt;InputType&gt;::ref, tex_align_offset));</div>
+<div class="line"><a name="l00692"></a><span class="lineno">  692</span>&#160;<span class="preprocessor">#else</span></div>
+<div class="line"><a name="l00693"></a><span class="lineno">  693</span>&#160;<span class="preprocessor"></span>        <span class="comment">// Use the texture object</span></div>
+<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;        <span class="keywordflow">return</span> &amp;conversion_op(tex1Dfetch&lt;InputType&gt;(tex_obj, tex_align_offset));</div>
+<div class="line"><a name="l00695"></a><span class="lineno">  695</span>&#160;<span class="preprocessor">#endif</span></div>
+<div class="line"><a name="l00696"></a><span class="lineno">  696</span>&#160;<span class="preprocessor"></span>    }</div>
+<div class="line"><a name="l00697"></a><span class="lineno">  697</span>&#160;</div>
+<div class="line"><a name="l00698"></a><span class="lineno">  698</span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> operator==(<span class="keyword">const</span> self_type&amp; rhs)</div>
+<div class="line"><a name="l00699"></a><span class="lineno">  699</span>&#160;    {</div>
+<div class="line"><a name="l00700"></a><span class="lineno">  700</span>&#160;        <span class="keywordflow">return</span> (ptr == rhs.ptr);</div>
+<div class="line"><a name="l00701"></a><span class="lineno">  701</span>&#160;    }</div>
+<div class="line"><a name="l00702"></a><span class="lineno">  702</span>&#160;</div>
+<div class="line"><a name="l00703"></a><span class="lineno">  703</span>&#160;    __host__ __device__ __forceinline__ <span class="keywordtype">bool</span> operator!=(<span class="keyword">const</span> self_type&amp; rhs)</div>
+<div class="line"><a name="l00704"></a><span class="lineno">  704</span>&#160;    {</div>
+<div class="line"><a name="l00705"></a><span class="lineno">  705</span>&#160;        <span class="keywordflow">return</span> (ptr != rhs.ptr);</div>
+<div class="line"><a name="l00706"></a><span class="lineno">  706</span>&#160;    }</div>
+<div class="line"><a name="l00707"></a><span class="lineno">  707</span>&#160;</div>
+<div class="line"><a name="l00708"></a><span class="lineno">  708</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00709"></a><span class="lineno">  709</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00710"></a><span class="lineno">  710</span>&#160;};</div>
+<div class="line"><a name="l00711"></a><span class="lineno">  711</span>&#160;</div>
+<div class="line"><a name="l00712"></a><span class="lineno">  712</span>&#160;</div>
+<div class="line"><a name="l00713"></a><span class="lineno">  713</span>&#160;</div>
+<div class="line"><a name="l00714"></a><span class="lineno">  714</span>&#160;       <span class="comment">// end group UtilModule</span></div>
+<div class="line"><a name="l00716"></a><span class="lineno">  716</span>&#160;</div>
+<div class="line"><a name="l00717"></a><span class="lineno">  717</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00718"></a><span class="lineno">  718</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/util__type_8cuh_source.html b/docs/html/util__type_8cuh_source.html
new file mode 100644
index 0000000000..0a661ad33a
--- /dev/null
+++ b/docs/html/util__type_8cuh_source.html
@@ -0,0 +1,687 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: util_type.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">util_type.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="util__type_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &lt;iostream&gt;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &lt;limits&gt;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;</div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;</div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00043"></a><span class="lineno">   43</span>&#160;</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00046"></a><span class="lineno">   46</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;</div>
+<div class="line"><a name="l00055"></a><span class="lineno">   55</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00056"></a><span class="lineno">   56</span>&#160;<span class="comment"> * Type equality</span></div>
+<div class="line"><a name="l00057"></a><span class="lineno">   57</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00058"></a><span class="lineno">   58</span>&#160;</div>
+<div class="line"><a name="l00062"></a><span class="lineno">   62</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> IF, <span class="keyword">typename</span> ThenType, <span class="keyword">typename</span> ElseType&gt;</div>
+<div class="line"><a name="l00063"></a><span class="lineno"><a class="code" href="structcub_1_1_if.html">   63</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_if.html" title="Type selection (IF ? ThenType : ElseType) ">If</a></div>
+<div class="line"><a name="l00064"></a><span class="lineno">   64</span>&#160;{</div>
+<div class="line"><a name="l00066"></a><span class="lineno"><a class="code" href="structcub_1_1_if.html#af689e9527f56372e66413b65581ded8e">   66</a></span>&#160;    <span class="keyword">typedef</span> ThenType <a class="code" href="structcub_1_1_if.html#af689e9527f56372e66413b65581ded8e" title="Conditional type result. ">Type</a>;      <span class="comment">// true</span></div>
+<div class="line"><a name="l00067"></a><span class="lineno">   67</span>&#160;};</div>
+<div class="line"><a name="l00068"></a><span class="lineno">   68</span>&#160;</div>
+<div class="line"><a name="l00069"></a><span class="lineno">   69</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00070"></a><span class="lineno">   70</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00071"></a><span class="lineno">   71</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> ThenType, <span class="keyword">typename</span> ElseType&gt;</div>
+<div class="line"><a name="l00072"></a><span class="lineno">   72</span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_if.html" title="Type selection (IF ? ThenType : ElseType) ">If</a>&lt;false, ThenType, ElseType&gt;</div>
+<div class="line"><a name="l00073"></a><span class="lineno">   73</span>&#160;{</div>
+<div class="line"><a name="l00074"></a><span class="lineno">   74</span>&#160;    <span class="keyword">typedef</span> ElseType <a class="code" href="structcub_1_1_if.html#af689e9527f56372e66413b65581ded8e" title="Conditional type result. ">Type</a>;      <span class="comment">// false</span></div>
+<div class="line"><a name="l00075"></a><span class="lineno">   75</span>&#160;};</div>
+<div class="line"><a name="l00076"></a><span class="lineno">   76</span>&#160;</div>
+<div class="line"><a name="l00077"></a><span class="lineno">   77</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00078"></a><span class="lineno">   78</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00079"></a><span class="lineno">   79</span>&#160;</div>
+<div class="line"><a name="l00080"></a><span class="lineno">   80</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00081"></a><span class="lineno">   81</span>&#160;<span class="comment"> * Conditional types</span></div>
+<div class="line"><a name="l00082"></a><span class="lineno">   82</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00083"></a><span class="lineno">   83</span>&#160;</div>
+<div class="line"><a name="l00084"></a><span class="lineno">   84</span>&#160;</div>
+<div class="line"><a name="l00088"></a><span class="lineno">   88</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A, <span class="keyword">typename</span> B&gt;</div>
+<div class="line"><a name="l00089"></a><span class="lineno"><a class="code" href="structcub_1_1_equals.html">   89</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_equals.html" title="Type equality test. ">Equals</a></div>
+<div class="line"><a name="l00090"></a><span class="lineno">   90</span>&#160;{</div>
+<div class="line"><a name="l00091"></a><span class="lineno">   91</span>&#160;    <span class="keyword">enum</span> {</div>
+<div class="line"><a name="l00092"></a><span class="lineno">   92</span>&#160;        VALUE = 0,</div>
+<div class="line"><a name="l00093"></a><span class="lineno">   93</span>&#160;        NEGATE = 1</div>
+<div class="line"><a name="l00094"></a><span class="lineno">   94</span>&#160;    };</div>
+<div class="line"><a name="l00095"></a><span class="lineno">   95</span>&#160;};</div>
+<div class="line"><a name="l00096"></a><span class="lineno">   96</span>&#160;</div>
+<div class="line"><a name="l00097"></a><span class="lineno">   97</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00098"></a><span class="lineno">   98</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00099"></a><span class="lineno">   99</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> A&gt;</div>
+<div class="line"><a name="l00100"></a><span class="lineno">  100</span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_equals.html" title="Type equality test. ">Equals</a> &lt;A, A&gt;</div>
+<div class="line"><a name="l00101"></a><span class="lineno">  101</span>&#160;{</div>
+<div class="line"><a name="l00102"></a><span class="lineno">  102</span>&#160;    <span class="keyword">enum</span> {</div>
+<div class="line"><a name="l00103"></a><span class="lineno">  103</span>&#160;        VALUE = 1,</div>
+<div class="line"><a name="l00104"></a><span class="lineno">  104</span>&#160;        NEGATE = 0</div>
+<div class="line"><a name="l00105"></a><span class="lineno">  105</span>&#160;    };</div>
+<div class="line"><a name="l00106"></a><span class="lineno">  106</span>&#160;};</div>
+<div class="line"><a name="l00107"></a><span class="lineno">  107</span>&#160;</div>
+<div class="line"><a name="l00108"></a><span class="lineno">  108</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00109"></a><span class="lineno">  109</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00110"></a><span class="lineno">  110</span>&#160;</div>
+<div class="line"><a name="l00111"></a><span class="lineno">  111</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00112"></a><span class="lineno">  112</span>&#160;<span class="comment"> * Marker types</span></div>
+<div class="line"><a name="l00113"></a><span class="lineno">  113</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00114"></a><span class="lineno">  114</span>&#160;</div>
+<div class="line"><a name="l00118"></a><span class="lineno"><a class="code" href="structcub_1_1_null_type.html">  118</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_null_type.html" title="A simple &quot;NULL&quot; marker type. ">NullType</a></div>
+<div class="line"><a name="l00119"></a><span class="lineno">  119</span>&#160;{</div>
+<div class="line"><a name="l00120"></a><span class="lineno">  120</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00121"></a><span class="lineno">  121</span>&#160;<span class="preprocessor"></span>    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00122"></a><span class="lineno">  122</span>&#160;    __host__ __device__ __forceinline__ <a class="code" href="structcub_1_1_null_type.html" title="A simple &quot;NULL&quot; marker type. ">NullType</a>&amp; operator =(<span class="keyword">const</span> T&amp; b) { <span class="keywordflow">return</span> *<span class="keyword">this</span>; }</div>
+<div class="line"><a name="l00123"></a><span class="lineno">  123</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00124"></a><span class="lineno">  124</span>&#160;<span class="preprocessor"></span>};</div>
+<div class="line"><a name="l00125"></a><span class="lineno">  125</span>&#160;</div>
+<div class="line"><a name="l00126"></a><span class="lineno">  126</span>&#160;</div>
+<div class="line"><a name="l00130"></a><span class="lineno">  130</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> A&gt;</div>
+<div class="line"><a name="l00131"></a><span class="lineno"><a class="code" href="structcub_1_1_int2_type.html">  131</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type</a></div>
+<div class="line"><a name="l00132"></a><span class="lineno">  132</span>&#160;{</div>
+<div class="line"><a name="l00133"></a><span class="lineno">  133</span>&#160;   <span class="keyword">enum</span> {VALUE = A};</div>
+<div class="line"><a name="l00134"></a><span class="lineno">  134</span>&#160;};</div>
+<div class="line"><a name="l00135"></a><span class="lineno">  135</span>&#160;</div>
+<div class="line"><a name="l00136"></a><span class="lineno">  136</span>&#160;</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;<span class="comment"> * Size and alignment</span></div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;<span class="keyword">struct </span>WordAlignment</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;{</div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;    <span class="keyword">struct </span>Pad</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;    {</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;        T       val;</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;        <span class="keywordtype">char</span>    byte;</div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    };</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    {</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;        ALIGN_BYTES = <span class="keyword">sizeof</span>(Pad) - <span class="keyword">sizeof</span>(T)</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    };</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> If&lt;(ALIGN_BYTES % 4 == 0),</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;        <span class="keywordtype">int</span>,</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;        <span class="keyword">typename</span> If&lt;(ALIGN_BYTES % 2 == 0),</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;            short,</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;            <span class="keywordtype">char</span>&gt;::Type&gt;::Type                  ShuffleWord;</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> If&lt;(ALIGN_BYTES % 8 == 0),</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;        <span class="keywordtype">long</span> <span class="keywordtype">long</span>,</div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;        ShuffleWord&gt;::Type                      VolatileWord;</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> If&lt;(ALIGN_BYTES % 16 == 0),</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;        longlong2,</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;        <span class="keyword">typename</span> If&lt;(ALIGN_BYTES % 8 == 0),</div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;            <span class="keywordtype">long</span> long,                                 <span class="comment">// needed to get heterogenous PODs to work on all platforms</span></div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;            ShuffleWord&gt;::Type&gt;::Type           DeviceWord;</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    {</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;        DEVICE_MULTIPLE = <span class="keyword">sizeof</span>(DeviceWord) / <span class="keyword">sizeof</span>(T)</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    };</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;</div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;    <span class="keyword">struct </span>UninitializedBytes</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    {</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;        <span class="keywordtype">char</span> buf[<span class="keyword">sizeof</span>(T)];</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;    };</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    <span class="keyword">struct </span>UninitializedShuffleWords</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;    {</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;        ShuffleWord buf[<span class="keyword">sizeof</span>(T) / <span class="keyword">sizeof</span>(ShuffleWord)];</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    };</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    <span class="keyword">struct </span>UninitializedVolatileWords</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;    {</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;        VolatileWord buf[<span class="keyword">sizeof</span>(T) / <span class="keyword">sizeof</span>(VolatileWord)];</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    };</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;    <span class="keyword">struct </span>UninitializedDeviceWords</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;    {</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;        DeviceWord buf[<span class="keyword">sizeof</span>(T) / <span class="keyword">sizeof</span>(DeviceWord)];</div>
+<div class="line"><a name="l00200"></a><span class="lineno">  200</span>&#160;    };</div>
+<div class="line"><a name="l00201"></a><span class="lineno">  201</span>&#160;</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;};</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;</div>
+<div class="line"><a name="l00205"></a><span class="lineno">  205</span>&#160;</div>
+<div class="line"><a name="l00206"></a><span class="lineno">  206</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00207"></a><span class="lineno">  207</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;<span class="comment"> * Wrapper types</span></div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00217"></a><span class="lineno"><a class="code" href="structcub_1_1_uninitialized.html">  217</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a></div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;{</div>
+<div class="line"><a name="l00220"></a><span class="lineno"><a class="code" href="structcub_1_1_uninitialized.html#ab100c102e4368f8c9038f8a2e80d3fc9">  220</a></span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> WordAlignment&lt;T&gt;::DeviceWord <a class="code" href="structcub_1_1_uninitialized.html#ab100c102e4368f8c9038f8a2e80d3fc9" title="Biggest memory-access word that T is a whole multiple of and is not larger than the alignment of T...">DeviceWord</a>;</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    {</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;        WORDS = <span class="keyword">sizeof</span>(T) / <span class="keyword">sizeof</span>(<a class="code" href="structcub_1_1_uninitialized.html#ab100c102e4368f8c9038f8a2e80d3fc9" title="Biggest memory-access word that T is a whole multiple of and is not larger than the alignment of T...">DeviceWord</a>)</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;    };</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;</div>
+<div class="line"><a name="l00228"></a><span class="lineno"><a class="code" href="structcub_1_1_uninitialized.html#a5fa7311d943222333e8c87497ff8e782">  228</a></span>&#160;    <a class="code" href="structcub_1_1_uninitialized.html#ab100c102e4368f8c9038f8a2e80d3fc9" title="Biggest memory-access word that T is a whole multiple of and is not larger than the alignment of T...">DeviceWord</a> <a class="code" href="structcub_1_1_uninitialized.html#a5fa7311d943222333e8c87497ff8e782" title="Backing storage. ">storage</a>[WORDS];</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;</div>
+<div class="line"><a name="l00231"></a><span class="lineno"><a class="code" href="structcub_1_1_uninitialized.html#a790b865325f19ac45cc84d3fed0d3038">  231</a></span>&#160;    __host__ __device__ __forceinline__ T&amp; <a class="code" href="structcub_1_1_uninitialized.html#a790b865325f19ac45cc84d3fed0d3038" title="Alias. ">Alias</a>()</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    {</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;        <span class="keywordflow">return</span> <span class="keyword">reinterpret_cast&lt;</span>T&amp;<span class="keyword">&gt;</span>(*this);</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;    }</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;};</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keywordtype">int</span> COUNT&gt;</div>
+<div class="line"><a name="l00242"></a><span class="lineno"><a class="code" href="structcub_1_1_array_wrapper.html">  242</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_array_wrapper.html" title="A wrapper for passing simple static arrays as kernel parameters. ">ArrayWrapper</a></div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;{</div>
+<div class="line"><a name="l00245"></a><span class="lineno"><a class="code" href="structcub_1_1_array_wrapper.html#ae665a1b28a83513db861072328de9551">  245</a></span>&#160;    T <a class="code" href="structcub_1_1_array_wrapper.html#ae665a1b28a83513db861072328de9551" title="Static array of type T. ">array</a>[COUNT];</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;};</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;</div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00258"></a><span class="lineno"><a class="code" href="structcub_1_1_double_buffer.html">  258</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_double_buffer.html" title="Double-buffer storage wrapper for multi-pass stream transformations that require more than one storag...">DoubleBuffer</a></div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;{</div>
+<div class="line"><a name="l00261"></a><span class="lineno"><a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4">  261</a></span>&#160;    T *<a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[2];</div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;</div>
+<div class="line"><a name="l00264"></a><span class="lineno"><a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4">  264</a></span>&#160;    <span class="keywordtype">int</span> <a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a>;</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;</div>
+<div class="line"><a name="l00267"></a><span class="lineno"><a class="code" href="structcub_1_1_double_buffer.html#a8d51dcd30484a1f186e056eb7ab09979">  267</a></span>&#160;    __host__ __device__ __forceinline__ <a class="code" href="structcub_1_1_double_buffer.html#a8d51dcd30484a1f186e056eb7ab09979" title="Constructor. ">DoubleBuffer</a>()</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;    {</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a> = 0;</div>
+<div class="line"><a name="l00270"></a><span class="lineno">  270</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[0] = NULL;</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[1] = NULL;</div>
+<div class="line"><a name="l00272"></a><span class="lineno">  272</span>&#160;    }</div>
+<div class="line"><a name="l00273"></a><span class="lineno">  273</span>&#160;</div>
+<div class="line"><a name="l00275"></a><span class="lineno"><a class="code" href="structcub_1_1_double_buffer.html#a100c51f0e1aefdff4cdfe6480c89f59e">  275</a></span>&#160;    __host__ __device__ __forceinline__ <a class="code" href="structcub_1_1_double_buffer.html#a100c51f0e1aefdff4cdfe6480c89f59e" title="Constructor. ">DoubleBuffer</a>(</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;        T *d_current,         </div>
+<div class="line"><a name="l00277"></a><span class="lineno">  277</span>&#160;        T *d_alternate)       </div>
+<div class="line"><a name="l00278"></a><span class="lineno">  278</span>&#160;    {</div>
+<div class="line"><a name="l00279"></a><span class="lineno">  279</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a> = 0;</div>
+<div class="line"><a name="l00280"></a><span class="lineno">  280</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[0] = d_current;</div>
+<div class="line"><a name="l00281"></a><span class="lineno">  281</span>&#160;        <a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[1] = d_alternate;</div>
+<div class="line"><a name="l00282"></a><span class="lineno">  282</span>&#160;    }</div>
+<div class="line"><a name="l00283"></a><span class="lineno">  283</span>&#160;</div>
+<div class="line"><a name="l00285"></a><span class="lineno"><a class="code" href="structcub_1_1_double_buffer.html#a861d3dff1a70d5e5926057a44d9b8724">  285</a></span>&#160;    __host__ __device__ __forceinline__ T* <a class="code" href="structcub_1_1_double_buffer.html#a861d3dff1a70d5e5926057a44d9b8724" title="Return pointer to the currently valid buffer. ">Current</a>() { <span class="keywordflow">return</span> <a class="code" href="structcub_1_1_double_buffer.html#a38a2d8a9d5a36e9e4b9132166717a0b4" title="Pair of device buffer pointers. ">d_buffers</a>[<a class="code" href="structcub_1_1_double_buffer.html#a9641172c847169904c4054856d7c26f4" title="Selector into d_buffers (i.e., the active/valid buffer) ">selector</a>]; }</div>
+<div class="line"><a name="l00286"></a><span class="lineno">  286</span>&#160;};</div>
+<div class="line"><a name="l00287"></a><span class="lineno">  287</span>&#160;</div>
+<div class="line"><a name="l00288"></a><span class="lineno">  288</span>&#160;</div>
+<div class="line"><a name="l00289"></a><span class="lineno">  289</span>&#160;</div>
+<div class="line"><a name="l00290"></a><span class="lineno">  290</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00291"></a><span class="lineno">  291</span>&#160;<span class="comment"> * Static math</span></div>
+<div class="line"><a name="l00292"></a><span class="lineno">  292</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00293"></a><span class="lineno">  293</span>&#160;</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> CURRENT_VAL = N, <span class="keywordtype">int</span> COUNT = 0&gt;</div>
+<div class="line"><a name="l00302"></a><span class="lineno"><a class="code" href="structcub_1_1_log2.html">  302</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_log2.html" title="Statically determine log2(N), rounded up. ">Log2</a></div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;{</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;    <span class="keyword">enum</span> { VALUE = <a class="code" href="structcub_1_1_log2.html" title="Statically determine log2(N), rounded up. ">Log2&lt;N, (CURRENT_VAL &gt;</a>&gt; 1), COUNT + 1&gt;::VALUE };         <span class="comment">// Inductive case</span></div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;};</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div>
+<div class="line"><a name="l00308"></a><span class="lineno">  308</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00309"></a><span class="lineno">  309</span>&#160;<span class="preprocessor"></span><span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N, <span class="keywordtype">int</span> COUNT&gt;</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_log2.html" title="Statically determine log2(N), rounded up. ">Log2</a>&lt;N, 0, COUNT&gt;</div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;{</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;    <span class="keyword">enum</span> {VALUE = (1 &lt;&lt; (COUNT - 1) &lt; N) ?                                  <span class="comment">// Base case</span></div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;        COUNT :</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;        COUNT - 1 };</div>
+<div class="line"><a name="l00315"></a><span class="lineno">  315</span>&#160;};</div>
+<div class="line"><a name="l00316"></a><span class="lineno">  316</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00317"></a><span class="lineno">  317</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00318"></a><span class="lineno">  318</span>&#160;</div>
+<div class="line"><a name="l00322"></a><span class="lineno">  322</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">int</span> N&gt;</div>
+<div class="line"><a name="l00323"></a><span class="lineno"><a class="code" href="structcub_1_1_power_of_two.html">  323</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_power_of_two.html" title="Statically determine if N is a power-of-two. ">PowerOfTwo</a></div>
+<div class="line"><a name="l00324"></a><span class="lineno">  324</span>&#160;{</div>
+<div class="line"><a name="l00325"></a><span class="lineno">  325</span>&#160;    <span class="keyword">enum</span> { VALUE = ((N &amp; (N - 1)) == 0) };</div>
+<div class="line"><a name="l00326"></a><span class="lineno">  326</span>&#160;};</div>
+<div class="line"><a name="l00327"></a><span class="lineno">  327</span>&#160;</div>
+<div class="line"><a name="l00328"></a><span class="lineno">  328</span>&#160;</div>
+<div class="line"><a name="l00329"></a><span class="lineno">  329</span>&#160;</div>
+<div class="line"><a name="l00330"></a><span class="lineno">  330</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00331"></a><span class="lineno">  331</span>&#160;<span class="comment"> * Pointer vs. iterator detection</span></div>
+<div class="line"><a name="l00332"></a><span class="lineno">  332</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00333"></a><span class="lineno">  333</span>&#160;</div>
+<div class="line"><a name="l00334"></a><span class="lineno">  334</span>&#160;</div>
+<div class="line"><a name="l00338"></a><span class="lineno">  338</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tp&gt;</div>
+<div class="line"><a name="l00339"></a><span class="lineno"><a class="code" href="structcub_1_1_is_pointer.html">  339</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_is_pointer.html" title="Pointer vs. iterator. ">IsPointer</a></div>
+<div class="line"><a name="l00340"></a><span class="lineno">  340</span>&#160;{</div>
+<div class="line"><a name="l00341"></a><span class="lineno">  341</span>&#160;    <span class="keyword">enum</span> { VALUE = 0 };</div>
+<div class="line"><a name="l00342"></a><span class="lineno">  342</span>&#160;};</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;</div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tp&gt;</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_is_pointer.html" title="Pointer vs. iterator. ">IsPointer</a>&lt;Tp*&gt;</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;{</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;    <span class="keyword">enum</span> { VALUE = 1 };</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;};</div>
+<div class="line"><a name="l00351"></a><span class="lineno">  351</span>&#160;</div>
+<div class="line"><a name="l00352"></a><span class="lineno">  352</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;</div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;<span class="comment"> * Qualifier detection</span></div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tp&gt;</div>
+<div class="line"><a name="l00364"></a><span class="lineno"><a class="code" href="structcub_1_1_is_volatile.html">  364</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_is_volatile.html" title="Volatile modifier test. ">IsVolatile</a></div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;{</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;    <span class="keyword">enum</span> { VALUE = 0 };</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;};</div>
+<div class="line"><a name="l00368"></a><span class="lineno">  368</span>&#160;</div>
+<div class="line"><a name="l00369"></a><span class="lineno">  369</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00370"></a><span class="lineno">  370</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00371"></a><span class="lineno">  371</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tp&gt;</div>
+<div class="line"><a name="l00372"></a><span class="lineno">  372</span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_is_volatile.html" title="Volatile modifier test. ">IsVolatile</a>&lt;Tp volatile&gt;</div>
+<div class="line"><a name="l00373"></a><span class="lineno">  373</span>&#160;{</div>
+<div class="line"><a name="l00374"></a><span class="lineno">  374</span>&#160;    <span class="keyword">enum</span> { VALUE = 1 };</div>
+<div class="line"><a name="l00375"></a><span class="lineno">  375</span>&#160;};</div>
+<div class="line"><a name="l00376"></a><span class="lineno">  376</span>&#160;</div>
+<div class="line"><a name="l00377"></a><span class="lineno">  377</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00378"></a><span class="lineno">  378</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00379"></a><span class="lineno">  379</span>&#160;</div>
+<div class="line"><a name="l00380"></a><span class="lineno">  380</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00381"></a><span class="lineno">  381</span>&#160;<span class="comment"> * Qualifier removal</span></div>
+<div class="line"><a name="l00382"></a><span class="lineno">  382</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00383"></a><span class="lineno">  383</span>&#160;</div>
+<div class="line"><a name="l00390"></a><span class="lineno">  390</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tp, <span class="keyword">typename</span> Up = Tp&gt;</div>
+<div class="line"><a name="l00391"></a><span class="lineno"><a class="code" href="structcub_1_1_remove_qualifiers.html">  391</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_remove_qualifiers.html" title="Removes const and volatile qualifiers from type Tp. ">RemoveQualifiers</a></div>
+<div class="line"><a name="l00392"></a><span class="lineno">  392</span>&#160;{</div>
+<div class="line"><a name="l00394"></a><span class="lineno"><a class="code" href="structcub_1_1_remove_qualifiers.html#a9143e196ef5e6a0176b953f677e94671">  394</a></span>&#160;    <span class="keyword">typedef</span> Up <a class="code" href="structcub_1_1_remove_qualifiers.html#a9143e196ef5e6a0176b953f677e94671" title="Type without const and volatile qualifiers. ">Type</a>;</div>
+<div class="line"><a name="l00395"></a><span class="lineno">  395</span>&#160;};</div>
+<div class="line"><a name="l00396"></a><span class="lineno">  396</span>&#160;</div>
+<div class="line"><a name="l00397"></a><span class="lineno">  397</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00398"></a><span class="lineno">  398</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00399"></a><span class="lineno">  399</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tp, <span class="keyword">typename</span> Up&gt;</div>
+<div class="line"><a name="l00400"></a><span class="lineno">  400</span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_remove_qualifiers.html" title="Removes const and volatile qualifiers from type Tp. ">RemoveQualifiers</a>&lt;Tp, volatile Up&gt;</div>
+<div class="line"><a name="l00401"></a><span class="lineno">  401</span>&#160;{</div>
+<div class="line"><a name="l00402"></a><span class="lineno">  402</span>&#160;    <span class="keyword">typedef</span> Up Type;</div>
+<div class="line"><a name="l00403"></a><span class="lineno">  403</span>&#160;};</div>
+<div class="line"><a name="l00404"></a><span class="lineno">  404</span>&#160;</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tp, <span class="keyword">typename</span> Up&gt;</div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;<span class="keyword">struct </span>RemoveQualifiers&lt;Tp, const Up&gt;</div>
+<div class="line"><a name="l00407"></a><span class="lineno">  407</span>&#160;{</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;    <span class="keyword">typedef</span> Up Type;</div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;};</div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> Tp, <span class="keyword">typename</span> Up&gt;</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;<span class="keyword">struct </span>RemoveQualifiers&lt;Tp, const volatile Up&gt;</div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;{</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;    <span class="keyword">typedef</span> Up Type;</div>
+<div class="line"><a name="l00415"></a><span class="lineno">  415</span>&#160;};</div>
+<div class="line"><a name="l00416"></a><span class="lineno">  416</span>&#160;</div>
+<div class="line"><a name="l00417"></a><span class="lineno">  417</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00418"></a><span class="lineno">  418</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00419"></a><span class="lineno">  419</span>&#160;</div>
+<div class="line"><a name="l00420"></a><span class="lineno">  420</span>&#160;</div>
+<div class="line"><a name="l00421"></a><span class="lineno">  421</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00422"></a><span class="lineno">  422</span>&#160;<span class="comment"> * Typedef-detection</span></div>
+<div class="line"><a name="l00423"></a><span class="lineno">  423</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00424"></a><span class="lineno">  424</span>&#160;</div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;</div>
+<div class="line"><a name="l00429"></a><span class="lineno"><a class="code" href="group___util_module.html#ga84bf1a8ed872e12577935eb28feca420">  429</a></span>&#160;<span class="preprocessor">#define CUB_DEFINE_DETECT_NESTED_TYPE(detector_name, nested_type_name)  \</span></div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;<span class="preprocessor">    template &lt;typename T&gt;                                               \</span></div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;<span class="preprocessor">    struct detector_name                                                \</span></div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;<span class="preprocessor">    {                                                                   \</span></div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;<span class="preprocessor">        template &lt;typename C&gt;                                           \</span></div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;<span class="preprocessor">        static char&amp; test(typename C::nested_type_name*);               \</span></div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;<span class="preprocessor">        template &lt;typename&gt;                                             \</span></div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;<span class="preprocessor">        static int&amp; test(...);                                          \</span></div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;<span class="preprocessor">        enum                                                            \</span></div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;<span class="preprocessor">        {                                                               \</span></div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;<span class="preprocessor">            VALUE = sizeof(test&lt;T&gt;(0)) &lt; sizeof(int)                    \</span></div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;<span class="preprocessor">        };                                                              \</span></div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;<span class="preprocessor">    };</span></div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;</div>
+<div class="line"><a name="l00444"></a><span class="lineno">  444</span>&#160;</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;<span class="comment"> * Simple enable-if (similar to Boost)</span></div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00448"></a><span class="lineno">  448</span>&#160;</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;<span class="keyword">template</span> &lt;<span class="keywordtype">bool</span> Condition, <span class="keyword">class</span> T = <span class="keywordtype">void</span>&gt;</div>
+<div class="line"><a name="l00453"></a><span class="lineno"><a class="code" href="structcub_1_1_enable_if.html">  453</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_enable_if.html" title="Simple enable-if (similar to Boost) ">EnableIf</a></div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;{</div>
+<div class="line"><a name="l00456"></a><span class="lineno"><a class="code" href="structcub_1_1_enable_if.html#aafd9405b5887d2a6d3553eee0202798a">  456</a></span>&#160;    <span class="keyword">typedef</span> T <a class="code" href="structcub_1_1_enable_if.html#aafd9405b5887d2a6d3553eee0202798a" title="Enable-if type for SFINAE dummy variables. ">Type</a>;</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;};</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">class</span> T&gt;</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_enable_if.html" title="Simple enable-if (similar to Boost) ">EnableIf</a>&lt;false, T&gt; {};</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00465"></a><span class="lineno">  465</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;<span class="comment"> * Typedef-detection</span></div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;</div>
+<div class="line"><a name="l00474"></a><span class="lineno">  474</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T, <span class="keyword">typename</span> BinaryOp&gt;</div>
+<div class="line"><a name="l00475"></a><span class="lineno"><a class="code" href="structcub_1_1_binary_op_has_idx_param.html">  475</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_binary_op_has_idx_param.html" title="Determine whether or not BinaryOp&#39;s functor is of the form bool operator()(const T&amp; a...">BinaryOpHasIdxParam</a></div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;{</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT, <span class="keywordtype">bool</span> (BinaryOpT::*)(const T &amp;a, const T &amp;b, <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> <span class="keywordtype">id</span>x) const&gt;  <span class="keyword">struct </span>SFINAE1 {};</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT, <span class="keywordtype">bool</span> (BinaryOpT::*)(const T &amp;a, const T &amp;b, <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> <span class="keywordtype">id</span>x)&gt;        <span class="keyword">struct </span>SFINAE2 {};</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT, <span class="keywordtype">bool</span> (BinaryOpT::*)(T a, T b, <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> <span class="keywordtype">id</span>x) const&gt;                <span class="keyword">struct </span>SFINAE3 {};</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT, <span class="keywordtype">bool</span> (BinaryOpT::*)(T a, T b, <span class="keywordtype">unsigned</span> <span class="keywordtype">int</span> <span class="keywordtype">id</span>x)&gt;                      <span class="keyword">struct </span>SFINAE4 {};</div>
+<div class="line"><a name="l00482"></a><span class="lineno">  482</span>&#160;</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT, <span class="keywordtype">bool</span> (BinaryOpT::*)(const T &amp;a, const T &amp;b, <span class="keywordtype">int</span> <span class="keywordtype">id</span>x) const&gt;           <span class="keyword">struct </span>SFINAE5 {};</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT, <span class="keywordtype">bool</span> (BinaryOpT::*)(const T &amp;a, const T &amp;b, <span class="keywordtype">int</span> <span class="keywordtype">id</span>x)&gt;                 <span class="keyword">struct </span>SFINAE6 {};</div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT, <span class="keywordtype">bool</span> (BinaryOpT::*)(T a, T b, <span class="keywordtype">int</span> <span class="keywordtype">id</span>x) const&gt;                         <span class="keyword">struct </span>SFINAE7 {};</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT, <span class="keywordtype">bool</span> (BinaryOpT::*)(T a, T b, <span class="keywordtype">int</span> <span class="keywordtype">id</span>x)&gt;                               <span class="keyword">struct </span>SFINAE8 {};</div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT&gt; <span class="keyword">static</span> <span class="keywordtype">char</span> Test(SFINAE1&lt;BinaryOpT, &amp;BinaryOpT::operator()&gt; *);</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT&gt; <span class="keyword">static</span> <span class="keywordtype">char</span> Test(SFINAE2&lt;BinaryOpT, &amp;BinaryOpT::operator()&gt; *);</div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT&gt; <span class="keyword">static</span> <span class="keywordtype">char</span> Test(SFINAE3&lt;BinaryOpT, &amp;BinaryOpT::operator()&gt; *);</div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT&gt; <span class="keyword">static</span> <span class="keywordtype">char</span> Test(SFINAE4&lt;BinaryOpT, &amp;BinaryOpT::operator()&gt; *);</div>
+<div class="line"><a name="l00492"></a><span class="lineno">  492</span>&#160;</div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT&gt; <span class="keyword">static</span> <span class="keywordtype">char</span> Test(SFINAE5&lt;BinaryOpT, &amp;BinaryOpT::operator()&gt; *);</div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT&gt; <span class="keyword">static</span> <span class="keywordtype">char</span> Test(SFINAE6&lt;BinaryOpT, &amp;BinaryOpT::operator()&gt; *);</div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT&gt; <span class="keyword">static</span> <span class="keywordtype">char</span> Test(SFINAE7&lt;BinaryOpT, &amp;BinaryOpT::operator()&gt; *);</div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT&gt; <span class="keyword">static</span> <span class="keywordtype">char</span> Test(SFINAE8&lt;BinaryOpT, &amp;BinaryOpT::operator()&gt; *);</div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> BinaryOpT&gt; <span class="keyword">static</span> <span class="keywordtype">int</span> Test(...);</div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;</div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;</div>
+<div class="line"><a name="l00503"></a><span class="lineno"><a class="code" href="structcub_1_1_binary_op_has_idx_param.html#a8eb893aad920fb1153670ff4a5b75f7a">  503</a></span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> <span class="keywordtype">bool</span> HAS_PARAM = <span class="keyword">sizeof</span>(Test&lt;BinaryOp&gt;(NULL)) == <span class="keyword">sizeof</span>(char);</div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;};</div>
+<div class="line"><a name="l00505"></a><span class="lineno">  505</span>&#160;</div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;</div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;</div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;<span class="comment"> * Simple type traits utilities.</span></div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;<span class="comment"> * For example:</span></div>
+<div class="line"><a name="l00512"></a><span class="lineno">  512</span>&#160;<span class="comment"> *     Traits&lt;int&gt;::CATEGORY             // SIGNED_INTEGER</span></div>
+<div class="line"><a name="l00513"></a><span class="lineno">  513</span>&#160;<span class="comment"> *     Traits&lt;NullType&gt;::NULL_TYPE       // true</span></div>
+<div class="line"><a name="l00514"></a><span class="lineno">  514</span>&#160;<span class="comment"> *     Traits&lt;uint4&gt;::CATEGORY           // NOT_A_NUMBER</span></div>
+<div class="line"><a name="l00515"></a><span class="lineno">  515</span>&#160;<span class="comment"> *     Traits&lt;uint4&gt;::PRIMITIVE;         // false</span></div>
+<div class="line"><a name="l00516"></a><span class="lineno">  516</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00517"></a><span class="lineno">  517</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00518"></a><span class="lineno">  518</span>&#160;</div>
+<div class="line"><a name="l00522"></a><span class="lineno"><a class="code" href="group___util_module.html#ga4733b6d40e923244502e6f5b200766ef">  522</a></span>&#160;<span class="keyword">enum</span> <a class="code" href="group___util_module.html#ga4733b6d40e923244502e6f5b200766ef" title="Basic type traits categories. ">Category</a></div>
+<div class="line"><a name="l00523"></a><span class="lineno">  523</span>&#160;{</div>
+<div class="line"><a name="l00524"></a><span class="lineno">  524</span>&#160;    NOT_A_NUMBER,</div>
+<div class="line"><a name="l00525"></a><span class="lineno">  525</span>&#160;    SIGNED_INTEGER,</div>
+<div class="line"><a name="l00526"></a><span class="lineno">  526</span>&#160;    UNSIGNED_INTEGER,</div>
+<div class="line"><a name="l00527"></a><span class="lineno">  527</span>&#160;    FLOATING_POINT</div>
+<div class="line"><a name="l00528"></a><span class="lineno">  528</span>&#160;};</div>
+<div class="line"><a name="l00529"></a><span class="lineno">  529</span>&#160;</div>
+<div class="line"><a name="l00530"></a><span class="lineno">  530</span>&#160;</div>
+<div class="line"><a name="l00534"></a><span class="lineno">  534</span>&#160;<span class="keyword">template</span> &lt;Category _CATEGORY, <span class="keywordtype">bool</span> _PRIMITIVE, <span class="keywordtype">bool</span> _NULL_TYPE, <span class="keyword">typename</span> _Un<span class="keywordtype">signed</span>Bits&gt;</div>
+<div class="line"><a name="l00535"></a><span class="lineno"><a class="code" href="structcub_1_1_base_traits.html">  535</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_base_traits.html" title="Basic type traits. ">BaseTraits</a></div>
+<div class="line"><a name="l00536"></a><span class="lineno">  536</span>&#160;{</div>
+<div class="line"><a name="l00538"></a><span class="lineno"><a class="code" href="structcub_1_1_base_traits.html#a25ff6477c84dc3bd5f4b5e70cd600f09">  538</a></span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> <a class="code" href="group___util_module.html#ga4733b6d40e923244502e6f5b200766ef" title="Basic type traits categories. ">Category</a> CATEGORY      = _CATEGORY;</div>
+<div class="line"><a name="l00539"></a><span class="lineno">  539</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00540"></a><span class="lineno">  540</span>&#160;    {</div>
+<div class="line"><a name="l00541"></a><span class="lineno">  541</span>&#160;        PRIMITIVE       = _PRIMITIVE,</div>
+<div class="line"><a name="l00542"></a><span class="lineno">  542</span>&#160;        NULL_TYPE       = _NULL_TYPE,</div>
+<div class="line"><a name="l00543"></a><span class="lineno">  543</span>&#160;    };</div>
+<div class="line"><a name="l00544"></a><span class="lineno">  544</span>&#160;};</div>
+<div class="line"><a name="l00545"></a><span class="lineno">  545</span>&#160;</div>
+<div class="line"><a name="l00546"></a><span class="lineno">  546</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00547"></a><span class="lineno">  547</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> _Un<span class="keywordtype">signed</span>Bits&gt;</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;<span class="keyword">struct </span>BaseTraits&lt;UNSIGNED_INTEGER, true, false, _UnsignedBits&gt;</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;{</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;    <span class="keyword">typedef</span> _UnsignedBits       UnsignedBits;</div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;</div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> <a class="code" href="group___util_module.html#ga4733b6d40e923244502e6f5b200766ef" title="Basic type traits categories. ">Category</a>       CATEGORY    = UNSIGNED_INTEGER;</div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> UnsignedBits   MIN_KEY     = UnsignedBits(0);</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> UnsignedBits   MAX_KEY     = UnsignedBits(-1);</div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;    {</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;        PRIMITIVE       = <span class="keyword">true</span>,</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;        NULL_TYPE       = <span class="keyword">false</span>,</div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;    };</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ UnsignedBits TwiddleIn(UnsignedBits key)</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;    {</div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;        <span class="keywordflow">return</span> key;</div>
+<div class="line"><a name="l00570"></a><span class="lineno">  570</span>&#160;    }</div>
+<div class="line"><a name="l00571"></a><span class="lineno">  571</span>&#160;</div>
+<div class="line"><a name="l00572"></a><span class="lineno">  572</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ UnsignedBits TwiddleOut(UnsignedBits key)</div>
+<div class="line"><a name="l00573"></a><span class="lineno">  573</span>&#160;    {</div>
+<div class="line"><a name="l00574"></a><span class="lineno">  574</span>&#160;        <span class="keywordflow">return</span> key;</div>
+<div class="line"><a name="l00575"></a><span class="lineno">  575</span>&#160;    }</div>
+<div class="line"><a name="l00576"></a><span class="lineno">  576</span>&#160;};</div>
+<div class="line"><a name="l00577"></a><span class="lineno">  577</span>&#160;</div>
+<div class="line"><a name="l00578"></a><span class="lineno">  578</span>&#160;</div>
+<div class="line"><a name="l00582"></a><span class="lineno">  582</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> _Un<span class="keywordtype">signed</span>Bits&gt;</div>
+<div class="line"><a name="l00583"></a><span class="lineno">  583</span>&#160;<span class="keyword">struct </span>BaseTraits&lt;SIGNED_INTEGER, true, false, _UnsignedBits&gt;</div>
+<div class="line"><a name="l00584"></a><span class="lineno">  584</span>&#160;{</div>
+<div class="line"><a name="l00585"></a><span class="lineno">  585</span>&#160;    <span class="keyword">typedef</span> _UnsignedBits       UnsignedBits;</div>
+<div class="line"><a name="l00586"></a><span class="lineno">  586</span>&#160;</div>
+<div class="line"><a name="l00587"></a><span class="lineno">  587</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> <a class="code" href="group___util_module.html#ga4733b6d40e923244502e6f5b200766ef" title="Basic type traits categories. ">Category</a>       CATEGORY    = SIGNED_INTEGER;</div>
+<div class="line"><a name="l00588"></a><span class="lineno">  588</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> UnsignedBits   HIGH_BIT    = UnsignedBits(1) &lt;&lt; ((<span class="keyword">sizeof</span>(UnsignedBits) * 8) - 1);</div>
+<div class="line"><a name="l00589"></a><span class="lineno">  589</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> UnsignedBits   MIN_KEY     = HIGH_BIT;</div>
+<div class="line"><a name="l00590"></a><span class="lineno">  590</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> UnsignedBits   MAX_KEY     = UnsignedBits(-1) ^ HIGH_BIT;</div>
+<div class="line"><a name="l00591"></a><span class="lineno">  591</span>&#160;</div>
+<div class="line"><a name="l00592"></a><span class="lineno">  592</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;    {</div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;        PRIMITIVE       = <span class="keyword">true</span>,</div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;        NULL_TYPE       = <span class="keyword">false</span>,</div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;    };</div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;</div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ UnsignedBits TwiddleIn(UnsignedBits key)</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;    {</div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;        <span class="keywordflow">return</span> key ^ HIGH_BIT;</div>
+<div class="line"><a name="l00601"></a><span class="lineno">  601</span>&#160;    };</div>
+<div class="line"><a name="l00602"></a><span class="lineno">  602</span>&#160;</div>
+<div class="line"><a name="l00603"></a><span class="lineno">  603</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ UnsignedBits TwiddleOut(UnsignedBits key)</div>
+<div class="line"><a name="l00604"></a><span class="lineno">  604</span>&#160;    {</div>
+<div class="line"><a name="l00605"></a><span class="lineno">  605</span>&#160;        <span class="keywordflow">return</span> key ^ HIGH_BIT;</div>
+<div class="line"><a name="l00606"></a><span class="lineno">  606</span>&#160;    };</div>
+<div class="line"><a name="l00607"></a><span class="lineno">  607</span>&#160;</div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;};</div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;</div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;</div>
+<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> _Un<span class="keywordtype">signed</span>Bits&gt;</div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;<span class="keyword">struct </span>BaseTraits&lt;FLOATING_POINT, true, false, _UnsignedBits&gt;</div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;{</div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;    <span class="keyword">typedef</span> _UnsignedBits       UnsignedBits;</div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;</div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> <a class="code" href="group___util_module.html#ga4733b6d40e923244502e6f5b200766ef" title="Basic type traits categories. ">Category</a>       CATEGORY    = FLOATING_POINT;</div>
+<div class="line"><a name="l00620"></a><span class="lineno">  620</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> UnsignedBits   HIGH_BIT    = UnsignedBits(1) &lt;&lt; ((<span class="keyword">sizeof</span>(UnsignedBits) * 8) - 1);</div>
+<div class="line"><a name="l00621"></a><span class="lineno">  621</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> UnsignedBits   MIN_KEY     = UnsignedBits(-1);</div>
+<div class="line"><a name="l00622"></a><span class="lineno">  622</span>&#160;    <span class="keyword">static</span> <span class="keyword">const</span> UnsignedBits   MAX_KEY     = UnsignedBits(-1) ^ HIGH_BIT;</div>
+<div class="line"><a name="l00623"></a><span class="lineno">  623</span>&#160;</div>
+<div class="line"><a name="l00624"></a><span class="lineno">  624</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ UnsignedBits TwiddleIn(UnsignedBits key)</div>
+<div class="line"><a name="l00625"></a><span class="lineno">  625</span>&#160;    {</div>
+<div class="line"><a name="l00626"></a><span class="lineno">  626</span>&#160;        UnsignedBits mask = (key &amp; HIGH_BIT) ? UnsignedBits(-1) : HIGH_BIT;</div>
+<div class="line"><a name="l00627"></a><span class="lineno">  627</span>&#160;        <span class="keywordflow">return</span> key ^ mask;</div>
+<div class="line"><a name="l00628"></a><span class="lineno">  628</span>&#160;    };</div>
+<div class="line"><a name="l00629"></a><span class="lineno">  629</span>&#160;</div>
+<div class="line"><a name="l00630"></a><span class="lineno">  630</span>&#160;    <span class="keyword">static</span> __device__ __forceinline__ UnsignedBits TwiddleOut(UnsignedBits key)</div>
+<div class="line"><a name="l00631"></a><span class="lineno">  631</span>&#160;    {</div>
+<div class="line"><a name="l00632"></a><span class="lineno">  632</span>&#160;        UnsignedBits mask = (key &amp; HIGH_BIT) ? HIGH_BIT : UnsignedBits(-1);</div>
+<div class="line"><a name="l00633"></a><span class="lineno">  633</span>&#160;        <span class="keywordflow">return</span> key ^ mask;</div>
+<div class="line"><a name="l00634"></a><span class="lineno">  634</span>&#160;    };</div>
+<div class="line"><a name="l00635"></a><span class="lineno">  635</span>&#160;</div>
+<div class="line"><a name="l00636"></a><span class="lineno">  636</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00637"></a><span class="lineno">  637</span>&#160;    {</div>
+<div class="line"><a name="l00638"></a><span class="lineno">  638</span>&#160;        PRIMITIVE       = <span class="keyword">true</span>,</div>
+<div class="line"><a name="l00639"></a><span class="lineno">  639</span>&#160;        NULL_TYPE       = <span class="keyword">false</span>,</div>
+<div class="line"><a name="l00640"></a><span class="lineno">  640</span>&#160;    };</div>
+<div class="line"><a name="l00641"></a><span class="lineno">  641</span>&#160;};</div>
+<div class="line"><a name="l00642"></a><span class="lineno">  642</span>&#160;</div>
+<div class="line"><a name="l00643"></a><span class="lineno">  643</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00644"></a><span class="lineno">  644</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00645"></a><span class="lineno">  645</span>&#160;</div>
+<div class="line"><a name="l00649"></a><span class="lineno"><a class="code" href="structcub_1_1_numeric_traits.html">  649</a></span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt; <span class="keyword">struct </span><a class="code" href="structcub_1_1_numeric_traits.html" title="Numeric type traits. ">NumericTraits</a> :            <a class="code" href="structcub_1_1_base_traits.html" title="Basic type traits. ">BaseTraits</a>&lt;NOT_A_NUMBER, false, false, T&gt; {};</div>
+<div class="line"><a name="l00650"></a><span class="lineno">  650</span>&#160;</div>
+<div class="line"><a name="l00651"></a><span class="lineno">  651</span>&#160;<span class="preprocessor">#ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00652"></a><span class="lineno">  652</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00653"></a><span class="lineno">  653</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span><a class="code" href="structcub_1_1_numeric_traits.html" title="Numeric type traits. ">NumericTraits</a>&lt;<a class="code" href="structcub_1_1_null_type.html" title="A simple &quot;NULL&quot; marker type. ">NullType</a>&gt; :            <a class="code" href="structcub_1_1_base_traits.html" title="Basic type traits. ">BaseTraits</a>&lt;NOT_A_NUMBER, false, true, NullType&gt; {};</div>
+<div class="line"><a name="l00654"></a><span class="lineno">  654</span>&#160;</div>
+<div class="line"><a name="l00655"></a><span class="lineno">  655</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;char&gt; :                BaseTraits&lt;(std::numeric_limits&lt;char&gt;::is_signed) ? SIGNED_INTEGER : UNSIGNED_INTEGER, true, false, unsigned char&gt; {};</div>
+<div class="line"><a name="l00656"></a><span class="lineno">  656</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;signed char&gt; :         BaseTraits&lt;SIGNED_INTEGER, true, false, unsigned char&gt; {};</div>
+<div class="line"><a name="l00657"></a><span class="lineno">  657</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;short&gt; :               BaseTraits&lt;SIGNED_INTEGER, true, false, unsigned short&gt; {};</div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;int&gt; :                 BaseTraits&lt;SIGNED_INTEGER, true, false, unsigned int&gt; {};</div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;long&gt; :                BaseTraits&lt;SIGNED_INTEGER, true, false, unsigned long&gt; {};</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;long long&gt; :           BaseTraits&lt;SIGNED_INTEGER, true, false, unsigned long long&gt; {};</div>
+<div class="line"><a name="l00661"></a><span class="lineno">  661</span>&#160;</div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;unsigned char&gt; :       BaseTraits&lt;UNSIGNED_INTEGER, true, false, unsigned char&gt; {};</div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;unsigned short&gt; :      BaseTraits&lt;UNSIGNED_INTEGER, true, false, unsigned short&gt; {};</div>
+<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;unsigned int&gt; :        BaseTraits&lt;UNSIGNED_INTEGER, true, false, unsigned int&gt; {};</div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;unsigned long&gt; :       BaseTraits&lt;UNSIGNED_INTEGER, true, false, unsigned long&gt; {};</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;unsigned long long&gt; :  BaseTraits&lt;UNSIGNED_INTEGER, true, false, unsigned long long&gt; {};</div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;</div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;float&gt; :               BaseTraits&lt;FLOATING_POINT, true, false, unsigned int&gt; {};</div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;<span class="keyword">template</span> &lt;&gt; <span class="keyword">struct </span>NumericTraits&lt;double&gt; :              BaseTraits&lt;FLOATING_POINT, true, false, unsigned long long&gt; {};</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;</div>
+<div class="line"><a name="l00671"></a><span class="lineno">  671</span>&#160;<span class="preprocessor">#endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;</div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;<span class="keyword">template</span> &lt;<span class="keyword">typename</span> T&gt;</div>
+<div class="line"><a name="l00678"></a><span class="lineno"><a class="code" href="structcub_1_1_traits.html">  678</a></span>&#160;<span class="keyword">struct </span><a class="code" href="structcub_1_1_traits.html" title="Type traits. ">Traits</a> : <a class="code" href="structcub_1_1_numeric_traits.html" title="Numeric type traits. ">NumericTraits</a>&lt;typename RemoveQualifiers&lt;T&gt;::Type&gt; {};</div>
+<div class="line"><a name="l00679"></a><span class="lineno">  679</span>&#160;</div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;</div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;       <span class="comment">// end group UtilModule</span></div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;</div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/warp__reduce_8cuh_source.html b/docs/html/warp__reduce_8cuh_source.html
new file mode 100644
index 0000000000..8505e532a5
--- /dev/null
+++ b/docs/html/warp__reduce_8cuh_source.html
@@ -0,0 +1,370 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: warp_reduce.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_cb3a671affffe7eeb3fdf5ae58e42cc8.html">warp</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">warp_reduce.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="warp__reduce_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;specializations/warp_reduce_shfl.cuh&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;specializations/warp_reduce_smem.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../thread/thread_operators.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../util_arch.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div>
+<div class="line"><a name="l00049"></a><span class="lineno">   49</span>&#160;</div>
+<div class="line"><a name="l00137"></a><span class="lineno">  137</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00138"></a><span class="lineno">  138</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00139"></a><span class="lineno">  139</span>&#160;    <span class="keywordtype">int</span>         LOGICAL_WARPS           = 1,</div>
+<div class="line"><a name="l00140"></a><span class="lineno">  140</span>&#160;    <span class="keywordtype">int</span>         LOGICAL_WARP_THREADS    = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>&gt;</div>
+<div class="line"><a name="l00141"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html">  141</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_warp_reduce.html" title="The WarpReduce class provides collective methods for computing a parallel reduction of items partitio...">WarpReduce</a></div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;{</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;</div>
+<div class="line"><a name="l00145"></a><span class="lineno">  145</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;<span class="comment">     * Constants and typedefs</span></div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;    {</div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;        POW_OF_TWO = ((LOGICAL_WARP_THREADS &amp; (LOGICAL_WARP_THREADS - 1)) == 0),</div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;    };</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;</div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;<span class="preprocessor">    #ifndef DOXYGEN_SHOULD_SKIP_THIS    // Do not document</span></div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html" title="Type selection (IF ? ThenType : ElseType) ">If&lt;(CUB_PTX_ARCH &gt;</a>= 300) &amp;&amp; ((LOGICAL_WARPS == 1) || POW_OF_TWO),</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;        WarpReduceShfl&lt;T, LOGICAL_WARPS, LOGICAL_WARP_THREADS&gt;,</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;        WarpReduceSmem&lt;T, LOGICAL_WARPS, LOGICAL_WARP_THREADS&gt; &gt;::Type InternalWarpReduce;</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div>
+<div class="line"><a name="l00163"></a><span class="lineno">  163</span>&#160;<span class="preprocessor">    #endif // DOXYGEN_SHOULD_SKIP_THIS</span></div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;</div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> InternalWarpReduce::TempStorage _TempStorage;</div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div>
+<div class="line"><a name="l00171"></a><span class="lineno">  171</span>&#160;</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00174"></a><span class="lineno">  174</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;</div>
+<div class="line"><a name="l00177"></a><span class="lineno">  177</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;    <span class="keywordtype">int</span> warp_id;</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;</div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;    <span class="keywordtype">int</span> lane_id;</div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div>
+<div class="line"><a name="l00185"></a><span class="lineno">  185</span>&#160;</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;    {</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;        __shared__ <a class="code" href="structcub_1_1_warp_reduce_1_1_temp_storage.html" title="The operations exposed by WarpReduce require a temporary memory allocation of this nested type for th...">TempStorage</a> private_storage;</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00195"></a><span class="lineno">  195</span>&#160;    }</div>
+<div class="line"><a name="l00196"></a><span class="lineno">  196</span>&#160;</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;</div>
+<div class="line"><a name="l00201"></a><span class="lineno"><a class="code" href="structcub_1_1_warp_reduce_1_1_temp_storage.html">  201</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_warp_reduce_1_1_temp_storage.html" title="The operations exposed by WarpReduce require a temporary memory allocation of this nested type for th...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00202"></a><span class="lineno">  202</span>&#160;</div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div>
+<div class="line"><a name="l00204"></a><span class="lineno">  204</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;</div>
+<div class="line"><a name="l00214"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#aed6c8ead3a4c2fa56ae1d5851fb36848">  214</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_warp_reduce.html#aed6c8ead3a4c2fa56ae1d5851fb36848" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">WarpReduce</a>()</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;    :</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;        warp_id((LOGICAL_WARPS == 1) ?</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;            0 :</div>
+<div class="line"><a name="l00219"></a><span class="lineno">  219</span>&#160;            threadIdx.x / LOGICAL_WARP_THREADS),</div>
+<div class="line"><a name="l00220"></a><span class="lineno">  220</span>&#160;        lane_id(((LOGICAL_WARPS == 1) || (LOGICAL_WARP_THREADS == <a class="code" href="structcub_1_1_ptx_arch_props.html" title="The architectural properties for the PTX version targeted by the active compiler pass. ">PtxArchProps</a>::WARP_THREADS)) ?</div>
+<div class="line"><a name="l00221"></a><span class="lineno">  221</span>&#160;            LaneId() :</div>
+<div class="line"><a name="l00222"></a><span class="lineno">  222</span>&#160;            threadIdx.x % LOGICAL_WARP_THREADS)</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;    {}</div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;</div>
+<div class="line"><a name="l00229"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#a7e026682e53d5af519912ab9a9215e3b">  229</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_warp_reduce.html#a7e026682e53d5af519912ab9a9215e3b" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">WarpReduce</a>(</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;        <a class="code" href="structcub_1_1_warp_reduce_1_1_temp_storage.html" title="The operations exposed by WarpReduce require a temporary memory allocation of this nested type for th...">TempStorage</a> &amp;temp_storage)             </div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;    :</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;        warp_id((LOGICAL_WARPS == 1) ?</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;            0 :</div>
+<div class="line"><a name="l00235"></a><span class="lineno">  235</span>&#160;            threadIdx.x / LOGICAL_WARP_THREADS),</div>
+<div class="line"><a name="l00236"></a><span class="lineno">  236</span>&#160;        lane_id(((LOGICAL_WARPS == 1) || (LOGICAL_WARP_THREADS == <a class="code" href="structcub_1_1_ptx_arch_props.html" title="The architectural properties for the PTX version targeted by the active compiler pass. ">PtxArchProps</a>::WARP_THREADS)) ?</div>
+<div class="line"><a name="l00237"></a><span class="lineno">  237</span>&#160;            LaneId() :</div>
+<div class="line"><a name="l00238"></a><span class="lineno">  238</span>&#160;            threadIdx.x % LOGICAL_WARP_THREADS)</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;    {}</div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;</div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;</div>
+<div class="line"><a name="l00245"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#aef629abf014a0f1f9646d3b9123fcaa6">  245</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_warp_reduce.html#aef629abf014a0f1f9646d3b9123fcaa6" title="Collective constructor using a private static allocation of shared memory as temporary storage...">WarpReduce</a>(</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;        <span class="keywordtype">int</span> warp_id,                           </div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;        <span class="keywordtype">int</span> lane_id)                           </div>
+<div class="line"><a name="l00248"></a><span class="lineno">  248</span>&#160;    :</div>
+<div class="line"><a name="l00249"></a><span class="lineno">  249</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00250"></a><span class="lineno">  250</span>&#160;        warp_id(warp_id),</div>
+<div class="line"><a name="l00251"></a><span class="lineno">  251</span>&#160;        lane_id(lane_id)</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;    {}</div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;</div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;</div>
+<div class="line"><a name="l00258"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#aac44f5e8003911f074156366969947e4">  258</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_warp_reduce.html#aac44f5e8003911f074156366969947e4" title="Collective constructor using the specified memory allocation as temporary storage. Threads are identified using the given warp and lane identifiers. ">WarpReduce</a>(</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;        <a class="code" href="structcub_1_1_warp_reduce_1_1_temp_storage.html" title="The operations exposed by WarpReduce require a temporary memory allocation of this nested type for th...">TempStorage</a> &amp;temp_storage,             </div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;        <span class="keywordtype">int</span> warp_id,                           </div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;        <span class="keywordtype">int</span> lane_id)                           </div>
+<div class="line"><a name="l00262"></a><span class="lineno">  262</span>&#160;    :</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00264"></a><span class="lineno">  264</span>&#160;        warp_id(warp_id),</div>
+<div class="line"><a name="l00265"></a><span class="lineno">  265</span>&#160;        lane_id(lane_id)</div>
+<div class="line"><a name="l00266"></a><span class="lineno">  266</span>&#160;    {}</div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div>
+<div class="line"><a name="l00269"></a><span class="lineno">  269</span>&#160;</div>
+<div class="line"><a name="l00271"></a><span class="lineno">  271</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00275"></a><span class="lineno">  275</span>&#160;</div>
+<div class="line"><a name="l00276"></a><span class="lineno">  276</span>&#160;</div>
+<div class="line"><a name="l00309"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#a3327a2b8c9bdce58f7af1e2485489eed">  309</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_warp_reduce.html#a3327a2b8c9bdce58f7af1e2485489eed" title="Computes a warp-wide sum in each active warp. The output is valid in warp lane0. ">Sum</a>(</div>
+<div class="line"><a name="l00310"></a><span class="lineno">  310</span>&#160;        T                   input)              </div>
+<div class="line"><a name="l00311"></a><span class="lineno">  311</span>&#160;    {</div>
+<div class="line"><a name="l00312"></a><span class="lineno">  312</span>&#160;        <span class="keywordflow">return</span> InternalWarpReduce(temp_storage, warp_id, lane_id).Sum&lt;<span class="keyword">true</span>, 1&gt;(input, LOGICAL_WARP_THREADS);</div>
+<div class="line"><a name="l00313"></a><span class="lineno">  313</span>&#160;    }</div>
+<div class="line"><a name="l00314"></a><span class="lineno">  314</span>&#160;</div>
+<div class="line"><a name="l00352"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#a2ccc6eb62a1e6caf145eb94a8cd58f0f">  352</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_warp_reduce.html#a2ccc6eb62a1e6caf145eb94a8cd58f0f" title="Computes a partially-full warp-wide sum in each active warp. The output is valid in warp lane0...">Sum</a>(</div>
+<div class="line"><a name="l00353"></a><span class="lineno">  353</span>&#160;        T                   input,              </div>
+<div class="line"><a name="l00354"></a><span class="lineno">  354</span>&#160;        <span class="keywordtype">int</span>                 valid_items)        </div>
+<div class="line"><a name="l00355"></a><span class="lineno">  355</span>&#160;    {</div>
+<div class="line"><a name="l00356"></a><span class="lineno">  356</span>&#160;        <span class="comment">// Determine if we don&#39;t need bounds checking</span></div>
+<div class="line"><a name="l00357"></a><span class="lineno">  357</span>&#160;        <span class="keywordflow">if</span> (valid_items &gt;= LOGICAL_WARP_THREADS)</div>
+<div class="line"><a name="l00358"></a><span class="lineno">  358</span>&#160;        {</div>
+<div class="line"><a name="l00359"></a><span class="lineno">  359</span>&#160;            <span class="keywordflow">return</span> InternalWarpReduce(temp_storage, warp_id, lane_id).Sum&lt;<span class="keyword">true</span>, 1&gt;(input, valid_items);</div>
+<div class="line"><a name="l00360"></a><span class="lineno">  360</span>&#160;        }</div>
+<div class="line"><a name="l00361"></a><span class="lineno">  361</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00362"></a><span class="lineno">  362</span>&#160;        {</div>
+<div class="line"><a name="l00363"></a><span class="lineno">  363</span>&#160;            <span class="keywordflow">return</span> InternalWarpReduce(temp_storage, warp_id, lane_id).Sum&lt;<span class="keyword">false</span>, 1&gt;(input, valid_items);</div>
+<div class="line"><a name="l00364"></a><span class="lineno">  364</span>&#160;        }</div>
+<div class="line"><a name="l00365"></a><span class="lineno">  365</span>&#160;    }</div>
+<div class="line"><a name="l00366"></a><span class="lineno">  366</span>&#160;</div>
+<div class="line"><a name="l00367"></a><span class="lineno">  367</span>&#160;</div>
+<div class="line"><a name="l00405"></a><span class="lineno">  405</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00406"></a><span class="lineno">  406</span>&#160;        <span class="keyword">typename</span>            Flag&gt;</div>
+<div class="line"><a name="l00407"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#abc0cd1853c09b27fc45f564596163be4">  407</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_warp_reduce.html#abc0cd1853c09b27fc45f564596163be4" title="Computes a segmented sum in each active warp where segments are defined by head-flags. The sum of each segment is returned to the first lane in that segment (which always includes lane0). ">HeadSegmentedSum</a>(</div>
+<div class="line"><a name="l00408"></a><span class="lineno">  408</span>&#160;        T                   input,              </div>
+<div class="line"><a name="l00409"></a><span class="lineno">  409</span>&#160;        Flag                head_flag)          </div>
+<div class="line"><a name="l00410"></a><span class="lineno">  410</span>&#160;    {</div>
+<div class="line"><a name="l00411"></a><span class="lineno">  411</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="classcub_1_1_warp_reduce.html#a85d8612201876163a74a807c585b0af1" title="Computes a segmented reduction in each active warp where segments are defined by head-flags. The reduction of each segment is returned to the first lane in that segment (which always includes lane0). ">HeadSegmentedReduce</a>(input, head_flag, <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">cub::Sum</a>());</div>
+<div class="line"><a name="l00412"></a><span class="lineno">  412</span>&#160;    }</div>
+<div class="line"><a name="l00413"></a><span class="lineno">  413</span>&#160;</div>
+<div class="line"><a name="l00414"></a><span class="lineno">  414</span>&#160;</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;        <span class="keyword">typename</span>            Flag&gt;</div>
+<div class="line"><a name="l00453"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#a5b0134131d03909e43d24d6b0b50beb4">  453</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_warp_reduce.html#a5b0134131d03909e43d24d6b0b50beb4" title="Computes a segmented sum in each active warp where segments are defined by tail-flags. The sum of each segment is returned to the first lane in that segment (which always includes lane0). ">TailSegmentedSum</a>(</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;        T                   input,              </div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;        Flag                tail_flag)          </div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;    {</div>
+<div class="line"><a name="l00457"></a><span class="lineno">  457</span>&#160;        <span class="keywordflow">return</span> <a class="code" href="classcub_1_1_warp_reduce.html#a074ddcaf999d4e97376b145086e78ddb" title="Computes a segmented reduction in each active warp where segments are defined by tail-flags. The reduction of each segment is returned to the first lane in that segment (which always includes lane0). ">TailSegmentedReduce</a>(input, tail_flag, <a class="code" href="structcub_1_1_sum.html" title="Default sum functor. ">cub::Sum</a>());</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;    }</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;</div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;</div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ReductionOp&gt;</div>
+<div class="line"><a name="l00505"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#a1aa0a6e1a2c3feabbc20c27864df15c1">  505</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_warp_reduce.html#a1aa0a6e1a2c3feabbc20c27864df15c1" title="Computes a warp-wide reduction in each active warp using the specified binary reduction functor...">Reduce</a>(</div>
+<div class="line"><a name="l00506"></a><span class="lineno">  506</span>&#160;        T                   input,              </div>
+<div class="line"><a name="l00507"></a><span class="lineno">  507</span>&#160;        ReductionOp         reduction_op)       </div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;    {</div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;        <span class="keywordflow">return</span> InternalWarpReduce(temp_storage, warp_id, lane_id).Reduce&lt;<span class="keyword">true</span>, 1&gt;(input, LOGICAL_WARP_THREADS, reduction_op);</div>
+<div class="line"><a name="l00510"></a><span class="lineno">  510</span>&#160;    }</div>
+<div class="line"><a name="l00511"></a><span class="lineno">  511</span>&#160;</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ReductionOp&gt;</div>
+<div class="line"><a name="l00553"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#a176c3c913e3e077aab691a186f161d8e">  553</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_warp_reduce.html#a176c3c913e3e077aab691a186f161d8e" title="Computes a partially-full warp-wide reduction in each active warp using the specified binary reductio...">Reduce</a>(</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;        T                   input,              </div>
+<div class="line"><a name="l00555"></a><span class="lineno">  555</span>&#160;        ReductionOp         reduction_op,       </div>
+<div class="line"><a name="l00556"></a><span class="lineno">  556</span>&#160;        <span class="keywordtype">int</span>                 valid_items)        </div>
+<div class="line"><a name="l00557"></a><span class="lineno">  557</span>&#160;    {</div>
+<div class="line"><a name="l00558"></a><span class="lineno">  558</span>&#160;        <span class="comment">// Determine if we don&#39;t need bounds checking</span></div>
+<div class="line"><a name="l00559"></a><span class="lineno">  559</span>&#160;        <span class="keywordflow">if</span> (valid_items &gt;= LOGICAL_WARP_THREADS)</div>
+<div class="line"><a name="l00560"></a><span class="lineno">  560</span>&#160;        {</div>
+<div class="line"><a name="l00561"></a><span class="lineno">  561</span>&#160;            <span class="keywordflow">return</span> InternalWarpReduce(temp_storage, warp_id, lane_id).Reduce&lt;<span class="keyword">true</span>, 1&gt;(input, valid_items, reduction_op);</div>
+<div class="line"><a name="l00562"></a><span class="lineno">  562</span>&#160;        }</div>
+<div class="line"><a name="l00563"></a><span class="lineno">  563</span>&#160;        <span class="keywordflow">else</span></div>
+<div class="line"><a name="l00564"></a><span class="lineno">  564</span>&#160;        {</div>
+<div class="line"><a name="l00565"></a><span class="lineno">  565</span>&#160;            <span class="keywordflow">return</span> InternalWarpReduce(temp_storage, warp_id, lane_id).Reduce&lt;<span class="keyword">false</span>, 1&gt;(input, valid_items, reduction_op);</div>
+<div class="line"><a name="l00566"></a><span class="lineno">  566</span>&#160;        }</div>
+<div class="line"><a name="l00567"></a><span class="lineno">  567</span>&#160;    }</div>
+<div class="line"><a name="l00568"></a><span class="lineno">  568</span>&#160;</div>
+<div class="line"><a name="l00569"></a><span class="lineno">  569</span>&#160;</div>
+<div class="line"><a name="l00608"></a><span class="lineno">  608</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00609"></a><span class="lineno">  609</span>&#160;        <span class="keyword">typename</span>            ReductionOp,</div>
+<div class="line"><a name="l00610"></a><span class="lineno">  610</span>&#160;        <span class="keyword">typename</span>            Flag&gt;</div>
+<div class="line"><a name="l00611"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#a85d8612201876163a74a807c585b0af1">  611</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_warp_reduce.html#a85d8612201876163a74a807c585b0af1" title="Computes a segmented reduction in each active warp where segments are defined by head-flags. The reduction of each segment is returned to the first lane in that segment (which always includes lane0). ">HeadSegmentedReduce</a>(</div>
+<div class="line"><a name="l00612"></a><span class="lineno">  612</span>&#160;        T                   input,              </div>
+<div class="line"><a name="l00613"></a><span class="lineno">  613</span>&#160;        Flag                head_flag,          </div>
+<div class="line"><a name="l00614"></a><span class="lineno">  614</span>&#160;        ReductionOp         reduction_op)       </div>
+<div class="line"><a name="l00615"></a><span class="lineno">  615</span>&#160;    {</div>
+<div class="line"><a name="l00616"></a><span class="lineno">  616</span>&#160;        <span class="keywordflow">return</span> InternalWarpReduce(temp_storage, warp_id, lane_id).template SegmentedReduce&lt;true&gt;(input, head_flag, reduction_op);</div>
+<div class="line"><a name="l00617"></a><span class="lineno">  617</span>&#160;    }</div>
+<div class="line"><a name="l00618"></a><span class="lineno">  618</span>&#160;</div>
+<div class="line"><a name="l00619"></a><span class="lineno">  619</span>&#160;</div>
+<div class="line"><a name="l00658"></a><span class="lineno">  658</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00659"></a><span class="lineno">  659</span>&#160;        <span class="keyword">typename</span>            ReductionOp,</div>
+<div class="line"><a name="l00660"></a><span class="lineno">  660</span>&#160;        <span class="keyword">typename</span>            Flag&gt;</div>
+<div class="line"><a name="l00661"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_reduce.html#a074ddcaf999d4e97376b145086e78ddb">  661</a></span>&#160;    __device__ __forceinline__ T <a class="code" href="classcub_1_1_warp_reduce.html#a074ddcaf999d4e97376b145086e78ddb" title="Computes a segmented reduction in each active warp where segments are defined by tail-flags. The reduction of each segment is returned to the first lane in that segment (which always includes lane0). ">TailSegmentedReduce</a>(</div>
+<div class="line"><a name="l00662"></a><span class="lineno">  662</span>&#160;        T                   input,              </div>
+<div class="line"><a name="l00663"></a><span class="lineno">  663</span>&#160;        Flag                tail_flag,          </div>
+<div class="line"><a name="l00664"></a><span class="lineno">  664</span>&#160;        ReductionOp         reduction_op)       </div>
+<div class="line"><a name="l00665"></a><span class="lineno">  665</span>&#160;    {</div>
+<div class="line"><a name="l00666"></a><span class="lineno">  666</span>&#160;        <span class="keywordflow">return</span> InternalWarpReduce(temp_storage, warp_id, lane_id).template SegmentedReduce&lt;false&gt;(input, tail_flag, reduction_op);</div>
+<div class="line"><a name="l00667"></a><span class="lineno">  667</span>&#160;    }</div>
+<div class="line"><a name="l00668"></a><span class="lineno">  668</span>&#160;</div>
+<div class="line"><a name="l00669"></a><span class="lineno">  669</span>&#160;</div>
+<div class="line"><a name="l00670"></a><span class="lineno">  670</span>&#160;</div>
+<div class="line"><a name="l00672"></a><span class="lineno">  672</span>&#160;};</div>
+<div class="line"><a name="l00673"></a><span class="lineno">  673</span>&#160;       <span class="comment">// end group WarpModule</span></div>
+<div class="line"><a name="l00675"></a><span class="lineno">  675</span>&#160;</div>
+<div class="line"><a name="l00676"></a><span class="lineno">  676</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l00677"></a><span class="lineno">  677</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>
diff --git a/docs/html/warp__scan_8cuh_source.html b/docs/html/warp__scan_8cuh_source.html
new file mode 100644
index 0000000000..d8ae6defa0
--- /dev/null
+++ b/docs/html/warp__scan_8cuh_source.html
@@ -0,0 +1,525 @@
+<!-- HTML header for doxygen 1.8.3.1-->
+<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transitional.dtd">
+<html xmlns="http://www.w3.org/1999/xhtml">
+<head>
+<meta http-equiv="Content-Type" content="text/xhtml;charset=UTF-8"/>
+<meta http-equiv="X-UA-Compatible" content="IE=9"/>
+<meta name="generator" content="Doxygen 1.8.4"/>
+<title>CUB: warp_scan.cuh Source File</title>
+<link href="tabs.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="jquery.js"></script>
+<script type="text/javascript" src="dynsections.js"></script>
+<link href="search/search.css" rel="stylesheet" type="text/css"/>
+<script type="text/javascript" src="search/search.js"></script>
+<script type="text/javascript">
+  $(document).ready(function() { searchBox.OnSelectItem(0); });
+</script>
+<link href="doxygen.css" rel="stylesheet" type="text/css" />
+<link href="extra_stylesheet.css" rel="stylesheet" type="text/css"/>
+<link rel="shortcut icon" href="favicon.ico" type="image/x-icon" />
+<script type="text/javascript">
+  var _gaq = _gaq || [];
+  _gaq.push(['_setAccount', 'UA-38890655-1']);
+  _gaq.push(['_trackPageview']);
+  (function() {
+    var ga = document.createElement('script'); ga.type = 'text/javascript'; ga.async = true;
+    ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
+    var s = document.getElementsByTagName('script')[0]; s.parentNode.insertBefore(ga, s);
+  })();
+</script>
+</head>
+<body>
+<div id="top"><!-- do not remove this div, it is closed by doxygen! -->
+<div id="titlearea">
+<table cellspacing="0" cellpadding="0">
+ <tbody>
+ <tr style="height: 56px;">
+  <td style="padding-left: 0.5em;">
+   <div id="projectname">CUB
+   </div>
+  </td>
+ </tr>
+ </tbody>
+</table>
+</div>
+<!-- end header part -->
+<!-- Generated by Doxygen 1.8.4 -->
+<script type="text/javascript">
+var searchBox = new SearchBox("searchBox", "search",false,'Search');
+</script>
+  <div id="navrow1" class="tabs">
+    <ul class="tablist">
+      <li><a href="index.html"><span>Main&#160;Page</span></a></li>
+      <li><a href="modules.html"><span>Modules</span></a></li>
+      <li><a href="annotated.html"><span>Classes</span></a></li>
+      <li>
+        <div id="MSearchBox" class="MSearchBoxInactive">
+        <span class="left">
+          <img id="MSearchSelect" src="search/mag_sel.png"
+               onmouseover="return searchBox.OnSearchSelectShow()"
+               onmouseout="return searchBox.OnSearchSelectHide()"
+               alt=""/>
+          <input type="text" id="MSearchField" value="Search" accesskey="S"
+               onfocus="searchBox.OnSearchFieldFocus(true)" 
+               onblur="searchBox.OnSearchFieldFocus(false)" 
+               onkeyup="searchBox.OnSearchFieldChange(event)"/>
+          </span><span class="right">
+            <a id="MSearchClose" href="javascript:searchBox.CloseResultsWindow()"><img id="MSearchCloseImg" border="0" src="search/close.png" alt=""/></a>
+          </span>
+        </div>
+      </li>
+    </ul>
+  </div>
+  <div id="navrow2" class="tabs2">
+    <ul class="tablist">
+      <li><a href="files.html"><span>File&#160;List</span></a></li>
+      <li><a href="globals.html"><span>File&#160;Members</span></a></li>
+    </ul>
+  </div>
+<!-- window showing the filter options -->
+<div id="MSearchSelectWindow"
+     onmouseover="return searchBox.OnSearchSelectShow()"
+     onmouseout="return searchBox.OnSearchSelectHide()"
+     onkeydown="return searchBox.OnSearchSelectKey(event)">
+<a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(0)"><span class="SelectionMark">&#160;</span>All</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(1)"><span class="SelectionMark">&#160;</span>Classes</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(2)"><span class="SelectionMark">&#160;</span>Namespaces</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(3)"><span class="SelectionMark">&#160;</span>Files</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(4)"><span class="SelectionMark">&#160;</span>Functions</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(5)"><span class="SelectionMark">&#160;</span>Variables</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(6)"><span class="SelectionMark">&#160;</span>Typedefs</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(7)"><span class="SelectionMark">&#160;</span>Enumerations</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(8)"><span class="SelectionMark">&#160;</span>Enumerator</a><a class="SelectItem" href="javascript:void(0)" onclick="searchBox.OnSelectItem(9)"><span class="SelectionMark">&#160;</span>Groups</a></div>
+
+<!-- iframe showing the search results (closed by default) -->
+<div id="MSearchResultsWindow">
+<iframe src="javascript:void(0)" frameborder="0" 
+        name="MSearchResults" id="MSearchResults">
+</iframe>
+</div>
+
+<div id="nav-path" class="navpath">
+  <ul>
+<li class="navelem"><a class="el" href="dir_d583f216f1aafe19404e836b0c097ad2.html">cub</a></li><li class="navelem"><a class="el" href="dir_cb3a671affffe7eeb3fdf5ae58e42cc8.html">warp</a></li>  </ul>
+</div>
+</div><!-- top -->
+<div class="header">
+  <div class="headertitle">
+<div class="title">warp_scan.cuh</div>  </div>
+</div><!--header-->
+<div class="contents">
+<a href="warp__scan_8cuh.html">Go to the documentation of this file.</a><div class="fragment"><div class="line"><a name="l00001"></a><span class="lineno">    1</span>&#160;<span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00002"></a><span class="lineno">    2</span>&#160;<span class="comment"> * Copyright (c) 2011, Duane Merrill.  All rights reserved.</span></div>
+<div class="line"><a name="l00003"></a><span class="lineno">    3</span>&#160;<span class="comment"> * Copyright (c) 2011-2013, NVIDIA CORPORATION.  All rights reserved.</span></div>
+<div class="line"><a name="l00004"></a><span class="lineno">    4</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00005"></a><span class="lineno">    5</span>&#160;<span class="comment"> * Redistribution and use in source and binary forms, with or without</span></div>
+<div class="line"><a name="l00006"></a><span class="lineno">    6</span>&#160;<span class="comment"> * modification, are permitted provided that the following conditions are met:</span></div>
+<div class="line"><a name="l00007"></a><span class="lineno">    7</span>&#160;<span class="comment"> *     * Redistributions of source code must retain the above copyright</span></div>
+<div class="line"><a name="l00008"></a><span class="lineno">    8</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer.</span></div>
+<div class="line"><a name="l00009"></a><span class="lineno">    9</span>&#160;<span class="comment"> *     * Redistributions in binary form must reproduce the above copyright</span></div>
+<div class="line"><a name="l00010"></a><span class="lineno">   10</span>&#160;<span class="comment"> *       notice, this list of conditions and the following disclaimer in the</span></div>
+<div class="line"><a name="l00011"></a><span class="lineno">   11</span>&#160;<span class="comment"> *       documentation and/or other materials provided with the distribution.</span></div>
+<div class="line"><a name="l00012"></a><span class="lineno">   12</span>&#160;<span class="comment"> *     * Neither the name of the NVIDIA CORPORATION nor the</span></div>
+<div class="line"><a name="l00013"></a><span class="lineno">   13</span>&#160;<span class="comment"> *       names of its contributors may be used to endorse or promote products</span></div>
+<div class="line"><a name="l00014"></a><span class="lineno">   14</span>&#160;<span class="comment"> *       derived from this software without specific prior written permission.</span></div>
+<div class="line"><a name="l00015"></a><span class="lineno">   15</span>&#160;<span class="comment"> * </span></div>
+<div class="line"><a name="l00016"></a><span class="lineno">   16</span>&#160;<span class="comment"> * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS AND CONTRIBUTORS &quot;AS IS&quot; AND</span></div>
+<div class="line"><a name="l00017"></a><span class="lineno">   17</span>&#160;<span class="comment"> * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE IMPLIED</span></div>
+<div class="line"><a name="l00018"></a><span class="lineno">   18</span>&#160;<span class="comment"> * WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE ARE</span></div>
+<div class="line"><a name="l00019"></a><span class="lineno">   19</span>&#160;<span class="comment"> * DISCLAIMED. IN NO EVENT SHALL NVIDIA CORPORATION BE LIABLE FOR ANY</span></div>
+<div class="line"><a name="l00020"></a><span class="lineno">   20</span>&#160;<span class="comment"> * DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL DAMAGES</span></div>
+<div class="line"><a name="l00021"></a><span class="lineno">   21</span>&#160;<span class="comment"> * (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES;</span></div>
+<div class="line"><a name="l00022"></a><span class="lineno">   22</span>&#160;<span class="comment"> * LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND</span></div>
+<div class="line"><a name="l00023"></a><span class="lineno">   23</span>&#160;<span class="comment"> * ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT</span></div>
+<div class="line"><a name="l00024"></a><span class="lineno">   24</span>&#160;<span class="comment"> * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE OF THIS</span></div>
+<div class="line"><a name="l00025"></a><span class="lineno">   25</span>&#160;<span class="comment"> * SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.</span></div>
+<div class="line"><a name="l00026"></a><span class="lineno">   26</span>&#160;<span class="comment"> *</span></div>
+<div class="line"><a name="l00027"></a><span class="lineno">   27</span>&#160;<span class="comment"> ******************************************************************************/</span></div>
+<div class="line"><a name="l00028"></a><span class="lineno">   28</span>&#160;</div>
+<div class="line"><a name="l00034"></a><span class="lineno">   34</span>&#160;<span class="preprocessor">#pragma once</span></div>
+<div class="line"><a name="l00035"></a><span class="lineno">   35</span>&#160;<span class="preprocessor"></span></div>
+<div class="line"><a name="l00036"></a><span class="lineno">   36</span>&#160;<span class="preprocessor">#include &quot;specializations/warp_scan_shfl.cuh&quot;</span></div>
+<div class="line"><a name="l00037"></a><span class="lineno">   37</span>&#160;<span class="preprocessor">#include &quot;specializations/warp_scan_smem.cuh&quot;</span></div>
+<div class="line"><a name="l00038"></a><span class="lineno">   38</span>&#160;<span class="preprocessor">#include &quot;../thread/thread_operators.cuh&quot;</span></div>
+<div class="line"><a name="l00039"></a><span class="lineno">   39</span>&#160;<span class="preprocessor">#include &quot;../util_arch.cuh&quot;</span></div>
+<div class="line"><a name="l00040"></a><span class="lineno">   40</span>&#160;<span class="preprocessor">#include &quot;../util_type.cuh&quot;</span></div>
+<div class="line"><a name="l00041"></a><span class="lineno">   41</span>&#160;<span class="preprocessor">#include &quot;../util_namespace.cuh&quot;</span></div>
+<div class="line"><a name="l00042"></a><span class="lineno">   42</span>&#160;</div>
+<div class="line"><a name="l00044"></a><span class="lineno">   44</span>&#160;CUB_NS_PREFIX</div>
+<div class="line"><a name="l00045"></a><span class="lineno">   45</span>&#160;</div>
+<div class="line"><a name="l00047"></a><span class="lineno">   47</span>&#160;<span class="keyword">namespace </span>cub {</div>
+<div class="line"><a name="l00048"></a><span class="lineno">   48</span>&#160;</div>
+<div class="line"><a name="l00141"></a><span class="lineno">  141</span>&#160;<span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00142"></a><span class="lineno">  142</span>&#160;    <span class="keyword">typename</span>    T,</div>
+<div class="line"><a name="l00143"></a><span class="lineno">  143</span>&#160;    <span class="keywordtype">int</span>         LOGICAL_WARPS           = 1,</div>
+<div class="line"><a name="l00144"></a><span class="lineno">  144</span>&#160;    <span class="keywordtype">int</span>         LOGICAL_WARP_THREADS    = <a class="code" href="structcub_1_1_arch_props.html#a378def3dee75e77eb135efcf6f0ca063ac5a2eb5b9e3b50dd43ad67c1ff020d9c" title="Log of the number of threads per warp. ">PtxArchProps::WARP_THREADS</a>&gt;</div>
+<div class="line"><a name="l00145"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html">  145</a></span>&#160;<span class="keyword">class </span><a class="code" href="classcub_1_1_warp_scan.html" title="The WarpScan class provides collective methods for computing a parallel prefix scan of items partitio...">WarpScan</a></div>
+<div class="line"><a name="l00146"></a><span class="lineno">  146</span>&#160;{</div>
+<div class="line"><a name="l00147"></a><span class="lineno">  147</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00148"></a><span class="lineno">  148</span>&#160;</div>
+<div class="line"><a name="l00149"></a><span class="lineno">  149</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00150"></a><span class="lineno">  150</span>&#160;<span class="comment">     * Constants and typedefs</span></div>
+<div class="line"><a name="l00151"></a><span class="lineno">  151</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00152"></a><span class="lineno">  152</span>&#160;</div>
+<div class="line"><a name="l00153"></a><span class="lineno">  153</span>&#160;    <span class="keyword">enum</span></div>
+<div class="line"><a name="l00154"></a><span class="lineno">  154</span>&#160;    {</div>
+<div class="line"><a name="l00155"></a><span class="lineno">  155</span>&#160;        POW_OF_TWO = ((LOGICAL_WARP_THREADS &amp; (LOGICAL_WARP_THREADS - 1)) == 0),</div>
+<div class="line"><a name="l00156"></a><span class="lineno">  156</span>&#160;    };</div>
+<div class="line"><a name="l00157"></a><span class="lineno">  157</span>&#160;</div>
+<div class="line"><a name="l00159"></a><span class="lineno">  159</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> <a class="code" href="structcub_1_1_if.html" title="Type selection (IF ? ThenType : ElseType) ">If&lt;(CUB_PTX_ARCH &gt;</a>= 300) &amp;&amp; ((LOGICAL_WARPS == 1) || POW_OF_TWO),</div>
+<div class="line"><a name="l00160"></a><span class="lineno">  160</span>&#160;        WarpScanShfl&lt;T, LOGICAL_WARPS, LOGICAL_WARP_THREADS&gt;,</div>
+<div class="line"><a name="l00161"></a><span class="lineno">  161</span>&#160;        WarpScanSmem&lt;T, LOGICAL_WARPS, LOGICAL_WARP_THREADS&gt; &gt;::Type InternalWarpScan;</div>
+<div class="line"><a name="l00162"></a><span class="lineno">  162</span>&#160;</div>
+<div class="line"><a name="l00164"></a><span class="lineno">  164</span>&#160;    <span class="keyword">typedef</span> <span class="keyword">typename</span> InternalWarpScan::TempStorage _TempStorage;</div>
+<div class="line"><a name="l00165"></a><span class="lineno">  165</span>&#160;</div>
+<div class="line"><a name="l00166"></a><span class="lineno">  166</span>&#160;</div>
+<div class="line"><a name="l00167"></a><span class="lineno">  167</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00168"></a><span class="lineno">  168</span>&#160;<span class="comment">     * Thread fields</span></div>
+<div class="line"><a name="l00169"></a><span class="lineno">  169</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00170"></a><span class="lineno">  170</span>&#160;</div>
+<div class="line"><a name="l00172"></a><span class="lineno">  172</span>&#160;    _TempStorage &amp;temp_storage;</div>
+<div class="line"><a name="l00173"></a><span class="lineno">  173</span>&#160;</div>
+<div class="line"><a name="l00175"></a><span class="lineno">  175</span>&#160;    <span class="keywordtype">int</span> warp_id;</div>
+<div class="line"><a name="l00176"></a><span class="lineno">  176</span>&#160;</div>
+<div class="line"><a name="l00178"></a><span class="lineno">  178</span>&#160;    <span class="keywordtype">int</span> lane_id;</div>
+<div class="line"><a name="l00179"></a><span class="lineno">  179</span>&#160;</div>
+<div class="line"><a name="l00180"></a><span class="lineno">  180</span>&#160;</div>
+<div class="line"><a name="l00181"></a><span class="lineno">  181</span>&#160;    <span class="comment">/******************************************************************************</span></div>
+<div class="line"><a name="l00182"></a><span class="lineno">  182</span>&#160;<span class="comment">     * Utility methods</span></div>
+<div class="line"><a name="l00183"></a><span class="lineno">  183</span>&#160;<span class="comment">     ******************************************************************************/</span></div>
+<div class="line"><a name="l00184"></a><span class="lineno">  184</span>&#160;</div>
+<div class="line"><a name="l00186"></a><span class="lineno">  186</span>&#160;    __device__ __forceinline__ _TempStorage&amp; PrivateStorage()</div>
+<div class="line"><a name="l00187"></a><span class="lineno">  187</span>&#160;    {</div>
+<div class="line"><a name="l00188"></a><span class="lineno">  188</span>&#160;        __shared__ <a class="code" href="structcub_1_1_warp_scan_1_1_temp_storage.html" title="The operations exposed by WarpScan require a temporary memory allocation of this nested type for thre...">TempStorage</a> private_storage;</div>
+<div class="line"><a name="l00189"></a><span class="lineno">  189</span>&#160;        <span class="keywordflow">return</span> private_storage;</div>
+<div class="line"><a name="l00190"></a><span class="lineno">  190</span>&#160;    }</div>
+<div class="line"><a name="l00191"></a><span class="lineno">  191</span>&#160;</div>
+<div class="line"><a name="l00192"></a><span class="lineno">  192</span>&#160;</div>
+<div class="line"><a name="l00193"></a><span class="lineno">  193</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00194"></a><span class="lineno">  194</span>&#160;</div>
+<div class="line"><a name="l00196"></a><span class="lineno"><a class="code" href="structcub_1_1_warp_scan_1_1_temp_storage.html">  196</a></span>&#160;    <span class="keyword">struct </span><a class="code" href="structcub_1_1_warp_scan_1_1_temp_storage.html" title="The operations exposed by WarpScan require a temporary memory allocation of this nested type for thre...">TempStorage</a> : <a class="code" href="structcub_1_1_uninitialized.html" title="A storage-backing wrapper that allows types with non-trivial constructors to be aliased in unions...">Uninitialized</a>&lt;_TempStorage&gt; {};</div>
+<div class="line"><a name="l00197"></a><span class="lineno">  197</span>&#160;</div>
+<div class="line"><a name="l00198"></a><span class="lineno">  198</span>&#160;</div>
+<div class="line"><a name="l00199"></a><span class="lineno">  199</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00203"></a><span class="lineno">  203</span>&#160;</div>
+<div class="line"><a name="l00207"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a27ca414b95f92f2b52701cda45273b05">  207</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_warp_scan.html#a27ca414b95f92f2b52701cda45273b05" title="Collective constructor for 1D thread blocks using a private static allocation of shared memory as tem...">WarpScan</a>()</div>
+<div class="line"><a name="l00208"></a><span class="lineno">  208</span>&#160;    :</div>
+<div class="line"><a name="l00209"></a><span class="lineno">  209</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00210"></a><span class="lineno">  210</span>&#160;        warp_id((LOGICAL_WARPS == 1) ?</div>
+<div class="line"><a name="l00211"></a><span class="lineno">  211</span>&#160;            0 :</div>
+<div class="line"><a name="l00212"></a><span class="lineno">  212</span>&#160;            threadIdx.x / LOGICAL_WARP_THREADS),</div>
+<div class="line"><a name="l00213"></a><span class="lineno">  213</span>&#160;        lane_id(((LOGICAL_WARPS == 1) || (LOGICAL_WARP_THREADS == <a class="code" href="structcub_1_1_ptx_arch_props.html" title="The architectural properties for the PTX version targeted by the active compiler pass. ">PtxArchProps</a>::WARP_THREADS)) ?</div>
+<div class="line"><a name="l00214"></a><span class="lineno">  214</span>&#160;            LaneId() :</div>
+<div class="line"><a name="l00215"></a><span class="lineno">  215</span>&#160;            threadIdx.x % LOGICAL_WARP_THREADS)</div>
+<div class="line"><a name="l00216"></a><span class="lineno">  216</span>&#160;    {}</div>
+<div class="line"><a name="l00217"></a><span class="lineno">  217</span>&#160;</div>
+<div class="line"><a name="l00218"></a><span class="lineno">  218</span>&#160;</div>
+<div class="line"><a name="l00222"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a037e31be8f0e394e2b7a6ce02f24042e">  222</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_warp_scan.html#a037e31be8f0e394e2b7a6ce02f24042e" title="Collective constructor for 1D thread blocks using the specified memory allocation as temporary storag...">WarpScan</a>(</div>
+<div class="line"><a name="l00223"></a><span class="lineno">  223</span>&#160;        <a class="code" href="structcub_1_1_warp_scan_1_1_temp_storage.html" title="The operations exposed by WarpScan require a temporary memory allocation of this nested type for thre...">TempStorage</a> &amp;temp_storage)             </div>
+<div class="line"><a name="l00224"></a><span class="lineno">  224</span>&#160;    :</div>
+<div class="line"><a name="l00225"></a><span class="lineno">  225</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00226"></a><span class="lineno">  226</span>&#160;        warp_id((LOGICAL_WARPS == 1) ?</div>
+<div class="line"><a name="l00227"></a><span class="lineno">  227</span>&#160;            0 :</div>
+<div class="line"><a name="l00228"></a><span class="lineno">  228</span>&#160;            threadIdx.x / LOGICAL_WARP_THREADS),</div>
+<div class="line"><a name="l00229"></a><span class="lineno">  229</span>&#160;        lane_id(((LOGICAL_WARPS == 1) || (LOGICAL_WARP_THREADS == <a class="code" href="structcub_1_1_ptx_arch_props.html" title="The architectural properties for the PTX version targeted by the active compiler pass. ">PtxArchProps</a>::WARP_THREADS)) ?</div>
+<div class="line"><a name="l00230"></a><span class="lineno">  230</span>&#160;            LaneId() :</div>
+<div class="line"><a name="l00231"></a><span class="lineno">  231</span>&#160;            threadIdx.x % LOGICAL_WARP_THREADS)</div>
+<div class="line"><a name="l00232"></a><span class="lineno">  232</span>&#160;    {}</div>
+<div class="line"><a name="l00233"></a><span class="lineno">  233</span>&#160;</div>
+<div class="line"><a name="l00234"></a><span class="lineno">  234</span>&#160;</div>
+<div class="line"><a name="l00238"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#aa8e1da90057f72813e2ad36af598dcc2">  238</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_warp_scan.html#aa8e1da90057f72813e2ad36af598dcc2" title="Collective constructor using a private static allocation of shared memory as temporary storage...">WarpScan</a>(</div>
+<div class="line"><a name="l00239"></a><span class="lineno">  239</span>&#160;        <span class="keywordtype">int</span> warp_id,                           </div>
+<div class="line"><a name="l00240"></a><span class="lineno">  240</span>&#160;        <span class="keywordtype">int</span> lane_id)                           </div>
+<div class="line"><a name="l00241"></a><span class="lineno">  241</span>&#160;    :</div>
+<div class="line"><a name="l00242"></a><span class="lineno">  242</span>&#160;        temp_storage(PrivateStorage()),</div>
+<div class="line"><a name="l00243"></a><span class="lineno">  243</span>&#160;        warp_id(warp_id),</div>
+<div class="line"><a name="l00244"></a><span class="lineno">  244</span>&#160;        lane_id(lane_id)</div>
+<div class="line"><a name="l00245"></a><span class="lineno">  245</span>&#160;    {}</div>
+<div class="line"><a name="l00246"></a><span class="lineno">  246</span>&#160;</div>
+<div class="line"><a name="l00247"></a><span class="lineno">  247</span>&#160;</div>
+<div class="line"><a name="l00251"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a9787551c8a6e2a23f9d32cd029151093">  251</a></span>&#160;    __device__ __forceinline__ <a class="code" href="classcub_1_1_warp_scan.html#a9787551c8a6e2a23f9d32cd029151093" title="Collective constructor using the specified memory allocation as temporary storage. Threads are identified using the given warp and lane identifiers. ">WarpScan</a>(</div>
+<div class="line"><a name="l00252"></a><span class="lineno">  252</span>&#160;        <a class="code" href="structcub_1_1_warp_scan_1_1_temp_storage.html" title="The operations exposed by WarpScan require a temporary memory allocation of this nested type for thre...">TempStorage</a> &amp;temp_storage,             </div>
+<div class="line"><a name="l00253"></a><span class="lineno">  253</span>&#160;        <span class="keywordtype">int</span> warp_id,                           </div>
+<div class="line"><a name="l00254"></a><span class="lineno">  254</span>&#160;        <span class="keywordtype">int</span> lane_id)                           </div>
+<div class="line"><a name="l00255"></a><span class="lineno">  255</span>&#160;    :</div>
+<div class="line"><a name="l00256"></a><span class="lineno">  256</span>&#160;        temp_storage(temp_storage.Alias()),</div>
+<div class="line"><a name="l00257"></a><span class="lineno">  257</span>&#160;        warp_id(warp_id),</div>
+<div class="line"><a name="l00258"></a><span class="lineno">  258</span>&#160;        lane_id(lane_id)</div>
+<div class="line"><a name="l00259"></a><span class="lineno">  259</span>&#160;    {}</div>
+<div class="line"><a name="l00260"></a><span class="lineno">  260</span>&#160;</div>
+<div class="line"><a name="l00261"></a><span class="lineno">  261</span>&#160;</div>
+<div class="line"><a name="l00263"></a><span class="lineno">  263</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00267"></a><span class="lineno">  267</span>&#160;</div>
+<div class="line"><a name="l00268"></a><span class="lineno">  268</span>&#160;</div>
+<div class="line"><a name="l00300"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a64d246eb963f9a18d964e17a6f73fc27">  300</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#a64d246eb963f9a18d964e17a6f73fc27" title="Computes an inclusive prefix sum in each logical warp. ">InclusiveSum</a>(</div>
+<div class="line"><a name="l00301"></a><span class="lineno">  301</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00302"></a><span class="lineno">  302</span>&#160;        T               &amp;output)            </div>
+<div class="line"><a name="l00303"></a><span class="lineno">  303</span>&#160;    {</div>
+<div class="line"><a name="l00304"></a><span class="lineno">  304</span>&#160;        InternalWarpScan(temp_storage, warp_id, lane_id).InclusiveSum(input, output);</div>
+<div class="line"><a name="l00305"></a><span class="lineno">  305</span>&#160;    }</div>
+<div class="line"><a name="l00306"></a><span class="lineno">  306</span>&#160;</div>
+<div class="line"><a name="l00307"></a><span class="lineno">  307</span>&#160;</div>
+<div class="line"><a name="l00342"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a601da756b6729894ec8a52080d920cd4">  342</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#a601da756b6729894ec8a52080d920cd4" title="Computes an inclusive prefix sum in each logical warp. Also provides every thread with the warp-wide ...">InclusiveSum</a>(</div>
+<div class="line"><a name="l00343"></a><span class="lineno">  343</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00344"></a><span class="lineno">  344</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00345"></a><span class="lineno">  345</span>&#160;        T               &amp;warp_aggregate)    </div>
+<div class="line"><a name="l00346"></a><span class="lineno">  346</span>&#160;    {</div>
+<div class="line"><a name="l00347"></a><span class="lineno">  347</span>&#160;        InternalWarpScan(temp_storage, warp_id, lane_id).InclusiveSum(input, output, warp_aggregate);</div>
+<div class="line"><a name="l00348"></a><span class="lineno">  348</span>&#160;    }</div>
+<div class="line"><a name="l00349"></a><span class="lineno">  349</span>&#160;</div>
+<div class="line"><a name="l00350"></a><span class="lineno">  350</span>&#160;</div>
+<div class="line"><a name="l00425"></a><span class="lineno">  425</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> WarpPrefixOp&gt;</div>
+<div class="line"><a name="l00426"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a906d0d6381b3af1ad105ec69547350f3">  426</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#a906d0d6381b3af1ad105ec69547350f3" title="Computes an inclusive prefix sum in each logical warp. Instead of using 0 as the warp-wide prefix...">InclusiveSum</a>(</div>
+<div class="line"><a name="l00427"></a><span class="lineno">  427</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00428"></a><span class="lineno">  428</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00429"></a><span class="lineno">  429</span>&#160;        T               &amp;warp_aggregate,    </div>
+<div class="line"><a name="l00430"></a><span class="lineno">  430</span>&#160;        WarpPrefixOp    &amp;warp_prefix_op)    </div>
+<div class="line"><a name="l00431"></a><span class="lineno">  431</span>&#160;    {</div>
+<div class="line"><a name="l00432"></a><span class="lineno">  432</span>&#160;        <span class="comment">// Compute inclusive warp scan</span></div>
+<div class="line"><a name="l00433"></a><span class="lineno">  433</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#a64d246eb963f9a18d964e17a6f73fc27" title="Computes an inclusive prefix sum in each logical warp. ">InclusiveSum</a>(input, output, warp_aggregate);</div>
+<div class="line"><a name="l00434"></a><span class="lineno">  434</span>&#160;</div>
+<div class="line"><a name="l00435"></a><span class="lineno">  435</span>&#160;        <span class="comment">// Compute warp-wide prefix from aggregate, then broadcast to other lanes</span></div>
+<div class="line"><a name="l00436"></a><span class="lineno">  436</span>&#160;        T prefix;</div>
+<div class="line"><a name="l00437"></a><span class="lineno">  437</span>&#160;        prefix = warp_prefix_op(warp_aggregate);</div>
+<div class="line"><a name="l00438"></a><span class="lineno">  438</span>&#160;        prefix = InternalWarpScan(temp_storage, warp_id, lane_id).Broadcast(prefix, 0);</div>
+<div class="line"><a name="l00439"></a><span class="lineno">  439</span>&#160;</div>
+<div class="line"><a name="l00440"></a><span class="lineno">  440</span>&#160;        <span class="comment">// Update output</span></div>
+<div class="line"><a name="l00441"></a><span class="lineno">  441</span>&#160;        output = prefix + output;</div>
+<div class="line"><a name="l00442"></a><span class="lineno">  442</span>&#160;    }</div>
+<div class="line"><a name="l00443"></a><span class="lineno">  443</span>&#160;</div>
+<div class="line"><a name="l00445"></a><span class="lineno">  445</span>&#160;</div>
+<div class="line"><a name="l00446"></a><span class="lineno">  446</span>&#160;<span class="keyword">private</span>:</div>
+<div class="line"><a name="l00447"></a><span class="lineno">  447</span>&#160;</div>
+<div class="line"><a name="l00449"></a><span class="lineno">  449</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ExclusiveSum(T input, T &amp;output, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type&lt;true&gt;</a> is_primitive)</div>
+<div class="line"><a name="l00450"></a><span class="lineno">  450</span>&#160;    {</div>
+<div class="line"><a name="l00451"></a><span class="lineno">  451</span>&#160;        <span class="comment">// Compute exclusive warp scan from inclusive warp scan</span></div>
+<div class="line"><a name="l00452"></a><span class="lineno">  452</span>&#160;        T inclusive;</div>
+<div class="line"><a name="l00453"></a><span class="lineno">  453</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#a64d246eb963f9a18d964e17a6f73fc27" title="Computes an inclusive prefix sum in each logical warp. ">InclusiveSum</a>(input, inclusive);</div>
+<div class="line"><a name="l00454"></a><span class="lineno">  454</span>&#160;        output = inclusive - input;</div>
+<div class="line"><a name="l00455"></a><span class="lineno">  455</span>&#160;    }</div>
+<div class="line"><a name="l00456"></a><span class="lineno">  456</span>&#160;</div>
+<div class="line"><a name="l00458"></a><span class="lineno">  458</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ExclusiveSum(T input, T &amp;output, Int2Type&lt;false&gt; is_primitive)</div>
+<div class="line"><a name="l00459"></a><span class="lineno">  459</span>&#160;    {</div>
+<div class="line"><a name="l00460"></a><span class="lineno">  460</span>&#160;        <span class="comment">// Delegate to regular scan for non-primitive types (because we won&#39;t be able to use subtraction)</span></div>
+<div class="line"><a name="l00461"></a><span class="lineno">  461</span>&#160;        T identity = T();</div>
+<div class="line"><a name="l00462"></a><span class="lineno">  462</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#aafbc42fcea0a11b83289629554cbe625" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(input, output, identity, Sum());</div>
+<div class="line"><a name="l00463"></a><span class="lineno">  463</span>&#160;    }</div>
+<div class="line"><a name="l00464"></a><span class="lineno">  464</span>&#160;</div>
+<div class="line"><a name="l00466"></a><span class="lineno">  466</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ExclusiveSum(T input, T &amp;output, T &amp;warp_aggregate, Int2Type&lt;true&gt; is_primitive)</div>
+<div class="line"><a name="l00467"></a><span class="lineno">  467</span>&#160;    {</div>
+<div class="line"><a name="l00468"></a><span class="lineno">  468</span>&#160;        <span class="comment">// Compute exclusive warp scan from inclusive warp scan</span></div>
+<div class="line"><a name="l00469"></a><span class="lineno">  469</span>&#160;        T inclusive;</div>
+<div class="line"><a name="l00470"></a><span class="lineno">  470</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#a64d246eb963f9a18d964e17a6f73fc27" title="Computes an inclusive prefix sum in each logical warp. ">InclusiveSum</a>(input, inclusive, warp_aggregate);</div>
+<div class="line"><a name="l00471"></a><span class="lineno">  471</span>&#160;        output = inclusive - input;</div>
+<div class="line"><a name="l00472"></a><span class="lineno">  472</span>&#160;    }</div>
+<div class="line"><a name="l00473"></a><span class="lineno">  473</span>&#160;</div>
+<div class="line"><a name="l00475"></a><span class="lineno">  475</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ExclusiveSum(T input, T &amp;output, T &amp;warp_aggregate, Int2Type&lt;false&gt; is_primitive)</div>
+<div class="line"><a name="l00476"></a><span class="lineno">  476</span>&#160;    {</div>
+<div class="line"><a name="l00477"></a><span class="lineno">  477</span>&#160;        <span class="comment">// Delegate to regular scan for non-primitive types (because we won&#39;t be able to use subtraction)</span></div>
+<div class="line"><a name="l00478"></a><span class="lineno">  478</span>&#160;        T identity = T();</div>
+<div class="line"><a name="l00479"></a><span class="lineno">  479</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#aafbc42fcea0a11b83289629554cbe625" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(input, output, identity, Sum(), warp_aggregate);</div>
+<div class="line"><a name="l00480"></a><span class="lineno">  480</span>&#160;    }</div>
+<div class="line"><a name="l00481"></a><span class="lineno">  481</span>&#160;</div>
+<div class="line"><a name="l00483"></a><span class="lineno">  483</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> WarpPrefixOp&gt;</div>
+<div class="line"><a name="l00484"></a><span class="lineno">  484</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ExclusiveSum(T input, T &amp;output, T &amp;warp_aggregate, WarpPrefixOp &amp;warp_prefix_op, Int2Type&lt;true&gt; is_primitive)</div>
+<div class="line"><a name="l00485"></a><span class="lineno">  485</span>&#160;    {</div>
+<div class="line"><a name="l00486"></a><span class="lineno">  486</span>&#160;        <span class="comment">// Compute exclusive warp scan from inclusive warp scan</span></div>
+<div class="line"><a name="l00487"></a><span class="lineno">  487</span>&#160;        T inclusive;</div>
+<div class="line"><a name="l00488"></a><span class="lineno">  488</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#a64d246eb963f9a18d964e17a6f73fc27" title="Computes an inclusive prefix sum in each logical warp. ">InclusiveSum</a>(input, inclusive, warp_aggregate, warp_prefix_op);</div>
+<div class="line"><a name="l00489"></a><span class="lineno">  489</span>&#160;        output = inclusive - input;</div>
+<div class="line"><a name="l00490"></a><span class="lineno">  490</span>&#160;    }</div>
+<div class="line"><a name="l00491"></a><span class="lineno">  491</span>&#160;</div>
+<div class="line"><a name="l00493"></a><span class="lineno">  493</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> WarpPrefixOp&gt;</div>
+<div class="line"><a name="l00494"></a><span class="lineno">  494</span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> ExclusiveSum(T input, T &amp;output, T &amp;warp_aggregate, WarpPrefixOp &amp;warp_prefix_op, Int2Type&lt;false&gt; is_primitive)</div>
+<div class="line"><a name="l00495"></a><span class="lineno">  495</span>&#160;    {</div>
+<div class="line"><a name="l00496"></a><span class="lineno">  496</span>&#160;        <span class="comment">// Delegate to regular scan for non-primitive types (because we won&#39;t be able to use subtraction)</span></div>
+<div class="line"><a name="l00497"></a><span class="lineno">  497</span>&#160;        T identity = T();</div>
+<div class="line"><a name="l00498"></a><span class="lineno">  498</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#aafbc42fcea0a11b83289629554cbe625" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(input, output, identity, Sum(), warp_aggregate, warp_prefix_op);</div>
+<div class="line"><a name="l00499"></a><span class="lineno">  499</span>&#160;    }</div>
+<div class="line"><a name="l00500"></a><span class="lineno">  500</span>&#160;</div>
+<div class="line"><a name="l00501"></a><span class="lineno">  501</span>&#160;<span class="keyword">public</span>:</div>
+<div class="line"><a name="l00502"></a><span class="lineno">  502</span>&#160;</div>
+<div class="line"><a name="l00503"></a><span class="lineno">  503</span>&#160;</div>
+<div class="line"><a name="l00504"></a><span class="lineno">  504</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00508"></a><span class="lineno">  508</span>&#160;</div>
+<div class="line"><a name="l00509"></a><span class="lineno">  509</span>&#160;</div>
+<div class="line"><a name="l00547"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#acf4960fcb08e5960ca7c9aa28a34ae1c">  547</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#acf4960fcb08e5960ca7c9aa28a34ae1c" title="Computes an exclusive prefix sum in each logical warp. ">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00548"></a><span class="lineno">  548</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00549"></a><span class="lineno">  549</span>&#160;        T               &amp;output)            </div>
+<div class="line"><a name="l00550"></a><span class="lineno">  550</span>&#160;    {</div>
+<div class="line"><a name="l00551"></a><span class="lineno">  551</span>&#160;        ExclusiveSum(input, output, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type</a>&lt;<a class="code" href="structcub_1_1_traits.html" title="Type traits. ">Traits&lt;T&gt;::PRIMITIVE</a>&gt;());</div>
+<div class="line"><a name="l00552"></a><span class="lineno">  552</span>&#160;    }</div>
+<div class="line"><a name="l00553"></a><span class="lineno">  553</span>&#160;</div>
+<div class="line"><a name="l00554"></a><span class="lineno">  554</span>&#160;</div>
+<div class="line"><a name="l00592"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#ab68084364e2235b53998861731b267f8">  592</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#ab68084364e2235b53998861731b267f8" title="Computes an exclusive prefix sum in each logical warp. Also provides every thread with the warp-wide ...">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00593"></a><span class="lineno">  593</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00594"></a><span class="lineno">  594</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00595"></a><span class="lineno">  595</span>&#160;        T               &amp;warp_aggregate)    </div>
+<div class="line"><a name="l00596"></a><span class="lineno">  596</span>&#160;    {</div>
+<div class="line"><a name="l00597"></a><span class="lineno">  597</span>&#160;        ExclusiveSum(input, output, warp_aggregate, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type</a>&lt;<a class="code" href="structcub_1_1_traits.html" title="Type traits. ">Traits&lt;T&gt;::PRIMITIVE</a>&gt;());</div>
+<div class="line"><a name="l00598"></a><span class="lineno">  598</span>&#160;    }</div>
+<div class="line"><a name="l00599"></a><span class="lineno">  599</span>&#160;</div>
+<div class="line"><a name="l00600"></a><span class="lineno">  600</span>&#160;</div>
+<div class="line"><a name="l00678"></a><span class="lineno">  678</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> WarpPrefixOp&gt;</div>
+<div class="line"><a name="l00679"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a283236673ad2e54579f6b5ee97eac193">  679</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#a283236673ad2e54579f6b5ee97eac193" title="Computes an exclusive prefix sum in each logical warp. Instead of using 0 as the warp-wide prefix...">ExclusiveSum</a>(</div>
+<div class="line"><a name="l00680"></a><span class="lineno">  680</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00681"></a><span class="lineno">  681</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00682"></a><span class="lineno">  682</span>&#160;        T               &amp;warp_aggregate,    </div>
+<div class="line"><a name="l00683"></a><span class="lineno">  683</span>&#160;        WarpPrefixOp    &amp;warp_prefix_op)    </div>
+<div class="line"><a name="l00684"></a><span class="lineno">  684</span>&#160;    {</div>
+<div class="line"><a name="l00685"></a><span class="lineno">  685</span>&#160;        ExclusiveSum(input, output, warp_aggregate, warp_prefix_op, <a class="code" href="structcub_1_1_int2_type.html" title="Allows for the treatment of an integral constant as a type at compile-time (e.g., to achieve static c...">Int2Type</a>&lt;<a class="code" href="structcub_1_1_traits.html" title="Type traits. ">Traits&lt;T&gt;::PRIMITIVE</a>&gt;());</div>
+<div class="line"><a name="l00686"></a><span class="lineno">  686</span>&#160;    }</div>
+<div class="line"><a name="l00687"></a><span class="lineno">  687</span>&#160;</div>
+<div class="line"><a name="l00688"></a><span class="lineno">  688</span>&#160;</div>
+<div class="line"><a name="l00690"></a><span class="lineno">  690</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00694"></a><span class="lineno">  694</span>&#160;</div>
+<div class="line"><a name="l00730"></a><span class="lineno">  730</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l00731"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#aafd14f3920c493b104a3a6a0cc6a39d2">  731</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#aafd14f3920c493b104a3a6a0cc6a39d2" title="Computes an inclusive prefix sum using the specified binary scan functor in each logical warp...">InclusiveScan</a>(</div>
+<div class="line"><a name="l00732"></a><span class="lineno">  732</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00733"></a><span class="lineno">  733</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00734"></a><span class="lineno">  734</span>&#160;        ScanOp          scan_op)            </div>
+<div class="line"><a name="l00735"></a><span class="lineno">  735</span>&#160;    {</div>
+<div class="line"><a name="l00736"></a><span class="lineno">  736</span>&#160;        InternalWarpScan(temp_storage, warp_id, lane_id).InclusiveScan(input, output, scan_op);</div>
+<div class="line"><a name="l00737"></a><span class="lineno">  737</span>&#160;    }</div>
+<div class="line"><a name="l00738"></a><span class="lineno">  738</span>&#160;</div>
+<div class="line"><a name="l00739"></a><span class="lineno">  739</span>&#160;</div>
+<div class="line"><a name="l00779"></a><span class="lineno">  779</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l00780"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a6a2ac5f642393ccfc698aa515e192a22">  780</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#a6a2ac5f642393ccfc698aa515e192a22" title="Computes an inclusive prefix sum using the specified binary scan functor in each logical warp...">InclusiveScan</a>(</div>
+<div class="line"><a name="l00781"></a><span class="lineno">  781</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00782"></a><span class="lineno">  782</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00783"></a><span class="lineno">  783</span>&#160;        ScanOp          scan_op,            </div>
+<div class="line"><a name="l00784"></a><span class="lineno">  784</span>&#160;        T               &amp;warp_aggregate)    </div>
+<div class="line"><a name="l00785"></a><span class="lineno">  785</span>&#160;    {</div>
+<div class="line"><a name="l00786"></a><span class="lineno">  786</span>&#160;        InternalWarpScan(temp_storage, warp_id, lane_id).InclusiveScan(input, output, scan_op, warp_aggregate);</div>
+<div class="line"><a name="l00787"></a><span class="lineno">  787</span>&#160;    }</div>
+<div class="line"><a name="l00788"></a><span class="lineno">  788</span>&#160;</div>
+<div class="line"><a name="l00789"></a><span class="lineno">  789</span>&#160;</div>
+<div class="line"><a name="l00866"></a><span class="lineno">  866</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l00867"></a><span class="lineno">  867</span>&#160;        <span class="keyword">typename</span> ScanOp,</div>
+<div class="line"><a name="l00868"></a><span class="lineno">  868</span>&#160;        <span class="keyword">typename</span> WarpPrefixOp&gt;</div>
+<div class="line"><a name="l00869"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#adf74795dbe02947facd24657bc519c40">  869</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#adf74795dbe02947facd24657bc519c40" title="Computes an inclusive prefix sum using the specified binary scan functor in each logical warp...">InclusiveScan</a>(</div>
+<div class="line"><a name="l00870"></a><span class="lineno">  870</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00871"></a><span class="lineno">  871</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00872"></a><span class="lineno">  872</span>&#160;        ScanOp          scan_op,            </div>
+<div class="line"><a name="l00873"></a><span class="lineno">  873</span>&#160;        T               &amp;warp_aggregate,    </div>
+<div class="line"><a name="l00874"></a><span class="lineno">  874</span>&#160;        WarpPrefixOp    &amp;warp_prefix_op)    </div>
+<div class="line"><a name="l00875"></a><span class="lineno">  875</span>&#160;    {</div>
+<div class="line"><a name="l00876"></a><span class="lineno">  876</span>&#160;        <span class="comment">// Compute inclusive warp scan</span></div>
+<div class="line"><a name="l00877"></a><span class="lineno">  877</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#aafd14f3920c493b104a3a6a0cc6a39d2" title="Computes an inclusive prefix sum using the specified binary scan functor in each logical warp...">InclusiveScan</a>(input, output, scan_op, warp_aggregate);</div>
+<div class="line"><a name="l00878"></a><span class="lineno">  878</span>&#160;</div>
+<div class="line"><a name="l00879"></a><span class="lineno">  879</span>&#160;        <span class="comment">// Compute warp-wide prefix from aggregate, then broadcast to other lanes</span></div>
+<div class="line"><a name="l00880"></a><span class="lineno">  880</span>&#160;        T prefix;</div>
+<div class="line"><a name="l00881"></a><span class="lineno">  881</span>&#160;        prefix = warp_prefix_op(warp_aggregate);</div>
+<div class="line"><a name="l00882"></a><span class="lineno">  882</span>&#160;        prefix = InternalWarpScan(temp_storage, warp_id, lane_id).Broadcast(prefix, 0);</div>
+<div class="line"><a name="l00883"></a><span class="lineno">  883</span>&#160;</div>
+<div class="line"><a name="l00884"></a><span class="lineno">  884</span>&#160;        <span class="comment">// Update output</span></div>
+<div class="line"><a name="l00885"></a><span class="lineno">  885</span>&#160;        output = scan_op(prefix, output);</div>
+<div class="line"><a name="l00886"></a><span class="lineno">  886</span>&#160;    }</div>
+<div class="line"><a name="l00887"></a><span class="lineno">  887</span>&#160;</div>
+<div class="line"><a name="l00888"></a><span class="lineno">  888</span>&#160;</div>
+<div class="line"><a name="l00890"></a><span class="lineno">  890</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l00894"></a><span class="lineno">  894</span>&#160;</div>
+<div class="line"><a name="l00930"></a><span class="lineno">  930</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l00931"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#aafbc42fcea0a11b83289629554cbe625">  931</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#aafbc42fcea0a11b83289629554cbe625" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(</div>
+<div class="line"><a name="l00932"></a><span class="lineno">  932</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00933"></a><span class="lineno">  933</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00934"></a><span class="lineno">  934</span>&#160;        T               identity,           </div>
+<div class="line"><a name="l00935"></a><span class="lineno">  935</span>&#160;        ScanOp          scan_op)            </div>
+<div class="line"><a name="l00936"></a><span class="lineno">  936</span>&#160;    {</div>
+<div class="line"><a name="l00937"></a><span class="lineno">  937</span>&#160;        InternalWarpScan(temp_storage, warp_id, lane_id).ExclusiveScan(input, output, identity, scan_op);</div>
+<div class="line"><a name="l00938"></a><span class="lineno">  938</span>&#160;    }</div>
+<div class="line"><a name="l00939"></a><span class="lineno">  939</span>&#160;</div>
+<div class="line"><a name="l00940"></a><span class="lineno">  940</span>&#160;</div>
+<div class="line"><a name="l00978"></a><span class="lineno">  978</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l00979"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a09d36c6cf146b69c1cf91d4781b96374">  979</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#a09d36c6cf146b69c1cf91d4781b96374" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(</div>
+<div class="line"><a name="l00980"></a><span class="lineno">  980</span>&#160;        T               input,              </div>
+<div class="line"><a name="l00981"></a><span class="lineno">  981</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l00982"></a><span class="lineno">  982</span>&#160;        T               identity,           </div>
+<div class="line"><a name="l00983"></a><span class="lineno">  983</span>&#160;        ScanOp          scan_op,            </div>
+<div class="line"><a name="l00984"></a><span class="lineno">  984</span>&#160;        T               &amp;warp_aggregate)    </div>
+<div class="line"><a name="l00985"></a><span class="lineno">  985</span>&#160;    {</div>
+<div class="line"><a name="l00986"></a><span class="lineno">  986</span>&#160;        InternalWarpScan(temp_storage, warp_id, lane_id).ExclusiveScan(input, output, identity, scan_op, warp_aggregate);</div>
+<div class="line"><a name="l00987"></a><span class="lineno">  987</span>&#160;    }</div>
+<div class="line"><a name="l00988"></a><span class="lineno">  988</span>&#160;</div>
+<div class="line"><a name="l00989"></a><span class="lineno">  989</span>&#160;</div>
+<div class="line"><a name="l01066"></a><span class="lineno"> 1066</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01067"></a><span class="lineno"> 1067</span>&#160;        <span class="keyword">typename</span> ScanOp,</div>
+<div class="line"><a name="l01068"></a><span class="lineno"> 1068</span>&#160;        <span class="keyword">typename</span> WarpPrefixOp&gt;</div>
+<div class="line"><a name="l01069"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#ada12695322d9e1f5354fcae9d0910113"> 1069</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#ada12695322d9e1f5354fcae9d0910113" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01070"></a><span class="lineno"> 1070</span>&#160;        T               input,              </div>
+<div class="line"><a name="l01071"></a><span class="lineno"> 1071</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l01072"></a><span class="lineno"> 1072</span>&#160;        T               identity,           </div>
+<div class="line"><a name="l01073"></a><span class="lineno"> 1073</span>&#160;        ScanOp          scan_op,            </div>
+<div class="line"><a name="l01074"></a><span class="lineno"> 1074</span>&#160;        T               &amp;warp_aggregate,    </div>
+<div class="line"><a name="l01075"></a><span class="lineno"> 1075</span>&#160;        WarpPrefixOp    &amp;warp_prefix_op)    </div>
+<div class="line"><a name="l01076"></a><span class="lineno"> 1076</span>&#160;    {</div>
+<div class="line"><a name="l01077"></a><span class="lineno"> 1077</span>&#160;        <span class="comment">// Exclusive warp scan</span></div>
+<div class="line"><a name="l01078"></a><span class="lineno"> 1078</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#aafbc42fcea0a11b83289629554cbe625" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(input, output, identity, scan_op, warp_aggregate);</div>
+<div class="line"><a name="l01079"></a><span class="lineno"> 1079</span>&#160;</div>
+<div class="line"><a name="l01080"></a><span class="lineno"> 1080</span>&#160;        <span class="comment">// Compute warp-wide prefix from aggregate, then broadcast to other lanes</span></div>
+<div class="line"><a name="l01081"></a><span class="lineno"> 1081</span>&#160;        T prefix = warp_prefix_op(warp_aggregate);</div>
+<div class="line"><a name="l01082"></a><span class="lineno"> 1082</span>&#160;        prefix = InternalWarpScan(temp_storage, warp_id, lane_id).Broadcast(prefix, 0);</div>
+<div class="line"><a name="l01083"></a><span class="lineno"> 1083</span>&#160;</div>
+<div class="line"><a name="l01084"></a><span class="lineno"> 1084</span>&#160;        <span class="comment">// Update output</span></div>
+<div class="line"><a name="l01085"></a><span class="lineno"> 1085</span>&#160;        output = (lane_id == 0) ?</div>
+<div class="line"><a name="l01086"></a><span class="lineno"> 1086</span>&#160;            prefix :</div>
+<div class="line"><a name="l01087"></a><span class="lineno"> 1087</span>&#160;            scan_op(prefix, output);</div>
+<div class="line"><a name="l01088"></a><span class="lineno"> 1088</span>&#160;    }</div>
+<div class="line"><a name="l01089"></a><span class="lineno"> 1089</span>&#160;</div>
+<div class="line"><a name="l01090"></a><span class="lineno"> 1090</span>&#160;</div>
+<div class="line"><a name="l01092"></a><span class="lineno"> 1092</span>&#160;    <span class="comment">/******************************************************************/</span></div>
+<div class="line"><a name="l01096"></a><span class="lineno"> 1096</span>&#160;</div>
+<div class="line"><a name="l01097"></a><span class="lineno"> 1097</span>&#160;</div>
+<div class="line"><a name="l01134"></a><span class="lineno"> 1134</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l01135"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a1f4e88a801bdfdfde342f23fb2768ea8"> 1135</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#a1f4e88a801bdfdfde342f23fb2768ea8" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01136"></a><span class="lineno"> 1136</span>&#160;        T               input,              </div>
+<div class="line"><a name="l01137"></a><span class="lineno"> 1137</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l01138"></a><span class="lineno"> 1138</span>&#160;        ScanOp          scan_op)            </div>
+<div class="line"><a name="l01139"></a><span class="lineno"> 1139</span>&#160;    {</div>
+<div class="line"><a name="l01140"></a><span class="lineno"> 1140</span>&#160;        InternalWarpScan(temp_storage, warp_id, lane_id).ExclusiveScan(input, output, scan_op);</div>
+<div class="line"><a name="l01141"></a><span class="lineno"> 1141</span>&#160;    }</div>
+<div class="line"><a name="l01142"></a><span class="lineno"> 1142</span>&#160;</div>
+<div class="line"><a name="l01143"></a><span class="lineno"> 1143</span>&#160;</div>
+<div class="line"><a name="l01181"></a><span class="lineno"> 1181</span>&#160;    <span class="keyword">template</span> &lt;<span class="keyword">typename</span> ScanOp&gt;</div>
+<div class="line"><a name="l01182"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#af51aef1f68a2ca876f7515b6b3213d72"> 1182</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#af51aef1f68a2ca876f7515b6b3213d72" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01183"></a><span class="lineno"> 1183</span>&#160;        T               input,              </div>
+<div class="line"><a name="l01184"></a><span class="lineno"> 1184</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l01185"></a><span class="lineno"> 1185</span>&#160;        ScanOp          scan_op,            </div>
+<div class="line"><a name="l01186"></a><span class="lineno"> 1186</span>&#160;        T               &amp;warp_aggregate)    </div>
+<div class="line"><a name="l01187"></a><span class="lineno"> 1187</span>&#160;    {</div>
+<div class="line"><a name="l01188"></a><span class="lineno"> 1188</span>&#160;        InternalWarpScan(temp_storage, warp_id, lane_id).ExclusiveScan(input, output, scan_op, warp_aggregate);</div>
+<div class="line"><a name="l01189"></a><span class="lineno"> 1189</span>&#160;    }</div>
+<div class="line"><a name="l01190"></a><span class="lineno"> 1190</span>&#160;</div>
+<div class="line"><a name="l01191"></a><span class="lineno"> 1191</span>&#160;</div>
+<div class="line"><a name="l01268"></a><span class="lineno"> 1268</span>&#160;    <span class="keyword">template</span> &lt;</div>
+<div class="line"><a name="l01269"></a><span class="lineno"> 1269</span>&#160;        <span class="keyword">typename</span> ScanOp,</div>
+<div class="line"><a name="l01270"></a><span class="lineno"> 1270</span>&#160;        <span class="keyword">typename</span> WarpPrefixOp&gt;</div>
+<div class="line"><a name="l01271"></a><span class="lineno"><a class="code" href="classcub_1_1_warp_scan.html#a024d74c48e45b489843053097b0638d1"> 1271</a></span>&#160;    __device__ __forceinline__ <span class="keywordtype">void</span> <a class="code" href="classcub_1_1_warp_scan.html#a024d74c48e45b489843053097b0638d1" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(</div>
+<div class="line"><a name="l01272"></a><span class="lineno"> 1272</span>&#160;        T               input,              </div>
+<div class="line"><a name="l01273"></a><span class="lineno"> 1273</span>&#160;        T               &amp;output,            </div>
+<div class="line"><a name="l01274"></a><span class="lineno"> 1274</span>&#160;        ScanOp          scan_op,            </div>
+<div class="line"><a name="l01275"></a><span class="lineno"> 1275</span>&#160;        T               &amp;warp_aggregate,    </div>
+<div class="line"><a name="l01276"></a><span class="lineno"> 1276</span>&#160;        WarpPrefixOp    &amp;warp_prefix_op)    </div>
+<div class="line"><a name="l01277"></a><span class="lineno"> 1277</span>&#160;    {</div>
+<div class="line"><a name="l01278"></a><span class="lineno"> 1278</span>&#160;        <span class="comment">// Exclusive warp scan</span></div>
+<div class="line"><a name="l01279"></a><span class="lineno"> 1279</span>&#160;        <a class="code" href="classcub_1_1_warp_scan.html#aafbc42fcea0a11b83289629554cbe625" title="Computes an exclusive prefix scan using the specified binary scan functor in each logical warp...">ExclusiveScan</a>(input, output, scan_op, warp_aggregate);</div>
+<div class="line"><a name="l01280"></a><span class="lineno"> 1280</span>&#160;</div>
+<div class="line"><a name="l01281"></a><span class="lineno"> 1281</span>&#160;        <span class="comment">// Compute warp-wide prefix from aggregate, then broadcast to other lanes</span></div>
+<div class="line"><a name="l01282"></a><span class="lineno"> 1282</span>&#160;        T prefix = warp_prefix_op(warp_aggregate);</div>
+<div class="line"><a name="l01283"></a><span class="lineno"> 1283</span>&#160;        prefix = InternalWarpScan(temp_storage, warp_id, lane_id).Broadcast(prefix, 0);</div>
+<div class="line"><a name="l01284"></a><span class="lineno"> 1284</span>&#160;</div>
+<div class="line"><a name="l01285"></a><span class="lineno"> 1285</span>&#160;        <span class="comment">// Update output with prefix</span></div>
+<div class="line"><a name="l01286"></a><span class="lineno"> 1286</span>&#160;        output = (lane_id == 0) ?</div>
+<div class="line"><a name="l01287"></a><span class="lineno"> 1287</span>&#160;            prefix :</div>
+<div class="line"><a name="l01288"></a><span class="lineno"> 1288</span>&#160;            scan_op(prefix, output);</div>
+<div class="line"><a name="l01289"></a><span class="lineno"> 1289</span>&#160;    }</div>
+<div class="line"><a name="l01290"></a><span class="lineno"> 1290</span>&#160;</div>
+<div class="line"><a name="l01292"></a><span class="lineno"> 1292</span>&#160;};</div>
+<div class="line"><a name="l01293"></a><span class="lineno"> 1293</span>&#160;       <span class="comment">// end group WarpModule</span></div>
+<div class="line"><a name="l01295"></a><span class="lineno"> 1295</span>&#160;</div>
+<div class="line"><a name="l01296"></a><span class="lineno"> 1296</span>&#160;}               <span class="comment">// CUB namespace</span></div>
+<div class="line"><a name="l01297"></a><span class="lineno"> 1297</span>&#160;CUB_NS_POSTFIX  <span class="comment">// Optional outer namespace(s)</span></div>
+</div><!-- fragment --></div><!-- contents -->
+<!-- HTML footer for doxygen 1.8.3.1-->
+<!-- start footer part -->
+<hr class="footer"/><address class="footer"><small>
+Generated on Fri Aug 23 2013 17:22:43 for CUB by &#160;<a href="http://www.doxygen.org/index.html">
+<img class="footer" src="doxygen.png" alt="doxygen"/>
+</a> 1.8.4
+<br>
+&copy; 2013 NVIDIA Corporation
+</small></address>
+</body>
+</html>

+Public Methods
+template<typename T >
__host__ __device__ +__forceinline__ bool	operator() (const T &a, const T &b)
	Boolean inequality operator, returns `(a != b)`
+Public Methods
+template<typename T >
__host__ __device__ +__forceinline__ T	operator() (const T &a, const T &b)
	Boolean min operator, returns `(a < b) ? a : b`