In [1]:
import tensorflow as tf
print(tf.__version__)

2.0.0


# 张量的排序和取最值

本节目标：了解张量相关的排序操作，取最值操作：
- 直接排序
    - 直接排序 sort
    - 返回排序索引 

# 1 排序
## 1.1 sort：返回逆序排序后的Tensor

In [5]:
a = tf.random.shuffle(tf.range(6))
print(a)

tf.Tensor([0 4 1 5 3 2], shape=(6,), dtype=int32)


In [None]:
tf.sort(a)  # 默认是顺序排列

In [None]:
tf.sort(a, direction='ASCENDING')  # 默认顺序排列

In [None]:
tf.sort(a, direction='DESCENDING')  # 指定逆序排列

也对多维Tensor排序，当对多维Tensor进行排序时，可以通过axis参数指定需要排序的维度，默认axis默认值为-1，也就是对最后一维进行排序。

In [None]:
b = tf.random.uniform([3, 3], minval=1, maxval=10,dtype=tf.int32)

In [None]:
b

In [None]:
tf.sort(b)

In [None]:
tf.sort(b,axis=0)  # 通过axis参数指定第一维度，也就是列进行排序

# 1.2 argsort：返回排序后的索引

In [None]:
a

In [None]:
tf.argsort(a, direction='ASCENDING') # 返回排序之后的索引组成的Tensor, 默认是顺序排列

In [None]:
tf.argsort(a, direction='DESCENDING') # n逆序排列

可以通过axis参数指定需要排序的维度，默认获取-1维度排序后索引：

In [None]:
b

In [None]:
tf.argsort(b)  # 默认对最后一维度排序，也就是以行为单位排序

In [None]:
tf.argsort(b,axis=0)  # 指定第一维度进行排序，也就是以列为单位进行排序

返回的张量中，每一个元素表示b中原来元素在该行中的索引。

# 1.3 top_k：返回逆序排序后的前$k$个元素组成的Tensor

sort()方法和argsort()方法都是对给定Tensor的所有元素进行排序，在某些情况下如果我们只是要获取排序的前几个元素，这时候使用sort()或argsort()方法就有些浪费时间了，这时候可以使用top_k()方法。top_k()方法可以指定获取前k个元素。

注意：top_k()方法在tf.math模块中。

In [None]:
a

In [None]:
top_2 = tf.math.top_k(a, 2)  # 获取排序后前两位

In [None]:
top_2

从上述输出可以看到，top_k()方法返回的是一个TopKV2类型对象，内部包含两部分数据：第一部分是排序后的真实数据[5, 4]，可以通过TopKV2对象的values属性获取；第二部分是排序后数据所在原Tensor中的索引[2, 5]，可以通过TopKV2对象的indices获取。

In [None]:
top_2.values

In [None]:
top_2.indices

对于高维Tensor也是一样的:

In [None]:
b

In [None]:
tf.math.top_k(b, 2)

注意：top_k()方法只能对最后一维度进行排序。

# 2 最小值、最大值、平均值

# 2.1 reduce_min、reduce_max、reduce_mean

**（1）reduce_min()：求最小值**

In [None]:
a = tf.random.uniform([3, 3], minval=1, maxval=10, dtype=tf.int32)

In [None]:
a

不指定维度时，获取整个Tensor的最小值：

In [None]:
tf.reduce_min(a)  # 最小值

通过axis参数可以对指定维度求最小值：

In [None]:
 tf.reduce_min(a, axis=0)  # 求指定维度的最小值

**（2）reduce_max():求最大值**

In [None]:
tf.reduce_max(a)  # 最大值

In [None]:
 tf.reduce_max(a, axis=-1)  # 求最后一维度的最大值

**（3）reduce_mean():求平均值**

不指定维度时，求整个Tensor所有元素的平均值：

In [None]:
 tf.reduce_mean(a)  # 整个Tensor所有元素的平均值

In [None]:
tf.reduce_mean(a, axis=0)  # 求第一维度（行）均值

在上面求均值的例子中，因为Tensor的dtype为int32，所以求出来的均值也是int32，而不是浮点型。如果需要求浮点型的均值，就需要将a的类型先转换为float32：

In [None]:
tf.reduce_mean(tf.cast(a, tf.float32), axis=0)

# 2.2 argmin()、argmax()

argmin()、argmax()返回最大值最小值的索引组成的Tensor。

**（1）argmin():求最小值索引**

In [None]:
a = tf.random.uniform([3,3],minval=1, maxval=10, dtype=tf.int32)

In [None]:
a

In [None]:
b = tf.random.uniform([3,3,3],minval=1, maxval=10, dtype=tf.int32)

In [None]:
b

In [None]:
tf.argmin(a)  # 默认是第0维度

In [None]:
tf.argmin(b)

对于shape为（3, 3）的Tensor，argmin(a)返回的是shape为（3,）的Tensor，因为没有指定比较的维度，默认比较的是第0维度的元素，也就是每一列数据；对于shape为（3，3,3）的Tensor，argmin(a)返回的是shape为（3,3）的Tensor，默认比较的是第0维度的元素，也就是每一块对应位置的元素，例如第一块的5、第二块的9、第三块的9比较，第一块的5最小，索引为0，所以返回的Tensor中第一个元素是0。

注意：argmin()方法在没有指定维度时，默认返回的是第0维度最小值的索引，这与reducemin()方法不同，reducemin()方法在没有指定维度是是返回整个Tensor中所有元素中的最小值。

**（2）argmax():求最大值索引**

In [None]:
a = tf.random.uniform([3,3,3],minval=1, maxval=10, dtype=tf.int32)

In [None]:
a

In [None]:
tf.argmax(a, axis=0)  # 第一维度，也就是每一块

In [None]:
tf.argmax(a, axis=2)  # 第三维度，也就是每一行

