In [1]:
import tensorflow as tf
import numpy as np

## 0.前言
在神经网络的计算过程中,经常需要统计数据的各种属性,如最值、最值位置、均值、范数等信息。
由于张量通常较大,直接观察数据很难获得有用信息,通过获取这些张量的统计信息可以较轻松地推测张量数值的分布。

## 1.向量范数

vector norm是表征向量"长度"的一种度量方法，可推广到张量上。常用的范数有
* L1范数，向量所有元素的绝对值之和：$\|x\|_1=\sum_i|x_i|$
* L2范数，向量所有元素的平方之和，再开根号：$\|x\|_2=\sqrt{\sum_ix_i^2}$
* $\infty$范数，向量所有元素的绝对值最大值：$\|x\|_\infty=\mathrm{max}(|x_i|)$

对于矩阵和张量，同样可利用如上公式计算范数，只不过需要先将其打平成向量后再计算

关键函数：`tf.norm(x,ord)`：ord指定为`1`、`2`、`np.inf`

In [2]:
x=tf.ones([2,2])
print(tf.norm(x,ord=1))
print(tf.norm(x,ord=2))
print(tf.norm(x,ord=np.inf))

tf.Tensor(4.0, shape=(), dtype=float32)
tf.Tensor(2.0, shape=(), dtype=float32)
tf.Tensor(1.0, shape=(), dtype=float32)


## 2.最值、均值、和

求解张量在某个维度上的最大值、最小值、平均值、和的关键函数：
* `tf.reduce_max(x,axis)`
* `tf.reduce_min(x,axis)`
* `tf.reduce_mean(x,axis)`
* `tf.reduce_sum(x,axis)`

当不指定axis时，求解全局元素的最大、最小、平均值、和

In [3]:
x=tf.random.normal([4,10]) # 将x视为4个样本，每个样本10个类别的概率预测
max_vals=tf.reduce_max(x,axis=1) # 求每个样本的最大值
print(max_vals.shape)
min_vals=tf.reduce_min(x,axis=1) # 求每个样本的最小值
print(min_vals.shape)
mean_vals=tf.reduce_mean(x,axis=1) # 求每个样本的平均值
print(mean_vals.shape)
sum_vals=tf.reduce_mean(x,axis=-1) # 求每个样本的平均值
print(sum_vals.shape)

# 测试不指定axis
print(tf.reduce_mean(x))
print(tf.reduce_mean(mean_vals))
print(tf.abs(tf.reduce_mean(x)-tf.reduce_mean(mean_vals)))
print(tf.abs(tf.reduce_mean(x)-tf.reduce_mean(mean_vals))<1e-6)

(4,)
(4,)
(4,)
(4,)
tf.Tensor(-0.038900096, shape=(), dtype=float32)
tf.Tensor(-0.038900107, shape=(), dtype=float32)
tf.Tensor(1.1175871e-08, shape=(), dtype=float32)
tf.Tensor(True, shape=(), dtype=bool)


有时需要求最大值、最小值等的位置索引（如分类任务的最后预测）,关键函数:
* `tf.argmax(x,axis)`
* `tf.argmin(x,axis)`

In [4]:
out=tf.random.normal([2,10]) # 考虑两个样本
p=tf.nn.softmax(out,axis=1) # 对每个样本进行归一化

pred=tf.argmax(p,axis=1) # 找出每个样本的最大值位置
print(pred)


tf.Tensor([4 3], shape=(2,), dtype=int64)


In [None]:
import os
pid=os.getpid()
!kill -9 $pid


