In [2]:
import tensorflow as tf

In [3]:
X = tf.constant([[1.0, 2.0], 
                 [3.0, 4.0]])

print(X)
print(X.shape)
print(X.dtype)

tf.Tensor(
[[1. 2.]
 [3. 4.]], shape=(2, 2), dtype=float32)
(2, 2)
<dtype: 'float32'>


The most important attributes of a tf.Tensor are its shape, and dtype.
- Tensor.shape
- Tensor.dtype

Tensorflow implements standard mathematical operations on tensors, as well as operations specified for machine learning.

In [4]:
X + X

<tf.Tensor: shape=(2, 2), dtype=float32, numpy=
array([[2., 4.],
       [6., 8.]], dtype=float32)>

##   TensorFlow 中 tensor 的转置（tf.transpose）逻辑说明：


### TensorFlow 中 tensor 的转置（tf.transpose）逻辑说明：

1. perm 的含义：perm 是一个长度为 n 的整数列表，表示输出的第 k 个维度来自输入的第 perm[k] 个维度。
   - 因此输出张量 y 的形状满足：y.shape[k] = x.shape[perm[k]]。
   - 默认情况下，perm 会被设置为 [n-1, n-2, ..., 0]，也就是将维度反转（对 2D 就是常规矩阵转置）。

2. 索引映射（更直观）：
   - 如果 y = tf.transpose(x, perm)，则
     y[i0, i1, ..., i{n-1}] = x[i_{perm[0]}, i_{perm[1]}, ..., i_{perm[n-1]}]。
   - 例如：对于 2D（矩阵），perm=[1,0]，有 y[i,j] = x[j,i]；
     对于 3D，perm=[1,0,2]，有 y[a,b,c] = x[b,a,c]（即交换第 0、1 两个维度）。

3. conjugate 参数（仅对复数类型有效）：
   - 如果 x.dtype 是 complex64 或 complex128，且调用 tf.transpose(x, conjugate=True)，
     那么在转置的同时还会对数值做共轭（相当于复共轭转置）。

4. 使用建议与注意事项：
   - 对于高维张量，明确写出 perm 更易读也更可控；
   - 如果只想交换两个维度，可用 perm 指定对应位置交换；
   - 转置通常不改变内存占用，但可能改变内存布局，影响后续操作性能。

## 详细演示 tf.transpose 元素转换过程

### 核心原理：索引映射规则
如果 `y = tf.transpose(x, perm)`，那么：
**`y[i0, i1, ..., i_{n-1}] = x[i_{perm[0]}, i_{perm[1]}, ..., i_{perm[n-1]}]`**

这意味着：
- 输出张量 y 在位置 `[i0, i1, ..., i_{n-1}]` 的元素
- 来自输入张量 x 在位置 `[i_{perm[0]}, i_{perm[1]}, ..., i_{perm[n-1]}]` 的元素

下面我们用具体例子来演示这个转换过程：

In [30]:
# 示例1：2D矩阵转置 - 逐步演示元素转换
import tensorflow as tf
import numpy as np

print("=" * 60)
print("示例1：2D矩阵转置 perm=[1,0]")
print("=" * 60)

# 创建一个2x3的矩阵
A = tf.constant([[10, 20, 30], 
                 [40, 50, 60]])
print("原始矩阵 A (shape: 2x3):")
print(A.numpy())

# 转置：perm=[1,0] 意味着新矩阵的维度0来自原矩阵的维度1，维度1来自原矩阵的维度0
A_t = tf.transpose(A, perm=[1, 0])
print(f"\n转置后 A_t (shape: 3x2):")
print(A_t.numpy())

print("\n元素转换过程详解:")
print("根据规则：A_t[i,j] = A[j,i] (因为perm=[1,0])")
print()

# 逐个验证每个元素的转换
for i in range(3):  # A_t的行
    for j in range(2):  # A_t的列
        print(f"A_t[{i},{j}] = A[{j},{i}] = {A_t[i,j].numpy()} (来自 A[{j},{i}] = {A[j,i].numpy()})")

print("\n可视化转换过程:")
print("A[0,0]=10 → A_t[0,0]=10")
print("A[0,1]=20 → A_t[1,0]=20") 
print("A[0,2]=30 → A_t[2,0]=30")
print("A[1,0]=40 → A_t[0,1]=40")
print("A[1,1]=50 → A_t[1,1]=50")
print("A[1,2]=60 → A_t[2,1]=60")

示例1：2D矩阵转置 perm=[1,0]
原始矩阵 A (shape: 2x3):
[[10 20 30]
 [40 50 60]]

转置后 A_t (shape: 3x2):
[[10 40]
 [20 50]
 [30 60]]

元素转换过程详解:
根据规则：A_t[i,j] = A[j,i] (因为perm=[1,0])

A_t[0,0] = A[0,0] = 10 (来自 A[0,0] = 10)
A_t[0,1] = A[1,0] = 40 (来自 A[1,0] = 40)
A_t[1,0] = A[0,1] = 20 (来自 A[0,1] = 20)
A_t[1,1] = A[1,1] = 50 (来自 A[1,1] = 50)
A_t[2,0] = A[0,2] = 30 (来自 A[0,2] = 30)
A_t[2,1] = A[1,2] = 60 (来自 A[1,2] = 60)

可视化转换过程:
A[0,0]=10 → A_t[0,0]=10
A[0,1]=20 → A_t[1,0]=20
A[0,2]=30 → A_t[2,0]=30
A[1,0]=40 → A_t[0,1]=40
A[1,1]=50 → A_t[1,1]=50
A[1,2]=60 → A_t[2,1]=60


In [31]:
print("\n" + "=" * 60)
print("示例2：3D张量转置 perm=[2,1,0] - 完全反转维度")
print("=" * 60)

# 创建一个2x2x3的3D张量
B = tf.constant([[[100, 101, 102], 
                  [110, 111, 112]], 
                 [[200, 201, 202], 
                  [210, 211, 212]]])

print("原始3D张量 B (shape: 2x2x3):")
print("B[0,:,:] =")
print(B[0,:,:].numpy())
print("B[1,:,:] =") 
print(B[1,:,:].numpy())

# 转置：perm=[2,1,0] 意味着：
# - 新张量的维度0来自原张量的维度2
# - 新张量的维度1来自原张量的维度1  
# - 新张量的维度2来自原张量的维度0
B_t = tf.transpose(B, perm=[2, 1, 0])
print(f"\n转置后 B_t (shape: 3x2x2):")
print("B_t[0,:,:] =")
print(B_t[0,:,:].numpy())
print("B_t[1,:,:] =")
print(B_t[1,:,:].numpy()) 
print("B_t[2,:,:] =")
print(B_t[2,:,:].numpy())

print("\n元素转换规则：B_t[i,j,k] = B[k,j,i] (因为perm=[2,1,0])")
print("\n验证几个关键元素的转换:")

# 选择几个具体位置验证
test_positions = [(0,0,0), (0,1,1), (1,0,1), (2,1,0)]

for i, j, k in test_positions:
    original_val = B[k, j, i].numpy()  # 根据perm=[2,1,0]，B_t[i,j,k] = B[k,j,i]
    transposed_val = B_t[i, j, k].numpy()
    print(f"B_t[{i},{j},{k}] = {transposed_val} ← B[{k},{j},{i}] = {original_val}")
    assert transposed_val == original_val, "转换验证失败！"


示例2：3D张量转置 perm=[2,1,0] - 完全反转维度
原始3D张量 B (shape: 2x2x3):
B[0,:,:] =
[[100 101 102]
 [110 111 112]]
B[1,:,:] =
[[200 201 202]
 [210 211 212]]

转置后 B_t (shape: 3x2x2):
B_t[0,:,:] =
[[100 200]
 [110 210]]
B_t[1,:,:] =
[[101 201]
 [111 211]]
B_t[2,:,:] =
[[102 202]
 [112 212]]

元素转换规则：B_t[i,j,k] = B[k,j,i] (因为perm=[2,1,0])

验证几个关键元素的转换:
B_t[0,0,0] = 100 ← B[0,0,0] = 100
B_t[0,1,1] = 210 ← B[1,1,0] = 210
B_t[1,0,1] = 201 ← B[1,0,1] = 201
B_t[2,1,0] = 112 ← B[0,1,2] = 112


In [32]:
print("\n" + "=" * 60)
print("示例3：3D张量部分维度交换 perm=[1,0,2]")
print("=" * 60)

# 创建一个更直观的3D张量，每个元素包含其坐标信息
C = tf.constant([[[100, 101], [110, 111], [120, 121]], 
                 [[200, 201], [210, 211], [220, 221]]])

print("原始3D张量 C (shape: 2x3x2):")
print("可以理解为2个3x2的矩阵:")
for i in range(2):
    print(f"C[{i},:,:] =")
    print(C[i,:,:].numpy())

# perm=[1,0,2] 意味着只交换第0和第1维，第2维保持不变
C_t = tf.transpose(C, perm=[1, 0, 2])
print(f"\n转置后 C_t (shape: 3x2x2):")
print("现在变成3个2x2的矩阵:")
for i in range(3):
    print(f"C_t[{i},:,:] =")
    print(C_t[i,:,:].numpy())

print("\n元素转换规则：C_t[i,j,k] = C[j,i,k] (因为perm=[1,0,2])")
print("详细转换过程:")

# 展示所有元素的转换
for i in range(3):  # 新张量的第0维
    for j in range(2):  # 新张量的第1维  
        for k in range(2):  # 新张量的第2维
            original_val = C[j, i, k].numpy()  # C_t[i,j,k] = C[j,i,k]
            transposed_val = C_t[i, j, k].numpy()
            print(f"C_t[{i},{j},{k}] = {transposed_val:3d} ← C[{j},{i},{k}] = {original_val:3d}")

print("\n观察：第2维（最后一维）的元素保持在相同位置，只有前两维进行了交换")


示例3：3D张量部分维度交换 perm=[1,0,2]
原始3D张量 C (shape: 2x3x2):
可以理解为2个3x2的矩阵:
C[0,:,:] =
[[100 101]
 [110 111]
 [120 121]]
C[1,:,:] =
[[200 201]
 [210 211]
 [220 221]]

转置后 C_t (shape: 3x2x2):
现在变成3个2x2的矩阵:
C_t[0,:,:] =
[[100 101]
 [200 201]]
C_t[1,:,:] =
[[110 111]
 [210 211]]
C_t[2,:,:] =
[[120 121]
 [220 221]]

元素转换规则：C_t[i,j,k] = C[j,i,k] (因为perm=[1,0,2])
详细转换过程:
C_t[0,0,0] = 100 ← C[0,0,0] = 100
C_t[0,0,1] = 101 ← C[0,0,1] = 101
C_t[0,1,0] = 200 ← C[1,0,0] = 200
C_t[0,1,1] = 201 ← C[1,0,1] = 201
C_t[1,0,0] = 110 ← C[0,1,0] = 110
C_t[1,0,1] = 111 ← C[0,1,1] = 111
C_t[1,1,0] = 210 ← C[1,1,0] = 210
C_t[1,1,1] = 211 ← C[1,1,1] = 211
C_t[2,0,0] = 120 ← C[0,2,0] = 120
C_t[2,0,1] = 121 ← C[0,2,1] = 121
C_t[2,1,0] = 220 ← C[1,2,0] = 220
C_t[2,1,1] = 221 ← C[1,2,1] = 221

观察：第2维（最后一维）的元素保持在相同位置，只有前两维进行了交换


### 总结：tf.transpose 元素转换的核心规律

1. **索引映射公式**：`y[i0, i1, ..., i_{n-1}] = x[i_{perm[0]}, i_{perm[1]}, ..., i_{perm[n-1]}]`

2. **维度变换**：`y.shape[k] = x.shape[perm[k]]`

3. **直观理解**：
   - `perm[k]` 告诉我们新张量的第k维来自原张量的第`perm[k]`维
   - 每个元素都会根据这个映射规则"搬家"到新位置

4. **常见用法**：
   - `perm=[1,0]`：2D矩阵的标准转置
   - `perm=[2,1,0]`：完全反转所有维度
   - `perm=[1,0,2]`：只交换前两维，保持其他维度不变

下面运行一个交互式的验证工具：

##  Tenforflow concat 

Concatenates tensors along one dimension.  Concatenates the list of tensors values along dimension axis. 