# 深度学习概述

深度学习是机器学习的一个分支，通过多层神经网络自动提取数据特征进行学习和预测。它在图像识别、语音识别、自然语言处理等领域取得了显著的成果。

## 深度学习的基础

深度学习的核心是神经网络。神经网络由输入层、隐藏层和输出层组成。每一层由多个神经元构成，神经元之间通过权重连接，形成复杂的网络结构。

### 神经元

神经元是神经网络的基本单位。每个神经元接收输入信号，通过激活函数进行处理，输出结果。常见的激活函数有ReLU、Sigmoid、Tanh等。

In [None]:
import numpy as np
import matplotlib.pyplot as plt

# 设置字体和解决负号显示问题
plt.rcParams['font.sans-serif'] = 'Hiragino Sans GB'
plt.rcParams['axes.unicode_minus'] = False

# 定义激活函数
x = np.linspace(-10, 10, 100)
relu = np.maximum(0, x)
sigmoid = 1 / (1 + np.exp(-x))
tanh = np.tanh(x)

# 绘制激活函数
plt.figure(figsize=(12, 6))
plt.plot(x, relu, label='ReLU')
plt.plot(x, sigmoid, label='Sigmoid')
plt.plot(x, tanh, label='Tanh')
plt.title('常见激活函数')
plt.xlabel('输入值')
plt.ylabel('输出值')
plt.legend()
plt.show()

## 深度学习框架

常用的深度学习框架包括TensorFlow、Keras、PyTorch等。这些框架提供了高效的计算图和自动求导机制，极大地方便了深度学习模型的构建和训练。

In [None]:
# 示例：使用TensorFlow构建一个简单的全连接神经网络
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# 构建模型
model = Sequential([
    Dense(128, activation='relu', input_shape=(784,)),
    Dense(64, activation='relu'),
    Dense(10, activation='softmax')
])

# 编译模型
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])

# 输出模型摘要
model.summary()

## 深度学习的应用

深度学习在许多领域都有广泛的应用，以下是几个典型的例子：

### 图像识别

通过卷积神经网络（CNN），深度学习在图像分类、目标检测、图像分割等任务中表现出色。

In [None]:
# 示例：使用Keras加载预训练的ResNet50模型进行图像分类
from tensorflow.keras.applications import ResNet50
from tensorflow.keras.applications.resnet50 import preprocess_input, decode_predictions
from tensorflow.keras.preprocessing import image

# 加载预训练模型
model = ResNet50(weights='imagenet')

# 加载和预处理图像
img_path = 'elephant.jpg'  # 替换为实际图像路径
img = image.load_img(img_path, target_size=(224, 224))
img_array = image.img_to_array(img)
img_array = np.expand_dims(img_array, axis=0)
img_array = preprocess_input(img_array)

# 进行预测
preds = model.predict(img_array)
print('Predicted:', decode_predictions(preds, top=3)[0])

### 自然语言处理

通过循环神经网络（RNN）和变换器（Transformer），深度学习在机器翻译、情感分析、文本生成等任务中取得了显著的进展。

In [None]:
# 示例：使用Transformers库加载预训练的GPT-2模型进行文本生成
from transformers import GPT2LMHeadModel, GPT2Tokenizer

# 加载模型和分词器
tokenizer = GPT2Tokenizer.from_pretrained('gpt2')
model = GPT2LMHeadModel.from_pretrained('gpt2')

# 输入文本
input_text = 'Deep learning is'
input_ids = tokenizer.encode(input_text, return_tensors='pt')

# 生成文本
output = model.generate(input_ids, max_length=50, num_return_sequences=1)

# 输出生成的文本
print(tokenizer.decode(output[0], skip_special_tokens=True))

通过以上示例，我们了解了深度学习的基础知识、框架和典型应用。在接下来的章节中，我们将深入探讨神经网络、卷积神经网络、循环神经网络和生成对抗网络的原理和应用。