TensorFlow 模型保存与加载

TensorFlow 提供了多种方法来保存和加载模型，以便在训练后存储模型、分享模型或在生产环境中部署模型。使用 Keras API，保存和加载模型的过程非常简单，同时支持多种格式（如 HDF5、SavedModel）和场景（如推理、继续训练）。本教程将详细介绍 TensorFlow 中模型保存与加载的核心方法、常用格式和一个实用示例，适合初学者和需要快速参考的用户。如果需要高级用法（如部署到 TensorFlow Serving 或 TensorFlow Lite）或特定场景，请告诉我！

1. 核心概念

保存模型：将模型的架构、权重和优化器状态保存到磁盘。
加载模型：恢复保存的模型以进行推理、继续训练或部署。
常见格式：
HDF5 (.h5)：Keras 的传统格式，适合保存整个模型（架构 + 权重 + 优化器状态）。
SavedModel：TensorFlow 推荐的格式，跨平台兼容，适合生产环境。
Weights Only：仅保存模型权重，需单独定义模型架构。
Checkpoint：保存检查点，用于恢复训练或断点续训。
应用场景：
保存训练好的模型以供后续使用。
断点续训（恢复优化器状态）。
模型部署（TensorFlow Serving、TensorFlow Lite）。

2. 保存与加载方法

2.1 保存和加载整个模型（HDF5 格式）

保存整个模型（架构、权重、优化器状态）到单个 .h5 文件。

保存：

  model.save('model.h5')

加载：

  loaded_model = tf.keras.models.load_model('model.h5')

优点：简单，包含所有信息，适合快速保存和恢复。
缺点：文件较大，不适合跨平台或生产环境部署。

2.2 保存和加载 SavedModel 格式

SavedModel 是 TensorFlow 的标准格式，适合生产环境和跨平台使用。

保存：

  model.save('saved_model')  # 保存到目录

加载：

  loaded_model = tf.keras.models.load_model('saved_model')

优点：支持 TensorFlow Serving、TensorFlow Lite 转换，跨语言兼容。
缺点：生成目录而非单一文件，占用空间稍大。

2.3 仅保存和加载权重

仅保存模型权重，需手动定义模型架构。

保存权重：

  model.save_weights('model_weights.h5')

加载权重：

  # 先定义模型架构
  model = tf.keras.Sequential([...])  # 必须与保存时相同
  model.load_weights('model_weights.h5')

优点：文件较小，适合共享权重。
缺点：需单独定义模型架构，加载时需编译模型。

2.4 使用检查点（Checkpoint）

检查点用于保存模型权重或整个模型，适合断点续训。

创建检查点：

  checkpoint = tf.keras.callbacks.ModelCheckpoint(
      'checkpoint/checkpoint_{epoch:02d}.h5',
      save_best_only=True,  # 仅保存最佳模型
      monitor='val_loss'    # 监控验证损失
  )
  model.fit(..., callbacks=[checkpoint])

加载检查点：

  model.load_weights('checkpoint/checkpoint_05.h5')

优点：支持动态保存，适合长时间训练。
缺点：需管理多个检查点文件。

2.5 TensorFlow Lite 模型（用于移动端/嵌入式设备）

将模型转换为 TensorFlow Lite 格式，优化推理性能。

转换：

  converter = tf.lite.TFLiteConverter.from_keras_model(model)
  tflite_model = converter.convert()
  with open('model.tflite', 'wb') as f:
      f.write(tflite_model)

加载与推理：

  interpreter = tf.lite.Interpreter(model_path='model.tflite')
  interpreter.allocate_tensors()

优点：模型体积小，适合移动设备。
缺点：不支持训练，仅用于推理。

3. 完整示例：保存与加载 MNIST 模型

以下是一个完整的示例，展示如何在 MNIST 数据集上训练模型，并使用多种格式保存和加载。

import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist
import numpy as np

# 1. 加载和预处理数据
(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0  # 归一化
x_train = x_train[..., np.newaxis]  # 增加通道维度 (28, 28) -> (28, 28, 1)
x_test = x_test[..., np.newaxis]

# 创建数据管道
train_dataset = (tf.data.Dataset.from_tensor_slices((x_train, y_train))
                 .shuffle(1000)
                 .batch(32)
                 .prefetch(tf.data.AUTOTUNE))
test_dataset = tf.data.Dataset.from_tensor_slices((x_test, y_test)).batch(32)

# 2. 构建模型
model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(128, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(10, activation='softmax')
])

# 3. 编译和训练
model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
model.fit(train_dataset, epochs=5, validation_data=test_dataset)

# 4. 评估原始模型
test_loss, test_acc = model.evaluate(test_dataset)
print(f'\n原始模型测试准确率: {test_acc:.4f}')

# 5. 保存和加载模型（多种方式）

# 5.1 保存整个模型（HDF5）
model.save('mnist_model.h5')
loaded_h5_model = tf.keras.models.load_model('mnist_model.h5')
test_loss, test_acc = loaded_h5_model.evaluate(test_dataset)
print(f'HDF5 模型测试准确率: {test_acc:.4f}')

# 5.2 保存 SavedModel
model.save('mnist_saved_model')
loaded_saved_model = tf.keras.models.load_model('mnist_saved_model')
test_loss, test_acc = loaded_saved_model.evaluate(test_dataset)
print(f'SavedModel 测试准确率: {test_acc:.4f}')

# 5.3 保存权重
model.save_weights('mnist_weights.h5')
# 重建模型并加载权重
new_model = models.Sequential([
    layers.Conv2D(32, (3, 3), activation='relu', input_shape=(28, 28, 1)),
    layers.MaxPooling2D((2, 2)),
    layers.Flatten(),
    layers.Dense(128, activation='relu'),
    layers.Dropout(0.5),
    layers.Dense(10, activation='softmax')
])
new_model.compile(optimizer='adam', loss='sparse_categorical_crossentropy', metrics=['accuracy'])
new_model.load_weights('mnist_weights.h5')
test_loss, test_acc = new_model.evaluate(test_dataset)
print(f'权重加载模型测试准确率: {test_acc:.4f}')

# 5.4 使用检查点
checkpoint = tf.keras.callbacks.ModelCheckpoint(
    'checkpoints/checkpoint_{epoch:02d}.h5',
    save_best_only=True,
    monitor='val_accuracy'
)
model.fit(train_dataset, epochs=3, validation_data=test_dataset, callbacks=[checkpoint])
# 加载检查点
model.load_weights('checkpoints/checkpoint_03.h5')
test_loss, test_acc = model.evaluate(test_dataset)
print(f'检查点模型测试准确率: {test_acc:.4f}')

# 5.5 保存为 TensorFlow Lite
converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()
with open('mnist_model.tflite', 'wb') as f:
    f.write(tflite_model)

4. 代码逐部分解释

4.1 数据加载与预处理

MNIST 数据集：60,000 张训练图像，10,000 张测试图像，28×28 灰度图。
归一化：像素值缩放到 [0,1]。
数据管道：使用 tf.data 实现打乱、批处理和预取。

4.2 模型结构

卷积神经网络（CNN）：包含卷积层、池化层和全连接层，适合图像分类。
Dropout：防止过拟合。
输出层：10 个类别，softmax 激活。

4.3 训练

训练 5 个 epoch，测试准确率通常在 98%-99%。
使用 Adam 优化器和交叉熵损失。

4.4 保存与加载

HDF5：保存整个模型，加载后直接使用。
SavedModel：保存到目录，适合生产环境。
权重：仅保存权重，需重建模型架构。
检查点：动态保存最佳模型，适合断点续训。
TensorFlow Lite：生成轻量级模型，适合移动设备推理。

5. 运行结果

原始模型：测试准确率约为 0.98-0.99。
加载模型：HDF5、SavedModel 和权重加载后的准确率与原始模型一致。
检查点：加载最佳检查点后准确率保持一致。
TensorFlow Lite：生成 .tflite 文件，可用于移动端推理。

示例输出：

原始模型测试准确率: 0.9875
HDF5 模型测试准确率: 0.9875
SavedModel 测试准确率: 0.9875
权重加载模型测试准确率: 0.9875
检查点模型测试准确率: 0.9875

6. 常见问题与解决

加载 HDF5 失败：
确保文件路径正确，文件未损坏。
检查 TensorFlow 版本兼容性（HDF5 格式可能因版本不同而报错）。
SavedModel 加载慢：
确保磁盘空间足够，目录完整。
使用 tf.keras.models.load_model 而非低级 API。
权重加载错误：
确保加载权重的模型架构与保存时完全一致。
检查输入形状和层配置。
检查点恢复失败：
确保检查点文件存在，路径正确。
检查 monitor 指标是否与训练时一致。
TensorFlow Lite 推理问题：
确保输入数据格式与模型预期一致（例如形状、数据类型）。
检查是否需要量化（converter.optimizations = [tf.lite.Optimize.DEFAULT]）。

7. 进阶用法

保存优化器状态：
HDF5 和 SavedModel 自动保存优化器状态，适合继续训练。
检查点也可以保存优化器：
python checkpoint = tf.train.Checkpoint(model=model, optimizer=model.optimizer) checkpoint.save('checkpoints/full_checkpoint')
模型量化（TensorFlow Lite）：

  converter.optimizations = [tf.lite.Optimize.DEFAULT]
  tflite_model = converter.convert()

导出为 TensorFlow Serving：
使用 SavedModel 格式，直接部署到 TensorFlow Serving。

  model.save('saved_model', save_format='tf')

8. 总结

TensorFlow 提供了多种模型保存和加载方式，满足从快速实验（HDF5）到生产部署（SavedModel、TensorFlow Lite）的需求。示例展示了在 MNIST 数据集上使用不同格式保存和加载模型的完整流程。选择合适的保存方式取决于应用场景：HDF5 适合快速实验，SavedModel 适合生产，检查点适合断点续训，TensorFlow Lite 适合移动设备。

如果你需要更复杂的保存/加载场景（如跨框架迁移、部署到云端）、特定格式的示例，或生成相关图表（如模型性能对比），请告诉我！

import tensorflow as tf
from tensorflow.keras import layers, models
from tensorflow.keras.datasets import mnist
import numpy as np

1. 加载和预处理数据

(x_train, y_train), (x_test, y_test) = mnist.load_data()
x_train, x_test = x_train / 255.0, x_test / 255.0 # 归一化
x_train = x_train[…, np.newaxis] # 增加通道维度 (28, 28) -> (28, 28, 1)
x_test = x_test[…, np.newaxis]

创建数据管道

train_dataset = (tf.data.Dataset.from_tensor_slices((x_train, y_train))
.shuffle(1000)
.batch(32)
.prefetch(tf.data.AUTOTUNE))
test_dataset = tf.data.Dataset.from_tensor_slices((x_test, y_test)).batch(32)

2. 构建模型

model = models.Sequential([
layers.Conv2D(32, (3, 3), activation=’relu’, input_shape=(28, 28, 1)),
layers.MaxPooling2D((2, 2)),
layers.Flatten(),
layers.Dense(128, activation=’relu’),
layers.Dropout(0.5),
layers.Dense(10, activation=’softmax’)
])

3. 编译和训练

model.compile(optimizer=’adam’, loss=’sparse_categorical_crossentropy’, metrics=[‘accuracy’])
model.fit(train_dataset, epochs=5, validation_data=test_dataset)

4. 评估原始模型

test_loss, test_acc = model.evaluate(test_dataset)
print(f’\n原始模型测试准确率: {test_acc:.4f}’)

5. 保存和加载模型（多种方式）

5.1 保存整个模型（HDF5）

model.save(‘mnist_model.h5’)
loaded_h5_model = tf.keras.models.load_model(‘mnist_model.h5’)
test_loss, test_acc = loaded_h5_model.evaluate(test_dataset)
print(f’HDF5 模型测试准确率: {test_acc:.4f}’)

5.2 保存 SavedModel

model.save(‘mnist_saved_model’)
loaded_saved_model = tf.keras.models.load_model(‘mnist_saved_model’)
test_loss, test_acc = loaded_saved_model.evaluate(test_dataset)
print(f’SavedModel 测试准确率: {test_acc:.4f}’)

5.3 保存权重

model.save_weights(‘mnist_weights.h5’)

重建模型并加载权重

new_model = models.Sequential([
layers.Conv2D(32, (3, 3), activation=’relu’, input_shape=(28, 28, 1)),
layers.MaxPooling2D((2, 2)),
layers.Flatten(),
layers.Dense(128, activation=’relu’),
layers.Dropout(0.5),
layers.Dense(10, activation=’softmax’)
])
new_model.compile(optimizer=’adam’, loss=’sparse_categorical_crossentropy’, metrics=[‘accuracy’])
new_model.load_weights(‘mnist_weights.h5’)
test_loss, test_acc = new_model.evaluate(test_dataset)
print(f’权重加载模型测试准确率: {test_acc:.4f}’)

5.4 使用检查点

checkpoint = tf.keras.callbacks.ModelCheckpoint(
‘checkpoints/checkpoint_{epoch:02d}.h5’,
save_best_only=True,
monitor=’val_accuracy’
)
model.fit(train_dataset, epochs=3, validation_data=test_dataset, callbacks=[checkpoint])

加载检查点

model.load_weights(‘checkpoints/checkpoint_03.h5’)
test_loss, test_acc = model.evaluate(test_dataset)
print(f’检查点模型测试准确率: {test_acc:.4f}’)

5.5 保存为 TensorFlow Lite

converter = tf.lite.TFLiteConverter.from_keras_model(model)
tflite_model = converter.convert()
with open(‘mnist_model.tflite’, ‘wb’) as f:
f.write(tflite_model)

TensorFlow 模型保存与加载

TensorFlow 模型保存与加载

1. 核心概念

2. 保存与加载方法

2.1 保存和加载整个模型（HDF5 格式）

2.2 保存和加载 SavedModel 格式

2.3 仅保存和加载权重

2.4 使用检查点（Checkpoint）

2.5 TensorFlow Lite 模型（用于移动端/嵌入式设备）

3. 完整示例：保存与加载 MNIST 模型

4. 代码逐部分解释

4.1 数据加载与预处理

4.2 模型结构

4.3 训练

4.4 保存与加载

5. 运行结果

6. 常见问题与解决

7. 进阶用法

8. 总结

1. 加载和预处理数据

创建数据管道

2. 构建模型

3. 编译和训练

4. 评估原始模型

5. 保存和加载模型（多种方式）

5.1 保存整个模型（HDF5）

5.2 保存 SavedModel

5.3 保存权重

重建模型并加载权重

5.4 使用检查点

加载检查点

5.5 保存为 TensorFlow Lite

likuolei

发表回复取消回复

归档

分类

2026 年 3 月
一	二	三	四	五	六	日
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

TensorFlow 模型保存与加载

1. 核心概念

2. 保存与加载方法

2.1 保存和加载整个模型（HDF5 格式）

2.2 保存和加载 SavedModel 格式

2.3 仅保存和加载权重

2.4 使用检查点（Checkpoint）

2.5 TensorFlow Lite 模型（用于移动端/嵌入式设备）

3. 完整示例：保存与加载 MNIST 模型

4. 代码逐部分解释

4.1 数据加载与预处理

4.2 模型结构

4.3 训练

4.4 保存与加载

5. 运行结果

6. 常见问题与解决

7. 进阶用法

8. 总结

1. 加载和预处理数据

创建数据管道

2. 构建模型

3. 编译和训练

4. 评估原始模型

5. 保存和加载模型（多种方式）

5.1 保存整个模型（HDF5）

5.2 保存 SavedModel

5.3 保存权重

重建模型并加载权重

5.4 使用检查点

加载检查点

5.5 保存为 TensorFlow Lite

likuolei

发表回复 取消回复

相关文章

发表回复取消回复