TensorFlow Federated：基于分散式数据的机器学习

2024-03-15 11:26•linux•阅读 2588

https://www.tensorflow.org/federated/

TensorFlow Federated (TFF) 是一个开源框架，用于对分散式数据进行机器学习和其他计算。我们开发 TFF 是为了促进联合学习 (FL) 的开放研究和实验，FL 是一种机器学习方法，使我们能够跨多个参与客户端训练共享全局模型，并将训练数据保存在本地。例如，FL 已被用于训练手机键盘的预测模型，但不会将敏感的输入数据上传到服务器。
开发者可以利用借助 TFF 对其模型和数据模拟所包含的联合学习算法，以及实验新算法。TFF 提供的构建块也可用于实现非学习计算，例如对分散式数据进行聚合分析。TFF 的接口可以分成两层：
chevron_right
Federated Learning (FL) API
该层提供了一组高阶接口，使开发者能够将包含的联合训练和评估实现应用于现有的 TensorFlow 模型。
chevron_right
Federated Core (FC) API
该系统的核心是一组较低阶接口，可以通过在强类型函数式编程环境中结合使用 TensorFlow 与分布式通信运算符，简洁地表达新的联合算法。这一层也是我们构建联合学习的基础。

借助 TFF，开发者能够以声明方式表达联合计算，从而将它们部署到不同的运行时环境中。TFF 包含一个用于实验的单机模拟运行时。请访问相关教程，并亲自试用！

from six.moves import range
import tensorflow as tf
import tensorflow_federated as tff
from tensorflow_federated.python.examples import mnist
tf.compat.v1.enable_v2_behavior()
# Load simulation data.
source, _ = tff.simulation.datasets.emnist.load_data()
def client_data(n):
  dataset = source.create_tf_dataset_for_client(source.client_ids[n])
  return mnist.keras_dataset_from_emnist(dataset).repeat(10).batch(20)
# Pick a subset of client devices to participate in training.
train_data = [client_data(n) for n in range(3)]
# Grab a single batch of data so that TFF knows what data looks like.
sample_batch = tf.nest.map_structure(
    lambda x: x.numpy(), iter(train_data[0]).next())
# Wrap a Keras model for use with TFF.
def model_fn():
  return tff.learning.from_compiled_keras_model(
      mnist.create_simple_keras_model(), sample_batch)
# Simulate a few rounds of training with the selected client devices.
trainer = tff.learning.build_federated_averaging_process(model_fn)
state = trainer.initialize()
for _ in range(5):
  state, metrics = trainer.next(state, train_data)
  print (metrics.loss)

上一篇 »Python机器学习库scikit-learn使用详解
下一篇 »Python机器学习库scikit-learn使用详解

TensorFlow Federated：基于分散式数据的机器学习

Federated Learning (FL) API

Federated Core (FC) API

相关推荐

python机器学习-数据集划分

大数据，三十七机器学习【机器学习语言---R语言介绍】

tensorflow学习总结之reduce_sum函数

深度学习示例：Apache Kafka，Python，Keras，TensorFlow和Deeplearning4j

命名实体识别之bert+bilstm，基于tensorflow

21天实战caffe笔记_第一天

Tensorflow学习笔记No.1

Pytorch相关知识介绍与应用