fluid/README-zh_CN.md

8.8 KiB
Raw Permalink Blame History

License CircleCI Build Status codecov Go Report Card Artifact HUB OpenSSF Scorecard CII Best Practices Leaderboard

Fluid

English | 简体中文

更新 最新进展:
最新版发布2024年4月17日, Fluid v1.0.0 发布! 版本更新介绍详情情参见 CHANGELOG
v0.9.0版发布2023年5月26日, Fluid v0.9.0 发布! 版本更新介绍详情情参见 CHANGELOG
v0.8.0版发布2022年9月3日, Fluid v0.8.0 发布! 版本更新介绍详情情参见 CHANGELOG
v0.7.0版发布2022年3月2日, Fluid v0.7.0 发布! 版本更新介绍详情情参见 CHANGELOG
v0.6.0版发布2021年8月11日, Fluid v0.6.0 发布! 版本更新介绍详情情参见 CHANGELOG
v0.5.0版发布2021年5月16日, Fluid v0.6.0 发布! 版本更新介绍详情情参见 CHANGELOG
进入CNCF2021年4月27日, Fluid通过CNCF Technical Oversight Committee (TOC)投票决定被接受进入CNCF成为CNCF Sandbox Project
v0.4.0版发布2020年11月6日, Fluid v0.6.0 发布! 版本更新介绍详情情参见 CHANGELOG
v0.3.0版发布2020年10月1日, Fluid v0.6.0 发布! 版本更新介绍详情情参见 CHANGELOG

什么是Fluid

Fluid是一个开源的Kubernetes原生的分布式数据集编排和加速引擎主要服务于云原生场景下的数据密集型应用例如大数据应用、AI应用等。

Fluid现在是Cloud Native Computing Foundation (CNCF) 开源基金会旗下的一个沙箱项目。关于Fluid更多的原理性介绍, 可以参见我们的论文:

  1. Rong Gu, Kai Zhang, Zhihao Xu, et al. Fluid: Dataset Abstraction and Elastic Acceleration for Cloud-native Deep Learning Training Jobs. IEEE ICDE, pp. 2183-2196, May, 2022. (Conference Version)

  2. Rong Gu, Zhihao Xu, Yang Che, et al. High-level Data Abstraction and Elastic Data Caching for Data-intensive AI Applications on Cloud-native Platforms. IEEE TPDS, pp. 2946-2964, Vol 34(11), 2023. (Journal Version)

通过定义数据集资源的抽象,实现如下功能:

核心功能

  • 数据集抽象原生支持

    将数据密集型应用所需基础支撑能力功能化,实现数据高效访问并降低多维管理成本

  • 可扩展的数据引擎插件

    提供统一的访问接口方便接入第三方存储通过不同的Runtime实现数据操作

  • 自动化的数据操作

    提供多种操作模式,与自动化运维体系相结合

  • 数据弹性与调度

    将数据缓存技术和弹性扩缩容、数据亲和性调度能力相结合,提高数据访问性能

  • 运行时平台无关

    支持原生、边缘、Serverless Kubernetes集群、Kubernetes多集群等多样化环境适用于混合云场景

重要概念

Dataset: 数据集是逻辑上相关的一组数据的集合会被运算引擎使用比如大数据的SparkAI场景的TensorFlow。而这些数据智能的应用会创造工业界的核心价值。Dataset的管理实际上也有多个维度比如安全性版本管理和数据加速。我们希望从数据加速出发对于数据集的管理提供支持。

Runtime: 实现数据集安全性,版本管理和数据加速等能力的执行引擎,定义了一系列生命周期的接口。可以通过实现这些接口,支持数据集的管理和加速。

先决条件

  • Kubernetes version > 1.16, 支持CSI
  • Golang 1.18+
  • Helm 3

快速开始

你可以通过 快速开始 在Kubernetes集群中测试Fluid.

文档

如果需要详细了解Fluid的使用请参考文档 docs

你也可以访问Fluid主页来获取有关文档.

快速演示

演示 1: 加速文件访问

演示 2: 加速机器学习

演示 3: 加速PVC

演示 4: 数据预热

演示 5: 在线不停机数据集缓存扩缩容

如何贡献

欢迎您的贡献,如何贡献请参考CONTRIBUTING.md.

欢迎加入与反馈

Fluid让Kubernetes真正具有分布式数据缓存的基础能力开源只是一个起点需要大家的共同参与。大家在使用过程发现Bug或需要的Feature都可以直接在 GitHub上面提 issue 或 PR一起参与讨论。另外我们有一个钉钉群欢迎您的参与和讨论。

钉钉讨论群

Slack 讨论群

  • 加入 CNCF Slack 通过搜索频道 #fluid 和我们进行讨论.

开源协议

Fluid采用Apache 2.0 license开源协议详情参见LICENSE文件。

漏洞报告

安全性是Fluid项目高度关注的事务。如果您发现或遇到安全相关的问题欢迎您给fluid.opensource.project@gmail.com邮箱发送邮件报告。具体细节请查看SECURITY.md

行为准则

Fluid 遵守 CNCF 行为准则