OSSDevelopment/Assignments/Lab4.md

7.2 KiB
Raw Blame History

Lab 4CI/CD流水线搭建10分

截止日期2022.11.02 11:59am

实践目的

  • 了解使用GitHub Action搭建CI/CD流水线的基本方法。
  • 以Python为例了解典型的软件项目应当具有的基本开发工具、框架和流程。

初始文件

Lab4/文件夹中是一个功能极简的用Python实现图数据结构的包pygraph,该项目目前采用Poetry进行依赖管理,pytest作为测试框架,文件结构如下:

  • pygraph.py实现图数据结构,包含一个类和一些简单函数,均未实现,且结构混乱。
  • pyproject.toml是Poetry使用的依赖配置文件文件中声明了本项目支持的Python版本仅支持Python 3.10)以及本Lab中需要的各种开发依赖。
  • tests/文件夹包含若干测试。
  • pyproject.tomlpytest的配置文件。

Lab 4需要为这个项目配置开发环境补全未实现的代码并配置一个包含所有常见阶段的CI/CD流水线。

实践流程

  1. 请在OSS-Dev-Course-PKU中创建一个私有GitHub仓库名为2022Fall-{学号}-Lab4,为老师和助教添加访问权限,并将Lab4/文件夹中的所有文件push到仓库内注意不是push文件夹本身

    不要设置为公开仓库或者为其他同学添加访问权限否则此Lab评分作废若误操作请联系助教删除仓库

  2. 将新创建的仓库clone到本地配置Python开发环境安装Poetry使用Poetry配置虚拟环境并安装所有依赖。

    # 若Python和Poetry配置正确用如下两行命令即可配置虚拟环境并安装所有依赖
    poetry shell
    poetry install
    
  3. 使用black对代码进行重新格式化。

    black .
    
  4. 使用pre-commit工具为项目添加Pre-Commit Hook使得git能够在commit前调用black对代码进行自动格式化。这需要涉及到编写一个.pre-commit-config.yaml文件,并运行pre-commit install命令。

    为项目配置统一、简洁的代码风格,是为了降低其他人阅读代码时的认知负荷,方便团队协作。这一流程可以利用现有工具高度自动化,不会为开发带来任何额外负担。

  5. 修改pygraph.py文件,实现其中所有功能,保证运行如下命令可以通过所有测试,并生成测试覆盖率报告。

    pytest -r P --cov=pygraph
    

    这里采用的开发范式是测试驱动开发Test-Driven DevelopmentTDD先通过编写测试用例精准描述需求再在测试用例的基础上实现代码。这一开发方式可以“倒逼”程序员思考代码实现的简洁性、灵活性和可测试性有助于提升项目代码质量在敏捷开发中经常使用。

    由于本Lab的核心要点并不在于代码实现因此这里刻意使用了非常简单的代码。不过需要注意Lab里涉及到的代码实践可适用于且往往对于长期维护的大型软件项目不可或缺。我们强烈鼓励同学们在自己的其他项目中借鉴运用相关实践对于各种技术栈其内核都是相通的提升整体的工程水平。

  6. 使用pdoc3pygraph自动生成API文档可以在html/文件夹中查看生成的API文档。

    pdoc --html pygraph
    
  7. 使用GitHub Action配置五阶段CI/CD流水线包含如下步骤

    • 初始化Python环境安装Poetry
    • 使用Poetry自动安装所有依赖
    • 使用black检测代码是否存在格式问题
    • 使用pytest运行单元测试
    • 使用pdoc3生成API文档并将API文档部署到仓库中的gh-page分支。

    对于公有仓库可以配置GitHub读取gh-page分支在github.io直接提供相应的公开可访问的网页这样便实现了API文档的持续部署对于软件包本身的持续部署我们留到Lab 5再实现

    不过非常遗憾的是私有仓库的GitHub Page是收费功能。如果同学们以后创建自己的项目可以尝试用同样的方法自动部署各种网页确认实际效果。

    需要注意CI环境里是不能使用poetry shell的(相关讨论)。

  8. 将所有更改体现在GitHub仓库中。

提交前检查

在提交前请确保在一台安装了Python和Poetry的机器上能够依次运行如下命令并正常输出结果

poetry shell              # activate a working virtual environment
poetry install            # install all dependencies
pre-commit install        # install pre-commit hooks
black .                   # lint all Python code
pytest -r P --cov=pygraph # run all tests with test stdout and coverage report
pdoc --html pygraph       # build API documentation and deploy to html/

对于所有需要给别人使用的代码确保其他人能够轻松地按照开发文档配置能够运行你的代码的标准化的开发环境是至关重要的。Python生态里的大量工具链都是为了能够做到这一点。

此外请确保你的GitHub仓库里GitHub Action包含了所有要求的流水线阶段且能不报错正常执行有小绿勾

助教会人工检查流水线配置是否正确。需要尤其注意的是,black在默认配置下即使存在代码格式问题也只会重新格式化而不会报错这对于CI流水线中的检查是不合适的CI环境下重新格式化了也没用。因此需要通过相应配置选项让black检查是否存在风格错误。

评分标准

  • 3分所有测试能够通过。
  • 2分配置了能够自动格式化代码的Pre-Commit Hook。
  • 5分配置了至少包含如下五个阶段的GitHub Action流水线初始化Python环境、安装依赖、代码风格检查、运行单元测试、部署API文档。

提交方式

Lab 4无需特意提交任何内容助教会在DDL后检查OSS-Dev-Course-PKU中检查相应仓库,做出最终评分。

参考资料

  1. Poetry文档
  2. pytest文档
  3. pytest测试里用到的fixture功能
  4. black文档
  5. pre-commit文档
  6. pdoc3文档
  7. GitHub Action文档基本概念测试&构建Python项目
  8. 可能有用的GitHub Action插件
    1. https://black.readthedocs.io/en/stable/integrations/github_actions.html
    2. https://github.com/actions/setup-python
    3. https://github.com/marketplace/actions/deploy-to-github-pages