Katalyst 是字节跳动开源的成本优化实践系统,致力于解决云原生场景下的资源不合理利用问题,为资源管理和成本优化提供解决方案。
活动背景
活动介绍
Katalyst 开源社区【编程挑战】:社区根据未来新版本中的相关能力规划,发布议题任务,邀请高校同学参与项目部分 issue 的设计与开发,并为完成任务的同学提供一定的奖励。
支持 OOM 优先级作为 QoS 增强
github.com/kubewharf/katalyst-core/issues/216
请为 Katalyst 增加以下能力:
用户可以指定 OOM 优先级作为 QoS 增强
使用 oom_score_adj 实现 OOM 优先级
目前,Kubernetes 为不同的 QoS 类配置不同的 oom_score_adj 值。然而,OOM 的顺序还取决于其他维度的因素,如容器的内存使用等。
在混部场景中,当集群内存资源变得稀缺时,必须严格确保批处理作业比 web 服务更早因 OOM 而终止。
支持回收资源 NUMA 颗粒度上报
github.com/kubewharf/katalyst-core/issues/217
请为 Katalyst 增加以下能力:
增强资源上报机制,支持回收资源 NUMA 节点颗粒度的上报
目前,回收资源的上报是在节点颗粒度级别进行的。然而,在具有 NUMA 架构的环境中,这种方法可能会导致次优调度结果和由于 NUMA 级别的干扰而导致潜在的 Pod 驱逐。
支持 Kubernetes 中 NUMA 级别 pod 间亲和性和反亲和性
github.com/kubewharf/katalyst-core/issues/220
请为 Katalyst 增加以下能力:
支持 Kubernetes 中 NUMA 级别 pod 间亲和性和反亲和性。
目前,Kubernetes 在节点级别支持 pod 间亲和性和反亲和性。然而,将这种支持扩展到 NUMA 级别的需求逐渐增加。
例如,在 TensorFlow 训练中,高内存带宽消耗 worker,会影响同一 NUMA 节点上的参数服务器。将这些 pod 分配给不同的 NUMA 节点可以减轻这种干扰。
4. 完成项目的优秀 contributor 还可获得社区激励奖金 5000 元(等额京东卡)
1. 18 岁以上高校在校学生
2. 热爱开源文化,接受开源协作模式
唐同学
2. 发送个人简历+议题 proposal 给相关联系人
3. 通过后将由项目导师联系沟通具体开发任务,启动开发
活动时间
加入云原生交流群