谷歌首创基于云的AI自治系统,为数据中心自动降温
  

枫凌 894

{{ttag.title}}
2016年,DeepMind联合开发了一个人工智能驱动的推荐系统,用以提高谷歌数据中心的能源效率。现在,他们将这个系统提升到一个新的水平:在数据中心运营专家的监督之下直接让AI系统控制数据中心的冷却系统。这种首创的基于云的控制系统现在可以安全地为多个谷歌数据中心提供节能服务。
现实世界的很多最紧迫的问题变得越来越复杂,为它们寻求解决方案可能会让人不堪重负。在DeepMind和谷歌,谷歌认为,如果其能够将AI作为发现新知识的工具,那么就可以更容易得找到解决方案。
2016年,谷歌联合开发了一个人工智能驱动的推荐系统,用以提高谷歌数据中心的能源效率。谷歌的想法很简单:即使是微小的改进也可以显著地节约能源,减少二氧化碳排放,从而有助于应对气候变化。
现在谷歌将这个系统提升到一个新的水平:谷歌不是通过人为的方式实现推荐系统,而是在数据中心运营专家的监督之下让谷歌的AI系统直接控制数据中心的冷却系统。这种首创的基于云的控制系统现在可以安全地为多个谷歌数据中心提供节能服务。
它是怎么运作的
每隔五分钟,谷歌的AI系统就会从数千个传感器收集数据中心冷却系统的快照,并将其输入到谷歌的深度神经网络中,用以预测不同的潜在操作的组合将如何影响未来的能源消耗。然后,AI系统将识别出哪些操作将会最小化能量消耗,同时又能满足安全约束。这些操作被发送回数据中心,数据中心的本地控制系统负责验证和执行它们。
这个想法源于使用AI推荐系统的数据中心专家的反馈。他们告诉谷歌,虽然推荐系统已经为他们提供了一些新的最佳实践——例如将冷却负载分散到更多而不是更少的设备上——但实现推荐仍然需要很多的运营工作量和监督。当然,他们想知道谷歌是否可能实现在没有人工干预的情况下实现类似的节能。
谷歌很高兴地说,答案是肯定的!
专为安全和可靠性而设计
谷歌的数据中心包含数千台服务器,用于支持谷歌搜索、Gmail和YouTube等热门服务。确保它们可靠高效地运行是谷歌的关键任务。谷歌从头开始设计谷歌的AI代理和底层控制基础设施,并时刻考虑到安全性和可靠性问题,还使用了八种不同的机制来确保系统始终按预期运行。
谷歌已经实现的一个简单方法是预估不确定性。对于每一个潜在的操作——可能有数十亿个——谷歌的AI代理会计算出它们的信心指数。低信心指数的操作将不予考虑。
另一种方法是进行双层验证。谷歌将根据由数据中心运维人员定义的内部安全约束列表对AI计算得出的最佳操作进行审查。在指令从云端发送到物理数据中心后,本地控制系统就根据自己的约束集对指令进行验证。这种冗余检查可以确保系统保持在局部约束范围内,并且运维人员可以完全控制操作边界。
最重要的是,谷歌的数据中心运维人员始终控制着局面,可以随时选择退出AI控制模式。在这些情况下,控制系统将无缝地从AI控制转移到现场规则。
逐渐增长的节能
谷歌的原始推荐系统有运维人员进行审查和实现操作,而谷歌新的AI控制系统却直接自己实现了操作。考虑到安全性和可靠性问题,谷歌有目的地将系统的优化边界限制在较窄的操作体系中,这意味着在节能方面存在风险和回报之间的折衷。
尽管只有几个月的时间,这个系统已经实现了平均约30%的持续节能,并有了进一步的预期改进。这是因为随着时间的推移,系统会因为数据越来越多而变得更好,如下图所示。随着技术的成熟,谷歌的优化边界也将得到扩展,从而实现更高效的节能。
谷歌的AI控制系统正在寻找更多新颖的管理冷却的方式,这些方法甚至让数据中心运维人员感到惊讶。谷歌数据中心运维人员Dan Fuenffinger说:“看到AI学会利用冬季条件并生成比普通水更冷的水,着实令人感到惊讶,这样可以降低冷却所需的能量。随着时间的推移,人工规则不会变得更好,但AI却可以“。
谷歌很高兴谷歌的AI控制系统能够安全可靠地运行,同时始终如一地实现节能。但是,数据中心只是个开始。从长远来看,谷歌认为有可能将这项技术应用到其他工业环境,并在更大规模的范围内应对气候变化。

打赏鼓励作者,期待更多好文!

打赏
1人已打赏

sangfor_闪电回_小六 发表于 2018-9-11 15:27
  
感谢分享,涨姿势
发表新帖
热门标签
全部标签>
西北区每日一问
技术盲盒
每日一问
技术笔记
干货满满
GIF动图学习
功能体验
通用技术
标准化排查
SDP百科
产品连连看
技术咨询
技术圆桌
社区新周刊
2023技术争霸赛专题
秒懂零信任
自助服务平台操作指引
信服课堂视频
畅聊IT
在线直播
新版本体验
技术晨报
安装部署配置
sangfor周刊
VPN 对接
专家问答
高手请过招
升级&主动服务
答题自测
MVP
网络基础知识
升级
安全攻防
上网策略
测试报告
日志审计
问题分析处理
流量管理
每日一记
运维工具
云计算知识
用户认证
原创分享
解决方案
项目案例
SANGFOR资讯
专家分享
技术顾问
信服故事
功能咨询
终端接入
授权
设备维护
资源访问
地址转换
虚拟机
存储
迁移
加速技术
排障笔记本
产品预警公告
玩转零信任
信服圈儿
S豆商城资讯
技术争霸赛
「智能机器人」
追光者计划
深信服技术支持平台
社区帮助指南
答题榜单公布
纪元平台
卧龙计划
华北区拉练
天逸直播
以战代练
山东区技术晨报
文档捉虫活动
齐鲁TV
华北区交付直播
每周精选
2024年技术争霸赛
北京区每日一练
场景专题
故障笔记
排障那些事
高频问题集锦

本版版主

461
247
13

发帖

粉丝

关注

本版达人

feeling

本周分享达人

新手29676...

本周提问达人