今天给大家推送美国海军研究生院的研究文章:《具有并行性、云整合和人工智能不确定性的应用强化学习战争模拟》
利用现代框架、算法和云硬件来提高国防部(DOD)的战争游戏能力,特别侧重于减少训练时间,增加部署灵活性,并演示训练后的神经网络如何为重新激励的行动提供一定程度的确定性。
这项工作利用开源并行框架来训练神经网络并将其部署到Azure云平台。采用贝叶斯变分推理技术衡量一个训练有素的网络移动选择的确定性。开源框架的应用使培训时间减少了十倍以上,而且没有任何性能损失。此外,将训练好的模型部署到Azure云平台有效地减轻了基础设施约束,贝叶斯方法成功地提供了训练好的模型确定性的度量。国防部(DOD)可以利用机器学习和云计算方面的这些进步,大大加强未来的作战努力。