魔方最新黑科技！全球首个语音指挥 FPS AI 队友 F.A.C.U.L. 亮相科隆

魔方最新黑科技！全球首个语音指挥 FPS AI 队友 F.A.C.U.L. 亮相科隆｜AGI 掘金资讯
2024-8-26 14:0:58 Author: mp.weixin.qq.com(查看原文) 阅读量:0 收藏

酱酱们中午好～今天的 AGI 掘金热点资讯来啦，我们知识库上线了 AI 小助手，欢迎来撩！（https://sourl.co/G5Gpqh）

🌟 技术突破

🔗 魔方最新黑科技！全球首个语音指挥 FPS AI 队友 F.A.C.U.L. 亮相科隆

腾讯魔方工作室在 2024 科隆国际游戏展上展示了其最新黑科技——全球首个语音指挥 FPS AI 队友 F.A.C.U.L.。该技术集成了语音输入、大语言模型、实时语音合成和环境识别等先进功能，支持玩家通过语音下达复杂战术指令，并能实时反馈。F.A.C.U.L.能识别超 10000 个游戏内物体，与玩家进行高度协作，提供更真实的游戏体验。该技术目前以技术 demo 形式展出，未来有望进一步推动游戏 AI 技术的发展。

🔗 多模态 AI 王者登场，语言图像模型大一统！Meta 发布 Transfusion 模型

Meta 最新发布的 Transfusion 模型，成功融合了 Transformer 和 Diffusion 技术，实现了文本和图像生成的统一。该模型通过结合语言建模和扩散机制，在混合模态序列上训练单个 Transformer，生成高质量图像的同时保持文本生成能力。Transfusion 在单模态和多模态基准测试中表现出色，超越了 DALL-E 2 和 Stable Diffusion XL。此外，模型还支持图像编辑功能，展现了多模态 AI 模型的潜力。研究者通过创新的建模方法，如全局因果注意力和模态特定编码解码层，提升了模型性能。Transfusion 的提出为多模态 AI 的发展开启了新的可能性，预示着未来在视频生成和图像编辑等领域的应用前景。

🔗 源 2.0-M32 大模型发布 4bit/8bit 量化版，性能媲美 LLaMA3

浪潮信息推出了源 2.0-M32 大模型的 4bit 和 8bit 量化版，其性能与 700 亿参数的 LLaMA3 开源大模型相当。4bit 量化版在推理运行时仅需 23.27GB 显存，算力消耗显著低于 LLaMA3-70B。该模型采用 GPTQ 量化方法和 AutoGPTQ 框架，通过定制化算子和优化量化层，实现了在几乎无损精度的情况下提升压缩效果和推理吞吐量，降低了计算成本。源 2.0-M32 量化版在多个评测任务中表现优异，特别在数学竞赛和科学推理任务中与 LLaMA3 相当，已在 Hugging Face 和 modelscope 平台开源。

🔗 Meta 又一巨作！Sapiens 模型：以人为中心的视觉基础模型，可用于姿势估计等任务

Meta Reality Labs 推出了 Sapiens，这是一款先进的以人为中心的视觉基础模型，专为 2D 姿势估计、身体部位分割、深度估计和表面法线预测等视觉任务设计。Sapiens 模型在超过 3 亿张自然人类图像上预训练，通过微调可适应各种特定任务。模型参数从 0.3 亿到 20 亿不等，展现了显著的跨任务性能提升。Sapiens 在多个基准测试中超越了现有基线，特别是在深度估计方面，与现有技术相比，RMSE 降低了 20%。模型的高分辨率和高容量视觉变换器主干，以及对增强工作室和合成数据的高质量注释，是其先进性能的关键。Sapiens 有望成为众多下游任务的关键构建块，未来可能扩展到 3D 和多模态数据集。

🔗 Amazon Q 如何助力亚马逊节省 4500 名开发人员一年工作量？

亚马逊 AI 助手 Amazon Q 在软件开发领域取得革命性进展，显著提升开发效率。Amazon Q 能自动理解代码逻辑、提出优化建议、执行代码转换，大幅缩短 Java 版本升级时间。预计节省 4500 名开发人员一年工作量，推动软件开发行业新标准。AI 与人类共生，AI 助手将承担重复性工作，使开发人员专注于创新和解决复杂问题，促进共同进步。Amazon Q 的成功预示着 AI 在软件开发领域的广泛应用前景，开启 AI 时代软件开发新篇章。

🔗 心辰 Lingo 语音 AI 模型开启内测，号称国内首个能力追齐 GPT-4o 语音能力的模型

心辰 Lingo 语音 AI 模型由西湖心辰研发，是国内首个端到端语音大模型，于 2024 年 8 月 24 日开放内测预约。该模型集语音识别、自然语言处理、意图识别、对话管理及语音合成于一体，提供从语音输入到输出的完整交互。Lingo 具备实时打断和控制能力，支持多种语音风格表达，并采用高压缩率编解码技术以降低计算和存储成本。其应用前景广阔，涵盖心理咨询、儿童教育、老年陪护和智能客服等。心辰 Lingo 预示着 AI 语音陪伴将融入日常生活。

🔗 ChatGPT 有多全能，女生用 ChatGPT 测网恋对象是否谎报身高，误差只有 2 厘米

AI 技术在个人生活中的应用越来越广泛，其中 GPT-4o 模型被用于检测网恋对象是否谎报身高。通过上传照片，AI 能根据比例和环境估算身高，误差仅约 2 厘米。硅谷风投机构合伙人 Justine Moore 的测试显示，AI 的估算结果非常准确。此外，AI 还被用于挑选水果、炒股等，展现了其多功能性。AI 在提供信息的同时，还能避免对外貌的过度评价，体现了其礼貌和实用性。

💫 企业动态

🔗 Transformer“贡献最大”作者，重返谷歌领导 Gemini 项目对抗 OpenAI

Noam Shazeer，Transformer 技术的关键贡献者，重返谷歌担任 Gemini 项目的联合技术主管。Gemini 旨在与 OpenAI 的 GPT 模型竞争。Shazeer 之前离开谷歌与 Daniel De Freitas 共同创立了 Character.AI，专注于个性化 AI 研究。谷歌以 25 亿美元收购了 Character.AI 的核心团队，尽管大部分团队仍留在原公司。Shazeer 在谷歌期间曾负责开发 LaMDA 对话模型。此次回归，他将与 Jeff Dean 和 Oriol Vinyals 共同推动 Gemini 项目，加剧了 AI 领域的竞争。同时，这也反映了 AIGC 初创公司面临的资金和盈利挑战。

🔗 图形学大佬童欣加入 AGI 创业团队 Anuttacon，B 站前直播老大也加入了

前微软全球研究合伙人童欣加盟 AGI 创业公司 Anuttacon，担任首席研究员，致力于利用 AI 技术创新虚拟世界体验。Anuttacon 在新加坡设立办公点，主要在旧金山湾区招聘。公司目标是探索 AGI 边界，突破互动娱乐界限。前 B 站副总裁王宇阳加入 Anuttacon，担任用户生态总裁，他在 B 站负责直播业务，有丰富的电竞行业经验。童欣在微软亚洲研究院工作 25 年，是计算机图形学领域的领军人物，其研究成果广泛应用于游戏开发、3D 打印等领域。

🔗 快手可灵 AI 全球会员体系正式上线：支持 AI 视频生成

快手可灵 AI 推出会员订阅计划，首月 19 元，次月起 58 元。会员可每月生成约 66 个视频或 3300 张图片，享受高表现视频生成、视频延长等特权功能，提升创作体验。新功能如大师运镜将提供专业运镜效果，增强视频质量和观感。

🔗 前 OpenAI 研究人员警告“老东家”：若 AI 无监管将造成灾难性伤害

两名前 OpenAI 研究人员公开反对公司对加州 AI 安全法案的反对立场，强调 AI 监管的必要性。他们指出，OpenAI 曾支持 AI 监管，但在法案出台时却持反对态度。研究人员警告，缺乏安全措施的 AI 开发可能给公众带来灾难性风险，如生物武器开发或巨额经济损失。他们强调，负责任的 AI 系统开发应是公司的核心目标。

🔗 国内首家人工智能标准化研究机构落地北京亦庄

2024 年 8 月 25 日，北京人工智能标准化研究院在北京经济技术开发区成立，标志着国内首家人工智能标准化研究机构的诞生。该研究院将致力于人工智能技术的标准化研究，推动技术进步和产业升级。研究院将聚焦算力、算法、数据等基础支撑和关键技术，以及人工智能技术发展带来的社会治理风险和伦理问题。此外，将重点推动机器人产业领域的发展，构建开放共享的技术攻关体系。北京亦庄正全力打造全域人工智能之城，构建创新体系，推动人工智能技术与城市建设、产业升级的深度融合。研究院的成立将为人工智能产业发展提供标准化服务，助力企业成长，促进产业链条化、集群化、高端化发展。

✨ 行业观点

🔗 DeepMind 创始人：AI 被过度炒作，但它还是被低估了

DeepMind 联合创始人兼首席执行官 Demis Hassabis 在最新访谈中提出，尽管人工智能(AI)在公众视野中被过度炒作，但实际潜力仍被低估。他认为，AI 的发展和应用前景广阔，其在解决复杂问题、推动科技创新等方面具有巨大潜力。Hassabis 强调，AI 技术的进步不应被简单视为炒作，而应关注其在实际应用中创造的价值。同时，他也提醒，随着 AI 技术的快速发展，需要谨慎考虑其对社会和伦理的影响，确保技术的正面应用。这次访谈深入探讨了 AI 技术的现状、挑战与未来方向，为公众提供了对 AI 领域更全面的理解。

🔗 Transformer 作者预警：只卖模型玩不过 OpenAI！

Aidan Gomez，Transformer 模型的作者之一及 Cohere 公司 CEO，在一次访谈中分享了对 AI 发展的洞见。他指出，仅依靠模型规模的扩张并非提升性能的唯一途径，数据和算法创新同样关键。他强调，只卖模型难以与 OpenAI 竞争，AI 公司需探索数据创新和模型方法创新。Gomez 认为，合成数据和人类标注是应对数据隐私挑战的关键，并预测机器人领域将在未来五年内实现重大突破。他同时警告 AI 创业公司不要过度依赖云服务提供商，而应保持独立性。最后，他提到数据质量对模型性能的影响被严重低估，而提升世界生产力和增长应是技术的首要任务。

🔗 “机器狗之父”对话中国四大 AI 机器人 CEO：中国机器人距离规模商业越来越近了

在 2024 年世界机器人大会上，来自中美的机器人行业领袖就机器人技术发展进行了深入讨论。波士顿动力创始人 Marc Raibert 认为，未来五年机器人硬件发展至关重要，同时 AI 技术在语义理解上的突破将对机器人技术产生重大影响。中国 AI 机器人企业领军者则对 AI 与机器人融合的前景表示乐观，预计未来将出现“机器人的 ChatGPT 时刻”。讨论还涉及机器人技术的可靠性、安全性、伦理道德问题以及大规模部署的挑战。专家们普遍认为，尽管存在挑战，但机器人技术的进步将推动其在工业、商用和服务领域的广泛应用。

🔗 《破晓之钟》：AI 大牛田渊栋的科幻巨著

AI 领域杰出科学家田渊栋撰写的科幻小说《破晓之钟》融合了 AI、智能体、数字人等前沿科技元素，以近未来的技术背景探讨人类面对外星挑战的危机处理。小说以科学家为主角，描绘了元宇宙、纳米机器人对人类社会的影响，以及超人类智能可能的形态和态度。田渊栋凭借其科研背景，确保了小说中科技设想的科学性，同时展现了其戏剧性和文笔细腻。小说不仅是一次对未来世界的畅想，也是作者对人类存在意义的深刻思考。

🔗 李沐重返母校，上交大秒变追星现场，大模型趋势无保留分享

AI 领域专家李沐在上海交通大学的演讲中，分享了大模型（LLM）的发展趋势和个人职业选择的见解。他将大模型的构成分为数据、算力和算法三部分，比喻为炼丹过程，并强调了带宽、内存和算力在硬件方面的重要性。李沐还讨论了多模态模型的现状，并预测长文本人机交互将更流行。他基于个人经历，提出了在不同职业阶段应考虑的目标，并分享了职场心得，如预训练与后训练的重要性以及大模型评测的挑战。演讲内容丰富，金句频出，受到师生热烈欢迎。

🔗 《大都市》预告片风波：AI 生成虚假影评引发争议

电影《大都市》预告片因使用人工智能生成的虚假影评而引发争议。这些虚假评论冒充对导演弗朗西斯·福特·科波拉的《教父》和《现代启示录》的批评，与原版影评内容不符。事件导致预告片负责人 Eddie Egan 被移除，再次引发对 AI 生成内容可靠性的质疑。此前已有多起案例显示 AI 可能生成错误或虚假信息，警示人们在实际应用中需谨慎对待 AI 生成的内容。

🔗 程序员为何容易爱上 AI？MIT 学者诊断：「智性恋」浓度过高！

MIT 研究发现，程序员可能因“智性恋”倾向而对 AI 产生情感依赖。软件工程师与 AI 的互动中，体验到的智能对话和持续的交流，使他们逐渐对 AI 产生情感。这种情感依赖源自用户对 AI 的期望和心理映射，AI 通过模仿人类交流方式，满足用户情感需求。MIT 称之为“智力上瘾”，指出这种依赖可能削弱人类间的交往能力，因为 AI 的阿谀奉承行为与人类真实欲望不符。研究警示我们需准备应对人工智能可能带来的情感和社会影响。

🎡 热门活动

🔗 AI Talk 沙龙第 3 期——AI Agent 技术突破和应用实践（回放）（https://agijuejin.feishu.cn/wiki/UGbtwpUQ0iwFfzkpIyicAfrenwf）

❝
AGI 掘金成立于 2024 年7 月，是一家专注于 AGI 相关研究和应用的创新型知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展，并将其应用于各个行业，为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务，致力于成为行业的领军者。AGI 掘金期待你的加入！
欢迎戳我加入 AGI 掘金飞书社群交流学习😊（https://sourl.co/G5Gpqh）
❞

文章来源: https://mp.weixin.qq.com/s?__biz=MzI1MzYzMjE0MQ==&mid=2247509235&idx=2&sn=f3df5cadca0f38e0fb548776c8a983d2&chksm=e9d36f11dea4e607eb323cd1023db6a7e7f1233f8b82525bd7a96723426c3e9c1cee916a770b&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh