魔方最新黑科技!全球首个语音指挥 FPS AI 队友 F.A.C.U.L. 亮相科隆|AGI 掘金资讯
2024-8-26 14:0:58 Author: mp.weixin.qq.com(查看原文) 阅读量:0 收藏

酱酱们中午好~今天的 AGI 掘金热点资讯来啦,我们知识库上线了 AI 小助手,欢迎来撩!(https://sourl.co/G5Gpqh)

🌟 技术突破

🔗 魔方最新黑科技!全球首个语音指挥 FPS AI 队友 F.A.C.U.L. 亮相科隆

腾讯魔方工作室在 2024 科隆国际游戏展上展示了其最新黑科技——全球首个语音指挥 FPS AI 队友 F.A.C.U.L.。该技术集成了语音输入、大语言模型、实时语音合成和环境识别等先进功能,支持玩家通过语音下达复杂战术指令,并能实时反馈。F.A.C.U.L.能识别超 10000 个游戏内物体,与玩家进行高度协作,提供更真实的游戏体验。该技术目前以技术 demo 形式展出,未来有望进一步推动游戏 AI 技术的发展。

🔗 多模态 AI 王者登场,语言图像模型大一统!Meta 发布 Transfusion 模型

Meta 最新发布的 Transfusion 模型,成功融合了 Transformer 和 Diffusion 技术,实现了文本和图像生成的统一。该模型通过结合语言建模和扩散机制,在混合模态序列上训练单个 Transformer,生成高质量图像的同时保持文本生成能力。Transfusion 在单模态和多模态基准测试中表现出色,超越了 DALL-E 2 和 Stable Diffusion XL。此外,模型还支持图像编辑功能,展现了多模态 AI 模型的潜力。研究者通过创新的建模方法,如全局因果注意力和模态特定编码解码层,提升了模型性能。Transfusion 的提出为多模态 AI 的发展开启了新的可能性,预示着未来在视频生成和图像编辑等领域的应用前景。

🔗 源 2.0-M32 大模型发布 4bit/8bit 量化版,性能媲美 LLaMA3

浪潮信息推出了源 2.0-M32 大模型的 4bit 和 8bit 量化版,其性能与 700 亿参数的 LLaMA3 开源大模型相当。4bit 量化版在推理运行时仅需 23.27GB 显存,算力消耗显著低于 LLaMA3-70B。该模型采用 GPTQ 量化方法和 AutoGPTQ 框架,通过定制化算子和优化量化层,实现了在几乎无损精度的情况下提升压缩效果和推理吞吐量,降低了计算成本。源 2.0-M32 量化版在多个评测任务中表现优异,特别在数学竞赛和科学推理任务中与 LLaMA3 相当,已在 Hugging Face 和 modelscope 平台开源。

🔗 Meta 又一巨作!Sapiens 模型:以人为中心的视觉基础模型,可用于姿势估计等任务

Meta Reality Labs 推出了 Sapiens,这是一款先进的以人为中心的视觉基础模型,专为 2D 姿势估计、身体部位分割、深度估计和表面法线预测等视觉任务设计。Sapiens 模型在超过 3 亿张自然人类图像上预训练,通过微调可适应各种特定任务。模型参数从 0.3 亿到 20 亿不等,展现了显著的跨任务性能提升。Sapiens 在多个基准测试中超越了现有基线,特别是在深度估计方面,与现有技术相比,RMSE 降低了 20%。模型的高分辨率和高容量视觉变换器主干,以及对增强工作室和合成数据的高质量注释,是其先进性能的关键。Sapiens 有望成为众多下游任务的关键构建块,未来可能扩展到 3D 和多模态数据集。

🔗 Amazon Q 如何助力亚马逊节省 4500 名开发人员一年工作量?

亚马逊 AI 助手 Amazon Q 在软件开发领域取得革命性进展,显著提升开发效率。Amazon Q 能自动理解代码逻辑、提出优化建议、执行代码转换,大幅缩短 Java 版本升级时间。预计节省 4500 名开发人员一年工作量,推动软件开发行业新标准。AI 与人类共生,AI 助手将承担重复性工作,使开发人员专注于创新和解决复杂问题,促进共同进步。Amazon Q 的成功预示着 AI 在软件开发领域的广泛应用前景,开启 AI 时代软件开发新篇章。

🔗 心辰 Lingo 语音 AI 模型开启内测,号称国内首个能力追齐 GPT-4o 语音能力的模型

心辰 Lingo 语音 AI 模型由西湖心辰研发,是国内首个端到端语音大模型,于 2024 年 8 月 24 日开放内测预约。该模型集语音识别、自然语言处理、意图识别、对话管理及语音合成于一体,提供从语音输入到输出的完整交互。Lingo 具备实时打断和控制能力,支持多种语音风格表达,并采用高压缩率编解码技术以降低计算和存储成本。其应用前景广阔,涵盖心理咨询、儿童教育、老年陪护和智能客服等。心辰 Lingo 预示着 AI 语音陪伴将融入日常生活。

🔗 ChatGPT 有多全能,女生用 ChatGPT 测网恋对象是否谎报身高,误差只有 2 厘米

AI 技术在个人生活中的应用越来越广泛,其中 GPT-4o 模型被用于检测网恋对象是否谎报身高。通过上传照片,AI 能根据比例和环境估算身高,误差仅约 2 厘米。硅谷风投机构合伙人 Justine Moore 的测试显示,AI 的估算结果非常准确。此外,AI 还被用于挑选水果、炒股等,展现了其多功能性。AI 在提供信息的同时,还能避免对外貌的过度评价,体现了其礼貌和实用性。

💫 企业动态

🔗 Transformer“贡献最大”作者,重返谷歌领导 Gemini 项目对抗 OpenAI

Noam Shazeer,Transformer 技术的关键贡献者,重返谷歌担任 Gemini 项目的联合技术主管。Gemini 旨在与 OpenAI 的 GPT 模型竞争。Shazeer 之前离开谷歌与 Daniel De Freitas 共同创立了 Character.AI,专注于个性化 AI 研究。谷歌以 25 亿美元收购了 Character.AI 的核心团队,尽管大部分团队仍留在原公司。Shazeer 在谷歌期间曾负责开发 LaMDA 对话模型。此次回归,他将与 Jeff Dean 和 Oriol Vinyals 共同推动 Gemini 项目,加剧了 AI 领域的竞争。同时,这也反映了 AIGC 初创公司面临的资金和盈利挑战。

🔗 图形学大佬童欣加入 AGI 创业团队 Anuttacon,B 站前直播老大也加入了

前微软全球研究合伙人童欣加盟 AGI 创业公司 Anuttacon,担任首席研究员,致力于利用 AI 技术创新虚拟世界体验。Anuttacon 在新加坡设立办公点,主要在旧金山湾区招聘。公司目标是探索 AGI 边界,突破互动娱乐界限。前 B 站副总裁王宇阳加入 Anuttacon,担任用户生态总裁,他在 B 站负责直播业务,有丰富的电竞行业经验。童欣在微软亚洲研究院工作 25 年,是计算机图形学领域的领军人物,其研究成果广泛应用于游戏开发、3D 打印等领域。

🔗 快手可灵 AI 全球会员体系正式上线:支持 AI 视频生成

快手可灵 AI 推出会员订阅计划,首月 19 元,次月起 58 元。会员可每月生成约 66 个视频或 3300 张图片,享受高表现视频生成、视频延长等特权功能,提升创作体验。新功能如大师运镜将提供专业运镜效果,增强视频质量和观感。

🔗 前 OpenAI 研究人员警告“老东家”:若 AI 无监管将造成灾难性伤害

两名前 OpenAI 研究人员公开反对公司对加州 AI 安全法案的反对立场,强调 AI 监管的必要性。他们指出,OpenAI 曾支持 AI 监管,但在法案出台时却持反对态度。研究人员警告,缺乏安全措施的 AI 开发可能给公众带来灾难性风险,如生物武器开发或巨额经济损失。他们强调,负责任的 AI 系统开发应是公司的核心目标。

🔗 国内首家人工智能标准化研究机构落地北京亦庄

2024 年 8 月 25 日,北京人工智能标准化研究院在北京经济技术开发区成立,标志着国内首家人工智能标准化研究机构的诞生。该研究院将致力于人工智能技术的标准化研究,推动技术进步和产业升级。研究院将聚焦算力、算法、数据等基础支撑和关键技术,以及人工智能技术发展带来的社会治理风险和伦理问题。此外,将重点推动机器人产业领域的发展,构建开放共享的技术攻关体系。北京亦庄正全力打造全域人工智能之城,构建创新体系,推动人工智能技术与城市建设、产业升级的深度融合。研究院的成立将为人工智能产业发展提供标准化服务,助力企业成长,促进产业链条化、集群化、高端化发展。

✨ 行业观点

🔗 DeepMind 创始人:AI 被过度炒作,但它还是被低估了

DeepMind 联合创始人兼首席执行官 Demis Hassabis 在最新访谈中提出,尽管人工智能(AI)在公众视野中被过度炒作,但实际潜力仍被低估。他认为,AI 的发展和应用前景广阔,其在解决复杂问题、推动科技创新等方面具有巨大潜力。Hassabis 强调,AI 技术的进步不应被简单视为炒作,而应关注其在实际应用中创造的价值。同时,他也提醒,随着 AI 技术的快速发展,需要谨慎考虑其对社会和伦理的影响,确保技术的正面应用。这次访谈深入探讨了 AI 技术的现状、挑战与未来方向,为公众提供了对 AI 领域更全面的理解。

🔗 Transformer 作者预警:只卖模型玩不过 OpenAI!

Aidan Gomez,Transformer 模型的作者之一及 Cohere 公司 CEO,在一次访谈中分享了对 AI 发展的洞见。他指出,仅依靠模型规模的扩张并非提升性能的唯一途径,数据和算法创新同样关键。他强调,只卖模型难以与 OpenAI 竞争,AI 公司需探索数据创新和模型方法创新。Gomez 认为,合成数据和人类标注是应对数据隐私挑战的关键,并预测机器人领域将在未来五年内实现重大突破。他同时警告 AI 创业公司不要过度依赖云服务提供商,而应保持独立性。最后,他提到数据质量对模型性能的影响被严重低估,而提升世界生产力和增长应是技术的首要任务。

🔗 “机器狗之父”对话中国四大 AI 机器人 CEO:中国机器人距离规模商业越来越近了

在 2024 年世界机器人大会上,来自中美的机器人行业领袖就机器人技术发展进行了深入讨论。波士顿动力创始人 Marc Raibert 认为,未来五年机器人硬件发展至关重要,同时 AI 技术在语义理解上的突破将对机器人技术产生重大影响。中国 AI 机器人企业领军者则对 AI 与机器人融合的前景表示乐观,预计未来将出现“机器人的 ChatGPT 时刻”。讨论还涉及机器人技术的可靠性、安全性、伦理道德问题以及大规模部署的挑战。专家们普遍认为,尽管存在挑战,但机器人技术的进步将推动其在工业、商用和服务领域的广泛应用。

🔗 《破晓之钟》:AI 大牛田渊栋的科幻巨著

AI 领域杰出科学家田渊栋撰写的科幻小说《破晓之钟》融合了 AI、智能体、数字人等前沿科技元素,以近未来的技术背景探讨人类面对外星挑战的危机处理。小说以科学家为主角,描绘了元宇宙、纳米机器人对人类社会的影响,以及超人类智能可能的形态和态度。田渊栋凭借其科研背景,确保了小说中科技设想的科学性,同时展现了其戏剧性和文笔细腻。小说不仅是一次对未来世界的畅想,也是作者对人类存在意义的深刻思考。

🔗 李沐重返母校,上交大秒变追星现场,大模型趋势无保留分享

AI 领域专家李沐在上海交通大学的演讲中,分享了大模型(LLM)的发展趋势和个人职业选择的见解。他将大模型的构成分为数据、算力和算法三部分,比喻为炼丹过程,并强调了带宽、内存和算力在硬件方面的重要性。李沐还讨论了多模态模型的现状,并预测长文本人机交互将更流行。他基于个人经历,提出了在不同职业阶段应考虑的目标,并分享了职场心得,如预训练与后训练的重要性以及大模型评测的挑战。演讲内容丰富,金句频出,受到师生热烈欢迎。

🔗 《大都市》预告片风波:AI 生成虚假影评引发争议

电影《大都市》预告片因使用人工智能生成的虚假影评而引发争议。这些虚假评论冒充对导演弗朗西斯·福特·科波拉的《教父》和《现代启示录》的批评,与原版影评内容不符。事件导致预告片负责人 Eddie Egan 被移除,再次引发对 AI 生成内容可靠性的质疑。此前已有多起案例显示 AI 可能生成错误或虚假信息,警示人们在实际应用中需谨慎对待 AI 生成的内容。

🔗 程序员为何容易爱上 AI?MIT 学者诊断:「智性恋」浓度过高!

MIT 研究发现,程序员可能因“智性恋”倾向而对 AI 产生情感依赖。软件工程师与 AI 的互动中,体验到的智能对话和持续的交流,使他们逐渐对 AI 产生情感。这种情感依赖源自用户对 AI 的期望和心理映射,AI 通过模仿人类交流方式,满足用户情感需求。MIT 称之为“智力上瘾”,指出这种依赖可能削弱人类间的交往能力,因为 AI 的阿谀奉承行为与人类真实欲望不符。研究警示我们需准备应对人工智能可能带来的情感和社会影响。

🎡 热门活动

🔗 AI Talk 沙龙第 3 期——AI Agent 技术突破和应用实践(回放)(https://agijuejin.feishu.cn/wiki/UGbtwpUQ0iwFfzkpIyicAfrenwf)

AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!

欢迎戳我加入 AGI 掘金飞书社群交流学习😊(https://sourl.co/G5Gpqh)


文章来源: https://mp.weixin.qq.com/s?__biz=MzI1MzYzMjE0MQ==&mid=2247509235&idx=2&sn=f3df5cadca0f38e0fb548776c8a983d2&chksm=e9d36f11dea4e607eb323cd1023db6a7e7f1233f8b82525bd7a96723426c3e9c1cee916a770b&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh