酱酱们中午好~今天的 AGI 掘金热点资讯来啦,我们知识库上线了 AI 小助手,欢迎来撩!(https://sourl.co/G5Gpqh)
谷歌研究者推出 AI 游戏引擎 GameNGen,能实时生成逼真的游戏画面,无需编码即可创造游戏。该技术在模拟《毁灭战士》时显示了高画质和实时交互能力,预示着游戏开发成本和时间的大幅降低,同时为小型工作室和个人创作者提供了创造复杂互动体验的可能性。GameNGen 的诞生不仅可能重塑游戏产业格局,还为虚拟现实、自动驾驶等行业带来变革潜力,尽管仍面临算力和通用性挑战。
智谱 AI 最新推出了全国首个手机 AI 视频通话功能,该功能不仅能够破译《黑神话:悟空》中的经文,还能辅导作业、翻译、检查食品保质期等。AI 视频通话的实现,标志着智谱 AI 在交互方式上的重大突破,使得 AI 能够通过摄像头理解用户所看到的世界。此外,智谱 AI 还升级了其基座大模型 GLM-4-Plus,增强了语言文本和图像视频理解能力,进一步推动了大模型技术的前沿发展。
阿里云 Qwen 团队推出了 Qwen2-VL 视觉大模型,具备图像和视频理解、复杂推理决策能力,支持多语言文本识别。模型包含 2B、7B 和 72B 版本,其中 2B 和 7B 版本已开源,授权协议为 Apache 2.0。Qwen2-VL 在多个视觉理解基准测试中达到先进水平,能够处理长视频内容,并可集成到移动设备和机器人中进行自动操作。相关资源和社区链接已提供以供深入了解。
HuggingFace 推出了低成本 AI 机器人 LeRobot,由前特斯拉工程师 Remi Cadene 领导开发。LeRobot 基于 Koch v1.1 机器人套件,包含两个六电机机械臂,支持使用摄像头作为视觉传感器。项目提供全部开源硬件和软件资源,包括训练控制程序和 AI 模型,使得个人可以自行组装并训练机器人。LeRobot 的单个机械臂成本约 200 美元,未来计划推出更经济的 Moss v1 版本,定价 150 美元。项目旨在推动 AI 机器人技术普及,让更多人能够体验和开发自己的 AI 机器人。
美年健康、华为云和润达医疗联合推出了国内首款 AI 健康管理师“健康小美”,提供 24 小时 1 对 1 的个性化健康管理服务。该产品利用大模型技术和医疗大数据,能够识别并理解医疗数据,提供专业精准的健康分析和疾病风险预测。结合用户健康档案和生活习惯,"健康小美"可提供定制化的健康干预措施和就医指导,实现全天候健康咨询和多模态交互的健康管理新体验。
中国科学院地球化学研究所和阿里云在 2024 数博会上发布了国际首个月球科学多模态专业大模型。该模型基于阿里云通义系列模型,通过视觉、多模态及自然语言技术,在月球撞击坑年代和形态判别上达到超过 80%的准确率。模型的应用极大提升了月球地质研究的效率,可从多种数据中识别撞击坑特征,并回答相关问题。未来,该模型将嵌入数字月球云平台,助力月球与行星科研创新。
上海人工智能实验室发布的书生·天际 3.0 实景三维大模型,通过技术创新,实现了渲染效率的 6 倍提升并支持 VR 设备应用。模型支持全尺度场景的 3D 建模,从单个物体到城市场景,提供逼真立体的呈现。新系统 LandMarkSystem 兼容多种算法和硬件,优化实时渲染能力。书生·天际 3.0 的开源代码和算法,为城市规划、文旅、游戏开发等领域带来广阔应用前景。
Zamba2-mini 是 Zyphra 推出的端侧开源 AI 模型,具有 12 亿参数,采用 4bit 量化技术,内存占用控制在 700MB 以下。该模型在推理任务中表现出色,与更大模型相比,首次令牌时间减半,内存占用减少 27%。Zamba2-mini 通过高度优化的架构和双层共享注意力层设计,实现了高质量输出和高计算效率。其预训练基于三万亿个 token 的庞大数据集,并在 Apache 2.0 许可下开源。
谷歌子公司Gemini计划重新启用升级后的Imagen 3 AI技术来生成人物图像。此前因争议而暂停的功能,此次将引入新的图像质量标准和多样性保护机制,避免历史问题重现。新模型将首先向付费用户提供,同时推出SynthID工具以区分AI图像,公司承诺将根据用户反馈持续优化。
国内 AI 硬件公司深圳机智连接科技推出可穿戴 AI 设备 NotePin,售价 169 美元,续航 20 小时,支持 59 种语言转录和摘要生成。配备 MEMS 麦克风和 AI 技术,支持端到端加密,保障用户隐私。NotePin 定位生产力工具,旨在记录和整理日常生活与工作,由许高领导的公司开发,此前 AI 硬件 Plaud 已获 20 万用户。
OpenAI 宣布其 AI 聊天机器人 ChatGPT 周活跃用户数已超 2 亿,一年内翻倍。92%的财富 500 强公司采用其产品,自 7 月 18 日发布成本更低、性能更优的 GPT-4o mini 模型后,自动化 API 使用量翻倍。CEO 奥特曼强调,ChatGPT 在医疗、教育等领域发挥重要作用,帮助完成日常任务、解决问题和激发创造力。尽管面临微软、谷歌、Meta 等巨头的竞争,OpenAI 依旧保持行业领先地位。同时,Meta 的 Llama 模型使用量亦见显著增长。
OpenAI 和 Anthropic 与美国国家标准与技术研究院下属的人工智能安全研究所签订协议,共同推进 AI 模型的安全研究和评估。此举旨在制定负责任的 AI 规则,确保技术安全、可靠。尽管美国人工智能安全研究所的行政命令并非法律,但合作被视为 AI 安全领域的重要里程碑,有助于塑造全球 AI 安全标准。尽管存在对"安全"定义模糊和缺乏明确规定的担忧,该协议仍被看作是向正确方向迈出的一步。
湖北籍男子任某(32 岁)因在社交媒体发布 AI 合成的虚假视频,通过夸张标题和内容吸引流量并获利,被厦门警方以涉嫌寻衅滋事罪采取刑事强制措施。任某利用写作 APP 和 AI 技术生成虚假文章和图片,制作视频误导公众,警方提醒网民保持警惕,不轻信未经证实的信息,同时将加强打击网络谣言。
三星 One UI 7.0 操作系统预计将于 2024 年 10 月发布,届时将在三星开发者大会上展示其新功能。该版本基于 Android 15,将为超过 50 款 Galaxy 设备带来更新,包括改进的蓝牙 Auracast、NFC 功能,以及全新的 UI 设计和动画。One UI 7.0 还计划优化电池寿命,引入 App Lock 功能和垂直应用抽屉,提升用户操作体验。此外,三星还可能增强 Bixby、Galaxy AI 等生态系统功能,为用户带来更智能、更安全的手机使用体验。
科技媒体 The Decoder 报道,Anthropic 公司旗下的 Claude AI 聊天机器人被用户反馈变得“慵懒”,在基础编程任务上表现不佳。Reddit 社区中,用户 NextgenAITrading 的帖子获得了广泛关注。对此,Anthropic 公司回应称,经过调查未发现普遍问题,并确认未对 Claude 3.5 Sonnet 模型或推理管道进行修改。此前,OpenAI 的 ChatGPT 也曾面临类似“变懒”的反馈。
Omdia 报告预测,AI 数据中心芯片需求将从 2022 年的不足 100 亿美元激增至 2029 年的 1510 亿美元。但预计 2026 年后市场增速将显著下降。当前市场增长主要由技术采纳推动,未来增长动力将转向 AI 应用需求变化。超大规模企业定制芯片,如谷歌 TPU,开始抢占 GPU 市场份额。AI 模型规模自 2021 年以来未见显著增长,创新转向多样化小型模型,预示着 AI 基础设施投资可能面临挑战。推理需求的增长将推动推理基础设施的扩展。
8 月 23 日在上海举办的“AI+陪伴”交流会上,有新 Newin 创始人 Tim 分享了 AI 陪伴产品的最新市场观察。a16z 榜单显示,陪伴类产品排名上升,使用时长和移动访问比例超过 ChatGPT。国内产品在产品能力和商业化方面表现强劲,如 Talkie 的 ARPU 和更新频次远超 C.ai。投资者青睐具有差异化和个性化的 AI 陪伴产品。驰星创投和观庐科技分别从投资和产品角度,探讨了 AI 陪伴产品的商业潜力和人文价值,强调了数据资产和数字分身在陪伴赛道的重要性。
张宏江博士在《AI 光年》栏目中分享了对 AI 大模型的八点观察,包括大模型的规模定律、计算中心的转移、操作系统角色、应用前景、模型大小选择、投资机会、多模态模型对 AGI 的重要性以及其对机器人的赋能。他预见大模型将成为新一代操作系统,推动软件重写和生态构建,同时强调多模态大模型在实现通用人工智能(AGI)和自主智能世界中的关键作用。
在 2024 年世界机器人大会上,尽管人形机器人成为焦点,但一位长期关注该领域的投资人表示不再考虑投资。原因是目前人形机器人在工业和家用场景中表现不够突出,与现有自动化解决方案相比缺乏明显优势。尽管机器人在机械性能上有所差异,但在软件层面难以形成突破,泛化能力不足。此外,人形机器人的量产和进厂更多是为了收集数据,而非真正的工业化应用。尽管存在怀疑,但技术发展是逐步的,人形机器人的真正成熟仍需时间。
❝AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!
欢迎戳我加入 AGI 掘金飞书社群交流学习😊(https://sourl.co/G5Gpqh)
❞
点击阅读原文,了解详情