酱酱们中午好~今天的 AGI 掘金热点资讯来啦,我们知识库上线了 AI 小助手,欢迎来撩!(https://sourl.co/G5Gpqh)
马斯克的 Neuralink 公司展示了脑机接口技术的最新进展,瘫痪志愿者 Alex 通过植入脑机接口,成功用意念控制游戏《CS 2》,并在 5 分钟内学会操控鼠标,打破世界纪录。Alex 还使用 CAD 软件设计并 3D 打印了脑机接口充电器支架,展现了脑机接口在日常生活中的实用性和稳定性。Neuralink 致力于提升操作方式,解码手写意图,以帮助瘫痪者恢复使用电子设备和交流能力。未来,脑机接口有望实现控制机械臂和轮椅,为患者带来更大自由。
谷歌 DeepMind 最新研究将 Gemini 1.5 Pro 大模型集成到实体机器人中,赋予其导航、推理等高级能力。机器人通过 100 万 Tokens 上下文长度的长上下文处理能力,理解多模态指令,识别物品和场景,执行 57 种任务。在 836 平方米真实空间的测试中,机器人展现出在无需推理和需要推理任务中的高成功率,以及在复杂环境中的适应性和导航准确性。该技术的发展将推动实体机器人在服务和执行任务方面的人性化和智能化。
英伟达于 2024 年 8 月 21 日推出 Mistral-NeMo-Minitron 8B,一个具有 80 亿参数的 AI 模型。该模型通过宽度剪枝和知识蒸馏技术,实现了高精度和高效率,能够在搭载 RTX 显卡的工作站上运行。Mistral-NeMo-Minitron 8B 在九项语言模型基准测试中表现卓越,覆盖语言理解、常识推理、数学推理等任务。该模型的发布标志着 AI 技术在精度和效率方面的进一步发展,为数据中心、云和工作站的 AI 应用提供了新的可能性。
浙江人形机器人创新中心研发的领航者 2 号 NAVIAI,在 2024 世界机器人大会上首次亮相,展示了其类人外观和高智能作业能力。这款 1.65 米高、60 公斤重的机器人,拥有 41 个自由度,能执行复杂动作如演讲、泡茶、下棋等。它采用拟人全身模仿学习技术,AI 算力高达 275Tops,反应迅速,能适应多种场景。领航者 2 号的全栈自主研发,标志着国内人形机器人技术的重大突破,预示着人形机器人 3.0 时代的到来,有望在服务、医疗、教育等领域广泛应用。
GPT-4,一个大型语言模型,尽管仅在人类语言上训练,却在生物学领域显示出惊人的潜力。Nature 发表的研究表明,GPT-4 能够以高精度对氨基酸和蛋白质结构进行建模,甚至在集成 Wolfram 插件后,对 α-螺旋结构的建模准确度显著提升。GPT-4 在抗病毒药物与病毒蛋白相互作用分析中也展现出能力,正确识别药物配体并预测可能的结合位点。尽管存在局限性,GPT-4 的这些能力为生物信息学和药物发现提供了新的视角和工具。
北京大学张大庆教授提出无线感知技术,利用 WiFi、5G 等信号实现隔墙感知,精度可达毫米级。该技术成本低,隐私安全问题小,有望在医疗、康养、安防等领域广泛应用。随着 6G 技术发展,未来手机将能隔空监测人体呼吸和心跳。张教授团队还探索量子无线感知,通过量子原理提高感知精度,实现更精细的非接触感知。预计 6G 时代,无线感知技术将更加普及,成为日常生活的一部分。
微软 Azure AI 语音服务新增 Text to Speech Avatar 功能,允许开发者创建个性化虚拟人形象,将文本转换为自然声音视频。该服务提供多种人物预设形象,支持批量合成 API,实现异步或实时文本到语音人像视频合成,并在 Speech Studio 中提供内容创作工具。服务按视频长度计费,已在多个地区推出。
Mamba 架构通过 Albert Gu 团队的 MOHAWK 方法,实现了在 1%的计算量下达到新的最佳性能(SOTA)。该方法将 Transformer 模型的预训练知识迁移到 Mamba 等替代架构中,通过矩阵对齐、隐藏状态对齐和权重转移三个阶段的蒸馏过程,显著降低了计算成本。Phi-Mamba 模型仅使用 3B token 进行训练,便在长序列处理上超越了传统 Transformer 架构,展现了在资源有限情况下的高效性能。
D-ID 公司推出了一款 AI 视频翻译工具,该工具不仅能够将视频内容翻译成 30 种不同的语言,还能克隆说话者的声音并调整其口型以匹配翻译后的语音。这项技术基于 D-ID 早期的动画照片技术发展而来,旨在帮助创作者扩大全球影响力,降低本地化成本。D-ID Studio 及其 API 将提供这项服务,支持 10 秒至 5 分钟、2GB 以下的视频文件,目前提供免费试用。
卡尔曼启发特征传播(KEEP)框架在视频人脸超分辨率(VFSR)领域取得突破,利用卡尔曼滤波原理实现跨帧信息融合,提高面部细节恢复质量。KEEP 算法通过编码器、解码器、卡尔曼滤波网络和跨帧注意模块,增强时间一致性,有效处理视频帧间特征传播问题。实验结果表明,KEEP 在多个评估指标上超越现有技术,尤其在保持跨视频帧面部细节一致性方面表现出色。
AI 图像生成领域领导者 Midjourney 推出新网页版编辑器,集成重绘、缩放等功能,提升用户体验。面对新兴竞争者如 Flux 1 和 Ideogram 2.0 的挑战,Midjourney 通过免费开放新工具,试图吸引和留住用户。同时,Ideogram 2.0 以其高质量的图像生成和文本渲染技术,以及较低的成本,成为 Midjourney 的强劲对手。AI 图像生成市场的竞争愈发激烈,各公司纷纷推出新功能和优化服务,以争夺市场份额。
OpenAI 宣布与 Condé Nast 集团建立技术合作,旨在通过 ChatGPT 的搜索功能提升新闻发现和传播能力。Condé Nast,成立于 1909 年,旗下拥有《时尚》、《GQ》等知名刊物,覆盖多个领域,具有全球影响力。合作将展示 Condé Nast 内容,重塑用户与数字内容的互动方式。此外,OpenAI 还与多家媒体合作,加强技术研发并解决版权问题。
安全软件公司 McAfee 推出了一款深度伪造检测器,该技术能分析音频数据,识别网络中的伪造视频。该检测器首次在联想新款 Copilot-Plus 电脑上应用,提供 30 天免费试用,之后年费 9.99 美元起。所有分析在本地完成,保护用户隐私。McAfee 计划扩展功能,包括分析无声视频和图片,并已推出教育资源网站。
Anthropic 工程师 Alex Albert 分享了他与 AI 助手 Claude 共度的一天,展示了 AI 在日常生活中的多面性应用。从早餐替代食材的查询、健身替代方案、工作邮件处理、文档制作、社交媒体互动,到晚餐烹饪指导、电影类型推荐、首饰材质比较,以及哲学书籍讨论,Claude 展现了其在不同场景下的实用性和智能性。Alex 的分享不仅提供了丰富的 prompt 指令参考,也引发了网友对 AI 依赖和思考替代的讨论。
三星在 2024 年 7 月推出的 Galaxy Ring 智能戒指,售价 3099 元,主打健康监测功能,包括心率、压力水平、体温等。然而,iFixit 于 8 月 21 日发布报告指出,该戒指在可维修性上表现极差,一旦损坏或电池老化便无法修复,成为"100%一次性"产品。其电池和充电感应线圈通过接口连接,拆解后即报废,预计使用寿命不超过两年。尽管具有 7 天续航能力,但产品耐用性问题引发消费者关注。
Anthropic 的 Claude 移动应用在 16 周内收入超过 100 万美元,美国用户贡献近半。尽管在下载量和收入上不及 ChatGPT,Claude 在 AI 应用中增速领先,下载量美国占 32.5%,收入占 48.4%。面对苹果推出 Apple Intelligence 带来的竞争压力,Claude 在 Web 端表现更佳,增速超 ChatGPT。
国产游戏《黑神话:悟空》上线后,因热度引发 AI 搜索错误,导致某机锋网员工手机号被误标为游戏客服电话。微软必应 AI 助手抓取错误信息,使受害者短时间内接到大量电话。尽管相关文章已删除,错误信息仍一度出现在搜索首页。微软必应覆盖 36 个国家和地区,用户超 6 亿,此次事件暴露了 AI 搜索引擎在信息抓取和处理上的不足。尽管必应团队已对错误信息进行更正,但 AI 搜索的准确性和可靠性问题仍需关注。
2024 年世界机器人大会在北京举行,169 家企业带来 600 余件创新产品,其中 60 余款为首发新品。人形机器人成为焦点,数字华夏推出的“夏澜”机器人,搭载 AI 系统和高仿外观,展示了自然语言交互和流畅动作控制。大会聚焦机器人在家庭服务、情感陪伴及特定场景如应急、消防的应用,同时探讨了人形与四足机器人的优劣。尽管存在行业泡沫争议,机器人技术正逐步融入日常生活,预示着智能化和人机协作的未来趋势。
宇树科技创始人王兴兴在对话中指出,中国机器人行业面临的最大瓶颈是 AI 能力的不足,尤其在 AI 人才培养方面存在欠缺。他认为,尽管硬件发展存在挑战,但硬件问题更多是工程上的,可以通过技术创新和成本控制来解决。王兴兴强调,机器人行业仍处于探索阶段,技术方案尚未统一,但随着行业关注度的提升和更多资源的投入,未来发展前景乐观。他预测,机器人行业的“iPhone 时刻”可能在未来 3 到 5 年内到来,届时将见证行业爆发式增长。同时,他也提到了触觉技术在机器人领域的应用挑战,以及自动驾驶技术对机器人技术发展的潜在影响。
❝AGI 掘金成立于 2024 年7 月,是一家专注于 AGI 相关研究和应用的创新型 知识平台。我们的使命是推动 AGI 技术和 AI 应用的落地与发展,并将其应用于各个行业,为人类社会创造更大的价值。我们提供 AGI 技术最新讯息、应用解决方案、组织各种有趣的服务,致力于成为行业的领军者。AGI 掘金期待你的加入!
欢迎戳我加入 AGI 掘金飞书社群交流学习😊(https://sourl.co/G5Gpqh)
❞