Claude 是一款目前免费使用的聊天式大型语言模型,在之前由 LMSYS 评选的聊天式大型语言模型排行榜中,仅次于排名榜首的 GPT-4,昨日(2023年7月11日)独立发布 Claude 2,支持中文对话,不再依托 Slack,目前美国和英国的用户已经可以注册使用了。@Appinn
什么是 LMSYS
大型模型系统组织 (LMSYS Org) 是一个开放的研究组织,由加州大学伯克利分校的学生和教师与加州大学圣地亚哥分校和卡耐基梅隆大学合作创立。排行榜地址在这里。
Claude 2
之前的 Claude 需要在 Slack 中使用,并且有个神奇的现象,部分用户可免费使用,部分用户需要付费 Slack 使用,部分用户完全不能使用。
Claude 2 发布之初,基本上所有的美国和英国用户都可以注册使用。青小蛙唠叨一句:注册要赶早啊,谁知道明天是不是就不给注册了。
注册地址:https://claude.ai/ (目前仅限美国、英国用户)
注册过程中规中矩,支持 Email 注册,以及 Google 登录。
注意两个免责条款:
- 有时可能会产生不正确或误导性的信息,或产生攻击性或有偏见的内容。
- 本网站无意提供专业建议,包括法律、财务和医疗建议。请勿在未进行独立研究的情况下依赖克劳德。
最明显的特色就是支持上传文档了:
支持一次上传 5 个文档、每个最大 10MB,支持 PDF、Docx、TXT、CSV、MD、ini 等很多格式,青小蛙觉得常见文本格式都支持,比如字幕文件 .srt 也可以的。
青小蛙拿出了 DEMO 文档给 Claude 2 处理,结果满意:
Claude 2 会根据对话内容,自动帮你起一个名字,和 ChatGPT 一样可以创建多个对话。首页给了几个例子:
- 用要点提纲概括此PDF文档
- 帮助我练习西班牙语词汇
- 解释这个python游戏是如何工作的
至于聊天式大型语言模型到底怎么用,每个人都不一样,比如青小蛙现在会让 GPT 起标题,但效果也是是好是坏。当然最重要的,可能还是对用户的训练,即如何更靠谱的提问。会提问才能用好 GPT 😂
最后,来个范例,青小蛙使用的英国节点推荐。
原文:https://www.appinn.com/claude-2-release/
下面的内容,是 Claude 2 发布页面的内容机翻:
我们很高兴推出我们的新型号 Claude 2。 Claude 2 具有改进的性能、更长的响应时间,并且可以通过 API 以及面向公众的新测试版网站 claude.ai 进行访问。我们从用户那里听说,克劳德很容易交谈,清楚地解释其思维,不太可能产生有害的输出,并且具有更长的记忆力。我们在编码、数学和推理方面对之前的模型进行了改进。例如,我们最新的模型在律师考试多项选择部分的得分为 76.5%,高于 Claude 1.3 的 73.0%。与申请研究生院的大学生相比,Claude 2 在 GRE 阅读和写作考试中的得分高于 90%,在定量推理方面与申请者的中位数相似。
将克劳德视为一位友好、热情的同事或私人助理,可以用自然语言指导来帮助您完成许多任务。面向企业的 Claude 2 API 的价格与 Claude 1.3 相同。此外,美国和英国的任何人今天都可以开始使用我们的测试版聊天体验。
当我们努力提高模型的性能和安全性时,我们增加了 Claude 输入和输出的长度。用户可以在每个提示中输入最多 100K 个令牌,这意味着 Claude 可以处理数百页的技术文档甚至一本书。克劳德现在还可以编写更长的文档 – 从备忘录到信件再到故事,最多可达几千个标记 – 全部一次性完成。
此外,我们的最新模型大大提高了编码技能。 Claude 2 在 Python 编码测试 Codex HumanEval 上的得分比 56.0% 提高了 71.2%。在 GSM8k 这一大量小学数学题上,Claude 2 的得分从 85.2% 上升到 88.0%。我们为 Claude 2 制定了令人兴奋的功能改进路线图,并将在未来几个月内缓慢、迭代地部署它们。
我们一直在迭代改进克劳德 2 的底层安全性,使其更加无害,并且更难以提示产生攻击性或危险的输出。我们有一个内部红队评估,使用自动化测试对我们的模型在大量有代表性的有害提示上进行评分,同时我们还定期手动检查结果。在此评估中,与 Claude 1.3 相比,Claude 2 在提供无害响应方面的表现要好 2 倍。尽管没有任何模型可以免受越狱的影响,但我们使用了各种安全技术(您可以在此处和此处阅读相关内容)以及广泛的红队合作来提高其输出。
Claude 2 为我们的聊天体验提供动力,并且在美国和英国普遍可用。我们正在努力让 Claude 在未来几个月内能够在全球范围内提供更多服务。现在,您可以创建一个帐户并开始用自然语言与 Claude 交谈,请求其帮助完成您喜欢的任何任务。与人工智能助手交谈可能需要一些尝试和错误,因此请阅读我们的提示,以充分利用 Claude。
我们目前还与数千家使用 Claude API 的企业合作。 Jasper 是我们的合作伙伴之一,它是一个生成式 AI 平台,使个人和团队能够扩展其内容策略。他们发现,Claude 2 能够在各种用例中与其他最先进的模型并驾齐驱,但在长格式低延迟用途方面具有特殊的优势。 “我们真的很高兴成为第一批向客户提供 Claude 2 的公司之一,它带来了增强的语义、最新的知识培训、改进的复杂提示推理,以及通过 3 倍大的上下文窗口轻松重新混合现有内容的能力”,Jasper 工程副总裁 Greg Larson 说道。 “我们很自豪能够通过与 Anthropic 的合作来帮助我们的客户保持领先地位。”
Sourcegraph 是一个代码 AI 平台,帮助客户编写、修复和维护代码。他们的编码助手 Cody 使用 Claude 2 改进的推理能力为用户查询提供更准确的答案,同时还通过多达 100K 上下文窗口传递更多代码库上下文。此外,Claude 2 还接受了最新数据的训练,这意味着它拥有更新的框架和库的知识,可供 Cody 从中提取。 Sourcegraph 首席执行官兼联合创始人 Quinn Slack 表示:“在人工智能编码方面,开发人员需要快速、可靠地访问有关其独特代码库的上下文,以及具有大上下文窗口和强大通用推理能力的强大法学硕士。” “开发工作流程中最慢、最令人沮丧的部分正在变得更快、更愉快。感谢 Claude 2,Cody 帮助更多开发人员构建更多推动世界前进的软件。”
我们欢迎您提供反馈,因为我们致力于更广泛地负责任地部署我们的产品。我们的聊天体验是公开测试版,用户应该意识到克劳德 – 像所有当前模型一样 – 可能会产生不适当的响应。人工智能助手在日常情况下最有用,例如用于总结或组织信息,但不应在涉及身心健康和福祉的情况下使用。如果您想在当前不受支持的领域与 Claude 交谈,或者您是一家企业并希望开始与 Claude 合作,请告诉我们。