Claude 2-TikTok导航

Claude 2 有一个超强能力：同时和「多个文档」的内容沟通，并展开深度对话。
如果你能驾驭的话，这将是跨领域、跨学科主题式讨论，如同魔法一般，赋予 Copliot 全新内涵。

Claude 2 在编写代码、分析文本、数学推理等方面的能力得到加强，并且可以产生更长的响应。

更重要的是，用户可以在新的 beta 网站上免费试用，并且 Claude 2 商用 API 的价格与 1.3 版本相同。

机器之心在多次介绍过 Claude，它是由 OpenAI 离职人员创建的 Anthropic 公司打造的。在 ChatGPT 发布两个月后，该公司就迅速开发出了 Claude，可以完成摘要总结、搜索、协助创作、问答、编码等任务。

之后持续升级，五月份通过 100K Context Windows 将 Claude 的上下文窗口从 9k token 扩展到了 100k。

现在终于迎来了大版本更新。Anthropic 表示，Claude 2 基于此前从用户那里获得的反馈建议进行改进。

接下来看各方面能力细节。

Claude 2 在哪些方面得到了加强？

总的来说，Claude 2 注重提高以下能力：

Anthropic 致力于提高 Claude 作为编码助理的能力，Claude 2 在编码基准和人类反馈评估方面性能显著提升。

长上下文（long-context）模型对于处理长文档、少量 prompt 以及使用复杂指令和规范进行控制特别有用。Claude 的上下文窗口从 9K token 扩展到了 100K token（Claude 2 已经扩展到 200K token，但目前发布版本仅支持 100K token）。

以前的模型经过训练可以编写相当短的回答，但许多用户要求更长的输出。Claude 2 经过训练，可以生成最多 4000 个 token 的连贯文档，相当于大约 3000 个单词。

Claude 通常用于将长而复杂的自然语言文档转换为结构化数据格式。Claude 2 经过训练，可以更好地生成 JSON、XML、YAML、代码和 Markdown 格式的正确输出。

虽然 Claude 的训练数据仍然主要是英语，但 Claude 2 的训练数据中非英语数据比例已经明显增加。

Claude 2 的训练数据包括 2022 年和 2023 年初更新的数据。这意味着它知道最近发生的事件，但它仍然可能会产生混淆。

该研究进行了一系列评估实验来测试 Claude 2 的性能水平，包括对齐评估和能力评估两部分。

在模型对齐方面，该研究针对大模型的三个关键要求做了具体评估，包括：遵循指令、生成内容有用（helpfulness）；生成内容无害（harmlessness）；生成内容准确、真实（honesty）。

数据统计

暂无评论...