Yi-Large

5月13日零一万物发布首个闭源模型Yi-Large，新上线一站式 AI 工作站「万知」。宣布面向国内市场一次性发布包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多个模型 API 接口，Yi API Platform 英文站同步对全球开发者开放试用申请。

在第三方权威评测中，该模型在全球头部大模型的中英文双语 PK 上表现出色。在最新出炉的斯坦福评测机构 AlpacaEval 2.0 经官方认证的模型排行榜上，Yi-Large 模型的英语能力主要指标 LC Win Rate（控制回复的长度）排到了世界第二，仅次于 GPT-4 Turbo，Win Rate 则排到了世界第一。此外，在更全面的大模型综合能力评测中，Yi-Large 多数指标超越 GPT4、Claude3、Google Gemini 1.5 等同级模型，达到首位。

在中文能力方面，SuperCLUE 更新的四月基准表现中，Yi-Large 位列国产大模型之首。在针对代码生成能力的 HumanEval、针对数学推理能力的 GSM-8K 和 MATH、以及针对领域专家能力的 GPQA 等评测集上，Yi-Large 也取得了耀眼的成绩。同时，在中外权威指令遵循评测集中，Yi-Large 的表现均优于国际前五大模型。

从行业落地的角度来看，理解人类指令、对齐人类偏好已经成为大模型不可或缺的能力，指令遵循（Instruction Following）相关评测也越发受到全球大模型企业重视。在针对代码生成能力的 HumanEval、针对数学推理能力的 GSM-8K 和 MATH、以及针对领域专家能力的 GPQA 等评测集上，Yi-Large 也取得了耀眼的成绩。

图片来源：01.ai官网

Yi-Large的特点如下：

大规模：Yi-Large采用了数十亿的参数，这意味着它可以存储和处理大量的信息，从而在各种中文自然语言处理任务中取得优异的表现。
预训练：Yi-Large使用了一种称为“预训练”的技术，这使得它可以自动从大量的中文文本中学习知识和规律。这使得Yi-Large在处理各种中文自然语言处理任务时具有更高的准确性和效率。
多样化：Yi-Large不仅可以处理传统的自然语言处理任务，如文本分类、情感分析、命名实体识别等，还可以处理一些复杂的任务，如机器翻译、问答系统、文本生成等。

零一万物是李开复创建的AI公司，成立之初主要面向海外市场打造GPT-4消费级应用，然后再接入零一万物的模型，上线9个月已有千万级用户。最新一轮融资中，零一万物估值近十亿美元，为中国六家大模型独角兽之一。