
5月13日零一万物发布首个闭源模型Yi-Large,新上线一站式 AI 工作站「万知」。宣布面向国内市场一次性发布包含 Yi-Large、Yi-Large-Turbo、Yi-Medium、Yi-Medium-200K、Yi-Vision、Yi-Spark 等多个模型 API 接口,Yi API Platform 英文站同步对全球开发者开放试用申请。
在第三方权威评测中,该模型在全球头部大模型的中英文双语 PK 上表现出色。在最新出炉的斯坦福评测机构 AlpacaEval 2.0 经官方认证的模型排行榜上,Yi-Large 模型的英语能力主要指标 LC Win Rate(控制回复的长度)排到了世界第二,仅次于 GPT-4 Turbo,Win Rate 则排到了世界第一。此外,在更全面的大模型综合能力评测中,Yi-Large 多数指标超越 GPT4、Claude3、Google Gemini 1.5 等同级模型,达到首位。
在中文能力方面,SuperCLUE 更新的四月基准表现中,Yi-Large 位列国产大模型之首。在针对代码生成能力的 HumanEval、针对数学推理能力的 GSM-8K 和 MATH、以及针对领域专家能力的 GPQA 等评测集上,Yi-Large 也取得了耀眼的成绩。同时,在中外权威指令遵循评测集中,Yi-Large 的表现均优于国际前五大模型。
从行业落地的角度来看,理解人类指令、对齐人类偏好已经成为大模型不可或缺的能力,指令遵循(Instruction Following)相关评测也越发受到全球大模型企业重视。在针对代码生成能力的 HumanEval、针对数学推理能力的 GSM-8K 和 MATH、以及针对领域专家能力的 GPQA 等评测集上,Yi-Large 也取得了耀眼的成绩。

Yi-Large的特点如下:
- 大规模:Yi-Large采用了数十亿的参数,这意味着它可以存储和处理大量的信息,从而在各种中文自然语言处理任务中取得优异的表现。
- 预训练:Yi-Large使用了一种称为“预训练”的技术,这使得它可以自动从大量的中文文本中学习知识和规律。这使得Yi-Large在处理各种中文自然语言处理任务时具有更高的准确性和效率。
- 多样化:Yi-Large不仅可以处理传统的自然语言处理任务,如文本分类、情感分析、命名实体识别等,还可以处理一些复杂的任务,如机器翻译、问答系统、文本生成等。
零一万物是李开复创建的AI公司,成立之初主要面向海外市场打造GPT-4消费级应用,然后再接入零一万物的模型,上线9个月已有千万级用户。最新一轮融资中,零一万物估值近十亿美元,为中国六家大模型独角兽之一。