京东千亿级参数大模型“言犀”来了,预计明年上半年面向产业全面开放
发布时间:2023-07-17 22:10:29 作者:界面新闻 浏览量:466
界面新闻记者 | 李彪
界面新闻编辑 |
拥挤不堪的国产大模型赛道再添互联网大厂选手。
7月13日,京东于北京举办的京东云峰会上正式发布大模型“言犀”。该模型参数规模达千亿,支持文字、语音、视觉多模态,将产业化作为核心差异点,通过“基座+垂直领域模型精调”架构重点面向零售、物流、金融、医疗健康等行业。
新履职的京东CEO许冉表示,京东对于大模型的理解可以用一个公式总结,即“大模型的价值=算法×算力×数据×产业厚度的平方”。只有当产业效率和产业边界得到实质性拓展,大模型带来的才是一场真正的工业革命。
京东探索研究院院长何晓冬此前在接受界面新闻等媒体采访时表示,大模型的难点不在于技术追赶,而在于产业突破。面向产业的专用模型并不意味着成本或开发难度更低,预训练需先将通用数据与行业专用数据混合均匀。这要求大模型具有基础的“智商”,再针对不同行业的业务赋予不同的权重。
模型的数据来源也凸显出产业化这一特点。言犀大模型有70%的数据来自通用领域,30%来自特定的产业领域——13.6%来自零售行业数据,6.7%来自健康行业数据,3.9%来自金融数据等等。
此外,未来在开放使用后,京东预计每年还会产生数百亿的优质交互数据,预训练数据与用户反馈的交互数据形成闭环,支持模型强化。
何晓冬表示,京东在电商、物流、金融等领域扎根多年的产业数据积累,以及先天具有的产业属性,是言犀大模型的核心竞争力,“产业模型的关键点在于降低训练和部署成本,因为这直接关系到客户的成本。”
发布会上,京东还现场演示了言犀AI开发计算平台。该平台通过定制化服务可支持企业用户输入自有业务数据,按照自身业务需求将通用模型转化为专用模型,全程只需要数个小时就可以完成训练,几分钟内完成部署。目前,该平台已经启动预约注册,预计8月份正式上线。
按照京东公布的三步战略,言犀大模型发布后,今年下半年主要应用于内部业务,重点服务各行业的标杆客户,预计到2024年上半年将面向产业全面开放使用。
眼下,“MaaS”(Model as a Service,模型即服务)已经成为大厂的必争之地。在本月举办的人工智能大会上,华为、腾讯、阿里均有公布其应用于产业端的大模型生态计划。而京东入局后,市场将随着大模型逐渐落地加速洗牌。
收藏