腾讯推出“混元大模型” 正式加入中国人工智能竞赛

腾讯副总裁蒋杰星期四(9月7日)在年度全球数字生态大会上说,混元大模型具备中文创作和复杂语境下的逻辑推理能力,目前已接入公司旗下的50多个产品和服务。(林煇智摄)
腾讯副总裁蒋杰星期四(9月7日)在年度全球数字生态大会上说,混元大模型具备中文创作和复杂语境下的逻辑推理能力,目前已接入公司旗下的50多个产品和服务。(林煇智摄)

字体大小:

中国互联网巨头腾讯发布人工智能(AI)大模型“混元大模型”,并推出类似ChatGPT的聊天机器人,正式加入中国科技企业在AI领域的竞赛。

腾讯星期四(9月7日)在深圳举行的年度全球数字生态大会上发布AI混元大模型(简称:混元),向企业客户开放使用。该模型是腾讯自主研发的大语言模型,其参数达到千亿级别,具备中文创作,以及复杂语境下的逻辑推理能力。

腾讯副总裁蒋杰介绍,目前混元已接入公司旗下的50多个产品和服务。他在活动上示范,混元如何进行会议内容分析和总结、文档创作和广告图片生成,并让聊天机器人“混元助手”自我介绍,以及回答简单数学题。

蒋杰称,混元使用基于探针的技术算法,不完全依赖外来数据库插件的“外挂”方式。他说,与目前市场上常见的AI大模型相比,这种方法能提高模型自身回答的真实性,有效降低幻觉率30%至50%。

美国初创公司OpenAI去年11月推出ChatGPT,在中国引起广泛关注,但相关服务不能在中国使用。多家中国科技公司今年陆续推出类似服务,抢占国内市场以获取新收入来源。

中国国家网信办从8月15日起加强对生成式AI服务监管,并要求业者在提供服务前向当局申报安全评估。

据中国媒体报道,包括腾讯,百度、商汤、百川智能等11家科技企业的AI大模型在上星期四(8月31日)已获得中国官方批准,有至少五家已推出面向公众的AI产品。

相较其他科技企业早在今年初已发布自家AI大模型,腾讯高级执行副总裁、云与智慧产业事业群总裁汤道生接受《联合早报》等媒体的群访时称,腾讯在推出AI大模型的进程“没有晚到”。

汤道生强调,其应用不限于聊天机器人,可融入多种企业场景,降低运营成本,提高效率。

他解释,混元不是一个通用的大模型,客户可以使用自家的企业数据来进行额外训练。“我们提供的是微调工具,帮助客户定制模型,以满足特定业务需求。”

高端芯片是训练大型AI模型的核心硬件。在中美科技竞争下,美国在去年9月下令美国芯片制造巨头英伟达停止向中国出口A100、H100高端图形处理器(GPU)芯片,以遏制中国在AI技术的发展。英伟达随后推出符合出口管制规定的A800芯片,但数据传输速率被限制,也面对严重的供应短缺。

汤道生说,目前的芯片供应未能满足广泛市场的需求,而公司未能获得技术领先的芯片意味着模型训练需要更多时间。他说:“需要找到一些创新的方法来弥补不足,例如(向模型)提供更高质量的训练数据。”

中国电信巨头华为8月底新上架的手机被证实搭载国产的七纳米制程芯片,网速也达到5G水平,外界认为华为或已初步突破美国的技术封锁。

在这背景下,汤道生认为,中国大陆产出类似A100的高端芯片是“迟早的事”,而腾讯会继续与中国及其他全球芯片制造商合作,以最好投资回报选择供应商。

LIKE我们的官方脸书网页以获取更多新信息