财联社7月8日讯(记者 付静 崔铭)今年以来大模型热度持续攀升,近半年内全球近百家公司、机构相继发布大语言模型相关产品。日前召开的2023世界人工智能大会(WAIC2023)上,国内外30余款大模型集中亮相,20余场论坛围绕大模型主题讨论,更是将大模型热度推向高潮。
财联社记者在WAIC2023现场注意到,各家大模型产品成为此次大会的顶流,“行业大模型”是业内人士谈论的高频词,当前大模型呈现垂直领域向“小而精”发展的态势。
但目前,大模型产业化仍面临诸多挑战。包括数据规模大且质量参差不齐;模型体积大,训练难度高;算力规模大,性能要求高等。大模型研发依赖算法算力和数据的综合支撑。“大模型生产厂商或可把复杂的模型生产过程封装起来,通过精调推理部署,以实现支撑千行百业的应用。”百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰如是说道。
(相关资料图)
大模型展台“水泄不通”
“我看到这次大会展馆里,大家一方面围绕大模型研究,另一方面是大模型在不同行业的应用,大家都展出了非常多的成果。这一切都说明,人工智能的发展正给我们带来新的期望。”正如华为轮值董事长胡厚崑在开幕式上所言,近日的上海世博展览馆因多款大模型产品的展出分外热闹。
财联社记者注意到,运营商、互联网大厂、AI独角兽的展台被围得“水泄不通”,不少观众前来了解、体验近期热度较高的中国移动“九天”人工智能行业大模型、百度文心一言、腾讯云行业大模型、阿里通义千问大模型等。
值得关注的是,此次多家展商特别强调了其大模型具体应用,现场亦颇为吸睛。例如在网易有道展台,“子曰”大模型最新应用成果虚拟人口语教练首次亮相。记者从公司方面获悉,“子曰”系网易有道自研的国内首个教育大模型,中文作文指导与批改、英语习题精讲等系列应用成果将于7月26日发布。
垂直应用向“小而精”发展
据财联社记者梳理,数十家厂商在WAIC2023期间发布大模型新品或对原有大模型宣布升级。
财联社记者获悉,中国移动(600941.SH)正式发布九天海算政务大模型、九天客服大模型等两大“九天”人工智能行业大模型。中国移动副总经理高同庆表示,九天海算政务大模型主要针对数字政府全流程进行深层次赋能,九天客服大模型则将重新定义客户服务的内涵和模式。此外,中国移动还将升级“九天揽月”人工智能产业合作生态。
中国电信(601728.SH)方面则表示,将基于TeleChat大模型的通用能力,“在智慧政务、客服、通信、司法、医疗、大数据中台等方面把模型能力嵌进去。”
商汤科技人士告诉财联社记者,此次“商汤日日新”大模型体系升级,商量SenseChat 2.0版本、秒画SenseMirage 3.0、如影SenseAvatar 2.0数字人生成平台等亮相。据了解,秒画3.0的模型参数从4月首发以来的10亿已提升至70亿量级。
同时,“网信国字号”也在积极发力大模型——中国电子云发布城市级大模型行业智能平台星智2.0,旨在构建城市级算法、模型、服务、生态一体化持续运营体系。同时,中国电子云发起的中电云人工智能创新应用产业联盟正式成立。
云天励飞在WAIC2023上首次披露了“云天天书”基础大模型的情况。云天励飞方面告诉财联社记者,该模型架构包含三个层级:通用大模型、行业大模型、场景大模型。云天励飞基于算法开发平台和算法芯片化平台,并通过高质量数据预训练生产通用大模型;在通用大模型基础上,引入高质量行业数据,生产行业大模型;再在行业大模型基础上,通过细分场景数据微调研发场景大模型。
达观数据的“曹植”大模型发布并开放公测。记者获悉,该模型支持多种语言长文本的自动化写作和多语种翻译等功能,适用于长文档写作、机器翻译、语义分析审核、知识问答、text-to-SQL等场景。
此外,华为也展示了盘古大模型相关行业应用。在近日举行的华为开发者大会上,华为云正式发布盘古大模型3.0,其中包含政务、金融、制造、矿山、气象等大模型等多个行业大模型。
综合前述产品不难发现,大模型正加快与各行各业深度融合的步伐。
WAIC2023开幕式上,胡厚崑亦透露了华为接下来将如何在大模型领域发力:“一方面是深耕算力,打造强有力的算力底座,来支撑中国的人工智能事业的发展。另一方面就是结合大模型,从通用大模型到行业大模型的研究创新,来真正让人工智能服务好千行百业,服务好科学研究。”
商汤科技董事长徐立同时表示:“大模型的突破掀起了人工智能的新一轮技术革命,随之而来的是产业需求呈现爆炸式增长,商汤希望不仅打造通用能力更加强大的基础模型,也进一步融合不同垂直领域的专业知识,构建更懂行业、更具专长的专业大模型,从根本上降低大模型的下游应用成本和门槛。”
中科院院士谭铁牛在WAIC2023期间提出观点:生成式人工智能在垂直领域向小而精发展可能是更加值得重视的一个方向。“大家知道现在参数都是成千上万亿,如果能够降到比如说百亿量级,将可以在消费级终端上使用并大面积推广,我认为这是个非常重要的发展趋势,否则的话那么大的模型只有少数几家大企业能够用,难以大面积推广。”
大模型生态建设进行时
多位与会人士提及,大模型技术有望驱动人类社会进入通用型的智能时代,深刻改变生活方式、产业发展模式格局、社会治理模式。
随着国内大模型的“井喷”式增长,一些问题也随之而来。业内人士向记者表示,现在国内大模型科研及应用力量分散,资源缺乏整合。同时在技术、人才、产品等方面的能力还有待提升。
谈及实际应用,在清华大学交叉信息研究院助理教授、Moonshot AI创始人杨植麟看来,“现在确实有很多大模型方面还没有解决的问题,比如安全性,怎样让它做到非常可控,避免产生幻觉,不去编造一些不存在的问题;比如它没有办法像科学家一样创造一些东西,可能最底层的产品开发工作还没有办法做。”
对于生成式人工智能面临的挑战,谭铁牛谈到,“生成式人工智能是个新概念、老课题,当下突飞猛进、方兴未艾;生成式人工智能不是人工智能的全部,要避免一叶障目。”
针对前述现状,科技部高新技术司副司长、一级巡视员梅建平提出了四点建议:一是加速推进大模型的基础理论、核心算法、高端芯片、系统、框架等基础的关键技术;二是要加快构建新型的大模型服务模式,形成普惠开放的全要素的智能服务体系;三是要着力打造一批可复制、可推广、标杆型的、大模型的垂直应用的示范应用场景,构建大模型行业应用生态;四是要强化联合研发、资源共享,打造开放的大模型创新生态。
云天励飞副总裁罗忆在接受财联社记者专访时也表示:“大模型肯定是会朝着更健康有序的方向发展。整个通用人工智能发展其实是国家层面甚至是人类命运共同体的事情。对于国家来讲,要在顶层做好规划,然后将产学研资源更好地结合起来,大家共同地去做技术攻关,把生态和联盟建设好。”
关键词: