项目主任连线【第十期】| 大模型时代的人工智能技术进展和产业应用
项目主任连线【第十期】| 大模型时代的人工智能技术进展和产业应用


12月25日,香港中文大学(深圳)金融EMBA项目有幸请到科大讯飞副总裁、研究院院长、语音及语言信息处理国家工程研究中心副主任刘聪先生,向大家分享讯飞星火大模型的实践经验,并对大模型和通用人工智能领域的现状和发展趋势进行分析和解读。
王健
深圳高等金融研究院副院长
金融EMBA项目主任
本次分享活动由深圳市好上好信息有限公司高级总监,23级诚道班的王寒飞同学主持。在分享的开场部分,
深圳高等金融研究院副院长,金融EMBA项目主任王健教授简单概述了目前人工智能行业的发展现状,阐释了科大讯飞作为国内人工智能领域的头部企业之一,其实践经验对于学员们认识和应用人工智能的帮助,也对刘聪院长接下来的分享表示了欢迎和期待。
刘聪
科大讯飞副总裁
研究院院长
语音及语言信息处理国家工程研究中心副主任
在本次分享中,刘聪院长围绕科大讯飞的星火大模型,从科大讯飞人工智能技术进展与应用、人工智能大模型的技术解读与分析、讯飞星火大模型的进展与应用实践、我国发展通用人工智能趋势与思考四个模块介绍大模型时代的人工智能技术进展和产业应用。
01
科大讯飞AI技术进展与应用
刘聪院长提到,虽然可能大家对讯飞的标签是智能语音,但是伴随着智能学习在过去十几年的发展,讯飞已经从过去智能语音的各个维度,拓展到自然语言理解、图像图文等多个行业。
我国人工智能发展史上,讯飞推动并达成了诸多里程碑:
2008年 语音合成
2012年 语音评测
2015年 语音识别
2017年 智医助理机器人
2018年 机器翻译
2019年 机器阅读理解
2022年 常识推理

在介绍人工智能发展的阶段中,刘聪院长引用了语音及语言信息处理国家工程实验室执行主任胡郁的观点,将人工智能技术分为三个层次:能存会算的运算智能,能听会说、能看会认的感知智能以及能理解会思考的认知智能,在这三个层次中,科大讯飞都位于行业的领跑者。
02
人工智能大模型的技术解读与分析
目前人工智能产业受到国家重视,各地区省市推出了针对大模型的政策,而国内国际上的大模型产业竞争也呈现出“激烈迅猛“之势。刘聪院长分析了以ChatGPT为代表的认知只能大模型底层技术实现路径——预训练、有监督微调、人类反馈的强化学习。
预训练:对海量文本进行高质量的清洗及超大规模语言模型训练
有监督微调:大量高质量有监督指令任务的有监督训练
人类反馈的强化学习:以人类反馈为优化目标的模型表现对齐
刘聪院长强调,预训练数据的数量和对应质量十分关键,然而不断增大的参数需要更高效的算力支撑。他举例道,GPT-3训练模型的参数量为300p,需要1000张A800型号的计算卡运算一个月,而GPT-4训练模型的参数量为至少3000p,需要10000张A800型号的计算卡运算3-4个月才有可能实现对标GPT-4效果的模型。
介绍完大模型训练的技术路径后,刘聪院长总结了大模型智能涌现的技术启示。

03
讯飞星火大模型的进展与应用实践
刘聪院长评价道,大模型在人工留能技术和应用的重大历史意义,不亚于互联网和个人电酷的诞生,认知大模型的“智能涌现”将带来解决人类刚需的全新机遇。

科大讯飞为星火大模型做了充足准备,依托三大国家级平台,打造了1个通用认知智能大模型,并且在9月5日正式向全民开放使用。
星火认知大模型在七大维度能力上取得优异表现,与教育、医疗、金融等产业结合紧密,在发布之初就受到业内关注。为推动一体化设计,讯飞与华为合作,致力于打造全国产化大模型算力底座,目前,对标GPT-4的更大参数规模的星火大模型已经启动训练,预计2024年上半年完成
04
我国发展通用人工智能趋势与思考
刘聪院长提出了我国发展通用人工智能需要关注的四点趋势:

趋势一:未来通用大模型会向多模态多语言方向发展
从技术维度来看,通用认知大模型是技术阶跃的关键,认知智能大模型是未来通用人工智能发展的核心基础。
趋势二:未来通用大模型会向更可信可解释方向发展
需要从海量数据源头质量,系统方案设计层面增强大模型回答准确性。
趋势三:未来通用大模型会向系统性创新的方向发展
大模型时代需要更加关注系统性创新所带来的护城河效应
趋势四:未来通用大模型会向软硬一体全国产化发展
面向大模型的AI芯片软硬件,已成当前“卡脖子”的底层基础设施。

在大家关注的商业领域,刘聪院长强调,大模型在ToB、ToC领域带来各行各业升级和变革的巨大机会,在大模型时代,多专多能、有行业场景的企业,在未来产业格局竟争中可能走的更远。但大模型不是无所不能,无处不同的,技术可达性、经济实用性、应用边界性是大模型技术持续落地关键要素,最终目的是给客户或用户创造价值。

在问答环节中,面对学员提出的对人工智能产生意识的担忧,刘聪院长表示,目前大模型有擅长的地方也有不擅长的地方,距离产生自我意识还有很长的一段距离。与其害怕并拒绝大模型,不如聚焦于如何应用大模型,为商业和客户创造价值。
本次项目主任连线对大模型进行了多维度的讲解,让学员全面了解了大模型的底层技术,发展现状和发展趋势。大模型作为未来通用人工智能发展的核心基础,不仅为企业带来了前所未有的机遇,同时也带来了巨大的挑战。因此,企业需要深入理解和掌握大模型的相关知识和技术,以便更好地利用大模型对行业进行技术赋能,推动企业的持续发展和创新。
香港中文大学(深圳)金融EMBA项目办公室出品