搜狐科技《思想大爆炸——对话科学家》栏目第113期配资网络炒股,对话浙江大学计算机学院教授庄越挺。
嘉宾简介:庄越挺,浙江大学求是特聘教授,浙江大学学术委员会副主任,浙江大学计算机科学与技术学院原院长,中国人工智能学会副理事长,长期从事跨媒体、人工智能、数字图书馆等领域研究。
划重点:
1、这次AI热潮与以往不同,主要由工业界的需求驱动,应用领域比较广泛。
2、AIGC未来的发展方向是from X to Y 的多模态大模型。目前的技术,无论是文本还是图像生成,都只是基于概率的采样,而没有真正的推理过程。
3、我们的想法是让大模型和小模型协同工作,用最少的成本达到最好的效果。
出品|搜狐科技
展开剩余88%作者|汉雨棣
编辑|杨锦
当ChatGPT掀起全球狂欢,当杭州“创业六小龙”在资本浪潮中崭露头角,很少有人注意到,中国人工智能的起点,始于上世纪90年代图书馆里手抄文献的学者背影。浙江大学庄越挺教授,已经亲历了AI的两次起落。
90年代,他参与的国家七五重点攻关项目“天马”专家系统斩获国家奖项,在随后漫长的“AI寒冬”中坚守阵地;2017年后,AlphaGo与深度学习重燃AI战事。从“纸上谈兵”的理论争议到医疗、文化的落地革命,他坦言“这次热潮不一样”——工业需求与技术突破的双重推力,正将AI推向一个更务实却也更颠覆的时代。
当被问及“杭州为何跑出六小龙”,庄越挺认为,关键因素离不开“浙大人的踏实”与政府的开放包容。杭州这座城市的创新生态,既有海归带来的全球视野,也有创业系锻造的商业敏感,更离不开浙大校友“总工程师式”的技术执着。
作为高校研究者,他表示现在高校项目中,AI研究的真正价值在于“顶天立地”——既要攀登理论高峰,也要解决癌症筛查、古籍数字化等民生痛点。
在近日“吴文俊人工智能科学技术奖”颁奖典礼期间,搜狐科技与庄越挺展开了一场深入的对话。
一、对AI的三十年追问
搜狐科技:您在硕士研究生阶段就开始研究人工智能,当时主要研究的是专家系统,那时候这个领域非常热门。后来您担任了十年浙江大学人工智能研究所的所长。经过这么多年人工智能又重新火热起来。您认为这两次热潮有不同之处吗?
庄越挺:有区别。我读研究生是在90年代,当时人工智能的热潮主要集中在专家系统上,基于符号主义,通过总结知识形成规则,再用逻辑推理的方式进行处理。当时人工智能的研究就非常火爆了。我在硕士期间参与了一个由中科院数学所陆汝钤院士牵头的国家七五重点攻关项目,主要是专家系统开发环境,后来这个项目还获得了国家科技进步二等奖,可以说是当时做得最好的项目之一。
后来我在浙江大学人工智能研究所担任所长。当时人工智能就转入低潮期了,但我说仍然还是要坚持人工智能的研究。
中国新一代人工智能研究的热潮开始于在2017年,国家发布了《新一代人工智能发展规划》。这次热潮与以往不同,主要是由工业界的需求驱动,应用领域比较广泛,得益于像深度学习这样的技术突破,即数据驱动的神经网络方式。比如,阿尔法狗(AlphaGo)是一个标志性事件,说明深度学习技术为代表的、数据驱动的神经网络方式可以担当大任。
搜狐科技:您提到浙大牵头创建了数字图书馆。经过了几十年您对目前的数字图书馆发展情况满意吗?
庄越挺:那时候的情况是很多书都躺在图书馆里,没有电子版。不像现在,你要写一本书,写完之后图书馆都会有电子版,这就是“原生电子书”,出版的书“生下来”就有电子版。但以前可不是这样,我们读书的时候找文献非常困难,所以当时我们经常要跑到北京查资料,比如到国家图书馆或者其他研究机构的图书馆,找到资料复印后再带回去。尤其是2000年之前,很多文科类的书基本都没有扫描和数字化,研究历史和古籍的资料尤甚。
我们当时就在思考,图书馆的理念应该是“Anyone Anytime Anywhere can access Any information”,也就是任何人、任何时间、任何地点都可以获取任何知识。这个理念在今天已经基本实现了。
在这个过程中大数据的概念刚好出现。我们在研究图书馆技术时就发现大数据技术非常有用,就同时也做了一些研究。大数据智能恰恰就是新一代人工智能的核心之一。
现在,如果把所有书放到人工智能模型中进行训练,模型就掌握了所有书里的知识,可以进行推理。你问它任何问题它都能回答。所以数字图书馆未来一定会走向基于大语言模型的智慧图书馆,这是必然的趋势。
搜狐科技:目前的大数据还有哪些新的发展方向吗?
庄越挺:比如GPT,它主要是完成从文本到文本的任务。但AIGC的内容远远不止这些,比如说以文生图、以文生声音,以文生视频等等。这个概念实际上还可以进一步泛化,就是从 X 到 Y。即输入是任意的媒体类型或组织,输出也是任意的媒体类型及组合。比如输入是图像,输出是文本;输入是文本,输出是声音。各种各样都有。这是多模态的大模型,突破点就在这里。但显然,这块还没有达到我们完全满意的地步,还有很多工作要做。
搜狐科技:主要的技术难点在哪里?
庄越挺:这个问题需要一步一步来分析。文本生成的后训练中我们可以给AI加入一种思维方式,比如现在的“思维链”方法。通过强化学习对思维链进行训练后,可以产生很好的效果。但是对于图像生成这一类的任务,目前还没有办法将思维链这种方式应用到图像推理中。因此,图像生成更多依赖于扩散模型学习,底层思路和文本生成有所不同。
从人类思考方式的角度来看,我们的大脑在想到某个事物时会有一个推理过程。但目前的技术,无论是文本还是图像生成,都只是基于概率的采样,而没有真正的推理过程。也就是说,文本中使用的思维方式目前还无法应用到多模态的生成中,在这方面仍然存在局限性。
搜狐科技:您预计我们需要多长时间才能攻克这个难题?
庄越挺:系统每天都在进步,没有一个明确的“攻克”时间点。它不像某一个数学难题,一旦解出来了就是彻底解决了。AIGC的任何方面都是每天都在进步,今天比昨天好,昨天比前天好。我认为当它达到某个足够好的阶段,能够满足大家的需求时,就可以认为是“攻克”了。
二、浙大是怎么培养出梁文锋们的?
搜狐科技:今年以deepseek为代表的“杭州六小龙”很火。有人说杭州是新的硅谷,其中浙大系的创业者占了很大比重。您觉得这是不是和浙大的基因有关?
庄越挺:有人统计过,在杭州创业公司的CTO中有相当大比例是浙大的校友。像杭州城西这一带创新氛围很好,有几个因素:一个是浙大系,一个是创业系,还有一个是海归系。海归也发挥了很重要的作用,带来了很多新的想法。
搜狐科技:北京、上海也有大企业、好高校,还有更多的海归,为什么是浙江?为什么是杭州?是不是浙大有什么特别的校友基因?
庄越挺:这种校友的基因一定是有的。每个大学都有自己的氛围和习惯,比如清北的人有清北的基因,同样,浙大人有浙大的基因。浙大的校训是求是创新,浙大人很踏实。以前很多浙大校友在国家重要单位做总工程师,技术扎实。我觉得这种基因是有的。
我没有深入研究过校友创业,但最近浙大校友的确在创新创业上表现得特别出色。整个杭州也很开放,尤其是城西科技城,政府对企业非常支持,对人才也很宽容。我觉得这些支持因素起了很大的作用。我也经常参与一些人才项目评审,确实能感受到杭州对创业和人才的重视程度。
搜狐科技:您作为吴文俊人工智能科学技术奖励委员会秘书长,在评选项目的时候,以及平常带学生的时候,是更看重项目的落地能力,还是更看重创新能力?
庄越挺:作为高校工作人员,我们一方面肯定要注重理论研究。对于AI的研究,肯定不仅仅是工程师行为,不是单纯地调参数调算法、达到最优结果。理论研究需要有一些创新的想法,这是科研的基础。
另一方面,这些想法也不能完全脱离实际,不能搞一些不着边际的研究。理论必须联系实际,即我们常说的,既要“顶天”,也要“立地”。我们现在强调的是结合应用的创新,比如解决医疗问题,像医学图像识别,帮助筛选疾病、癌症等。这不仅是解决实际问题,还隐含着理论上的突破。
我非常反对单纯以论文为导向的模式——写完一篇论文就认为任务完成了,这种从论文到论文的做法我很反对。特别是现在大模型方向的研究,论文中提到的一些内容是需要在实践中验证的,实践需要能够支持你的研究,这样才能支撑你的研究走得更远。论文要写在祖国的大地上。
搜狐科技:您觉得AI发展会导致失业吗?
庄越挺:技术进步只是改变了一些行业,而不是消灭它们。就像蒸汽机的出现取代了马车和马夫,电力的出现取代了蒸汽机,当时很多人因为汽车的出现而不得不适应新的变化。
同样,计算机的出现也改变了某些行业。我认为那些能够将人工智能作为工具并善于使用它的人会更有优势。就像电子词典的出现,人们不再需要翻纸质词典,因为电子词典速度更快,效率更高。人工智能系统也是如此,它们可以在短时间内解决问题,为什么还要依赖人工呢?这样节省下来的时间可以用来做更有价值的事情。
搜狐科技:那这么说那您其实是技术乐观主义者了?
庄越挺:是的,我是乐观的。
搜狐科技: 您现在在关注什么AI问题?
庄越挺: 我现在在做大小模型协同、跨媒体智能等方向的研究。
搜狐科技:小模型现在用得不多了。
庄越挺:不完全是这样。应该说对小模型的关注少了。大模型确实很好,像Open AI、DeepSeek的那些大模型都很出色。但大模型用来解决一些小问题时,有时就像是杀鸡用牛刀。因为大模型的使用成本很高,所以有时候我们应该广泛使用小模型。比如你问AI“请你介绍一下北京的人文历史”,这样的问题用小模型就可以解决。北京的历史文化都是标准的、教科书上会提到的内容。这种情况下,使用大模型就是白花钱。
很多小模型非常实用配资网络炒股,尤其是那些用于视觉和多媒体的模型。现在网上已经积累了大量开源的小模型,比如Hugging Face,以及国内的魔塔社区。我们的想法是让大模型和小模型协同工作,用最少的成本达到最好的效果。
发布于:北京市