清华大学郑纬民:未来应基于AI大模型开发行业垂直模型,赋能工农业、智慧城市等领域

2023-05-25 13:43:08 来源:21世纪经济报道


(资料图片)

21世纪经济报道 记者郭美婷  骆轶琪 广州报道

从去年底OpenAI推出ChatGPT,到近日大厂集体抢滩内卷AI模型,这一轮人工智能热潮给产业界创造了无限遐想,并且在人才、教育、科技等领域也带来了一系列连锁反应。

近日,在香港科技大学(广州)举办的“交叉科技与数字经济论坛”上,中国工程院院士、清华大学计算机科学与技术系教授郑纬民接受了21世纪经济报道记者的采访。谈起近日以ChatGPT为代表的AI大模型掀起的热潮,郑纬民认为,ChatGPT在技术理论上并没有达到太大的突破,其成功之处在于做好了三件非常重要的事情。

第一是数据的清洗,训练ChatGPT的数据来自于互联网,杂乱而繁多,其中有非常多无用甚至有害的信息,需要取其精华去其糟粕;第二是反馈学习,ChatGPT能够从人类反馈中强化学习,通过微调人类反馈来调整语言模型;第三是ChatGPT做成了一个系统工程,即达到了软硬件的协同。” 郑纬民特别强调了系统工程的重要性,一个好的系统工程能够让使用8000块GPU的大模型达到使用10000块GPU的效果,降本增效。

AI大模型的核心硬件是芯片。目前,国外厂商如英伟达等在芯片生产上有着更多的话语权,国内则因起步较晚,自研的芯片在性能上仍稍显不足。在郑纬民看来,性能上的差距可以在生态上得到弥补。“所谓好的生态就是让芯片用起来不费劲,建立这样的生态,并让市场接受,需要一个过程。”

ChatGPT最初的爆红,在于其能够流畅地与人对话,写诗、作画、列提纲等更不在话下,然而,郑纬民认为,未来以ChatGPT为代表的AI大模型所带来的贡献应不止于此。如何基于大模型,研发针对行业细分领域的垂直的模型,并在工业、农业、智慧城市的建设等领域利用AI大模型赋能更加重要。

ChatGPT的出现同样给教育界带来了巨大冲击。早在去年12月上旬,洛杉矶联合学区就暂停了对ChatGPT网站的访问;纽约市公立学校、巴黎政治学院等均有推进过禁制令。国内,香港大学几度反转,两月内对ChatGPT禁了又放,香港科技大学提出允许学生“有限度使用”ChatGPT。

郑纬民认为,教育培养的是学生思考问题的能力。“以鸡兔同笼数学题为例,它或许可以利用解方程方式直接算出答案来,但相当于计算的思维过程就没有了,这对于学生的培养并不那么有利。当然,在学生已经完全理解了问题的分析、解决过程和思维逻辑后,这时候可以解放双手,让ChatGPT帮忙解决一些简单的问题。”

标签: