追捧者认为它和互联网、铅字印刷术、电的发明同等重要,微软联合创始人盖茨说:“人工智能有能力改变世界。”恐惧者认为它是“人类未来文明的最大风险之一”,特拉斯首席执行官马斯克猜测它有可能控制甚至毁灭人类文明。不屑一顾者认为“它的智商甚至不如狗”,图灵奖得主杨立昆断言,“5年内,就没人用ChatGPT了。”
在本文写作过程中,记者请ChatGPT写一篇介绍生成式人工智能的文章。它生成的文章标题颇能体现人类爱与恐惧交织的情绪——“释放生成式人工智能的创造力:改变科技并引发对人类的威胁”。
兴奋与困惑
对生成式人工智能的追捧来自它超乎人类预期强大能力。ChatGPT所基于的大模型GPT-4在各种测试中的表现令人吃惊:顺利通过统一律师考试,得分高于90%的人类考生;参加生物奥林匹克竞赛,击败了99%的人类考生;还在大学艺术史、生物学等课程考试中名列前茅。
对生成式人工智能的恐惧来自人们对它的困惑——它的能力从何而来,连开发者都无法完全明白。这与过去的程序完全不同,传统上,程序员开始编写代码前,在脑中已经设计好了,可以解释机器要做什么。但人工智能基于的机器学习模型本质上是“黑匣子”,研究人员并不全然知道它如何生成内容。复旦大学大数据研究院教授赵星说:“人们将数据一股脑往模型里面扔,至于出来的是什么,却没有明确的预期。”很明显,在技术层面上,生成式人工智能存在内生不确定性。
不管人们对生成式人工智能的态度如何,它的火热却是不争的事实。ChatGPT推出两个月后,月活跃用户就达到了1亿,成为有史以来增长最快的应用程序。紧随ChatGPT,中美主要科技企业接连推出了各自的生成式人工智能产品。PitchBook数据显示,仅在2022年,生成式人工智能赛道就发生了78笔投资,总融资金额超过13.7亿美元,几乎相当于过去5年的融资总和。据Research and Markets预测,2020年至2024年,全球数字内容市场将增长5198.3亿美元,年复合增长率达15%。
自从iPhone出现以来,人们对一项新技术能够改变行业的信念从未如此之深。云计算公司纷纷跟进,开发、销售基于大模型的产品;电子商务公司希望借生成式人工智能改变经营模式;社交媒体平台上充斥着写的帖子……
面对生成式人工智能可能带来的风险,监管、规范的呼声也逐渐增强。意大利数据保护局于3月31日宣布暂时停止使用ChatGPT,并已就ChatGPT涉嫌违反数据收集规则展开调查。欧洲数据保护委员会于4月13日表示,正在成立一个特别工作组,帮助欧盟各国应对ChatGPT,促进欧盟各国之间的合作。4月11日,我国国家互联网信息办公室发布了《生成式人工智能服务管理办法(征求意见稿)》,拟对规范生成式人工智能在我国的开发及应用。
被改变的生产逻辑
人们对于人工智能的理解被重塑了。一位国内咨询行业的从业者告诉记者,2023年业界讨论的人工智能和2022年讨论的人工智能已经不一样了,之前人工智能产业更多是基于算法做知识图谱,而2023年之后人工智能意味着大模型、生成式人工智能、自然语言交互。
实际上,这种定义的变化,意味着人类未来生产模式逻辑的改变。
一方面,生成式人工智能能够强化人工智能技术对传统产业融合渗透和改造质效。研究院人工智能产业研究员刘晨告诉记者,就如同ChatGPT已经可以提供智能咨询、文稿编写、代码编写、翻译等基础工作,生成式人工智能也可以覆盖文本、音频、图像、视频等基本内容模态,同时还能进行跨模态生成,从而赋能各类细分行业推动生产力提升。未来,从感知走向认知,人工智能创造能力会不断增强,走进人类的日常生活,赋予万物智能。
另一方面,相较于专业生成内容(PGC,Professional Generated Content)和用户生成内容(UGC,User Generated Content),生成式人工智能成本更低、内容更加丰富,人工智能实现了从甄别、推荐作用到内容创作者的角色转换,将成为新一代全行业生产力工具。
以OpenAI为代表的新技术路线采用千亿参数的大模型训练,在理解需求时也会更加接近人类的思维方式。举例来说,过去我们在与智能音箱的对话中,常常会遇到语音助手表示不知道的情况,这是因为其背后的知识图谱相对静态。今后,如果有了生成式人工智能技术加持,智能音箱就可以根据外界的信息综合判断,以概率方式给出答案,这更加符合人类与世界交互的特点。
此外,生成式人工智能也有望带动数字内容创作、元宇宙、虚拟人等新兴领域加速发展。
国内人工智能热点转移
过去半年,国产大模型万众瞩目。大模型(LLM)是指具有大量参数的机器学习模型,可以在训练过程中处理大规模的数据集。大模型被用来构建GPT这样的生成式人工智能模型。
3月16日,百度推出搭载文心大模型的文心一言,对标ChatGPT。百度称文心一言是“新一代知识增强大语言模型”,拥有人类反馈的强化学习、知识增强、检索增强和对话增强等能力。
百度之后,一大批巨头企业跟进发布大模型。4月8日,华为更新盘古大模型。4月10日,商汤科技推出商量SenseChat。4月11日,阿里巴巴推出通义千问。再之后,360、字节跳动、、京东、腾讯、美图……几乎所有的中国互联网巨头都相继下场。对互联网巨头们来说,这场“大模型之战”不得不打,因为这已直接关系到市场对于企业发展前景的判断。
放眼全球,中国在大模型数量上绝不落后。据科技部人工智能发展研究中心5月底发布的《中国人工智能大模型地图研究报告》显示,当前国内10亿参数规模以上的大模型已发布79个,大有“百模大战”之势。
与市场热烈呼声形成对比的是,国产大模型的使用体验没能惊艳四座。以目前国内人工智能技术发展最快的百度来说,还有诸多不成熟的地方。市场更多反映为“中规中矩”。
在训练数据上,国内大模型距离ChatGPT也有一定差距。极客圈推测文心一言数据规模在4TB(太字节)左右,而ChatGPT据推测超过了45TB。业内人士认为,虽然不少企业宣布接入大模型,但通用大模型距离实际应用还有段距离。
国产生成式人工智能仍在路上
这场人工智能赛道的切换是突然的,许多国产大模型训练得还不够完备。人们现在看到的ChatGPT实际上也是多年累积的结果。2019年,OpenAI创始人山姆·曼完全接手这家公司时,OpenAI资金链濒临断裂,业界几乎都不看好通用大模型这条赛道。因为当时这类大模型的应用场景还不明确,支持这样量级的大模型产品非常烧钱,这对于任何一家公司来说都是一个巨大的挑战。
后来的故事世人皆知,微软用数十亿美元成功“喂”出ChatGPT,重新点燃了人们对大模型的兴趣和期待。
当前,中国在人工智能应用技术领域发展迅速,如计算机视觉、智能语音、自然语言处理等,但在底层算法理论和开发平台等基础技术领域发展节奏缓慢。刘晨认为,这很大程度上是因为中国在基础型技术领域科研实力依然不足、底层技术人才储备不足。
6月中旬,中国工程院院士、我国通信领域权威专家邬贺铨曾公开表示,在中国从事人工智能研究的技术人员不算少,但具有架构设计能力和生成式人工智能数据训练提示师水平的人才仍然短缺。AIMiner发布的2022年人工智能全球最具影响力学者榜单中,美国在机器学习领域顶尖科研学者数量上占据绝对优势,位居全球第一,而中国仅居第四。
这使得生成式人工智能国产化进程中,基础型技术从研发到真正应用面临一系列困难。刘晨举例,以飞桨为代表的中国深度学习框架正在发展成为更适合产业需求、更受中国开发者欢迎的开源开放平台,但由于基础能力不足,且一项技术从实验室到产业落地至少需要3到6个月时间,国产框架的技术和功能体验并不能满足开发者的需求,也就很难培育起繁荣的人工智能开发应用生态。
也许生成式人工智能有多火热并不那么重要,只有从源头做起,才能真正抓住人工智能技术浪潮的主动权。