每日新闻网 > 科技前沿 > AI大模型加速落地 “新蓝海”如何开拓

AI大模型加速落地 “新蓝海”如何开拓

来源：光明日报 | 时间：2024-08-05 14:08:33 | 点击：4648

云南昆明，观众在第八届南博会上等待AI机器人制作素描画像。新华社发

工作人员在湖北武汉一家AI智慧产业园的展示中心内工作。新华社发

当前，生成式人工智能技术在多个领域展现出广泛的应用潜力，逐渐成为科技领域的关注焦点。

国家互联网信息办公室最新数据显示，截至目前，我国已经完成备案并上线、能为公众提供服务的生成式人工智能服务大模型已达180多个，注册用户突破5.64亿。

大模型如何进一步赋能千行百业？今后还需要在哪些方面重点发力？本期，我们邀请专家学者就生成式人工智能发展过程中遇到的难点问题和未来发展趋势进行探讨，为读者呈现这一领域的最新动态。

本期嘉宾：

清华大学新闻与传播学院教授陈昌凤

中央财经大学法学院教授朱晓峰

上海交通大学人工智能学院教授严骏驰

大模型是通向通用人工智能的路径吗？

记者：有人说，大模型改变了人类对于整个世界的认知方式，让我们看到了实现通用人工智能的路径。您对这个观点怎么看？

朱晓峰：相较于传统的人工智能，以大模型为核心的人工智能具有自主生成能力，不再是人类工程师教它什么，它会什么，而是在一定程度上像人类一样具有了自主学习和输出能力，可以从事那些人类工程师未事先赋予其相应能力的工作。这与通用人工智能的方向具有一致性。一般认为，通用人工智能具备三个关键特征，分别是自主定义任务、完成无限任务以及由价值驱动。虽然现有的生成式人工智能还不具备其中的任何一个特征，但大模型的出现和迅速发展，使我们看到了实现通用人工智能的可能道路。从这个意义上讲，这个判断是准确的。

严骏驰：大模型技术正在以惊人的速度重塑我们对世界的认知，并为未来的智能技术开辟了广阔的前景。这些技术通过处理和分析大量数据，展现出了令人瞩目的智能特性。然而，要实现真正的通用人工智能，我们可能还需要更深入的理解和更复杂的技术创新。

一方面，我们要知道大模型的“智能”并不是真正意义上的“智能”。当前的大型模型虽然在规模上达到了前所未有的水平，但它们的智能层次仍有局限性。这些模型能够执行特定的记忆任务，然而，真正的智能远不止于此。它涉及复杂的因果推理、逻辑思维等高级认知能力，这些是目前大模型所缺乏的关键要素。要实现通用人工智能，我们必须超越这些局限，模拟出更接近人类智能的全面认知能力。

另一方面，我们需要了解实现真正“智能”的关键所在。大模型的智能程度高度依赖于数据和计算资源，这种依赖导致它们的智能更多是基于统计和记忆，而非深刻的理解或创造性。真正的智能应该能够识别和纠正现有知识的不足，并有能力探索和创造新知识。这是目前大模型所未能触及的领域，也是未来智能技术发展的关键所在，我们还需要创新的算法和更深层次的认知理解。

大模型技术的发展为我们展示了实现通用人工智能的潜在路径，未来的智能技术发展将依赖我们在认知模型、算法创新和伦理研究等方面的持续努力和探索。

陈昌凤：反过来说，是人类的认知革命驱动了大模型的诞生。大模型是科学发展与哲学变迁的产物。牛顿经典力学理论带动了自然科学的第一次大发展，催生了与之相适应的哲学思维——整个宇宙是机械运动的结果，生命乃至人类也可被看作机器，生命运动可以用机械运动去解释了。

从20世纪中期开始，伴随着生物学和计算机科学的发展，人们尝试以计算的抽象思维去认识和把握世界。人工智能的奠基者图灵把人的大脑看作离散态的机器，论证认为人类心灵活动实质上是信息处理过程。计算机的奠基人冯·诺依曼提出细胞自动机的理论，认为生命的本质是计算的过程，此后更多的研究用计算思维来认识和理解生命，将生命的过程还原为计算的过程。

认知科学由此也掀起了变革热潮。人类智能的可计算性是基础，认知计算主义认为，人类大脑和计算机都被看作一套处理符号的形式系统，人类的计算、感知和认知等智能行为，都可以被数据化、符号化，成为计算机模拟、处理的对象。这些都是人工智能发展的理论基础。在尝试了不同的路径之后，辛顿等科学家研究出了深度学习、神经网络系统，从而驱动了这一轮大模型的诞生。可以肯定的是，这一场技术变革将带来更深层次的认知变革，将进一步破解人类的思维密码。

高质量中文语料短缺难题如何破解？

记者：目前普遍认为，大模型技术的发展仍面临诸多挑战，其中最突出的问题之一是数据支持的不足，尤其是高质量的中文语料短缺，难以支撑算法模型的持续迭代和优化。这个问题如何破解？

陈昌凤：当前，国际最先进的大模型几乎已经“学完”了人类已有的可获得的数字化文献。有研究指出，根据2023年数据消耗速度，高质量语言数据将在2026年前被耗尽，低质量语言数据将在2030年至2050年被耗尽；视觉数据将在2030年至2060年被耗尽。

国际上，文本数据使用殆尽，而数据流通与版权保护形成的矛盾也限制了大模型的数据可使用性。已经有很多信息巨头公司正在将视觉化信息、音频类信息转为可训练的文本数据。有消息指出，大量转录的音频数据已经用于模型训练，不少“合成数据”也已经开始受到青睐。

中文数据方面确实存在先天不足。一方面，在上世纪末的数字化浪潮中，中文领域对数字化的重视和投入均不足，初期的数字化信息质量也参差不齐，欠缺再利用的价值；另一方面，网络信息存储和数据化建设均难与技术发展相同步、相匹配。此外，迄今引进的部分数据库，带着固有的价值观烙印。亡羊补牢，为时未晚。如果从顶层设计部署到实践落实能够重视、弥补，相信仍有意义。

严骏驰：在大模型技术发展的道路上，高质量中文语料的短缺问题日益凸显，成为制约技术迭代和优化的重要因素。为解决这一挑战，可以通过以下措施来提升中文语料的质量和可用性：

一是挖掘和整合国内中文资源。我国拥有庞大的中文报纸、期刊、网站和App资源，这些都是构建高质量中文语料库的重要基础。例如，中国的报纸种类繁多，App市场活跃，国家图书馆的中文藏书也极为丰富。我们需要深入挖掘和整合这些资源，以提升中文语料的质量和多样性。

二是加强数据合规监管。政府部门和监管机构需要建立相应的监管机制，以确保人工智能领域的数据合规。这包括对大模型的数据采集来源、处理方法以及合规性进行监督和审查。同时，我们还需建设集中的数据共享平台，在保证数据合规的前提下，增强中文数据的可用性，以推动大模型技术的发展，同时保障各方的合法权益。

朱晓峰：还有两点也很重要。一是建立统一的中文语料库编码规范标准，提高中文语料数据的可使用性。我国目前的中文语料库的国家标准有《信息处理用现代汉语分词规范》《信息处理用现代汉语词类标记规范》等，但这些只是作为推荐性标准，行业采用率不高。实践中不同中文语料库采用不同的编码规范标准，形成了语料库之间的异构性，数据资源之间难以相互转换，同时导致重复建设。对此，考虑到元数据标准规范是中文语料库标准规范中最有条件、最容易实行的规范，可以依据这一规范，建设相应的中文语料库。

二是建立Web检索，搭建由国家、省市图书馆和各高校图书馆主导的中文语料库资源共享平台，推动中文语料库共享进程。Web检索为语料库的访问提供了便利，但在实际应用中，尤其是对于语言信息处理研究和人工智能的使用来说，往往需要获取语料库的全文或特定子库的内容，这就对现有的Web检索系统提出了更高的要求，即需要建立更加广泛、全面且易于使用的中文语料库资源，以便满足这些高级需求。这意味着在现有Web检索技术的基础上，还需要不断优化和完善语料库的组织结构、检索方式以及用户界面等，以提高语料库资源的可访问性和易用性。

大模型的“新蓝海”在哪里？

记者：目前，大模型已经在自动驾驶、医疗健康等领域展现出巨大潜力。未来，大模型可能会在哪些领域开拓出新的“蓝海”市场？

陈昌凤：大模型横空出世不足两年，一些“大模型”已经朝着“小模型”的方向转变，比如着力于开拓垂类应用模型——教育类、金融类、政务服务类、媒体类、医疗健康类等，并取得了可见的成效。一些可能朝着更细化的AI Agent（智能体）应用方向发展。目前一些人工智能产业正从应用层中寻求创新和价值。

严骏驰：现阶段，我国生成式人工智能的应用主要聚焦于医疗、汽车、教育、金融、文化等消费级场景，但在高精尖领域，如自动化定理证明、电路芯片设计、科学文档理解和发现以及图表理解等方面，大模型技术的应用潜力尚未得到充分开发。这些领域对于技术的要求更高，同时也具有更大的创新空间。

大模型技术在数学和逻辑推理方面有很大的潜力。通过处理和分析大量的数学和逻辑数据，大模型可以辅助自动化定理证明，提高证明过程的效率和准确性。例如，大模型可以辅助证明复杂的数学定理，帮助数学家解决一些长期未解的问题。此外，大模型还可以辅助自动化推理，例如在编程语言和形式化验证中的应用，从而提高软件开发和系统设计的效率和质量。

大模型技术在芯片设计领域也值得关注。通过引入大模型技术，可以优化设计工作流程，缩短设计时间，并优化功耗、性能和面积。这不仅提高了设计效率，还帮助开发者解决整个系统堆栈中的复杂问题。此外，大模型还可以协助完成一些重复性的探索工作，帮助开发者更快达成目标，如优化测试周期、提高覆盖率并最小化测试向量数量等。

大模型技术在科学文献分析方面的应用也显示出巨大潜力。通过处理和分析大量的科学文献数据，大模型可以帮助科学家更好地理解和发现科学知识。例如，大模型可以辅助科学家从大量的科学文献中提取关键信息，发现新的科学关联和趋势，从而推动科学研究的进展。此外，大模型还可以辅助科学文献的自动分类和索引，提高科学文献的检索效率和准确性。

在大模型技术的发展中，图表理解领域的研究也值得期待。大模型技术能够帮助理解和分析图表数据，提取关键信息，并应用于各种领域，如市场分析、金融预测等。这种技术的应用能够提高数据分析和决策制定的效率和准确性。

朱晓峰：大模型技术的特性和产业发展的要求决定了其需要大规模和长周期的投入和布局。在此过程中，我们不仅要尊重市场规律，肯定企业自身的努力，更要充分发挥国家层面的引导作用。例如在大模型基础设施建设、产业引导等方面，做出更多政策上面的引导和支持。

同时，在一些特定领域，如医疗、生命科学、数字城市等，我国拥有独特的优势。应当充分利用并发挥这些优势，通过大模型来驱动创新，从而带动人工智能产业的全面发展进步。（记者方曲韵）

(责编：李昉、郝孟佳)

【作者：】

文章评论

全部评论

更多推荐

我国科学家在光通信及6G领域取得新进展

　我国科学家近日在光通信和6G领域取得突破性进展，在国际上率先实现光纤通信和无线通信系统间的跨网络融合，自主研发的“光纤—无线一体化融合通信系统”的数据传输速率刷新纪录。该成果19日凌晨在线发表于《自然》。　　AI数据中...

水星来拜年！ 20日上演东大距

2026年第一次水星大距将于2月20日（正月初四）上演，给大家来拜年。天文科普专家表示，这是一次水星东大距，届时只要天气晴好，在20日前后几天，感兴趣的公众用裸眼或借助小型天文望远镜就可以观测到这颗平日里难得一见的行星。...

春节为什么是正月初一？用“画”告诉你

春节是我国最重要的传统节日，春节为什么是在正月初一？每年春节这一天是怎么算出来的？　　为了回答这一问题，我们携手紫金山天文台的专家，和南京艺术学院的老师同学们，采用绘画的方式，制作了系列报道《春节有“画”说》，由两位新春...

春节出游行李携带有讲究

央视网消息：2026年春运已进入客流高峰，不少旅客大包小包，携带年货、生活用品乘坐高铁返乡。行李中哪些物品可以携带，哪些属于禁止或限制携带范畴？一起来了解。　　禁止携带活体动物乘坐高铁宠物需托运　　近日，民...

硬件“硬核”软件“贴心” 细微之处看春运中实打实安全感与幸福感

央视网消息：2月15日，上海虹桥火车站的客流持续高位运行。春运期间，在那里乘车有哪些事项需要特别注意？车站又提供了哪些特殊服务？　　2月15日是春节假期首日，上海虹桥火车站迎来了一天中的客流高峰。根据铁路部门提供的最新数...

中国AI为何再次令世界惊艳

新华社北京2月14日电　特稿丨中国AI为何再次令世界惊艳　　新华社记者　　中国人工智能（AI）视频创作模型Seedance 2.0近日发布后在全球网络上迅速走红。各国用户大量分享该模型生成的超逼真视频，引发国际社会广泛关...

“三体计算星座”实现星间组网突破

记者2月12日从浙江新型研发机构之江实验室了解到，“三体计算星座”已实现星间组网突破，通过在轨协同完成了10个人工智能模型与应用的部署与验证，探索了深空探测、智慧城市建设、自然资源普查等场景的太空计算创新应用。图为之江实...

跨境便利化措施护航春节“果篮子”鲜甜直达

央视网消息：随着春节临近，这几天，各地的年货市场愈发红火热闹。除了传统的本土特产，“洋年货”这几年也是越来越受欢迎。特别是进口水果，是大家走亲访友、招待客人的热门选项。在我国北方最大的进口水果集散地，来自全球多地的进口水...

乌克兰称首都基辅遭受“大规模袭击”

乌克兰首都基辅市长克利奇科12日说，基辅当天凌晨遭到俄罗斯导弹“大规模袭击”，多栋建筑物被击中。　　克利奇科在社交媒体上写道：“大规模袭击仍在继续。请留在掩体中！”克利奇科称，包括住宅楼在内的多栋建筑物遭袭。　　基辅市军...

入境游“磁吸力”上升！暖冬度假、北国冰雪、世遗底蕴到中国过年“热力”值爆表

央视网消息：2026年春节假期，国家移民管理局预测，全国口岸日均出入境旅客将超205万人次，较去2025年春节假期增长14.1%。其中，大型空港口岸出入境客流增长明显，预计出境客流高峰将集中在2月15日，入境客流高峰将集...

2024

08/05

14:08

浏览量： 4648

大字号

今日热点

上海：受台风“康妮”外围环流影响市民街头顶风行走

科技创新产业融合武安市连翘产业插上腾飞翅膀

全国昆虫农业与微生物农业无抗产业链发展论坛在京召开

青铜峡市举行 2023年全国科普日暨怡园社区科普馆揭牌仪式

安徽淮北：科普宣传日感受科技魅力【2】

AI大模型加速落地 “新蓝海”如何开拓

友情链接