论AI时代的信息技术和中间件产品方向

March 1, 2025

在过去的30年,各种技术层出不穷,热点快速切换。 异构环境、分布式、大数据、微服务、容器云原生,每个时代都催生一批新的明星技术和产品。 如今在人工智能时代,大语言模型、GPU、Agent等成为热点词。

那么在AI时代,究竟什么才是技术时期发展的驱动力呢?

我认为是:以前所未有的方式快速学习全人类的知识,并高效的合理运用。

一、信息软件的三个时代

1.企业级数据库

回溯到企业级产品时期,那时技术核心点在数据库,更确切的是存储了实体运营的关系型数据,以及表现现实状态的信息。 围绕关系型数据库,软件开发存取数据时使用SQL语言,这种描述语言能体现思维过程。

信息保存在各个独立的知识域中,分享传递还是以纸质的出版物为主。 数据库形态从开始时的单机到分布式不断发展,同时催生出广泛的中间件产品,如应用服务器,消息中间件,缓存中间件,事务中间件等等。

2.大数据

互联网时代,全世界的信息连成网络,信息数据的产生以指数级快速增长。 每个人每个实体都可以产出各种数据,发表博客、上传照片、每日运动、上网购物等海量数据。

大数据时代,原有的关系数据库存在局限,出现了各种NoSQL, NewSQL,以及有Google等存放和索引全球网络的搜索引擎。 非结构化和半结构化数据占据绝大多数容量,包括了互联时代后所有电子数据,而绝大多数纸质典籍和资料也已经联机上网,并通过社交力量不断优化。

大数据数据库,除了可以通过经典SQL查询外,还提供了更多的方法被高效查询访问;而搜索引擎和海量数据库中的信息,则通过搜索交互框方式,如关键词等方式,筛选加权排序。 大数据的处理通过分布式云计算,通过分片等方式委托给多个运算节点,再将结果合并返回。

3.全数据集

人工智能时代,用自然语言方式来理解知识,用智能思维方式来思考推理。 当获取存储了知识信息,或者说是经过提炼的精华信息后,人们用最朴素的自然语言去和这个数据集合进行交互。

人人都可以使用计算机网络,不再需要专业的、需要经过培训的专业编程语言。 同时人工智能还具有推理思维能力,通过不同的角度和维度思考,分析加工知识信息,给出结果。 理论上来说,大模型不断受训和思维,掌握的知识总量可能已经远超过人类认为已拥有的。

二、大语言模型能力一窥

得益于“开源”大语言模型,我们能充分了解和使用其能力,起码是核心的能力。

1.博学广记

在HuggingFace上,每个模型都有一个模型卡,上面有其详细的描述信息。

有些模型就说明了其用来训练的数据源是哪些。正如同我们学习时需要有对应的教科书、学习辅导材料、练习试卷等。

以嵌入式模型all-MiniLM-L6-v2为例,并不大只有90M左右,算是“小”模型,采用的数据集就有:

  • QA问答,Yahoo问答集,SQuAD斯坦福问答数据集等
  • 评论,Amazon商品评论,Quora知识讨论等
  • 知识集,Wikipedia维基百科,AGNews新闻文章等
  • 代码,CodeSearchNet开源代码库等

而真正意义上的大语言模型,如Granite,则包括了更多的数据集,如: arXiv论文库,Common Crawl网站文章抓取,SEC Filings证券交易所各种材料,USPTO美国专利文本

以上这些数据集,多数数据量都是TB以上起步。 非结构化自然语言这个信息量有多大呢,“半部论语治天下”,一个维基百科的网站就够看一辈子。

所以大语言模型就是人类知识的凝聚,所谓2B,70B等模型种类,就是提炼浓缩的程度。

2.能力全能

每个模型在发布时,很多都会附带一个评测表格,对比自身和同业的能力。

这个表上面有评测的项目和得分。比如说最近大火的DeepSeek,就罗列了4个大项,分别是:英语、编码、数学和中文。 英语和中文都是语言项,和用于训练的各语言语料有关系。

结合各类语言模型,细分语言后得到如下分类:

  • 语言
  1. 知识,理解(读)
  2. 内容,摘要(写)
  3. 对话,表达(听说)
  4. 推理,指令(逻辑)
  • 数学
  • 编程

每类各选取若干个主流评测说明:

  • MMLU 多目标QA
  • SimpleQA 事实知识
  • IFEval 指令跟随
  • DROP 阅读理解基准
  • GPQA Diamond 研究生级别推理
  • MATH 500 数学问题解决
  • AIME 2024 高中数学竞赛
  • SWE-bench 生成式编程
  • HumanEval 评估代码生成任务

如果模型在一项评测上获得高分,则说明在测试的方面具备很强的能力。和采用题库进行考试差不多。

要注意,在代码编程和数学方向,总有对应的MATH/CODE,或者推理/指令模型,可以看成这个模型更具备“理工”思维方式。

3.大语言模型及开发框架的能力归类

  • 多模态,特点标注
  • Embedded和向量存储
  • 提示词,对话管理
  • 响应流式和格式化
  • RAG, ETL等Chain
  • Tools
  • MCP

最有想象力的就是MCP,即Model Context Protocol(模型上下文协议),这个由Anthropic公司开发的协议技术,迅速得到了各主流语言及开发框架的支持。

通过协议定义,在server端定义了3个要素:

  • Resources资源

  • Prompts提示词

  • Tools工具

  • 资源可以用来表述服务器了解的信息,可以类比于Rest协议开发中,将服务器端数据信息映射为Resources资源。

  • 工具,通过服务器获取信息,类比LLM API中定义的Tools。通过已存在的操作接口,将原服务器的能力暴露出去。

  • 而提示词则用自然语言,描述如何获取资源或调用工具。

通过MCP,可以将目前几乎所有的信息源和软件系统的能力,在LLM加持下,对外暴露。 任何人只要略懂相关知识,会说话表达,就能够使用软件。

三、AI时代的中间件产品方向

中间件软件,本质是屏蔽各种系统环境的技术差异性,帮助开发者更有效率的开发软件应用。

如今我们看到,每个人都可以通过自然语言来使用软件,甚至进行推理、生成代码,来完成更多的工作。 这就是最有意义的“中间”软件!

不过,我们还是要了解3个重要事情:

1.基础数学和基础软件会变得更重要。

整个AI的根基是数学,而所有的信息获取,都是建立在基础软件之上。

任务调度,内存高效使用,高性能存储,网络和分布式,所有的计算机基础知识会比之前提出更高要求。

2.开发工作不会消失,反而是专业性要求会更强

有一种论调是有了AI,会淘汰掉很多工作岗位,如不再需要程序员。 其实任何科技的进步和工具的演进,都只会提升一个知识领域的精通的门槛,”淘汰”的是入门性工作和懒人。

比如,现在AI可以写代码,写论文,甚至写书。让一段代码能运行起来很简单,软件脚手架已经成熟多年了。 更关键的是能读懂、会修改、进行优化提升的能力。AI也许可以帮助去做这些,但前提是必须会写提示词,关键是懂得相关的领域知识。

对于个人来说,认真积累知识是根本。 AI可以是个很好的工具,善用者会大大提升效率,生产力提升后,会减少成本,从而挤压原有入门级或者中低级工作。

3.解决问题的模型才是好模型

对于具体的工作任务来说,可能只用到很少的知识,但有很强的专业性。 目前的大模型还在“军备竞赛”阶段,动则就“满血”,容纳几百B的参数。

根据前面的分析,使用大模型,看中其三方面能力:数据集即知识储备,思维推理能力,自然语言处理能力。

我们需要的不一定是很大的模型,而是能很好满足帮助开展业务的“小领域”模型。 比如说开发一个医药管理系统,则与药品,医疗,从业法规相关的知识更重要,而有些知识只在局部和经营过程中才存在。

我们目前设计和研发的中间件产品软件,都会和AI进行结合,更好的帮助程序员开发软件应用,使用户使用更便捷高效。

  • 对于业务类和运维管理中间件,提供NLP自然语言管理能力;应用服务器可以高效开发和部署使用AI应用。
  • 数据类中间件,查询、处理、转运、元数据等都可以通过自然语言进行分析处理。
  • 另外,将大语言模型的AI能力归纳提炼,研发服务器产品,并结合社交软件,将现在的对话窗口和复制粘贴性应用方式,变为可快捷开发部署软件模型。

LLM知识智慧巨龙已经抬头!