March 1, 2025

在过去的30年，各种技术层出不穷，热点快速切换。异构环境、分布式、大数据、微服务、容器云原生，每个时代都催生一批新的明星技术和产品。如今在人工智能时代，大语言模型、GPU、Agent等成为热点词。

那么在AI时代，究竟什么才是技术时期发展的驱动力呢？

我认为是：以前所未有的方式快速学习全人类的知识，并高效的合理运用。

一、信息软件的三个时代

1.企业级数据库

回溯到企业级产品时期，那时技术核心点在数据库，更确切的是存储了实体运营的关系型数据，以及表现现实状态的信息。围绕关系型数据库，软件开发存取数据时使用SQL语言，这种描述语言能体现思维过程。

信息保存在各个独立的知识域中，分享传递还是以纸质的出版物为主。数据库形态从开始时的单机到分布式不断发展，同时催生出广泛的中间件产品，如应用服务器，消息中间件，缓存中间件，事务中间件等等。

2.大数据

互联网时代，全世界的信息连成网络，信息数据的产生以指数级快速增长。每个人每个实体都可以产出各种数据，发表博客、上传照片、每日运动、上网购物等海量数据。

大数据时代，原有的关系数据库存在局限，出现了各种NoSQL, NewSQL，以及有Google等存放和索引全球网络的搜索引擎。非结构化和半结构化数据占据绝大多数容量，包括了互联时代后所有电子数据，而绝大多数纸质典籍和资料也已经联机上网，并通过社交力量不断优化。

大数据数据库，除了可以通过经典SQL查询外，还提供了更多的方法被高效查询访问；而搜索引擎和海量数据库中的信息，则通过搜索交互框方式，如关键词等方式，筛选加权排序。大数据的处理通过分布式云计算，通过分片等方式委托给多个运算节点，再将结果合并返回。

3.全数据集

人工智能时代，用自然语言方式来理解知识，用智能思维方式来思考推理。当获取存储了知识信息，或者说是经过提炼的精华信息后，人们用最朴素的自然语言去和这个数据集合进行交互。

人人都可以使用计算机网络，不再需要专业的、需要经过培训的专业编程语言。同时人工智能还具有推理思维能力，通过不同的角度和维度思考，分析加工知识信息，给出结果。理论上来说，大模型不断受训和思维，掌握的知识总量可能已经远超过人类认为已拥有的。

二、大语言模型能力一窥

得益于“开源”大语言模型，我们能充分了解和使用其能力，起码是核心的能力。

1.博学广记

在HuggingFace上，每个模型都有一个模型卡，上面有其详细的描述信息。

有些模型就说明了其用来训练的数据源是哪些。正如同我们学习时需要有对应的教科书、学习辅导材料、练习试卷等。

以嵌入式模型all-MiniLM-L6-v2为例，并不大只有90M左右，算是“小”模型，采用的数据集就有：

QA问答，Yahoo问答集，SQuAD斯坦福问答数据集等
评论，Amazon商品评论，Quora知识讨论等
知识集，Wikipedia维基百科，AGNews新闻文章等
代码，CodeSearchNet开源代码库等

而真正意义上的大语言模型，如Granite，则包括了更多的数据集，如： arXiv论文库，Common Crawl网站文章抓取，SEC Filings证券交易所各种材料，USPTO美国专利文本

以上这些数据集，多数数据量都是TB以上起步。非结构化自然语言这个信息量有多大呢，“半部论语治天下”，一个维基百科的网站就够看一辈子。

所以大语言模型就是人类知识的凝聚，所谓2B，70B等模型种类，就是提炼浓缩的程度。

2.能力全能

每个模型在发布时，很多都会附带一个评测表格，对比自身和同业的能力。

这个表上面有评测的项目和得分。比如说最近大火的DeepSeek，就罗列了4个大项，分别是：英语、编码、数学和中文。英语和中文都是语言项，和用于训练的各语言语料有关系。

结合各类语言模型，细分语言后得到如下分类：

语言

知识，理解(读)
内容，摘要(写)
对话，表达(听说)
推理，指令(逻辑)

数学
编程

每类各选取若干个主流评测说明：

MMLU 多目标QA
SimpleQA 事实知识
IFEval 指令跟随
DROP 阅读理解基准
GPQA Diamond 研究生级别推理
MATH 500 数学问题解决
AIME 2024 高中数学竞赛
SWE-bench 生成式编程
HumanEval 评估代码生成任务

如果模型在一项评测上获得高分，则说明在测试的方面具备很强的能力。和采用题库进行考试差不多。

要注意，在代码编程和数学方向，总有对应的MATH/CODE，或者推理/指令模型，可以看成这个模型更具备“理工”思维方式。

3.大语言模型及开发框架的能力归类

多模态，特点标注
Embedded和向量存储
提示词，对话管理
响应流式和格式化
RAG, ETL等Chain
Tools
MCP

最有想象力的就是MCP，即Model Context Protocol(模型上下文协议)，这个由Anthropic公司开发的协议技术，迅速得到了各主流语言及开发框架的支持。

通过协议定义，在server端定义了3个要素：

Resources资源
Prompts提示词
Tools工具
资源可以用来表述服务器了解的信息，可以类比于Rest协议开发中，将服务器端数据信息映射为Resources资源。
工具，通过服务器获取信息，类比LLM API中定义的Tools。通过已存在的操作接口，将原服务器的能力暴露出去。
而提示词则用自然语言，描述如何获取资源或调用工具。

通过MCP，可以将目前几乎所有的信息源和软件系统的能力，在LLM加持下，对外暴露。任何人只要略懂相关知识，会说话表达，就能够使用软件。

三、AI时代的中间件产品方向

中间件软件，本质是屏蔽各种系统环境的技术差异性，帮助开发者更有效率的开发软件应用。

如今我们看到，每个人都可以通过自然语言来使用软件，甚至进行推理、生成代码，来完成更多的工作。这就是最有意义的“中间”软件！

不过，我们还是要了解3个重要事情：

1.基础数学和基础软件会变得更重要。

整个AI的根基是数学，而所有的信息获取，都是建立在基础软件之上。

任务调度，内存高效使用，高性能存储，网络和分布式，所有的计算机基础知识会比之前提出更高要求。

2.开发工作不会消失，反而是专业性要求会更强

有一种论调是有了AI，会淘汰掉很多工作岗位，如不再需要程序员。其实任何科技的进步和工具的演进，都只会提升一个知识领域的精通的门槛，”淘汰”的是入门性工作和懒人。

比如，现在AI可以写代码，写论文，甚至写书。让一段代码能运行起来很简单，软件脚手架已经成熟多年了。更关键的是能读懂、会修改、进行优化提升的能力。AI也许可以帮助去做这些，但前提是必须会写提示词，关键是懂得相关的领域知识。

对于个人来说，认真积累知识是根本。 AI可以是个很好的工具，善用者会大大提升效率，生产力提升后，会减少成本，从而挤压原有入门级或者中低级工作。

3.解决问题的模型才是好模型

对于具体的工作任务来说，可能只用到很少的知识，但有很强的专业性。目前的大模型还在“军备竞赛”阶段，动则就“满血”，容纳几百B的参数。

根据前面的分析，使用大模型，看中其三方面能力：数据集即知识储备，思维推理能力，自然语言处理能力。

我们需要的不一定是很大的模型，而是能很好满足帮助开展业务的“小领域”模型。比如说开发一个医药管理系统，则与药品，医疗，从业法规相关的知识更重要，而有些知识只在局部和经营过程中才存在。

我们目前设计和研发的中间件产品软件，都会和AI进行结合，更好的帮助程序员开发软件应用，使用户使用更便捷高效。

对于业务类和运维管理中间件，提供NLP自然语言管理能力；应用服务器可以高效开发和部署使用AI应用。
数据类中间件，查询、处理、转运、元数据等都可以通过自然语言进行分析处理。
另外，将大语言模型的AI能力归纳提炼，研发服务器产品，并结合社交软件，将现在的对话窗口和复制粘贴性应用方式，变为可快捷开发部署软件模型。

LLM知识智慧巨龙已经抬头！

研发产品 - 业务中间件

研发产品 - 互联中间件

技术产品

All Product

解决方案

All Solution

软件开发

咨询服务

All Service

开源服务 - 中间件

开源服务 - 开发框架

开源服务 - 大数据

开源服务 - 语言和技术标准

开源服务 - 容器

开源服务 - 运维管理

论AI时代的信息技术和中间件产品方向