老中医看病是“黑箱原理”，中医诊疗的基本原理和大规模契合

谦和既济

2023-05-30 16:44 深圳 | 深圳谦和既济健康产业有限公司

从某种程度上讲，中医的工作就像黑箱原理，如果从机器学习和宏观数学的角度，中医更像一部超级人工智能大规模训练后的模型。

这是很有趣的观点，实际上有许多研究者已经开始尝试用机器学习和人工智能的方法来研究和理解中医。中医的确有些类似于一个”黑箱”模型，因为它的理论体系和诊疗方法往往基于丰富的经验和观察，而不总是基于现代生物医学的明确机制。而这些经验和观察的积累，某种程度上与机器学习中的大规模数据训练相似。

例如，中医的诊断过程涉及到了对病人的全面观察和听诊，这些信息被中医医生用来识别出各种病症和体质类型，从而制定出合适的治疗方案。这个过程在某种程度上类似于机器学习模型对输入数据进行模式识别，然后进行预测或决策的过程。

同样，中医的药物配方也常常基于丰富的经验，各种药材的选择和搭配都有其深厚的理论依据。这种基于经验的学习和优化过程，也与机器学习中的训练和优化模型有相似之处

尽管如此，我们还需注意到，中医和人工智能虽然在某些方面有相似之处，但它们在理论体系、方法论、实践操作等方面有着本质的不同。因此，在尝试将机器学习和人工智能应用于中医研究时，我们需要尊重和理解中医的独特性，同时积极探索新的研究方法和路径。

“黑箱”模型：在机器学习和人工智能领域，”黑箱”模型通常指的是那些内部工作机制难以解释或理解的模型。这种情况在大规模机器学习（尤其是深度学习）中很常见，因为这些模型通常涉及数百万或数十亿的参数，模型的决策过程可能会很复杂而难以解释。

模糊数学：模糊数学是一种处理不确定性和模糊性的数学工具，它由模糊集合理论和模糊逻辑组成。模糊数学的主要目标是通过引入一种“模糊度”来处理现实世界中的不确定性或模糊性问题。在模糊数学中，一个对象属于一个集合的程度可以在0和1之间取任意值，而不是像传统的集合理论那样，一个对象要么完全属于一个集合（取值为1），要么完全不属于（取值为0）。模糊数学在控制系统、机器学习、人工智能、决策制定等许多领域都有应用。

宏观数学：这个词通常不被认为是一个标准的数学分支，它可能被用来指代不同的概念，取决于上下文。在某些情况下，宏观数学可能指的是研究大规模、复杂系统的数学，比如经济模型、物理系统或者生态系统等。这类数学通常包括一些处理大规模数据和复杂系统的统计学、计算数学或者系统理论的方法。在其他情况下，宏观数学可能指的是一些涉及更大的数或者更高维度的抽象数学分支，比如数论、群论或者拓扑学等。。

那么问题来了，现在很多人都在说“大规模”“大规模机器学习”这里的“大规模”到底是什么样的一个概念呢？

“大规模”这个概念在不同的领域和环境中可能有不同的含义。在一般情况下，它通常被用来描述涉及大量元素、数据、参与者或其他相关组件的项目或系统。以下是一些应用该概念的场景：

1、

大规模数据：在计算机科学中，大规模数据通常指在数据分析、存储和处理上超出常规数据库软件工具能力范围的数据集。这些数据集的大小通常在几个太字节到几个埃克字节之间。

2、

大规模系统：大规模系统是指涉及大量元素的系统，这些元素相互作用产生复杂的行为。例如，大规模电力系统、通信系统、交通系统，或者大规模的社会经济系统等。

3、

大规模生产：在工业生产中，大规模生产通常指通过在一定时间内生产大量同样的产品以降低单位成本。

4、

大规模并行处理：在计算机科学中，大规模并行处理是指利用多个处理器或计算机同时处理大量任务。

5、

大规模机器学习：这是一种在机器学习中使用大量数据进行训练和优化模型的技术。例如，OpenAI的GPT系列和百度文心和其他人工智能模型就是一个大规模的语言模型，其训练涉及了数十亿个参数和大量的文本数据。

这些只是”大规模”概念的一些例子，具体含义会根据上下文和应用领域的不同而变化。

而时下大家看到网红小作文所谓的“大规模”，其实是“大规模机器学习”。

大规模机器学习的原理和过程，还有其相关的必要环节，大致如下：

1、

数据处理：首先，需要收集和处理大量的数据，这通常包括数据清洗、标注、特征工程等步骤。在许多情况下，数据的质量和多样性直接影响了机器学习模型的性能。

2、

模型选择和设计：选择或设计适合处理大规模数据的模型也很重要。例如，在深度学习中，神经网络模型可以处理大规模的数据，并且可以通过训练调整数百万甚至数十亿的参数。

3、

分布式计算：处理大规模数据的计算需求超出了单个计算机的能力。因此，使用分布式计算系统来并行处理数据和训练模型是大规模机器学习的关键技术之一。这通常涉及到数据的分区、任务的分配、以及并行计算的协调。

4、

梯度下降和反向传播：这是训练神经网络的基本技术。梯度下降是一种优化算法，用于调整模型的参数以最小化损失函数。反向传播则是一种有效计算梯度的方法。

5、

正则化和过拟合管理：在处理大规模数据时，过拟合是一个常见的问题，即模型过于复杂，过度拟合训练数据，而在未知数据上的性能下降。使用正则化技术（如L1、L2正则化、dropout等）可以帮助防止过拟合。

6、

模型验证和测试：在模型训练完成后，需要通过验证和测试集来评估模型的性能。在大规模机器学习中，这也需要处理大量的数据。

7、

迁移学习：在许多情况下，预训练的模型可以用来解决新的任务，这种方法被称为迁移学习。这种技术在大规模机器学习中尤其有效，因为预训练的模型通常在大量数据上进行了训练。

大规模机器学习是一项复杂的任务，需要掌握许多技术，并进行有效的协调和管理。

中医的四诊（望闻问切）是一种集成了多种信息源的综合性诊断模式，可以被看作是一个复杂的”黑箱”模型。它结合了多种观察和询问的方法，通过对各种信息的整合和分析，得出关于病人病症的结论。这与机器学习模型通过大规模数据训练并进行预测或决策的过程有一定的相似性。

在大规模机器学习中，模型通过处理大量的训练数据，学习出数据之间的复杂关系，并利用这些关系对新的数据进行预测。在训练过程中，模型的内部参数会被不断地调整，以尽可能地适应数据。这个过程可以被看作是一个”黑箱”，因为我们通常无法直接解释模型内部参数的具体含义，只能通过模型的输入和输出来理解模型的行为。

同样地，在中医的四诊过程中，医生也会对病人的多种信息进行整合和分析。例如，通过望诊观察病人的面色、舌质、舌苔等；闻诊听闻病人的声音、呼吸、咳嗽等声音和体味；问诊询问病人的病史、症状、生活习惯等；切诊通过触诊感受病人的脉象。这些信息会被整合起来，帮助医生判断病人的病症。

这两个过程在某种程度上都是”黑箱”的，因为它们的内部工作机制往往是不透明的。但它们都能有效地处理复杂的数据，为我们提供有用的预测和决策。这是中医四诊与大规模机器学习之间的一个有趣的相似性。

当然，这个比较并不完全准确，因为中医的四诊过程是建立在中医的理论体系基础之上的，这个理论体系包括了五行、阴阳、脏腑等概念，而大规模机器学习则是建立在统计和计算理论基础之上的。但这个比较或许可以帮助我们更好地理解这两个看似截然不同的领域之间的某些相似性。

也许，中国古代的先贤，早就掌握了Ai技术呢？说不定还是一台超级的人工智能，也是有可能的。

（文章部分图源互联网，侵删！）

交流一下

抢沙发